چگونه هوش مصنوعی در حال تغییر عکاسی است

اگر می‌خواهید بدانید اسمارت‌فون بعدی شما در عکاسی چه کیفیتی بروز می‌دهد؛ به جای بررسی لنز و سنسورهای دوربین‌های آن، سراغ فناری‌های هوش مصنوعی شرکت سازنده گوشی بروید.

واقعیت این است که در چند سال اخیر، دوربین‌های اسمارت‌فون‌ها پیشرفت‌های بسیار بزرگی داشتند و این پیشرفت‌ها هنوز ادامه دارند.

ولی این پیشرفت‌ها مدیون سنسور و لنز و نوع دوربین‌های استفاده شده در این اسمارت‌فون‌ها نیست؛ بلکه این هوش مصنوعی است که به دوربین‌ها قدرت داده است و شاهد ثبت عکس‌هایی با کیفیت دوربین‌های DSLR هستیم.

دوربین‌های اسمارت‌فون‌های امروزی می‌توانند به لطف AI، سوژه‌های را شناسایی و تحلیل کنند؛ متناسب با شرایط نوری از لنزها و فیلترهای مختلف برای ثبت عکس سود ببرند و چندین فریم از سوژه با کیفیت‌های مختلف بگیرند تا در نهایت، ترکیب آن‌ها یک عکس بدون نقصی بسازد.

همه‌چیز از اپ‌های مدیریت عکس شروع شد

در سال ۲۰۱۵، اپلیکیشن Google Photos نشان داد چگونه می‌توان از قدرت هوش مصنوعی در عکاسی و پردازش عکس‌ها استفاده کرد.

این اپلیکیشن می‌توانست با استفاده از الگوریتم‌های یادگیری ماشینی در هزاران عکس آپلود شده روی سرویس گوگل پلاس جست‌وجو کند تا عکس‌هایی با ویژگی‌ها و مشخصات خاصی (مثلا دارای گربه) یافته و مرتب‌سازی کند.

گوگل با خرید شرکت DNNresearch در سال ۲۰۱۳، یک شبکه عصبی عمیق را براساس اطلاعات برچسب‌زنی کاربران ابداع و آموزش داد.

به این روش می‌گویند «یادگیری تحت نظارت» و شامل پروسه‌ای می‌شود که یک شبکه عصبی را براساس میلیون عکس آپلود شده توسط مردم آموزش می‌دهند تا بتواند عکس‌هایی با ویژگی خاص را در سطح پیکسل شناسایی کند.

این شبکه عصبی به مرور بهتر و بهتر می‌شود و الگوریتم‌هایی به دست می‌آید که می‌توانند میان عناصر یک عکس ارتباط برقرار کنند و به درک درستی از چرایی آن‌ها در عکس برسند. مثلا چرم سیاه و سفید با خز سفید چه تفاوتی دارند و چگونه می‌توان آن‌ها را از پوست یک گاو هولشتاین متمایز کرد.

با آموزش‌های بیشتر می‌توان انتظار داشت الگوریتم‌های یادگیری ماشینی بتوانند عکس‌های شامل یک حیوان را شناسایی کنند یا عکس‌هایی که در آن‌ها میز صبحانه وجود دارد را فیلتر سازند.

مدت زمان زیادی طول می‌کشد تا یک شبکه عصبی و الگوریتم یادگیری ماشینی به این سطح از فهم عکس برسد. اما وقتی کامل شده و روی مراکزداده قرار می‌گیرد؛ باقی کار آسان می‌شود و می‌توان از آن در دستگاه‌های تلفن همراه که قدرت پردازشی کمی دارند؛ استفاده کرد.

هنگامی که عکس‌های کاربران روی سرویس‌های ابری آپلود می‌شوند؛ گوگل به راحتی از این شبکه عصبی برای تجزیه و تحلیل عکس‌ها و برچسب‌گذاری آن‌ها استفاده می‌کند. به این ترتیب، کتابخانه بسیار بزرگی از عکس‌های طبقه‌بندی شده در دسترس است.

حدود یک سال پس از عرضه Google Photos، اپل هم اعلام کرد یک ویژگی جست‌وجوی عکس مشابه با استفاده از شبکه‌ عصبی آموزش دیده در اختیار دارد ولی برای حفظ حریم خصوصی کاربران، پردازش‌ها و جست‌وجو روی خود دستگاه کاربر انجام شده و هیچ اطلاعاتی به سرورها منتقل نمی‌شود.

نفوذ واحدهای شبکه عصبی به گوشی‌ها

تا اینجا درباره چگونگی بهبود نرم‌افزارهای مدیریت عکس صحبت کردیم اما هوش مصنوعی و یادگیری ماشینی در دنیای عکس و عکاسی، تاثیراتی فراتر از آنچه گفته شد، داشته‌اند و به وضوح روی افزایش کیفیت عکس‌ها موثراند.

لنزهای دوربین‌های اسمارت‌فون‌ها سریع‌تر شدند و سنسورهای بزرگ‌تری ساخته شده است اما ما هنوز با محدودیت‌هایی در استفاده از سیستم‌های اپتیک روی دستگاه‌های کوچک موبایل روبرو هستیم.

اما این روزها شاهد عکس‌های با کیفیت بهتری نسبت به گذشته هستیم. این اتفاق برای همه دوربین‌ها و اسمارت‌فون‌ها رخ نداده است و فقط برخی سخت‌افزارها می‌توانند عکس‌های پردازش نشده با کیفیت‌تری بگیرند.

دلیل آن هم استفاده از واحدهای پردازش عصبی (NPU) یا تراشه‌های پردازش سیگنال ادغام شده با پردازنده اصلی موبایل است.

این سخت‌افزارها باعث می‌شوند پردازش‌های تصویری روی دستگاه‌های همراه انجام شوند و هر چیزی از انواع افکت‌ها و عمیق‌دهی تصویر واقعی و جعلی تا ساخت تصاویر پرتره یا بهبود کیفیت تصاویر با نگاشت چندین پیکسل را امکان‌پذیر می‌کنند.

البته، تمام پردازش‌های تصویر زیرمجموعه هوش مصنوعی قرار نمی‌گیرند اما قطعا هوش مصنوعی در مرکز این فرآیند قرار دارد.

اپل از این سخت‌افزار برای ساختن عکس‌های پرتره با دوربین دوگانه خود استفاده می‌کند. پردازنده پردازش تصویر آیفون از تکنیک‌های یادگیری ماشینی برای شناسایی افراد توسط یک دوربین این سیستم استفاده می‌کند در حالی‌که دوربین دوم سعی می‌کند چهره و سوژه اصلی را شناسایی و با عمق‌بخشی به آن از پس‌زمینه مجزا کند.

از سال ۲۰۱۶ فناوری یادگیری ماشینی برای شناسایی افراد در عکس‌ها و سوژه‌ها استفاده شد. یکی از نتایج توسعه نرم‌افزارهای مدیریت عکس که گوگل و اپل پیشگامان آن بودند.

تکنیک Pixel گوگل

گوگل در زمینه فناوری‌ها و تکنیک‌های بهبود کیفیت تصویر از دیگر شرکت‌ها جلوتر است و بهترین شاهد این ادعا، اسمارت‌فون‌های گوگل پیکسل ۳ هستند.

گوگل با ترفندهای هوش مصنوعی و یادگیری ماشین به همراه ترکیب چندین فریم و پیکسل با یکدیگر و نهایتا پردازش تصویر توانسته است تصاویری با کیفیت +HDR بسازد. جالب است این فرمت تصویری می‌تواند به طور پیش‌فرض انتخاب شود.

این تکنیک گوگل به نام Pixel به تنهایی برای کیفیت‌بخشی به تصاویر کافی نیست. این ویژگی با کمک الگوریتم‌های یادگیری ماشینی سعی می‌کند تعادل رنگ سفید و سیاه را به طور دقیقی محاسبه کند.

این ویژگی به بهترین شکل در گوشی Pixel 3 پیاده‌سازی شده است. به همین دلیل، گوشی‌های پیکسل ۳ گوگل کیفیت عکس بسیار بالا در حد بهترین دوربین‌های دنیا دارند ولی از سیستم‌های دوربین چندگانه سود نمی‌برد و در پی افزایش سخت‌افزار دوربین‌ها نبوده است.

در کنار هوش مصنوعی، هنوز سخت‌افزارهای دوربین و عکاسی در بهبود کیفیت تصویر تاثیرگذار هستند. برای مثال، گوشی‌های آنر ویوو ۲۰ و هواوی نوا ۴ از سنسورهای تصور ۴۸ مگاپیکسلی سود می‌برند که البته حامی سخت‌افزارهای هوش مصنوعی هم هستند.

این سنسور به وضوح بزرگ‌تر از سایر رقبا در بازار اسمارت‌فون‌ها است و بیشتری وضوح یا زوم را به شما می‌دهد. البته، به‌کارگیری این سنسورها با محدودیت‌هایی هم همراه است و نمی‌توان انتظار داشته به همان نسبت کیفیت تصویر بهتر شود.

در آغاز راه هستیم

مدت اندکی است که تراشه‌های پردازش تصویر در گوشی‌های تلفن همراه استفاده می‌شوند ولی به نسبت واحدهای NPU قدیمی‌تر هستند.

هواوی اولین شرکتی بود که با عرضه پردازنده کرین ۹۷۰، از یک واحد AI اختصاصی در این پردازنده موبایل رونمایی کرد. اپل هم با رونمایی از A11 Bionic به این تراشه مجهز شد.

کوالکام به عنوان بزرگ‌ترین سازنده پردازنده‌های موبایل جهان هنوز پردازنده‌ای با واحد NPU معرفی نکرده است ولی تراشه اختصاصی Pixel Visual Core را برای پردازش تصویر مبتنی بر هوش مصنوعی توسعه داده است.

پردازنده A12 Bionic اپل هم یک موتور هشت هسته‌ای عصبی دارد که می‌تواند هوش مصنوعی و پردازش تصویر را با قدرت و سرعت بسیار بالایی روی آیفون و آیپد پیاده‌سازی کند.

اپل می‌گوید این هسته‌های پردازش عصبی کمک می‌کنند دوربین‌ها فاصله کانونی دقیق‌تر و واقع‌گرایانه‌تری نسبت به سوژه‌ها داشته باشند.

به هر حال، دوربین یکی از بخش‌های اساسی اسمارت‌فون‌ها در چند سال اخیر بوده است و هوش مصنوعی به همراه سخت‌افزارهای شبکه عصبی دارند این بخش را توسعه می‌دهند.

منبع

قبلی «
بعدی »

دیدگاه خود را با ما اشتراک بگذارید:

ایمیل شما نزد ما محفوظ است و از آن تنها برای پاسخگویی احتمالی استفاده می‌شود و در سایت درج نخواهد شد.
نوشتن نام و ایمیل ضروری است. اما لازم نیست که کادر نشانی وب‌سایت پر شود.
لطفا تنها در مورد همین نوشته اظهار نظر بفرمایید و اگر درخواست و فرمایش دیگری دارید، از طریق فرم تماس مطرح کنید.

اینستاگرام ما را لطفا دنبال کنید!

پیشنهاد می‌کنیم