چگونه هوش مصنوعی در حال تغییر عکاسی است

اگر میخواهید بدانید اسمارتفون بعدی شما در عکاسی چه کیفیتی بروز میدهد؛ به جای بررسی لنز و سنسورهای دوربینهای آن، سراغ فناریهای هوش مصنوعی شرکت سازنده گوشی بروید.
واقعیت این است که در چند سال اخیر، دوربینهای اسمارتفونها پیشرفتهای بسیار بزرگی داشتند و این پیشرفتها هنوز ادامه دارند.
ولی این پیشرفتها مدیون سنسور و لنز و نوع دوربینهای استفاده شده در این اسمارتفونها نیست؛ بلکه این هوش مصنوعی است که به دوربینها قدرت داده است و شاهد ثبت عکسهایی با کیفیت دوربینهای DSLR هستیم.
دوربینهای اسمارتفونهای امروزی میتوانند به لطف AI، سوژههای را شناسایی و تحلیل کنند؛ متناسب با شرایط نوری از لنزها و فیلترهای مختلف برای ثبت عکس سود ببرند و چندین فریم از سوژه با کیفیتهای مختلف بگیرند تا در نهایت، ترکیب آنها یک عکس بدون نقصی بسازد.
همهچیز از اپهای مدیریت عکس شروع شد
در سال ۲۰۱۵، اپلیکیشن Google Photos نشان داد چگونه میتوان از قدرت هوش مصنوعی در عکاسی و پردازش عکسها استفاده کرد.
این اپلیکیشن میتوانست با استفاده از الگوریتمهای یادگیری ماشینی در هزاران عکس آپلود شده روی سرویس گوگل پلاس جستوجو کند تا عکسهایی با ویژگیها و مشخصات خاصی (مثلا دارای گربه) یافته و مرتبسازی کند.
گوگل با خرید شرکت DNNresearch در سال ۲۰۱۳، یک شبکه عصبی عمیق را براساس اطلاعات برچسبزنی کاربران ابداع و آموزش داد.
به این روش میگویند «یادگیری تحت نظارت» و شامل پروسهای میشود که یک شبکه عصبی را براساس میلیون عکس آپلود شده توسط مردم آموزش میدهند تا بتواند عکسهایی با ویژگی خاص را در سطح پیکسل شناسایی کند.
این شبکه عصبی به مرور بهتر و بهتر میشود و الگوریتمهایی به دست میآید که میتوانند میان عناصر یک عکس ارتباط برقرار کنند و به درک درستی از چرایی آنها در عکس برسند. مثلا چرم سیاه و سفید با خز سفید چه تفاوتی دارند و چگونه میتوان آنها را از پوست یک گاو هولشتاین متمایز کرد.
با آموزشهای بیشتر میتوان انتظار داشت الگوریتمهای یادگیری ماشینی بتوانند عکسهای شامل یک حیوان را شناسایی کنند یا عکسهایی که در آنها میز صبحانه وجود دارد را فیلتر سازند.
مدت زمان زیادی طول میکشد تا یک شبکه عصبی و الگوریتم یادگیری ماشینی به این سطح از فهم عکس برسد. اما وقتی کامل شده و روی مراکزداده قرار میگیرد؛ باقی کار آسان میشود و میتوان از آن در دستگاههای تلفن همراه که قدرت پردازشی کمی دارند؛ استفاده کرد.
هنگامی که عکسهای کاربران روی سرویسهای ابری آپلود میشوند؛ گوگل به راحتی از این شبکه عصبی برای تجزیه و تحلیل عکسها و برچسبگذاری آنها استفاده میکند. به این ترتیب، کتابخانه بسیار بزرگی از عکسهای طبقهبندی شده در دسترس است.
حدود یک سال پس از عرضه Google Photos، اپل هم اعلام کرد یک ویژگی جستوجوی عکس مشابه با استفاده از شبکه عصبی آموزش دیده در اختیار دارد ولی برای حفظ حریم خصوصی کاربران، پردازشها و جستوجو روی خود دستگاه کاربر انجام شده و هیچ اطلاعاتی به سرورها منتقل نمیشود.
نفوذ واحدهای شبکه عصبی به گوشیها
تا اینجا درباره چگونگی بهبود نرمافزارهای مدیریت عکس صحبت کردیم اما هوش مصنوعی و یادگیری ماشینی در دنیای عکس و عکاسی، تاثیراتی فراتر از آنچه گفته شد، داشتهاند و به وضوح روی افزایش کیفیت عکسها موثراند.
لنزهای دوربینهای اسمارتفونها سریعتر شدند و سنسورهای بزرگتری ساخته شده است اما ما هنوز با محدودیتهایی در استفاده از سیستمهای اپتیک روی دستگاههای کوچک موبایل روبرو هستیم.
اما این روزها شاهد عکسهای با کیفیت بهتری نسبت به گذشته هستیم. این اتفاق برای همه دوربینها و اسمارتفونها رخ نداده است و فقط برخی سختافزارها میتوانند عکسهای پردازش نشده با کیفیتتری بگیرند.
دلیل آن هم استفاده از واحدهای پردازش عصبی (NPU) یا تراشههای پردازش سیگنال ادغام شده با پردازنده اصلی موبایل است.
این سختافزارها باعث میشوند پردازشهای تصویری روی دستگاههای همراه انجام شوند و هر چیزی از انواع افکتها و عمیقدهی تصویر واقعی و جعلی تا ساخت تصاویر پرتره یا بهبود کیفیت تصاویر با نگاشت چندین پیکسل را امکانپذیر میکنند.
البته، تمام پردازشهای تصویر زیرمجموعه هوش مصنوعی قرار نمیگیرند اما قطعا هوش مصنوعی در مرکز این فرآیند قرار دارد.
اپل از این سختافزار برای ساختن عکسهای پرتره با دوربین دوگانه خود استفاده میکند. پردازنده پردازش تصویر آیفون از تکنیکهای یادگیری ماشینی برای شناسایی افراد توسط یک دوربین این سیستم استفاده میکند در حالیکه دوربین دوم سعی میکند چهره و سوژه اصلی را شناسایی و با عمقبخشی به آن از پسزمینه مجزا کند.
از سال ۲۰۱۶ فناوری یادگیری ماشینی برای شناسایی افراد در عکسها و سوژهها استفاده شد. یکی از نتایج توسعه نرمافزارهای مدیریت عکس که گوگل و اپل پیشگامان آن بودند.
تکنیک Pixel گوگل
گوگل در زمینه فناوریها و تکنیکهای بهبود کیفیت تصویر از دیگر شرکتها جلوتر است و بهترین شاهد این ادعا، اسمارتفونهای گوگل پیکسل ۳ هستند.
گوگل با ترفندهای هوش مصنوعی و یادگیری ماشین به همراه ترکیب چندین فریم و پیکسل با یکدیگر و نهایتا پردازش تصویر توانسته است تصاویری با کیفیت +HDR بسازد. جالب است این فرمت تصویری میتواند به طور پیشفرض انتخاب شود.
این تکنیک گوگل به نام Pixel به تنهایی برای کیفیتبخشی به تصاویر کافی نیست. این ویژگی با کمک الگوریتمهای یادگیری ماشینی سعی میکند تعادل رنگ سفید و سیاه را به طور دقیقی محاسبه کند.
این ویژگی به بهترین شکل در گوشی Pixel 3 پیادهسازی شده است. به همین دلیل، گوشیهای پیکسل ۳ گوگل کیفیت عکس بسیار بالا در حد بهترین دوربینهای دنیا دارند ولی از سیستمهای دوربین چندگانه سود نمیبرد و در پی افزایش سختافزار دوربینها نبوده است.
در کنار هوش مصنوعی، هنوز سختافزارهای دوربین و عکاسی در بهبود کیفیت تصویر تاثیرگذار هستند. برای مثال، گوشیهای آنر ویوو ۲۰ و هواوی نوا ۴ از سنسورهای تصور ۴۸ مگاپیکسلی سود میبرند که البته حامی سختافزارهای هوش مصنوعی هم هستند.
این سنسور به وضوح بزرگتر از سایر رقبا در بازار اسمارتفونها است و بیشتری وضوح یا زوم را به شما میدهد. البته، بهکارگیری این سنسورها با محدودیتهایی هم همراه است و نمیتوان انتظار داشته به همان نسبت کیفیت تصویر بهتر شود.
در آغاز راه هستیم
مدت اندکی است که تراشههای پردازش تصویر در گوشیهای تلفن همراه استفاده میشوند ولی به نسبت واحدهای NPU قدیمیتر هستند.
هواوی اولین شرکتی بود که با عرضه پردازنده کرین ۹۷۰، از یک واحد AI اختصاصی در این پردازنده موبایل رونمایی کرد. اپل هم با رونمایی از A11 Bionic به این تراشه مجهز شد.
کوالکام به عنوان بزرگترین سازنده پردازندههای موبایل جهان هنوز پردازندهای با واحد NPU معرفی نکرده است ولی تراشه اختصاصی Pixel Visual Core را برای پردازش تصویر مبتنی بر هوش مصنوعی توسعه داده است.
پردازنده A12 Bionic اپل هم یک موتور هشت هستهای عصبی دارد که میتواند هوش مصنوعی و پردازش تصویر را با قدرت و سرعت بسیار بالایی روی آیفون و آیپد پیادهسازی کند.
اپل میگوید این هستههای پردازش عصبی کمک میکنند دوربینها فاصله کانونی دقیقتر و واقعگرایانهتری نسبت به سوژهها داشته باشند.
به هر حال، دوربین یکی از بخشهای اساسی اسمارتفونها در چند سال اخیر بوده است و هوش مصنوعی به همراه سختافزارهای شبکه عصبی دارند این بخش را توسعه میدهند.
این نوشتهها را هم بخوانید