نگران مشکل بسته بودن اتفاقی چشمها در یک عکس و خراب شدن این عکس خاطرهانگیز نباشید! چون ابزار هوش مصنوعی فیسبوک این مشکل را حل خواهد کرد
گرفتن یک عکس خوب از برخی افراد بسیار مشکل است. همیشه علتی برای خراب شدن عکس وجود دارد. مثلا نور زیاد، چشمک زدن طرف یا بسته بودن چشمها!
فیسبوک میخواهد این مشکل را با توسعه یک ابزار هوش مصنوعی رفع کند. او دارد ابزاری توسعه میدهد تا چشمک و بسته بودن چشم در عکسهای پرتره را رفع کند.
تلاش فیسبوک چیزی فراتر از یک ساخت یک کپی از چشم و جایگزین کردن با چشمهای بسته است.
ایده باز کردن چشمها در یک عکس تازگی ندارد ولی بیشتر تکنیکهای موجود به برداشتن برشی از چشمهای باز از روی یک عکس دیگر و چسباندن این برش به روی عکس خراب شده است.
مثلا نرمافزاری مانند ادوبی فتوشاپ المنت که برای ویرایش ساده عکسها است؛ یک مود مخصوص چنین کاری دارد. وقتی میخواهید از این مود استفاده کنید؛ درخواست میکند عکس دیگری با چشمان باز را در نرمافزار باز کنید.
سپس با استفاده از فناوری Adobe AI که Sensei نامیده میشود؛ چشمهای بسته در عکس ترمیم میشوند. این فناوری و ابزار ادوبی عملکرد خوبی دارد و بسیاری از عکسها را ترمیم میکند ولی باز هم جزییات کوچک و ریزی وجود دارد که درست نمیشوند. مانند روشنایی صورت در عکس یا سایههای چشمهای باز.
بسیاری از عکاسان حرفهای و همینطور اساتید پردازش تصویر، پزشکی قانونی و نظایر اینها به سادگی میتوانند تشخیص دهند در یک عکس، وضعیت چشمها درست و سایهها سر جای خودشان هستند یا خیر!
ایدهای بهتر برای کاربردهای گستردهتر
حالا فیسبوک ایده جایگزین دیگری برای این مشکل دارد. فیسبوک میخواهد با استفاده از شبکههای عصبی عمیق، اطلاعات مورد نیاز را از محتویات اطراف تصویر (نه فقط اطراف چشمها یا بخش آسیب دیده) جمعآوری تا بتواند عکس را ترمیم کند.
فیسبوک از فناوری به نام general adversarial network برای جمعآوری اطلاعات در یک عکس استفاده میکند. GAN همان فناوری است که چندی پیش موج جدیدی از فیلمهای جعلی را ساخت.
یک مدل از این فناوری (Exemplar GAN) باز هم از سورسها و عکسهای دیگر استفاده میکند ولی نه برای کپی کردن بخشهای آسیب دیده عکس بلکه برای نمونهبرداریهای اطلاعاتی تا یاد بگیرد آن بخش از تصویر میتواند چه علایم و نشانههایی داشته باشد.
سپس، فرآینده به نام in-painting استفاده میشود تا اطلاعات مورد نیاز برای جایگزین شدن با چشمهای بسته تولید شود.
این مدل از یادگیری عمیق نیاز به ارجاع به یک عکس ساده دارد؛ چیزی که در فیسبوک به وفور یافت میشود و هر فردی چندین عکس ساده از چهره خود در این شبکه اجتماعی دارد.
فیسبوک با استفاده از این فناوری و ابزار هوش مصنوعی میتواند تصاویر مختلف یک کاربر در حالتها و نورپردازیهای مختلف را شناسایی و تحلیل کند تا در صورت نیاز، یک عکس با چشمان بسته را ترمیم کند.
باید اعتراف کرد نتایج اولیه این ابزار AI فیسبوک شگفتانگیز هستند. شاید این تصاویر هنوز ناقص و تا حدودی مصنوعی به نظر برسند ولی محققان این شرکت در حال تکمیل این فناوری و کار بیشتر روی الگوریتمهای آن هستند تا بهتر و بیشتر آموزش ببیند و عکسهای با وضعیتهای غیرقابل پیشبینی را هم ترمیم کند.
به طور کلی، فیسبوک این فناوری و ابزار AI را فقط برای ترمیم چشمهای بسته یک عکس انجام نمیدهد و اعتقاد دارد در آینده میتواند کاربردهای گستردهای داشته باشد. مثلا به ما کمک کند یک عکس پروفایلی خودمان را بهتر نگاه کنیم یا اینکه یک آهنگ را از سبکی به سبک دیگر برگردانیم.