گوگل و فناوری باورنکردنی جدید ارتقای کیفیت عکس‌ها: یک عکس ۶۴ در ۶۴ پیکسل بدهید و عکس ۱۰۲۴ در ۱۰۲۴ تحویل بگیرید

0

وقتی فیلم‌ها و سریال‌ها را تماشا می‌کنیم، بارها پیش آمده که از صحنه‌های خاصی حرص خورده باشیم. یکی از این صحنه‌های تکراری این است که یک عکس یا ویدئوی محو و کم کیفیت خاص را ماموران پلیس  یا امنیتی می‌توانند، آنقدر بزرگ و باکیفیت کنند که جزئیاتش هم مشخص شود. درست است که با پردازش کامپیوتری می‌توان مقداری به وضوح عکس‌ها افزود، اما اینها در حد معجزه هم نیستند و به صورت خلاصه نمی‌توان دیتایی ثبت نشده را خلق کرد. فقط می‌شود که حدس زد که دیتای پیکسل‌های دیگر چه می‌توانسته‌اند باشند و وقتی آنها به تصویر اضافه شدند، چشم ما می‌تواند جزئیات اضافه ببیند. اما آیا واقعا چنین نرم‌افزارهای افزایش کیفیتی وجود دارند. باید بگوییم که محصولات متعددی در این زمینه وجود دارند و گوگل هم به تازگی نتایج تلاش چندساله‌اش را منتشر کرده.

تصور کنید که عکس‌های کم‌کیفیت تاریخی دارید یا تصور بفرمایید و یا برخی شخصیت‌های مهم تاریخ را در نظر آورید که از آنها فقط چند عکس به جا مانده، در این صورت فناوری‌های افزایش وضوح و ابعاد عکس‌ها می‌توانند کاربردی شوند و خدمت زیادی به ما کنند.

به تازگی در وبلاگ هوش مصنوعی گوگل، مقاله جالبی منتشر نشده که نشان می‌دهد تیم پژوهشی گوگل موسوم به Brain Team چقدر در این زمینه فعال است.

این تیم یک مدل یادگیری هوش مصنوعی ایجاد کرده و تعلیم داده که می‌تواند عکس‌ها کم‌کیفیت را تبدیل به عکس‌های پرکیفیت کند. کانسپت این کار را گوگل مدل‌های پخش یا diffusion models می‌نامد. نخستین بار در سال ۲۰۱۵ گوگل خبر داده بود که روی چنین چیزی کار می‌کند و حالا برای نخستین بار عکس‌هایی از نخستین محصول نهایی شده منتشر کرده که SR3 نامیده می‌شود.

SR3 می‌تواند نویز عکس‌ها را بگیرد. شیوه کار الگوریتم یادگیری ماشینی است که ابتدا به صورت معکوس آموزش داده می‌شود. یعنی عکس‌های پرکیفیت به این الگوریتم نشان داده می‌شود و بعد در فرایندی نویز به عکس‌ها اضافه می‌شود. الگوریتم این دو عکس را با هم مقایسه می‌کند. بعد یاد می‌گیرد در روندی معکوس عمل کند.

فعلا SR3 آنقدر خوب عمل می‌کند که می‌تواند تصویر چهره‌ها را ۸ برابر بزرگ‌تر کند. محصول بعدی این فرایند CDM نامیده خواهد شد.

گوگل عکس‌هایی زیادی منتشر کرده که نشان می‌دهد الگوریتمش چطور عکس‌های ۳۲ د ۳۲ را به عکس‌های ۶۴ در ۶۴ و سپس ۲۵۶ در ۲۵۶ و حتی ۱۰۲۴ در ۱۰۲۶ تبدیل کرده است.

چنین فناوری‌ای می‌تواند کاربردهای متعدد پیدا کند که یکی از آنها افزایش کیفیت تصویربرداری‌های پزشکی است.

   

ارسال یک پاسخ

آدرس ایمیل شما منتشر نخواهد شد.