OpenAI از سورا Sora، مدل هوش مصنوعی تبدیل متن به ویدئو، رونمایی کرد

OpenAI در حال راه اندازی یک مدل جدید برای تولید ویدئو است که Sora نام دارد. این شرکت هوش مصنوعی می‌گوید سورا «می‌تواند صحنه‌های واقعی و تخیلی را با استفاده از دستورالعمل‌های متنی خلق کند». مبدل متن به ویدیو به کاربران اجازه می‌دهد تا ویدیوهای واقع‌گرایانه تا یک دقیقه ایجاد کنند.

بر اساس پست وبلاگ OpenAI، سورا قادر است صحنه های پیچیده با شخصیت های متعدد، انواع حرکت خاص، و جزئیات دقیق سوژه و پس زمینه” ایجاد کند.

این شرکت همچنین خاطرنشان می‌کند که این مدل می‌تواند درک کند که چگونه اجسام «در دنیای فیزیکی وجود دارند»، و همچنین «به‌طور دقیق لوازم را تفسیر می‌کند و شخصیت‌های قانع‌کننده‌ای ایجاد می‌کند که احساسات را ابراز می‌کنند.»

این مدل همچنین می‌تواند یک ویدیو بر اساس یک تصویر ثابت تولید کند، همچنین قادر است فریم‌های از دست رفته را در یک ویدیوی موجود پر کرده یا آن را گسترش دهد.

دموهای تولید شده توسط Sora که در پست وبلاگ OpenAI گنجانده شده است، شامل صحنه ای هوایی از کالیفرنیا ، ویدئویی که به نظر می‌رسد از داخل قطار توکیو گرفته شده است و موارد دیگر است.

بسیاری از آنها نشانه‌های آشکاری از هوش مصنوعی دارند – مانند یک طبقه متحرک مشکوک در یک ویدیو از یک موزه.

در این مورد OpenAI می‌گوید که این مدل «ممکن است با شبیه‌سازی دقیق فیزیک یک صحنه پیچیده مشکل داشته باشد»، اما نتایج در کل بسیار چشمگیر هستند.

پیش از این، مولدهای متن به تصویر مانند Midjourney در خط مقدم تبدیل متن به تصویر بودند. اما اخیراً، تولید ویدیو با سرعت قابل توجهی شروع به بهبود کرده است: شرکت‌هایی مانند Runway و Pika مدل‌های متن به ویدیوی قابل توجهی عرضه کرده‌اند و Lumiere گوگل نیز یکی از رقبای اصلی OpenAI در این میدان رقابت هستند.

سورا در حال حاضر به صورت عمومی در دسترس نیست و در مرحله ارزیابی مدل از نظر آسیب ها و خطرات احتمالیاست. OpenAI همچنین  به برخی از هنرمندان تجسمی، طراحان و فیلمسازان را برای دریافت بازخورد دسترسی داده اشت.

اوایل این ماه، OpenAI اعلام کرد که واترمارک‌ها را به ابزار تبدیل متن به تصویر خود DALL-E 3 اضافه می‌کند، اما خاطرنشان می‌کند که آنها را می‌توان «به راحتی حذف کرد». مانند سایر محصولات هوش مصنوعی این شرکت، OpenAI باید با عواقب ناشی از اشتباه گرفتن ویدپوهای ساختگی از اصلی را بسنجد و ارزیابی کند.


  این نوشته‌ها را هم بخوانید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا
[wpcode id="260079"]