چرا تولیدکنندههای تصویر مبتنی بر هوش مصنوعی، اشکالات ناشیانه به خصوص در نمایش دستها دارند؟

تصاویر هوش مصنوعی با خروجی فوق العاده خود دنیای عکاسی را شوکه کردهاند. اما ظاهراً یک مشکل وجود دارد که مولدهای تصویر مبتنی بر هوش مصنوعی را مدام آزار میدهد.
مولدهای تصویر هوش مصنوعی مانند DALL-E، Midjourney و Stable Diffusion به دلیل اضافه کردن تعداد انگشتها بیش از حد یا تغییر شکل انگشتهای همجوار شهرت خوبی ندارند و گاهی نتیجه آنها کابوسبار به نظر میرسد.
مثلا وقتی از هوش مصنوعی برای ایجاد تصاویر مهمانی به صورت واقع گرایانه استفاده میشود، در نگاه اول همه چیز خوب است. اما پس از بررسی دقیقتر، یک دختر میبینیم که یک دستش هشت انگشت دارد و دوربینی به دست گرفته.
اما چرا هوش مصنوعی اینقدر در برطرف این مشکلات عاجز است؟
یکی از سخنگویان یکی از برنامههای هوش مصنوعی میگوید: بخشی از دلیل تولید بد تصویر دستها این است که در مجموعه دادههایی که برای آموزش سینت سایزرهای تصویر استفاده میشود، انسانها دست خود را کمتر از صورت خود به نمایش میگذارند.
دستها همچنین در تصاویر منبع بسیار کوچکتر هستند و به ندرت تصویر بزرگی از آنها به هوشهای مصنوعی داده میشود.
به گفته پروفسور پیتر بنتلی، دانشمند کامپیوتر و نویسنده در دانشگاه کالج لندن، مولدهای تصویر دوبعدی نیز برای مفهوم سازی هندسه سه بعدی دست تلاش میکنند.
آنها ایده کلی یک دست با کف دست، انگشتان و ناخن را دارند، اما هیچ یک از این مدلها واقعاً نمیدانند که چه میکنند.
در آزمایش جالبی با Stable Diffusion و DALL-E از این دو برنامه خواسته شد که تصویر دو دست در هم قفل شده را تولید کنند. نتایج افتضاح بودند!
پروفسور هوش مصنوعی و هنر در دانشگاه فلوریدا، آملیا وینگر-بیرسکین، توضیح میدهد که هوش مصنوعی در واقع نمیداند که دست چیست و کارکرد آن چیست.
برنامه هوش مصنوعی به نحوه نمایش دستها در تصاویری که با آنها آموزش دیده مینگرد. دستها، در تصاویر، کاملاً ظریف هستند. آنها معمولاً چیزی را نگه میدارند. در بسیار اوقات هم آنها روی شانه فرد کناری هستند یا اینکه یک شخص دست شخص دیگری را گرفته است.
این فقط هوش مصنوعی نیست که با دستها مشکل دارد، هنرمندان در طول زمان از ترسیم دستها اجتناب میکردهاند ، ظاهرا به دلیل دشواری در تصویرسازی. در دوره رنسانس بود که هنرمندانی مانند لئوناردو داوینچی شروع به مطالعه و طراحی دستها کردند. مثلا داوینچی در واقع کاملاً به دستها وسواس داشت و مطالعات بسیاری روی دستها انجام داد.
یه جا شنیدم که طراحی از دستها به قدر سخت هستش که هنرمندان قرون وسطی بابت هر دست اضافی مزد بیشتری طلب می.کردند بنابراین تو خیلی از نقاشی ها که افراد زیادی توش حاضر بودند دستها با انواع ترفندها مثل پوشاندن زیر خرقهها قابل مشاهده نبودند