آیاChatGPT یا نسلهای ارتقا یافته بعدی چت رباتها میتوانند به آسانی جانشین پزشکان شوند؟
برخی از پزشکان رفتار خوبی در هنگام ویزیت بیماران در مطب یا محیط بیمارستانی ندارند، آنها مانند روباتهای بیاحساس پر از دانش پزشکی. اما اگر یک هوش مصنوعی به سوالاتی که معمولاً از پزشکان پرسیده می شود پاسخ دهد و این کار را به گونهای انجام دهد که هم دانش و هم حس راحتی را منتقل کند، چه؟
این سوال باعث انجام یک مطالعه تازه توسط دانشگاه کالیفرنیا شد. این مطالعه توانایی پاسخگویی همدلانه پزشکان و ربات چت هوش مصنوعی ChatGPT را با بررسی اینکه کدامیک در پاسخ به 195 سؤال پزشکی بهتر عمل می کند، آزمایش کرد.
البته سوالات در حیطه دانش عمومی پزشکی بود و شامل موارد پیچیده که نیاز به استدلال قوی باشد یا موارد نادر، نبود. مثلا یک سوال این بود که بلغ خلال دندان چقدر خطرناک است؟ یا هر برخورد میله آهنی به سر آیا باعث ضربه مغزی میشود.
یک متخصص مراقبت های بهداشتی که اعتبارش توسط یک ناظر تأیید شده بود، در یکی از زیرگروههای سایت ردیت به این سوالات پاسخ داد. محققان همچنین سؤالات را از ChatGPT هم پرسیدند.
بعد از گروهی از پزشکان پرسیده شد که کدام پاسخ بهتر است، چت بات یا پزشک، به خود گروه گفته نشده بود که پاسخ هر سوال را پزشک داده یا ChatGPT. هر پاسخ توسط سه قاضی مختلف مورد بررسی قرار گرفت و نمره میانگین گرفته شد و در مجموع 585 ارزیابی انجام شد.
در نهایت مشخص شد که در 79 درصد موارد، داوران پاسخهای ربات چت را ترجیح داده بودند و تشخیص داده بودند که اطلاعات با کیفیتتر و زبان همدلانهتری نسبت به پاسخهای پزشک داشت.
در مقایسه با پاسخهای پزشکان، پاسخهای ChatGPT حدود 4 برابر کیفیت داشت و حدود 10 برابر همدلی بیشتری داشت. همچنین 4 برابر طولانیتر از پاسخ پزشکان بود یعنی به طور متوسط 211 کلمه در برابر 52 کلمه پزشک.
نمونه ای از پاسخ پزشک و ربات چت به یک سوال:
سوال: آیا به دنبال بلعیدن خلال دندان خطر مرگ وجود دارد؟
یک پزشک پاسخ داد: «اگر از 2 تا 6 ساعت تجاوز کرده باشید، به احتمال زیاد وارد روده شما شده است. به این معنی که به راحتی قابل بازیابی نیست. البته بسیاری از مردم وقتی تیغ و خلال دندان میبلعند مشکلی برایشان ایجاد نمیشود. البته بیمار ممکن است دچار معده درد شود. به هر ترتیب در رفتن به اورژانس تردید نکنید و به یاد داشته باشید که به خلال دندان بلعیده شده اشاره کنید.»
پاسخ ChatGPT این بود: “این طبیعی است که از بلع خلال دندان نگران باشید، اما در این مورد، بعید است که خلال دندانی که بلعیده اید آسیب جدی به شما وارد کند. خلال دندانها از چوب ساخته شدهاند که سمی نیست. و مسمومیت ایجاد نخواهد کرد.اما ممکن است خلال دندان در صورت گیرکردن در گلو یا سوراخ شدن دستگاه گوارش باعث آسیب شنود.اما بعید است با خلال دندان پخته شده 2 سانتی متیر این اتفاق بیفتد. اگر هر گونه ناراحتی یا علائمی مانند درد شکم، مشکل در بلع یا استفراغ را داشتید، برای ارزیابی بیشتر با یک مرکز پزشکی تماس بگیرید. با این حال، اگر علائمی را تجربه نکردید، میتوان فرض کرد که خلال دندان از دستگاه گوارش شما عبور کرده است و نیازی به نگرانی نیست. همیشه بهتر است در هنگام مصرف غذا محتاط باشید و قبل از غذا خوردن هر گونه جسم خارجی را بردارید. قابل درک است که ممکن است احساس اضظراب داشته باشید، اما سعی کنید این حس اضطراب را کم کنید. بیش از حد نگران نباشید بسیار بعید است که خلال دندان آسیب جدی به شما وارد کند.”
این مطالعه نشان میدهد که چت رباتها ممکن است بهتر از یک پزشک پرمشغله به سؤالات آنلاین پاسخ میدهد و این تصور را ایجاد کند که رفتاری دلسوزانه دارد.
اما مشکل این است که چنین تحقیقی در شرایط واقعی انجام نشده و پزشکها در انجمن آنلاین پاسخ دادهاند. ممکن است پزشکهای پرکار اصلا وقت شرکت در چنین انجمنهای آنلاین و پاسخ به سوالات را نداشته باشند یا حوصله تایپ نداشته باشند یا در تماس رو در رو با بیمار بهتر باشند. از طرف دیگر پاسخ فعلا نوشتاری چت ربات میتواند اطمینانبرانگیز باشد.
از دیگر سو، ممکن است بعد از مدتی به نظرمان برسد که ادب ظاهری چت رباتها و استفادهشان از جملات کاهش دهنده اضطراب تصنعی است.
مسئله یک سوی دیگر هم دارد: بیمارانی که معمولا به جای دانستن واقعیت یا آگاهی از سناریوهای بد، پاسخهای مودبانه یا پاسخهایی بگیرند که در «بیشتر» مواقع رخ میدهند. در صورتی که در پزشکی با اینکه باید نخست چیزهای شایع را در نظر گرفت، اما بر اساس شرایط موارد نادر هم پیش میآیند. مثلا همین خلال دندان ممکن است در موارد نادری باعث پارگی مری و بیماری بسیار خطرناک مدیاستینیت شود.
پزشکی که توصیه به مراجعه به اورژانس و طبعا تحت نظر بودن و تکرار پرسش و احتمالا انجام عکس قفسه سینه میکند بهتر است یا چت رباتی مودبی که شایعترینها را برمیشمارد؟
همچنین اگر در کدنویسی و محاسبات ریاضی چت ربات اشتباهی رخ بدهد، چه کسی از نظر قانونی مسئول است.
با این حال، از زمان همهگیری کرونا، ویزیت آنلاین نصفه و نیمه در کشور ما هم رایج شده.
یک راه میانبر این است که اطلاعات پزشکی کامل که همیشه از بیماران دریغ میشد یا چت ربات های تخصصی و بعد از تایید و ملاحظه پزشک به صورت کتبی به آنها داده شود.
این طوری دیگر بیماران میدانند که سیر تشخیص بیماریشان چطور خواهد بود و چه احتمالاتی وجود دارد و مثلا از هر آزمایشی چه اطلاعاتی بیرون میآید.
در هر صورت به نظر میرسد که دستیارهای هوش مصنوعی که سرعت بالایی دارند، همدلی بالایی ایجاد میکنند و در مورد چیزهای روتین اطلاعات مفصلی میدهند، به زودی دستیار پزشکان شوند.
اما در مورد جانشین شدن کامل پزشکان هنوز سالهای زیادی باقی مانده است. چت رباتها هنوز مانده که زبان محاورهای و بومی هر منطقه یا زبان بدن را به خوبی درک کنند. همچنین برای پزشک شدن نیاز به انواع حسگرها دارند.
این تحقیق در JAMA Internal Medicine منتشر شده.
البته باید چند نکته دیگر را نیز در نظر گرفت.
اول اینکه ربات یک ربات تخصصی نبوده و صرفا یک ربات آموزش داده شده با همه دانشهاست. قاعدتا اگر ربات صرفا آموزش داده شده با متون پزشکی را داشته باشیم احتمالا نتیجه بهتر است.
دوم اینکه این ربات ها نسخه های اولیه هستند قاعدتا وضعیت پاسخ دهی پزشکان تغییر چندانی نمی کند اما ربات به صورت تصاعدی وضعیت خروجی را در طی نسل های آینده بهتر خواهد کرد.
من انتظار داشتم هر دو در حدود ۵۰ درصد باشند اما نتیجه خیلی خوب بوده برای ربات. به هر حال بنده ترجیح می دهم نظر هر دو را داشته باشم. یا بهتراست گروهی از ربات ها زیر نظر یک پزشک کار کنند.
این را هم در نظر داشته باشید که نتیجه های آزمایش های بعد چندان قابل اعتنا نیستند زیر پزشک داور می داند که نسخه های بلند احتمالا مربوط به ربات است و اگر شرافت را نخواهد رعایت کند می تواند در نتیجه دخیل باشد. به عبارت دیگر برای داور پاسخ دهنده مخفی نیست و این قاعدتا در قضاوت او اثر می گذارد.