ْ«آلفازیرو»ی گوگل که به مکتب نرفته و تمریننکرده، به غمزهای مسئلهآموز دار و دسته «استاک فیش» شد!

مجتبی م. -یکی از خوانندههای خوب یک پزشک- لطف کردهاند و مقاله خوب زیر را نوشتهاند و به ما هدیه کردهاند.
همانطور که احتمالاً میدانید رتبهبندی شطرنجبازان بر اساس امتیاز یا ریتینگ آنها صورت میگیرد، که در هر تورنمنتی که شرکت کنند بردها این امتیاز رو زیاد و باختها این امتیاز رو کم میکنه. مساوی برابر بازیکن قویتر امتیاز رو بالا میبره و برعکس.
در شطرنج هر برد، یک امتیاز و هر مساوی نیم امتیاز دارد، این امتیازها برای تعیین نفر اول در هر تورنمت استفاده شده و با ریتینگ متفاوت است.
قهرمان فعلی جهان مگنوس کارلسون نروژی است که سه سال پشت سر هم قهرمان جهان شده است. بالاترین ریتینگ کارلسون 2882 بوده در سال 2014.
بالا بردن ریتینگ کار سخت و طاقتفرسایی است و باختن به بازیکنان ریت پایینتر به شدت ریتینگ رو میکشه پایین، مثلا احسان قائم مقامی در مسابقات قهرمانی ایران 14 واحد از امتیازش کم شد و پرهام مقصود لو قهرمان شد. پیک ریتینگ قائم مقامی 2633 بوده مربوط به سال 2005.
برای استاد بزرگی امتیاز 2500 و برای ابر استاد بزرگی امتیاز 2700 نیاز است که در ایران تاکنون کسی به این امتیاز نرسیده.
خوب این از آدمها، حالا بریم سراغ برنامههای کامپیوتری شطرنجباز که بهشون انجین یا موتور گفته میشود.
بهترین برنامههای کامپیوتری شطرنج فعلی جهان عبارتاند از:
استاک فیش، کومودو و هودینی
ریتینگ این انجین ها به ترتیب 3226 , 3224 و 3192 است
از رو امتیازها قطعاً متوجه شدید حتی قهرمان شطرنج جهان در مقابل انجین شانسی نداره. این انجینها حتی با آوانس هم در برابر قهرمان شطرنج جهان پیروز خواهند شد. ناکامورا ( یکی از ده شطرنج باز برتر جهان با ریتینگ 2781) با کمک انجین ریبکا (3000 ) مقابل استاک فیش شکست خورد. (دو باخت و دو مساوی). البته ریبکای استفاده شده آخرین نسخه نبود.
این موتورها هم یک سری مسابقات دارند که در این مسابقات قویترین انجین در دو بخش فکری و رپید (شطرنج سریع) مشخص میشود.
یکی از این مسابقات TCEC (http://tcec.chessdom.com) است که سال ۲۰۱۶ استاک فیش قهرمان شد.
( امسال هودینی در بخش فکری اول شد و بخش رپید هم اکنون در جریانه)
استاک فیش یه موتور اوپن سورس (متن باز) است که ده سالی از عمرش میگذرد.
همه این مقدمات گفته شد تا برسیم به اتفاقی که در هفته پیش رخ داد، برای شرح این اتفاق لازم شد برگردیم به چند ماه قبل:
گوگل (یا به بیان بهتر آلفابت) الگوریتم هوش مصنوعیای دارد که دارای قابلیت یادگیری است، یعنی اگه قوانین یک کاری مثلاً یک بازی رو بهش بدیم و بعد باهاش بازی کنیم هر بار که ببازد یاد میگیره که دفعه بعد اون جوری شکست نخوره.
چند ماه پیش گوگل به این برنامه هوش مصنوعی بازی GO رو یاد داده بود. GO یک بازی اصالتاً چینی است شبیه دوز با یک صفحه 19 در 19. برنامه هوش مصنوعی گوگل بعد از یادگرفتن اصول اولیه این بازی و تمرین با یک بازیکن حرفهای GO موفق شد با نتیجه 4 به 1 قهرمان فعلی GO جهان یعنی لی سودول کره ای رو شکست دهد.
اما ربط این بخش دوم به بخش شطرنجی اول چیست؟
ربط این دو بخش این است که گوگل به این هوش مصنوعی قوانین شطرنج رو یاد داده و یک فرصت تمرینی چهارساعته برای این هوش مصنوعی در نظر گرفته شد تا برنامه مهارتهای خودش در شطرنج رو تقویت کند، پس از این تمرین، برنامه هوش مصنوعی گوگل (در اینجا با نام آلفازیرو زیر بخش پروژه دیپ مایند) آماده مقابله با استاک فیش شد.
موتورهایی که اسم آنها برده شد سالهاست که در حال بهبود میباشند و انواع گشایشها و آخر بازیهای مختلف براشون تعریف شده اما به آلفا زیرو فقط قوانین پایهای آموزش داده شده و بعد تمرین کرده و بعد از هر شکست قویتر شده است. شبیه شخصیت کمیک بوکی Doomsday.
نتیجه پیکار آلفازیرو در برابر استاک فیش:
از 100 مسابقه، 72 مسابقه مساوی (پات) شده و 28 مسابقه دیگر را آلفا زیرو برده است. استاک فیش حتی در یک مسابقه هم نتوانسته آلفا زیرو رو شکست دهد! یعنی نتیجه شد 36 به 64.
جالب این که استاک فیش در tcec2017 حتی یک مسابقه را هم نباخت.
مورد بعدی اینکه آلفا زیرو در هر ثانیه 80.000 پوزیشن رو حساب و استاک فیش 70.000.000 موقعیت رو حساب میکنن، اما انگار کمیت همه چیز نیست. آلفازیرو حین محاسبه موقعیتهای مختلف این قابلیت رو داراست که لاین (مسیر) های ضعیف رو تشخیص بده و محاسبات مربوط به اون مسیرها رو حذف کند. اینجوری در زمان کمتری میتونه بهترین حرکت رو پیدا کنه، چیزی شبیه الگوریتم فکر کردن انسان که جدا از بقیه چیزها احتمالاً الگوریتم فکر کردن انسان با توجه با سرعت پایین پردازش مغز «بهصرفهترین» الگوریتم هست.
مورد بعدی اینکه الگوریتمهای کامپیوتری که البته تا این اندازه هوش مصنوعی توشون دخیل نبوده هزاران روش برای گشایش ( تو شطرنج بهش میگن گامبی) دارن و همین طور در مورد آخر بازی و بازی با پیادهها در پایان بازی. انجینهایی مثل استاک فیش و کومودو هر وقت یه نسخه جدید میدن معمولا ادعا میکنن 40 تا 50 واحد قویتر شدن و مثلاً پایان بازیشون بهبود پیدا کرده. اما آلفا زیرو چون هیچ کدوم از اون کتابخانهها رو نداره ( قطعا اگه بیشتر بازی کنه خودش اونا رو کشف میکنه و احتمالا بهترشون هم بکنه و لازم نیست ما مدام اونا رو بهش اضافه کنیم) بازیهاش برای یه شطرنجباز حرفهای عجیبه چون خیلی با تئوریهای ما سازگار نیست
مثلاً تو عکس زیر اسب سیاه رو با شاه میزنه!!
و بعد شاه رو همچون یک پیاده حرکت میده و در پایان در یه همچین موقعیتی پیروز میشه (سفید آلفا زیرو است.)
یا همنشینی شاه و وزیر در موقعیت جالب زیر
یا در موقعیت زیر
که دیگر انجینها حرکت رخ به صورت زیر رو پیشنهاد میدن:
اما آلفا زیرو برای به دست آوردن موقعیت برتر در صفحه فارغ از ارزش فیل در قبال پیاده این حرکت رو انجام میده
ده تا از بازیهای آلفا زیرو رو در اینجا میتونید ببینید.
اینگونه حرکات نه خیلی شبیه بازی آدمها و نه شبیه بقیه موتورهای کامپیوتری است. گویا سبک سوم خاص و منحصر به فردی است مخصوص آلفا زیرو. (البته مسلماً انتظار هست جزئیات بیشتری از این بازیها و شرایط انجام اونها منتشر بشه. و اینکه هرکسی بتونه این بازیها رو دوباره شبیهسازی کنه)
این گونه یادگیری و این بازیها باز همون علامت سوال همیشگی خطرات هوش مصنوعی رو به ذهن متبادر میکنه. مثلا ایلان ماسک مدیر کمپانی تسلا و اسپیس ایکس گفته هوش مصنوعی از کره شمالی هم خطرناکتره! (جالبه تسلا خودش مدتهاست رو هوش مصنوعی و خودروهای خودران کار میکنه.)
به هرحال ترس ما (با دلیل یا بیدلیل) اینه که روزی بیاد که ما بمونیم و یک “هال ٩٠٠٠” که از بدشانسی محاسباتش نشون داده بقای بشر برای آینده حیات کره زمین خطرناکه و داره فکر میکنه و محاسبه میکنه چجوری باید نسل بشر رو منقرض کنه.
این نوشتهها را هم بخوانید
با سلام
تشکر بابت پرداختن به شطرنج. موضوع جالبی بود
ممنون
ممنون از این خواننده. جالب بود
واقعا عالی بود خیلی پر بار بود مطالب
جالب بود ممنون
عالی بود.
البته فکر میکنم الون ماسک این حرفها رو از روی سیاستش میزنه وگرنه کمپانی های خودش استعداد خوبی در توسعه هوش مصنوعی دارند. به عبارتی داره میگه: شما درست نکنید، خودم باید درست کنم!
سلام-امکانش هست همه بازیهای آلفازیرو را برای دانلود قرار دهید؟با تشکر
با سلام
ساسان عزیز فعلا فقط همین ده تا بازی منتشر شده. امیدواریم گوگل در آینده جزئیات بیشتری در مورد این بازیها منتشر کنه
تو بازی های منتشر شده اکثر بازی های آلفا زیرو Queen’s Indian بوده و در مقابل Ruy Lopez از دفاع برلین استفاده کرده
موفق باشید
جمله آخر مقاله خیلی هوشمندانه و قشنگ بود
هال 9000 همونی بود که تو فیلم اودیسه فضایی بود؟
سلام….استاک فیش چندین بار توسط،بازیکنان انسان شکست داده شده…صرفا جهت اطلاع
سلام لطفا یکی از بازی هایی که میگین استوک فیش “توسط بازیکنان انسان”شکست داده شده قرار بدید ( امیدوارم منظورتون بدون آوانس پیاده اسب و باشه وگرنه منم میتونم با استوک فیش مساوی کنم!) بعدشم این نسخه استوک فیش که آلفازیرو شکستش داده قدیمی ( نسخه ۸ ) هست الان من با جدیدترین نسخه های Development آنالیز میکنم به راحتی اشتباه های نسخه ۸ رو اصلاح میکنه و میتونه حرکت های “فضایی” آلفازیرو رو خودش انجام بده.
پس گوگل، از بازی های تبلیغاتی با انجین های قدیمی دست بردار و با انجین های جدید خودتو امتحان کن خواهی دید که به اندازه ای که فکر میکنی قدرتمند نیستی!
عالی بود .