.

ْ«آلفازیرو»ی گوگل که به مکتب نرفته و تمرین‌نکرده، به غمزه‌ای مسئله‌آموز دار و دسته «استاک فیش» شد!

مجتبی م. -یکی از خواننده‌های خوب یک پزشک- لطف کرده‌اند و مقاله خوب زیر را نوشته‌اند و به ما هدیه کرده‌اند.


همان‌طور که احتمالاً می‌دانید رتبه‌بندی شطرنج‌بازان بر اساس امتیاز یا ریتینگ آن‌ها صورت می‌گیرد، که در هر تورنمنتی که شرکت کنند بردها این امتیاز رو زیاد و باخت‌ها این امتیاز رو کم میکنه. مساوی برابر بازیکن قوی‌تر امتیاز رو بالا می‌بره و برعکس.

در شطرنج هر برد، یک امتیاز و هر مساوی نیم امتیاز دارد، این امتیازها برای تعیین نفر اول در هر تورنمت استفاده شده و با ریتینگ متفاوت است.

قهرمان فعلی جهان مگنوس کارلسون نروژی است که سه سال پشت سر هم قهرمان جهان شده است. بالاترین ریتینگ کارلسون 2882 بوده در سال 2014.

بالا بردن ریتینگ کار سخت و طاقت‌فرسایی است و باختن به بازیکنان ریت پایین‌تر به شدت ریتینگ رو میکشه پایین، مثلا احسان قائم مقامی در مسابقات قهرمانی ایران 14 واحد از امتیازش کم شد و پرهام مقصود لو قهرمان شد. پیک ریتینگ قائم مقامی 2633 بوده مربوط به سال 2005.

برای استاد بزرگی امتیاز 2500 و برای ابر استاد بزرگی امتیاز 2700 نیاز است که در ایران تاکنون کسی به این امتیاز نرسیده.

خوب این از آدم‌ها، حالا بریم سراغ برنامه‌های کامپیوتری شطرنج‌باز که بهشون انجین یا موتور گفته می‌شود.


بهترین برنامه‌های کامپیوتری شطرنج فعلی جهان عبارت‌اند از:

استاک فیش، کومودو و هودینی

ریتینگ این انجین ها به ترتیب 3226 , 3224 و 3192 است

از رو امتیازها قطعاً متوجه شدید حتی قهرمان شطرنج جهان در مقابل انجین شانسی نداره. این انجین‌ها حتی با آوانس هم در برابر قهرمان شطرنج جهان پیروز خواهند شد. ناکامورا ( یکی از ده شطرنج باز برتر جهان با ریتینگ 2781) با کمک انجین ریبکا (3000 ) مقابل استاک فیش شکست خورد. (دو باخت و دو مساوی). البته ریبکای استفاده شده آخرین نسخه نبود.

این موتورها هم یک سری مسابقات دارند که در این مسابقات قوی‌ترین انجین در دو بخش فکری و رپید (شطرنج سریع) مشخص می‌شود.

یکی از این مسابقات TCEC  (http://tcec.chessdom.com) است که سال ۲۰۱۶ استاک فیش قهرمان شد.

( امسال هودینی در بخش فکری اول شد و بخش رپید هم اکنون در جریانه)

استاک فیش یه موتور اوپن سورس (متن باز)  است که ده سالی از عمرش می‌گذرد.

همه این مقدمات گفته شد تا برسیم به اتفاقی که در هفته پیش رخ داد، برای شرح این اتفاق لازم شد برگردیم به چند ماه قبل:

گوگل (یا به بیان بهتر آلفابت) الگوریتم هوش مصنوعی‌ای دارد که دارای قابلیت یادگیری است، یعنی اگه قوانین یک کاری مثلاً یک بازی رو بهش بدیم و بعد باهاش بازی کنیم هر بار که ببازد یاد می‌گیره که دفعه بعد اون جوری شکست نخوره.

چند ماه پیش گوگل به این برنامه هوش مصنوعی بازی GO رو یاد داده بود. GO یک بازی اصالتاً چینی است شبیه دوز با یک صفحه 19 در 19. برنامه هوش مصنوعی گوگل بعد از یادگرفتن اصول اولیه این بازی و تمرین با یک بازیکن حرفه‌ای GO موفق شد با نتیجه 4 به 1 قهرمان فعلی GO جهان یعنی لی سودول کره ای رو شکست دهد.

اما ربط این بخش دوم به بخش شطرنجی اول چیست؟

ربط این دو بخش این است که گوگل به این هوش مصنوعی قوانین شطرنج رو یاد داده و یک فرصت تمرینی چهارساعته برای این هوش مصنوعی در نظر گرفته شد تا برنامه مهارت‌های خودش در شطرنج رو تقویت کند، پس از این تمرین، برنامه هوش مصنوعی گوگل (در اینجا با نام آلفازیرو زیر بخش پروژه دیپ مایند) آماده مقابله با استاک فیش شد.

موتورهایی که اسم آن‌ها برده شد سالهاست که در حال بهبود می‌باشند و انواع گشایش‌ها و آخر بازی‌های مختلف براشون تعریف شده اما به آلفا زیرو فقط قوانین پایه‌ای آموزش داده شده و بعد تمرین کرده و بعد از هر شکست  قوی‌تر شده است. شبیه شخصیت کمیک بوکی Doomsday.

نتیجه پیکار آلفازیرو در برابر استاک فیش:

از 100 مسابقه، 72 مسابقه مساوی (پات) شده و 28 مسابقه دیگر را آلفا زیرو برده است. استاک فیش حتی در یک مسابقه هم نتوانسته آلفا زیرو رو شکست دهد! یعنی نتیجه شد 36 به 64.

جالب این که استاک فیش در tcec2017 حتی یک مسابقه را هم نباخت.

مورد بعدی اینکه آلفا زیرو در هر ثانیه 80.000 پوزیشن رو حساب و  استاک فیش 70.000.000 موقعیت رو حساب میکنن، اما انگار کمیت همه چیز نیست. آلفازیرو حین محاسبه موقعیت‌های مختلف این قابلیت رو داراست که لاین (مسیر) های ضعیف رو تشخیص بده و محاسبات مربوط به اون مسیرها رو حذف کند. این‌جوری در زمان کمتری می‌تونه بهترین حرکت رو پیدا کنه، چیزی شبیه الگوریتم فکر کردن انسان که جدا از بقیه چیزها احتمالاً الگوریتم فکر کردن انسان با توجه با سرعت پایین پردازش مغز «به‌صرفه‌ترین» الگوریتم هست.

مورد بعدی اینکه الگوریتم‌های کامپیوتری که البته تا این اندازه هوش مصنوعی توشون دخیل نبوده هزاران روش برای گشایش ( تو شطرنج بهش میگن گامبی) دارن و همین طور در مورد آخر بازی و بازی با پیاده‌ها در پایان بازی. انجین‌هایی مثل استاک فیش و کومودو  هر وقت یه نسخه جدید می‌دن معمولا ادعا میکنن 40 تا 50 واحد قوی‌تر شدن و مثلاً پایان بازی‌شون بهبود پیدا کرده. اما آلفا زیرو چون هیچ کدوم از اون کتابخانه‌ها رو نداره ( قطعا اگه بیشتر بازی کنه خودش اونا رو کشف می‌کنه و احتمالا بهترشون هم بکنه و لازم نیست ما مدام اونا رو بهش اضافه کنیم) بازی‌هاش برای یه شطرنج‌باز حرفه‌ای عجیبه چون خیلی با تئوری‌های ما سازگار نیست

مثلاً تو عکس زیر اسب سیاه رو با شاه میزنه!!

و بعد شاه رو همچون یک پیاده حرکت می‌ده و در پایان در یه همچین موقعیتی پیروز می‌شه (سفید آلفا زیرو است.)

یا هم‌نشینی شاه و وزیر در موقعیت جالب زیر

یا در موقعیت زیر

که دیگر انجین‌ها حرکت رخ به صورت زیر رو پیشنهاد می‌دن:

اما آلفا زیرو برای به دست آوردن موقعیت برتر در صفحه فارغ از ارزش فیل در قبال پیاده این حرکت رو انجام می‌ده

ده تا از بازی‌های آلفا زیرو رو در اینجا می‌تونید ببینید.


این‌گونه حرکات نه خیلی شبیه بازی آدم‌ها و نه شبیه بقیه موتورهای کامپیوتری است. گویا سبک سوم خاص و منحصر به فردی است مخصوص آلفا زیرو. (البته مسلماً انتظار هست جزئیات بیشتری از این بازی‌ها و شرایط انجام اون‌ها منتشر بشه. و اینکه هرکسی بتونه این بازی‌ها رو دوباره شبیه‌سازی کنه)

این گونه یادگیری و این بازی‌ها باز همون علامت سوال همیشگی خطرات هوش مصنوعی رو به ذهن متبادر میکنه. مثلا ایلان ماسک مدیر کمپانی تسلا و اسپیس ایکس گفته هوش مصنوعی از کره شمالی هم خطرناک‌تره! (جالبه تسلا خودش مدت‌هاست رو هوش مصنوعی و خودروهای خودران کار می‌کنه.)

به هرحال ترس ما (با دلیل یا بی‌دلیل) اینه که روزی بیاد که ما بمونیم و یک “هال ٩٠٠٠” که از بدشانسی محاسباتش نشون داده بقای بشر برای آینده حیات کره زمین خطرناکه و داره فکر میکنه و محاسبه می‌کنه چجوری باید نسل بشر رو منقرض کنه.


  این نوشته‌ها را هم بخوانید

11 دیدگاه

  1. عالی بود.
    البته فکر میکنم الون ماسک این حرفها رو از روی سیاستش میزنه وگرنه کمپانی های خودش استعداد خوبی در توسعه هوش مصنوعی دارند. به عبارتی داره میگه: شما درست نکنید، خودم باید درست کنم!

    1. با سلام
      ساسان عزیز فعلا فقط همین ده تا بازی منتشر شده. امیدواریم گوگل در آینده جزئیات بیشتری در مورد این بازیها منتشر کنه
      تو بازی های منتشر شده اکثر بازی های آلفا زیرو Queen’s Indian بوده و در مقابل Ruy Lopez از دفاع برلین استفاده کرده
      موفق باشید

  2. جمله آخر مقاله خیلی هوشمندانه و قشنگ بود
    هال 9000 همونی بود که تو فیلم اودیسه فضایی بود؟

  3. سلام لطفا یکی از بازی هایی که میگین استوک فیش “توسط بازیکنان انسان”شکست داده شده قرار بدید ( امیدوارم منظورتون بدون آوانس پیاده اسب و باشه وگرنه منم میتونم با استوک فیش مساوی کنم!) بعدشم این نسخه استوک فیش که آلفازیرو شکستش داده قدیمی ( نسخه ۸ ) هست الان من با جدیدترین نسخه های Development آنالیز میکنم به راحتی اشتباه های نسخه ۸ رو اصلاح میکنه و میتونه حرکت های “فضایی” آلفازیرو رو خودش انجام بده.
    پس گوگل، از بازی های تبلیغاتی با انجین های قدیمی دست بردار و با انجین های جدید خودتو امتحان کن خواهی دید که به اندازه ای که فکر میکنی قدرتمند نیستی!

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا
[wpcode id="260079"]