ْ«آلفازیرو»ی گوگل که به مکتب نرفته و تمرین‌نکرده، به غمزه‌ای مسئله‌آموز دار و دسته «استاک فیش» شد!

مجتبی م. -یکی از خواننده‌های خوب یک پزشک- لطف کرده‌اند و مقاله خوب زیر را نوشته‌اند و به ما هدیه کرده‌اند.


همان‌طور که احتمالاً می‌دانید رتبه‌بندی شطرنج‌بازان بر اساس امتیاز یا ریتینگ آن‌ها صورت می‌گیرد، که در هر تورنمنتی که شرکت کنند بردها این امتیاز رو زیاد و باخت‌ها این امتیاز رو کم میکنه. مساوی برابر بازیکن قوی‌تر امتیاز رو بالا می‌بره و برعکس.

در شطرنج هر برد، یک امتیاز و هر مساوی نیم امتیاز دارد، این امتیازها برای تعیین نفر اول در هر تورنمت استفاده شده و با ریتینگ متفاوت است.

قهرمان فعلی جهان مگنوس کارلسون نروژی است که سه سال پشت سر هم قهرمان جهان شده است. بالاترین ریتینگ کارلسون ۲۸۸۲ بوده در سال ۲۰۱۴.

بالا بردن ریتینگ کار سخت و طاقت‌فرسایی است و باختن به بازیکنان ریت پایین‌تر به شدت ریتینگ رو میکشه پایین، مثلا احسان قائم مقامی در مسابقات قهرمانی ایران ۱۴ واحد از امتیازش کم شد و پرهام مقصود لو قهرمان شد. پیک ریتینگ قائم مقامی ۲۶۳۳ بوده مربوط به سال ۲۰۰۵.

برای استاد بزرگی امتیاز ۲۵۰۰ و برای ابر استاد بزرگی امتیاز ۲۷۰۰ نیاز است که در ایران تاکنون کسی به این امتیاز نرسیده.

خوب این از آدم‌ها، حالا بریم سراغ برنامه‌های کامپیوتری شطرنج‌باز که بهشون انجین یا موتور گفته می‌شود.


بهترین برنامه‌های کامپیوتری شطرنج فعلی جهان عبارت‌اند از:

استاک فیش، کومودو و هودینی

ریتینگ این انجین ها به ترتیب ۳۲۲۶ , ۳۲۲۴ و ۳۱۹۲ است

از رو امتیازها قطعاً متوجه شدید حتی قهرمان شطرنج جهان در مقابل انجین شانسی نداره. این انجین‌ها حتی با آوانس هم در برابر قهرمان شطرنج جهان پیروز خواهند شد. ناکامورا ( یکی از ده شطرنج باز برتر جهان با ریتینگ ۲۷۸۱) با کمک انجین ریبکا (۳۰۰۰ ) مقابل استاک فیش شکست خورد. (دو باخت و دو مساوی). البته ریبکای استفاده شده آخرین نسخه نبود.

این موتورها هم یک سری مسابقات دارند که در این مسابقات قوی‌ترین انجین در دو بخش فکری و رپید (شطرنج سریع) مشخص می‌شود.

یکی از این مسابقات TCEC  (http://tcec.chessdom.com) است که سال ۲۰۱۶ استاک فیش قهرمان شد.

( امسال هودینی در بخش فکری اول شد و بخش رپید هم اکنون در جریانه)

استاک فیش یه موتور اوپن سورس (متن باز)  است که ده سالی از عمرش می‌گذرد.

همه این مقدمات گفته شد تا برسیم به اتفاقی که در هفته پیش رخ داد، برای شرح این اتفاق لازم شد برگردیم به چند ماه قبل:

گوگل (یا به بیان بهتر آلفابت) الگوریتم هوش مصنوعی‌ای دارد که دارای قابلیت یادگیری است، یعنی اگه قوانین یک کاری مثلاً یک بازی رو بهش بدیم و بعد باهاش بازی کنیم هر بار که ببازد یاد می‌گیره که دفعه بعد اون جوری شکست نخوره.

چند ماه پیش گوگل به این برنامه هوش مصنوعی بازی GO رو یاد داده بود. GO یک بازی اصالتاً چینی است شبیه دوز با یک صفحه ۱۹ در ۱۹. برنامه هوش مصنوعی گوگل بعد از یادگرفتن اصول اولیه این بازی و تمرین با یک بازیکن حرفه‌ای GO موفق شد با نتیجه ۴ به ۱ قهرمان فعلی GO جهان یعنی لی سودول کره ای رو شکست دهد.

اما ربط این بخش دوم به بخش شطرنجی اول چیست؟

ربط این دو بخش این است که گوگل به این هوش مصنوعی قوانین شطرنج رو یاد داده و یک فرصت تمرینی چهارساعته برای این هوش مصنوعی در نظر گرفته شد تا برنامه مهارت‌های خودش در شطرنج رو تقویت کند، پس از این تمرین، برنامه هوش مصنوعی گوگل (در اینجا با نام آلفازیرو زیر بخش پروژه دیپ مایند) آماده مقابله با استاک فیش شد.

موتورهایی که اسم آن‌ها برده شد سالهاست که در حال بهبود می‌باشند و انواع گشایش‌ها و آخر بازی‌های مختلف براشون تعریف شده اما به آلفا زیرو فقط قوانین پایه‌ای آموزش داده شده و بعد تمرین کرده و بعد از هر شکست  قوی‌تر شده است. شبیه شخصیت کمیک بوکی Doomsday.

نتیجه پیکار آلفازیرو در برابر استاک فیش:

از ۱۰۰ مسابقه، ۷۲ مسابقه مساوی (پات) شده و ۲۸ مسابقه دیگر را آلفا زیرو برده است. استاک فیش حتی در یک مسابقه هم نتوانسته آلفا زیرو رو شکست دهد! یعنی نتیجه شد ۳۶ به ۶۴.

جالب این که استاک فیش در tcec2017 حتی یک مسابقه را هم نباخت.

مورد بعدی اینکه آلفا زیرو در هر ثانیه ۸۰.۰۰۰ پوزیشن رو حساب و  استاک فیش ۷۰.۰۰۰.۰۰۰ موقعیت رو حساب میکنن، اما انگار کمیت همه چیز نیست. آلفازیرو حین محاسبه موقعیت‌های مختلف این قابلیت رو داراست که لاین (مسیر) های ضعیف رو تشخیص بده و محاسبات مربوط به اون مسیرها رو حذف کند. این‌جوری در زمان کمتری می‌تونه بهترین حرکت رو پیدا کنه، چیزی شبیه الگوریتم فکر کردن انسان که جدا از بقیه چیزها احتمالاً الگوریتم فکر کردن انسان با توجه با سرعت پایین پردازش مغز «به‌صرفه‌ترین» الگوریتم هست.

مورد بعدی اینکه الگوریتم‌های کامپیوتری که البته تا این اندازه هوش مصنوعی توشون دخیل نبوده هزاران روش برای گشایش ( تو شطرنج بهش میگن گامبی) دارن و همین طور در مورد آخر بازی و بازی با پیاده‌ها در پایان بازی. انجین‌هایی مثل استاک فیش و کومودو  هر وقت یه نسخه جدید می‌دن معمولا ادعا میکنن ۴۰ تا ۵۰ واحد قوی‌تر شدن و مثلاً پایان بازی‌شون بهبود پیدا کرده. اما آلفا زیرو چون هیچ کدوم از اون کتابخانه‌ها رو نداره ( قطعا اگه بیشتر بازی کنه خودش اونا رو کشف می‌کنه و احتمالا بهترشون هم بکنه و لازم نیست ما مدام اونا رو بهش اضافه کنیم) بازی‌هاش برای یه شطرنج‌باز حرفه‌ای عجیبه چون خیلی با تئوری‌های ما سازگار نیست

مثلاً تو عکس زیر اسب سیاه رو با شاه میزنه!!

و بعد شاه رو همچون یک پیاده حرکت می‌ده و در پایان در یه همچین موقعیتی پیروز می‌شه (سفید آلفا زیرو است.)

یا هم‌نشینی شاه و وزیر در موقعیت جالب زیر

یا در موقعیت زیر

که دیگر انجین‌ها حرکت رخ به صورت زیر رو پیشنهاد می‌دن:

اما آلفا زیرو برای به دست آوردن موقعیت برتر در صفحه فارغ از ارزش فیل در قبال پیاده این حرکت رو انجام می‌ده

ده تا از بازی‌های آلفا زیرو رو در اینجا می‌تونید ببینید.


این‌گونه حرکات نه خیلی شبیه بازی آدم‌ها و نه شبیه بقیه موتورهای کامپیوتری است. گویا سبک سوم خاص و منحصر به فردی است مخصوص آلفا زیرو. (البته مسلماً انتظار هست جزئیات بیشتری از این بازی‌ها و شرایط انجام اون‌ها منتشر بشه. و اینکه هرکسی بتونه این بازی‌ها رو دوباره شبیه‌سازی کنه)

این گونه یادگیری و این بازی‌ها باز همون علامت سوال همیشگی خطرات هوش مصنوعی رو به ذهن متبادر میکنه. مثلا ایلان ماسک مدیر کمپانی تسلا و اسپیس ایکس گفته هوش مصنوعی از کره شمالی هم خطرناک‌تره! (جالبه تسلا خودش مدت‌هاست رو هوش مصنوعی و خودروهای خودران کار می‌کنه.)

به هرحال ترس ما (با دلیل یا بی‌دلیل) اینه که روزی بیاد که ما بمونیم و یک “هال ٩٠٠٠” که از بدشانسی محاسباتش نشون داده بقای بشر برای آینده حیات کره زمین خطرناکه و داره فکر میکنه و محاسبه می‌کنه چجوری باید نسل بشر رو منقرض کنه.

نظرات

  1. با سلام
    تشکر بابت پرداختن به شطرنج. موضوع جالبی بود
    ممنون

  2. ممنون از این خواننده. جالب بود

  3. واقعا عالی بود خیلی پر بار بود مطالب

  4. جالب بود ممنون

  5. عالی بود.
    البته فکر میکنم الون ماسک این حرفها رو از روی سیاستش میزنه وگرنه کمپانی های خودش استعداد خوبی در توسعه هوش مصنوعی دارند. به عبارتی داره میگه: شما درست نکنید، خودم باید درست کنم!

  6. سلام-امکانش هست همه بازیهای آلفازیرو را برای دانلود قرار دهید؟با تشکر

    • با سلام
      ساسان عزیز فعلا فقط همین ده تا بازی منتشر شده. امیدواریم گوگل در آینده جزئیات بیشتری در مورد این بازیها منتشر کنه
      تو بازی های منتشر شده اکثر بازی های آلفا زیرو Queen’s Indian بوده و در مقابل Ruy Lopez از دفاع برلین استفاده کرده
      موفق باشید

  7. جمله آخر مقاله خیلی هوشمندانه و قشنگ بود
    هال ۹۰۰۰ همونی بود که تو فیلم اودیسه فضایی بود؟

  8. سلام….استاک فیش چندین بار توسط،بازیکنان انسان شکست داده شده…صرفا جهت اطلاع

  9. سلام لطفا یکی از بازی هایی که میگین استوک فیش “توسط بازیکنان انسان”شکست داده شده قرار بدید ( امیدوارم منظورتون بدون آوانس پیاده اسب و باشه وگرنه منم میتونم با استوک فیش مساوی کنم!) بعدشم این نسخه استوک فیش که آلفازیرو شکستش داده قدیمی ( نسخه ۸ ) هست الان من با جدیدترین نسخه های Development آنالیز میکنم به راحتی اشتباه های نسخه ۸ رو اصلاح میکنه و میتونه حرکت های “فضایی” آلفازیرو رو خودش انجام بده.
    پس گوگل، از بازی های تبلیغاتی با انجین های قدیمی دست بردار و با انجین های جدید خودتو امتحان کن خواهی دید که به اندازه ای که فکر میکنی قدرتمند نیستی!

دیدگاه خود را با ما اشتراک بگذارید:

ایمیل شما نزد ما محفوظ است و از آن تنها برای پاسخگویی احتمالی استفاده می‌شود و در سایت درج نخواهد شد.
نوشتن نام و ایمیل ضروری است. اما لازم نیست که کادر نشانی وب‌سایت پر شود.
لطفا تنها در مورد همین نوشته اظهار نظر بفرمایید و اگر درخواست و فرمایش دیگری دارید، از طریق فرم تماس مطرح کنید.