ْ«آلفازیرو»ی گوگل که به مکتب نرفته و تمرین‌نکرده، به غمزه‌ای مسئله‌آموز دار و دسته «استاک فیش» شد!

نوشته: علیرضا مجیدی به روز رسانی شده در آذر 27, 1396

مجتبی م. -یکی از خواننده‌های خوب یک پزشک- لطف کرده‌اند و مقاله خوب زیر را نوشته‌اند و به ما هدیه کرده‌اند.

همان‌طور که احتمالاً می‌دانید رتبه‌بندی شطرنج‌بازان بر اساس امتیاز یا ریتینگ آن‌ها صورت می‌گیرد، که در هر تورنمنتی که شرکت کنند بردها این امتیاز رو زیاد و باخت‌ها این امتیاز رو کم میکنه. مساوی برابر بازیکن قوی‌تر امتیاز رو بالا می‌بره و برعکس.

در شطرنج هر برد، یک امتیاز و هر مساوی نیم امتیاز دارد، این امتیازها برای تعیین نفر اول در هر تورنمت استفاده شده و با ریتینگ متفاوت است.

قهرمان فعلی جهان مگنوس کارلسون نروژی است که سه سال پشت سر هم قهرمان جهان شده است. بالاترین ریتینگ کارلسون 2882 بوده در سال 2014.

بالا بردن ریتینگ کار سخت و طاقت‌فرسایی است و باختن به بازیکنان ریت پایین‌تر به شدت ریتینگ رو میکشه پایین، مثلا احسان قائم مقامی در مسابقات قهرمانی ایران 14 واحد از امتیازش کم شد و پرهام مقصود لو قهرمان شد. پیک ریتینگ قائم مقامی 2633 بوده مربوط به سال 2005.

ویزای مولتی آلمان

برای استاد بزرگی امتیاز 2500 و برای ابر استاد بزرگی امتیاز 2700 نیاز است که در ایران تاکنون کسی به این امتیاز نرسیده.

خوب این از آدم‌ها، حالا بریم سراغ برنامه‌های کامپیوتری شطرنج‌باز که بهشون انجین یا موتور گفته می‌شود.

بهترین برنامه‌های کامپیوتری شطرنج فعلی جهان عبارت‌اند از:

استاک فیش، کومودو و هودینی

ریتینگ این انجین ها به ترتیب 3226 , 3224 و 3192 است

از رو امتیازها قطعاً متوجه شدید حتی قهرمان شطرنج جهان در مقابل انجین شانسی نداره. این انجین‌ها حتی با آوانس هم در برابر قهرمان شطرنج جهان پیروز خواهند شد. ناکامورا ( یکی از ده شطرنج باز برتر جهان با ریتینگ 2781) با کمک انجین ریبکا (3000 ) مقابل استاک فیش شکست خورد. (دو باخت و دو مساوی). البته ریبکای استفاده شده آخرین نسخه نبود.

این موتورها هم یک سری مسابقات دارند که در این مسابقات قوی‌ترین انجین در دو بخش فکری و رپید (شطرنج سریع) مشخص می‌شود.

یکی از این مسابقات TCEC (http://tcec.chessdom.com) است که سال ۲۰۱۶ استاک فیش قهرمان شد.

( امسال هودینی در بخش فکری اول شد و بخش رپید هم اکنون در جریانه)

استاک فیش یه موتور اوپن سورس (متن باز) است که ده سالی از عمرش می‌گذرد.

همه این مقدمات گفته شد تا برسیم به اتفاقی که در هفته پیش رخ داد، برای شرح این اتفاق لازم شد برگردیم به چند ماه قبل:

گوگل (یا به بیان بهتر آلفابت) الگوریتم هوش مصنوعی‌ای دارد که دارای قابلیت یادگیری است، یعنی اگه قوانین یک کاری مثلاً یک بازی رو بهش بدیم و بعد باهاش بازی کنیم هر بار که ببازد یاد می‌گیره که دفعه بعد اون جوری شکست نخوره.

چند ماه پیش گوگل به این برنامه هوش مصنوعی بازی GO رو یاد داده بود. GO یک بازی اصالتاً چینی است شبیه دوز با یک صفحه 19 در 19. برنامه هوش مصنوعی گوگل بعد از یادگرفتن اصول اولیه این بازی و تمرین با یک بازیکن حرفه‌ای GO موفق شد با نتیجه 4 به 1 قهرمان فعلی GO جهان یعنی لی سودول کره ای رو شکست دهد.

اما ربط این بخش دوم به بخش شطرنجی اول چیست؟

ربط این دو بخش این است که گوگل به این هوش مصنوعی قوانین شطرنج رو یاد داده و یک فرصت تمرینی چهارساعته برای این هوش مصنوعی در نظر گرفته شد تا برنامه مهارت‌های خودش در شطرنج رو تقویت کند، پس از این تمرین، برنامه هوش مصنوعی گوگل (در اینجا با نام آلفازیرو زیر بخش پروژه دیپ مایند) آماده مقابله با استاک فیش شد.

موتورهایی که اسم آن‌ها برده شد سالهاست که در حال بهبود می‌باشند و انواع گشایش‌ها و آخر بازی‌های مختلف براشون تعریف شده اما به آلفا زیرو فقط قوانین پایه‌ای آموزش داده شده و بعد تمرین کرده و بعد از هر شکست قوی‌تر شده است. شبیه شخصیت کمیک بوکی Doomsday.

نتیجه پیکار آلفازیرو در برابر استاک فیش:

از 100 مسابقه، 72 مسابقه مساوی (پات) شده و 28 مسابقه دیگر را آلفا زیرو برده است. استاک فیش حتی در یک مسابقه هم نتوانسته آلفا زیرو رو شکست دهد! یعنی نتیجه شد 36 به 64.

جالب این که استاک فیش در tcec2017 حتی یک مسابقه را هم نباخت.

مورد بعدی اینکه آلفا زیرو در هر ثانیه 80.000 پوزیشن رو حساب و استاک فیش 70.000.000 موقعیت رو حساب میکنن، اما انگار کمیت همه چیز نیست. آلفازیرو حین محاسبه موقعیت‌های مختلف این قابلیت رو داراست که لاین (مسیر) های ضعیف رو تشخیص بده و محاسبات مربوط به اون مسیرها رو حذف کند. این‌جوری در زمان کمتری می‌تونه بهترین حرکت رو پیدا کنه، چیزی شبیه الگوریتم فکر کردن انسان که جدا از بقیه چیزها احتمالاً الگوریتم فکر کردن انسان با توجه با سرعت پایین پردازش مغز «به‌صرفه‌ترین» الگوریتم هست.

مورد بعدی اینکه الگوریتم‌های کامپیوتری که البته تا این اندازه هوش مصنوعی توشون دخیل نبوده هزاران روش برای گشایش ( تو شطرنج بهش میگن گامبی) دارن و همین طور در مورد آخر بازی و بازی با پیاده‌ها در پایان بازی. انجین‌هایی مثل استاک فیش و کومودو هر وقت یه نسخه جدید می‌دن معمولا ادعا میکنن 40 تا 50 واحد قوی‌تر شدن و مثلاً پایان بازی‌شون بهبود پیدا کرده. اما آلفا زیرو چون هیچ کدوم از اون کتابخانه‌ها رو نداره ( قطعا اگه بیشتر بازی کنه خودش اونا رو کشف می‌کنه و احتمالا بهترشون هم بکنه و لازم نیست ما مدام اونا رو بهش اضافه کنیم) بازی‌هاش برای یه شطرنج‌باز حرفه‌ای عجیبه چون خیلی با تئوری‌های ما سازگار نیست

مثلاً تو عکس زیر اسب سیاه رو با شاه میزنه!!

و بعد شاه رو همچون یک پیاده حرکت می‌ده و در پایان در یه همچین موقعیتی پیروز می‌شه (سفید آلفا زیرو است.)

یا هم‌نشینی شاه و وزیر در موقعیت جالب زیر

یا در موقعیت زیر

که دیگر انجین‌ها حرکت رخ به صورت زیر رو پیشنهاد می‌دن:

اما آلفا زیرو برای به دست آوردن موقعیت برتر در صفحه فارغ از ارزش فیل در قبال پیاده این حرکت رو انجام می‌ده

ده تا از بازی‌های آلفا زیرو رو در اینجا می‌تونید ببینید.

این‌گونه حرکات نه خیلی شبیه بازی آدم‌ها و نه شبیه بقیه موتورهای کامپیوتری است. گویا سبک سوم خاص و منحصر به فردی است مخصوص آلفا زیرو. (البته مسلماً انتظار هست جزئیات بیشتری از این بازی‌ها و شرایط انجام اون‌ها منتشر بشه. و اینکه هرکسی بتونه این بازی‌ها رو دوباره شبیه‌سازی کنه)

این گونه یادگیری و این بازی‌ها باز همون علامت سوال همیشگی خطرات هوش مصنوعی رو به ذهن متبادر میکنه. مثلا ایلان ماسک مدیر کمپانی تسلا و اسپیس ایکس گفته هوش مصنوعی از کره شمالی هم خطرناک‌تره! (جالبه تسلا خودش مدت‌هاست رو هوش مصنوعی و خودروهای خودران کار می‌کنه.)

به هرحال ترس ما (با دلیل یا بی‌دلیل) اینه که روزی بیاد که ما بمونیم و یک “هال ٩٠٠٠” که از بدشانسی محاسباتش نشون داده بقای بشر برای آینده حیات کره زمین خطرناکه و داره فکر میکنه و محاسبه می‌کنه چجوری باید نسل بشر رو منقرض کنه.

اگر خواننده جدید سایت «یک پزشک» هستید!

شما در حال خواندن سایت یک پزشک (یک پزشک دات کام) به نشانی اینترنتی www.1pezeshk.com‌ هستید. سایتی با 18 سال سابقه که برخلاف اسمش سرشار از مطالب متنوع است!

ما را رها نکنید. بسیار ممنون می‌شویم اگر:

- سایت یک پزشک رو در مرورگر خود بوک‌مارک کنید.

-مشترک فید یا RSS یک پزشک شوید.

- شبکه‌های اجتماعی ما را دنبال کنید: صفحه تلگرام - صفحه اینستاگرام ما

- برای سفارش تبلیغات ایمیل alirezamajidi در جی میل یا تلگرام تماس بگیرید.

11 نظرات

مینا می گوید 6 سال پیش
با سلام
تشکر بابت پرداختن به شطرنج. موضوع جالبی بود
ممنون
پاسخ
یه بنده خدا می گوید 6 سال پیش
ممنون از این خواننده. جالب بود
پاسخ
نرگس انبیایی می گوید 6 سال پیش
واقعا عالی بود خیلی پر بار بود مطالب
پاسخ
Aydin می گوید 6 سال پیش
جالب بود ممنون
پاسخ
فرشاد می گوید 6 سال پیش
عالی بود.
البته فکر میکنم الون ماسک این حرفها رو از روی سیاستش میزنه وگرنه کمپانی های خودش استعداد خوبی در توسعه هوش مصنوعی دارند. به عبارتی داره میگه: شما درست نکنید، خودم باید درست کنم!
پاسخ
ساسان می گوید 6 سال پیش
سلام-امکانش هست همه بازیهای آلفازیرو را برای دانلود قرار دهید؟با تشکر
پاسخ
1. مجتبی.م می گوید 6 سال پیش
  با سلام
  ساسان عزیز فعلا فقط همین ده تا بازی منتشر شده. امیدواریم گوگل در آینده جزئیات بیشتری در مورد این بازیها منتشر کنه
  تو بازی های منتشر شده اکثر بازی های آلفا زیرو Queen’s Indian بوده و در مقابل Ruy Lopez از دفاع برلین استفاده کرده
  موفق باشید
  پاسخ
امید بهرامی می گوید 6 سال پیش
جمله آخر مقاله خیلی هوشمندانه و قشنگ بود
هال 9000 همونی بود که تو فیلم اودیسه فضایی بود؟
پاسخ
mehdad می گوید 6 سال پیش
سلام….استاک فیش چندین بار توسط،بازیکنان انسان شکست داده شده…صرفا جهت اطلاع
پاسخ
SF Team می گوید 6 سال پیش
سلام لطفا یکی از بازی هایی که میگین استوک فیش “توسط بازیکنان انسان”شکست داده شده قرار بدید ( امیدوارم منظورتون بدون آوانس پیاده اسب و باشه وگرنه منم میتونم با استوک فیش مساوی کنم!) بعدشم این نسخه استوک فیش که آلفازیرو شکستش داده قدیمی ( نسخه ۸ ) هست الان من با جدیدترین نسخه های Development آنالیز میکنم به راحتی اشتباه های نسخه ۸ رو اصلاح میکنه و میتونه حرکت های “فضایی” آلفازیرو رو خودش انجام بده.
پس گوگل، از بازی های تبلیغاتی با انجین های قدیمی دست بردار و با انجین های جدید خودتو امتحان کن خواهی دید که به اندازه ای که فکر میکنی قدرتمند نیستی!
پاسخ
M.M می گوید 5 سال پیش
عالی بود .
پاسخ

ارسال یک پاسخ

ْ«آلفازیرو»ی گوگل که به مکتب نرفته و تمرین‌نکرده، به غمزه‌ای مسئله‌آموز دار و دسته «استاک فیش» شد!

ویزای مولتی آلمان

نتیجه پیکار آلفازیرو در برابر استاک فیش:

اگر خواننده جدید سایت «یک پزشک» هستید!

شما در حال خواندن سایت یک پزشک (یک پزشک دات کام) به نشانی اینترنتی www.1pezeshk.com‌ هستید. سایتی با 18 سال سابقه که برخلاف اسمش سرشار از مطالب متنوع است!

ما را رها نکنید. بسیار ممنون می‌شویم اگر:

- سایت یک پزشک رو در مرورگر خود بوک‌مارک کنید.

-مشترک فید یا RSS یک پزشک شوید.

- شبکه‌های اجتماعی ما را دنبال کنید: صفحه تلگرام - صفحه اینستاگرام ما

- برای سفارش تبلیغات ایمیل alirezamajidi در جی میل یا تلگرام تماس بگیرید.

و دیگر مطالب ما را بخوانید. مثلا:

نوستالژی: سیر در لوازم التحریر قدیمی

تبدیل شخصیت‌های انیمیشن‌های و کارتون‌ها به نمونه‌های انسانی شبیه به آنها

آخرین «نمونه» مقاوم – هر یک از اینها، آخرین چیزهای سالم به جا مانده در طول تاریخ هستند

خودکشی دسته جمعی در دمین آلمان در پایان جنگ جهانی دوم

و باز هم قسمت دیگری از عکس‌های کمتر دیده شده تاریخی – گالری عکس

طراحی‌ها و معماری‌های نبوغ‌آمیز و عالی که باید تحسین‌شان کرد