دانش نهفته در پس الگوریتم‌های نت‌فلیکس

5

به علت سرعت پایین اینترنت و همچنین دشواری‌های پرداخت آنلاین در ایران کمتر کسی است که از «نت‌فلیکس» Netflix استفاده کند. این شرکت زمانی بیشتر به خاطر توزیع DVD مشهور بود، اما مدتهاست که ما نتفلیکس را به عنوان برترین شرکت پخش جاری و آنلاین فیلم‌ها و شوها و سریال‌های تلویزیونی می‌شناسیم.

اما برای فروش بیشتر و جلب مشترک بیشتر، این شرکت باید می‌توانست راهی برای کشف ذائقه مشتریان خود پیدا کند. به این صورت که خیلی سریع پیشنهادهایی دقیق به کسی که برنامه‌ها را خریده و پسندیده بکند و مثلا به او بگوید اگر از سریال «بیگ بنگ تئوری» خوشش آمده، احتمالا این سریال‌ها هم را دوست خواهد داشت و یا اگر فیلم «زندگی دیگران» را دوست دارد، بد نیست، این فیلم‌ها را ببیند.

در یک مقیاس ساده، کار خیلی آسان به نظر می‌رسد و مثلا صاحب یک سایت دانلود، می‌تواند خیلی راحت سه چهار اثر مشابه هر فیلم یا سریال را پیشنهاد کند، ما وقتی پای هزاران برنامه در میان باشد، این سیستم ساده پیشنهاد کارایی نخواهد داشت.

ما در این پست با سیستم پیشنهاد نت‌فلیکس آشنا می‌شویم.

در «یک پزشک» پیش از این در قالب پستی پیش از این از زاویه دید متفاوتی به الگوریتم‌های پیشنهاد نگاه کرده بودیم و نوشته بودیم که علیرغم ناگزیر بودن استفاده از این الگوریتم‌ها، اتکای صرف به آنها چه خطراتی در بر دارد.

اما در این پست ما می‌خواهیم ببینیم که واقعا سیستم پیشنهاد نت‌فلکیس چطور کار می‌کند، آیا بر ارزشیابی مشتری‌های نت‌فلیکس تکیه دارد یا سیستمی به کلی متفاوت است.


 اگر شما از نخستین فیلم Star Trek محصول 1960 خوشتان آمده باشد، اولین فیلمی که از سوی نت‌فلیکس به شما پیشنهاد می‌شود (البته بعد از تمام نسخه‌های دارای کلمه Trek) سری فیلم‌های ماموریت غیرممکن است. تماشای آخرین قسمت Doctor Who احتمالا شما را به سوی مشاهده درام تلویزیونی Being Human (نسخه بریتانیایی) سوق خواهد داد. فیلم‌های 300 و From Dusk to Dawn را ببینید و ردیف جدیدی در صفحه خانگی شما برای فیلم‌های اکشن و خشن و ماجرایی باز خواهد شد. تلاش برای درک آرایه نامرئی الگوریتم‌هایی که پیشنهادهای نت‌فلیکس را تولید می‌کنند، فعالیت جالبی است. به نظر شما واقعا در آن دنیای مملو از اطلاعات و حجم عظیم داده‌ها (که امروزه اسم دهان پرکن Big Data را با خود یدک می‌کشد) و در میان آن میلیاردها میلیارد ستاره‌ای که برای رتبه‌بندی فیلم‌های مختلف مورد استفاده قرار می‌گیرند، چه فرآیندهایی در حال انجام هستند؟

مشخص شده است که ۸۰۰ مهندس در پشت پرده نت‌فلیکس و در دفتر مرکزی آن در دره سیلیکون مشغول به کار هستند. این شرکت ادعا کرده است که ۷۵ درصد فعالیت کاربران توسط پیشنهادهای سایت هدایت می‌شود. در مارس امسال این شرکت چهار میلیاردمین DVDاش را ارسال کرد، اما در سه ماهه اول سال 2013 به تنهایی ۴ میلیارد ساعت ویدیو از این سایت استریم شده است.

netflix-DVD

کارلوس گومز-اوریبه (Carlos Gomez-Uribe) نایب رییس نوآوری در محصولات و الگوریتم‌های شخصی‌سازی نت‌فلیکس است. او به همراه خاویر آماتریاین (Xavier Amatriain) که مدیر مهندسی نت‌فلیکس است، نیروهای محرکه سیستم پیشنهاددهی نت‌فلیکس هستند. وایرد مصاحبه‌ای را با آن‌ها ترتیب داده است که شرح آن را در ادامه خواهید دید.

NetFlix-Dynamos


وایرد: خب واقعا چه چیزی در زیر این پیشنهادهای Star Trek – Mission: Impossible مشغول فعالیت است؟

کارلوس گومز: با نگاه کردن به فراداده‌ها (metadata) می‌توانید مشابهت‌های زیادی را بین ویدیوها بیابید. آیا در بازه‌های زمانی نزدیک به هم ساخته شده‌اند؟ آیا امتیازهای مشابهی از کاربران دریافت کرده‌اند؟ شما می‌توانید به رفتار کاربران مانند مرور ویدیوها، پخش آن‌ها و جست‌وجوها نگاه کنید. گاهی تعریف شباهت به موضوع صحبت بستگی پیدا می‌کند. اگر کارگردانی مانند پدرو آلمودوار (Pedro Almodóvar) را در نظر بگیرید، به چهار فیلم کاملا متفاوت می‌رسید. اما خود پدرو آلمودوار آن‌قدر مهم است که خودش به تنهایی هر چهار فیلم را مشابه هم می‌کند. اما در مورد کارگزدانی مانند اسپیلبرگ موضوع این‌گونه نیست.

وایرد: چه کسی خصوصیات فیلم‌ها و ویدیوها را برای نت‌فلیکس تعریف می‌کند؟

خاویر آماتریاین: ما بیش از ۴۰ کارمند داریم که فیلم‌ها و برنامه‌های تلویزیونی را به صورت دستی برای ما برچسب زنی می‌کنند. این افراد معمولا فریلنسرهایی هستند که برای کمک به درآمدشان این کار را انجام می‌دهند. تمام تحلیل‌گران ما خوره‌های تلویزیون و سینما هستند و بسیاری از آن‌ها هم تجربه‌هایی از کار در حوزه سرگرمی دارند. آن‌ها سلایق شخصی هم دارند، اما حرفه آن‌ها به عنوان تحلیل‌گر مستلزم بی‌طرفی است و ما آن‌ها را آموزش می‌دهیم که این‌گونه رفتار کنند.

وایرد: اکنون که نت‌فلیکس روی استریم کردن تمرکز کرده است، این پیشنهادها دچار چه تغییراتی شده‌اند؟

آماتریاین: زمانی که ما شرکتی بودیم که DVDها را از طریق پست ارسال می‌کردیم و افراد امتیازها و رتبه‌های‌شان را برای ما می‌فرستادند، نوعی فرآیند فکری را طی می‌کردند. شما چیزی را به صف درخواست‌های‌تان اضافه می‌کردید، چراکه می‌خواستید چند روز بعد آن را تماشا کنید. این تصمیم شما هزینه‌ای در بر داشت و البته پاداشی که با کمی تاخیر به دست شما می‌رسید. با استریم کردن آنی ویدیوها، شما پخش چیزی را شروع می‌کنید و اگر خوشتان نیامد بلافاصله به سراغ چیز دیگری می‌روید. کاربران غالبا مزایای بازخوردهای اشکار و واضح را درک نمی‌کنند، به همین دلیل در این راستا تلاش کمتری می‌کنند.

وایرد: به این ترتیب اهمیت رتبه‌بندی‌ها و امتیازهای پیش‌بینی شده که اساس کار نت‌فلیکس بودند کاهش یافته است؟

گومز: آزمایش‌ها نشان داده است که امتیازهای پیش‌بینی شده واقعا «بسیار مفبد» نیستند، اما آن‌چه شما در حال تماشای آن هستید از اهمیت زیادی برخوردار است. ما تلاش می‌کنیم از تمرکز صرف بر روی امتیازبندی‌ها و رتبه‌ها به سمت اکوسیستم پیچیده‌ای از الگوریتم‌ها حرکت کنیم.

وایرد: آیا نت فلیکس آن‌چه من می‌بینم را ردگیری می‌کند؟

آماتریاین: ما می‌دانیم که شما چه ویدیوهایی را پخش کرده‌اید، چه ویدیوهایی را جست‌وجو کرده‌اید و می‌دانیم این کارها را در چه تاریخی، در چه ساعتی و با چه دستگاهی انجام داده‌اید. ما حتی رفتار کاربران نظیر اسکرول کردن و مرور فیلم‌ها را هم ردگیری می‌کنیم. تمام این داده‌ها به الگوریتم‌های متعددی خورانده می‌شود که هر یک برای منظور خاصی بهینه شده است. در یک جمع‌بندی کلی بیشتر الگوریتم‌های ما بر این مبنا کار می‌کنند که الگوهای مشاهده‌ای مشابه، نشان‌دهنده سلیقه‌های مشابه در میان کاربران است. ما می‌توانیم از رفتار کاربران مشابه شما برای استنباط ترجیحات شما استفاده کنیم.

وایرد: بنابراین اگر من نیمه شب روی آی‌پدم چیزی را تماشا کنم، پیشنهادهای متفاوتی را نسبت به زمانی که همان ویدیو را ساعت ۸ شب روی تلویزیونم تماشا کنم دریافت خواهم کرد؟

آماتریاین: ما مدتی است که بر روی دخیل کردن شرایط و زمینه تماشای ویدیو در سیستم پیشنهادها کار می‌کنیم. ما داده‌هایی در دست داریم که نشان می‌دهد رفتارهای تماشای ویدیو در روزهای مختلف هفته، ساعت‌های مختلف روز و گاهی حتی موقعیت جغرافیایی متفاوت هستند. اما پیاده‌سازی سیستم پیشنهاددهی براساس شرایط زمانی و مکانی تماشای ویدیو با چالش‌هایی عملی روبرو است که ما فعلا در حال کار بر روی آن‌ها هستیم. امیدواریم در آینده نزدیک بتوانیم این سیستم را هم به کار ببریم.

وایرد: چرا این همه فیلم‌های دو ستاره و سه ستاره در فهرست پیشنهادهای من دیده می‌شود؟

گومز: مردم به فیلم‌هایی نظیر فهرست شیندلر امتیاز بالایی می‌دهند، در مقابل کمدی‌های احمقانه‌ای که من نگاه می‌کنم (مثلا Hot Tub Time Machine) امتیاز پایینی به خود اختصاص می‌دهند. اگر شما به کاربران تنها ویدیوهایی را پیشنهاد کنید که ۴ یا ۵ ستاره دارند، لزوما به این معنی نیست که آن‌ها هم می‌خواهند در پایان یک روز کاری وسط هفته آن ویدیو را تماشا کنند. رفتار تماشای ویدیو برای ما داده مهم‌تری است.

آماتریاین: ما می‌دانیم که بسیاری از این امتیازها خیالی هستند و در واقع فعالیت‌های روزمره شما [در تماشای ویدیو] را منعکس نمی‌کنند.

وایرد: ما نمی‌توانیم از دست شما فرار کنیم؟

گومز: بسیاری از افراد می‌گویند که غالبا فیلم‌های خارجی و مستند تماشا می‌کنند. اما در عمل این اتفاق خیلی زیاد رخ نمی‌دهد.

وایرد: آیا موقعیت مکانی پیشنهادهای شما [روی صفحه نمایش] بر رفتار تماشای کاربران تاثیر دارد؟

گومز: جانمایی آن‌ها مهم است. هر چه یک عنوان به اوایل یک سطر نزدیک‌تر باشد، احتمال پخش شدن‌اش بیشتر است. و هر چه یک سطر به روی صفحه نمایش در موقعیت بالاتری قرار بگیرد، احتمال پخش شدن یکی از آیتم‌های آن بیشتر خواهد شد.

وایرد: سیستم پیشنهاد دهی شما با سایر شرکت‌ها چه تفاوتی دارد؟

آماتریاین: تقریبا تمام کاری که ما انجام می‌دهیم «پیشنهاد دهی» است. من هفته گذشته در eBay‌ بودم و آن‌ها به من گفتند که ۹۰ درصد خریدهایی که مردم از سایت آن‌ها انجام می‌دهند براساس جست‌وجو انجام می‌شود. ما دقیقا در نقطه مقابل این وضعیت قرار داریم. پیشنهاد دهی بسیار مهم و حیاتی است. قابلیت جست‌وجوی شرکت ما تنها زمانی به درد می‌خورد که ما نتوانیم به مردم پیشنهاد کنیم که چه چیزی را تماشا کنند.

وایرد: آیا پیشنهاد دهی‌های الگوریتمی محدودیتی هم دارند؟

گومز: من تریلر فرانسوی Tell No One را حدود یک سال پیش نگاه کردم. از همان زمان سعی کردم فیلم‌های مشابهی را پیدا کنم. فردی که در تیم محتوا روی این ویدیو کار کرده است به من گفت این تنها نمونه موجود در کل جهان است!

منبع (+)


راه‌های متفاوتی برای دسترسی به محتواهای مشابه، وجود دارند، مثلا رفتن به سایت IMDB و دیدن پیشنهادهای این سایت که البته چندان دقیق و کاربردی نیست، مثلا در این اسکرین‌شات که از صفحه فیلم Volver می‌بینیم که گفته شده، افرادی که این فیلم را دیده‌اند از فیلم لوبوفسکی بزرگ یا Departed هم خوششان می‌آید. سایت‌های سینمایی دیگر هم معمولا فیلم‌هایی را که حال و هوای مشابه یک فیلم را دارند، پیشنهاد می‌کنند.

08-12-2013 10-59-07 AM

راه دیگر جستجویی محتوایی است، یعنی شما در گوگل موضوع فیلم را جستجو کنید، مثلا به انگلیسی جستجو کنید: فیلم‌های با مضمون جنگ سرد.

البته اپلیکیشن‌هایی مثل Discovr Movies یا Spideo هم بد نیستند.

06-29-2012-10-51-35-AM

به طوری که در این نوشته خواندید، سیستم پیشنهاد محتوای نت‌فلیکس به صورت خاصی عمل می‌کند، دنیای امروز دنیای شتابزده و تجاری است، کاربران در این شرایط خیلی سریع برچسب می‌زنند و انتخاب می‌کنند و نمره می‌دهند و گاهی تعهدی برای انتخاب و رأی خود ندارند و فکر نمی‌کنند که شاید همین رأی‌های شتابزده آنها، سیستم‌هایی را که می‌کوشند از تحلیل آنها استفاده کنند، بدون استفاده می‌کند.

نت‌فلیکس به طوری که خواندید، تنها به رأی و امتیازدهی کاربران تکیه نمی‌کند و از الگوریتم‌های پیچیده استفاده می‌کند.

از سوی دیگر با این همه راه «مکانیزه» برای دسترسی به محتواهای نمایشی، هنوز هم به گمانم هیچ چیز بهتر از پیشنهاد دوستانی که می‌شناسیم و به یکسانی نسبی سلیقه آنها با خودمان اطمینان داریم، نباشد!


اگر خواننده جدید سایت «یک پزشک»  هستید!
شما در حال خواندن سایت یک پزشک (یک پزشک دات کام) به نشانی اینترنتی www.1pezeshk.com هستید. سایتی با 18 سال سابقه که برخلاف اسمش سرشار از مطالب متنوع است!
ما را رها نکنید. بسیار ممنون می‌شویم اگر:
- سایت یک پزشک رو در مرورگر خود بوک‌مارک کنید.
-مشترک فید یا RSS یک پزشک شوید.
- شبکه‌های اجتماعی ما را دنبال کنید: صفحه تلگرام - صفحه اینستاگرام ما
- برای سفارش تبلیغات ایمیل alirezamajidi در جی میل یا تلگرام تماس بگیرید.
و دیگر مطالب ما را بخوانید. مثلا:

عکس های رنگی مردم «عادی» در دوران استالین که توسط یک دیپلمات آمریکایی که به دلیل جاسوسی اخراج شد،…

زندگی مردم عادی چیزی است که آنچنان که باید و شاید ثبت نمی‌شود. مورخی را تصور کنید که پنج دهه بعد بخواهد در مورد تاریخ الان ایران تحقیق کند. او احتمالا انبوهی از روزنامه‌های و مجلات و کتاب‌ها و مصاحبه‌های شفاهی و آمارها یا اطلاعات سایت‌ها را…

کلاژهای کاغذی زیبای مینیمال از شخصیت‌های سینمایی مشهور

اینکه بتوانی به صورت خلاصه و مختصر و مفید با هنر خودت، مفهومی را برسانی، هر بسیار جالبی است. حالا تصور کنید که با برش چند کاغذ رنگی و کنار هم نهادت انها، یغنی کلاژ کاغذی بشود، شخصیت‌های مهم سینمایی را بازسازی کرد.این کاری است که مارگارت…

اگر در این لحظات تاریخی حساس، شخصیت‌های مهم عکس سلفی می‌گرفتند

عکس سلفی به مفهوم کنونی آن مدت یک دهه است که مرسوم شده و به مفهوم گرفتن عکس آینه‌ای یا تکنیک‌های گرفتن عکس با شاتر زمان‌دار قدمت آن به زمان عکاسی برمی‌گردد.اما تصور کنید که در این لحظات مهم تاریخی، شخصیت‌ها دست به دوربین می‌شدند و به…

حومه‌نشینی چرا شکل می‌گیرد و چه مشکلاتی ایجاد می‌کند؟ + گالری عکس‌هایی از زشتی‌های این پدیده

مناطق حومه شهر، جوامع مسکونی هستند که در حومه مناطق بزرگتر شهری قرار دارند. آن‌ها ویژگی‌های متمایزی دارند که آن‌ها را ازمحیط روستایی و شهری متمایز می‌کند. شکل‌گیری حومه‌ها و مشکلاتی که با آن‌ها مواجه هستند را می‌توان به عوامل متعددی نسبت…

سلاح‌های مخفی و شگفت‌انگیز آلمان نازی در طی جنگ جهانی دوم

در طول جنگ جهانی دوم، آلمان نازی سرمایه گذاری زیادی در تحقیق و توسعه تسلیحات مخفی انجام داد تا بتواند بر دشمنان خود برتری یابد. برخی از برجسته ترین سلاح های مخفی که توسط آلمانی ها ساخته شده اند عبارتند از:موشک V-2: V-2 اولین موشک…

نه! ژاپن واقعا شبیه هیچ کشور دیگری نیست – عکس‌هایی که این را ثابت می‌کنند

هر کشوری ویژگی‌های فرهنگی و اجتماعی و حکمرانی و اقلیمی متفاوتی از کشور دیگری دارد. اما تفاوت برخی از کشورها با دیگران، چشم‌گیرتر است. ژاپن را یک اقیانوس از دنیاهای دیگر جدا نکرده، اما اگر شما هم این عکس‌ها را با من مرور می‌کنید، می‌بینید که…
آگهی متنی در همه صفحات
دکتر فارمو / موتور فن کویل / شیشه اتومبیل / نرم افزار حسابداری / خرید سیلوسایبین / هوش مصنوعی / قیمت وازلین ساج / مقاله بازار / شیشه اتومبیل / قیمت ایمپلنت دندان با بیمه /سپتیک تانک /بهترین دکتر لیپوماتیک در تهران /بهترین جراح بینی در تهران / آموزش تزریق ژل و بوتاکس / دوره های زیبایی برای مامایی / آموزش مزوتراپی، PRP و PRF /کاشت مو / مجتمع فنی تهران /قیمت روکش دندان /خدمات پرداخت ارزی نوین پرداخت / درمان طب / لیست قیمت تجهیزات پزشکی / دانلود آهنگ / سریال ایرانی کول دانلود / دانلود فیلم دوبله فارسی /داروخانه اینترنتی آرتان /اشتراك دايت /فروشگاه لوازم بهداشتی /داروخانه تینا /لیفت صورت در تهران /فروش‌ دوربین مداربسته هایک ویژن /سرور مجازی ایران /مرکز خدمات پزشکی و پرستاری در منزل درمان نو /توانی نو / ثبت برند /حمل بار دریایی از چین /سایت نوید /پزشک زنان سعادت آباد /کلاه کاسکت / لمینت متحرک دندان /فروشگاه اینترنتی زنبیل /ساعت تبلیغاتی /تجهیزات پزشکی /چاپ لیوان /خرید از آمازون /بهترین سریال های ایرانی /کاشت مو /قیمت ساک پارچه ای /تولید محتوا /دانلود نرم افزار /
5 نظرات
  1. saeed می گوید

    جالب بود! من همیشه به پیشنهادهای IMDb توجه میکردم ولی شاید یه سری هم به نت فلیکس زدم!!!

  2. اشکواری می گوید

    سلام
    کار نکردن netflix در ایران ربطی به پرداخت اینترنتی و سرعت اینترنت نداره. Netflix فقط در آمریکای شمالی (آمریکا و کانادا) , کشورهای کاراییب , بریتانیا , ایرلند , فنلاند , سوئد , نروژ و دانمارک کار میکنه. از IP هر کشوری دیگه ای که وصل بشید کار نخواهد کرد.

    1. Marilyn می گوید

      ژاپن رو یادتون رفت تو سایت خود نتفلیکس ژاپن هم هست.(ویکی نه)

      اما من کار با تورنت رو ترجیح میدم و به لیست پیش نهادی چه سایت چه دوستان چه دووسستانن ریاد وابسته نیستم معمولا تریلر جدید میبینم اگر خوشم بیاد فیلم هم میبینم البته در کل ویدیو های موسسه تراست پورت، ترینسیگنال، لیندا (نه فیلم جدید بیوگرافی لیندا) و … رو ترجیح میدم

  3. سعید می گوید

    فکر میکنم آمازون هم روی این زمینه زیاد کار کرده باشه

  4. جلال می گوید

    آنچه NetFlix را متمایز می کند سیستم مدلسازی دو طرفه آن است. یعنی هم فیلمها را مدل می کند و هم کاربران را. بیشتر سایتهای دیگر تنها فیلم ها را مدل می کنند. بنابراین اگر تعداد زیادی از کسانی که فیلم A را دیده اند، فیلم B را هم ببینند این سایتها به هر کسی که A را دیده پیشنهاد تماشای B را می دهند. در حالی که بینندگان فیلم هم با هم متفاوت اند. الگوریتمهایی مشابه آنچه NetFlix استفاده می کند اکنون در بسیاری از دانشگاههای دنیا در زیر مجموعه درسهایی با عنوانهایی مانند data mining, machine learnin و یا statistical learning تدریس می شوند (مهندسی کامپیوتر یا برق یا متخصصان آمار ریاضی این درسها را می گیرند).

ارسال یک پاسخ

آدرس ایمیل شما منتشر نخواهد شد.

••4 5