آینده دستیارهای صوتی هوشمند: نسل بعدی سیر، الکسا و دستیار گوگل
کارن للوچ تورجمن : فرض کنید صبح دوشنبه است. شما همین الان یک اعلان صوتی از طرف دستیار صوتی خود دریافت کردید.
دستیار صوتی: صبح بخیر. یک شلوار جدید در فروشگاه مورد علاقهتان به فروش میرسد. هفته قبل، زمانی که عینک هوشمندتان را به چشم داشتید، به یکی مانند همین که همکارتان داشت علاقه نشان دادید. آیا تمایل دارید که آن را در جشن روز پنجشنبه بپوشید؟ به شما پیشنهاد میکنم سینما رفتن فردا شب را بیخیال شوید تا بتوانید آن را بخرید. برای تایید خرید بگویید «بله». به من اجازه بدهید که در صورت لزوم هدیهای هم برای میزبانتان پیدا کنم. من میتوانم بر اساس بودجه شما و صفحه عمومی اینستاگرام او پیشنهاداتی ارائه کنم. برای ادامه بگویید «بله».
کارن للوچ تورجمن: بله.
خب، هیجانانگیزه یا ترسناک؟ چون به زودی آینده ما همینگونه خواهد بود. به عنوان یک مادر شاغل، به نظرم هیجانانگیز است. من دوست دارم که از جستجوها در گوگل، تلف کردن وقت با بالا و پایین کردن آمازون، محاسبه بودجه و یا بهینهسازی برنامهام دست بکشم. آنچه هیجانانگیز است امید به داشتن یک یار است که نیازها و درخواستهایم را دقیقاً برآورده میکند. فقط تصور کنید که چه کارهایی میتواند انجام دهد، مثلاً با کمک ضربان قلبم سفارش استارباکس من را برای کاهش کافئین تغییر دهد. میتواند بر اساس ناهارم و میزان قدمهایی که در پیادهروی پیمودم یک تمرین ورزشی به من پیشنهاد دهد. حتی میتواند با دستیار هوشمند دوستم برای برنامهریزی برنامههای شبانه که متناسب با بودجه، زمان و موقعیتهای هر دویمان باشد همکاری کند.
بدیهی است که این قضیه میتواند به سادگی وجه ترسناک به خود بگیرد. به همین دلیل است که مقرراتی باید وضع شوند. تمام کاربران و مصرفکنندگان باید نظارت کاملی بر دادههایی که به اشتراک میگذارند و هرگونه پیشنهادی که آن را میپذیرند و یا رد میکنند، داشته باشند.
در حال حاضر، موتورهای پیشنهاد کنندهای که با هوش مصنوعی کار میکنند چیز جدیدی نیستند به هیچ وجه. ما در واقع چندین بار در روز از آنها استفاده میکنیم. به طور متوسط، ۷۰ درصد زمان سپری شده در یوتیوب صرف ویدیوهای پیشنهادی توسط الگوریتمش میشود. و ممکن است خودتان مچبندی داشته باشید که از آن برای ردیابی خوابتان یا نظارت بر تمرین ورزشی خود استفاده کنید. و اولین نسل از دستیارهای مجازی با قابلیت صوتی وجود دارند. میدانید، مثل گوگل هوم یا آمازون الکسا که میتوانید برای تغییر دمای اتاقتان از آنها استفاده کنید. ماشین شما نیز احتمالاً به همان چیزهایی مجهز هست که به شما در مدیریت موسیقیتان، یا مسیریابی و حالت هندزفری کمک میکند.
اما یک چیز مشترک بین همه این ابزارها وجود دارد. آنها از هوش مصنوعی استفاده میکنند تا به شما در ناحیه خاصی از زندگیتان کمک کنند. خانه شما، اتومبیل شما، سلامتی شما. در همه اینها میتوانند باشند. حالا نسل جدیدی از دستیارهای صوتی را تصور کنید که هر کاری از آنها ساخته است، هر چیزی را همگامسازی میکنند.
بنابراین ممکن است شما بپرسید که چرا این قبلاً اتفاق نیفتاده است؟ زیرا دو قسمت تکنولوژیکی که برای تحقق این امر حیاتی هستند هنوز بدست نیامدهاند. اولی صداست. این ابزارها باید قادر باشند تا هرچه که ما میگوییم را درک کنند. و واضح است که اکنون اینگونه نیست. برای بچههای من و شاید بچههای شما، منبع بیانتهایی از سرگرمی است. آنها دوست دارند که سؤالات بسیار ساده بپرسند و هنوز هم جوابهای بسیار گیجکنندهای دریافت میکنند. دومی، وسعت اطلاعات است. آنها باید بتوانند طیف وسیعی از پیشنهادات را برای پوشش هر آنچه ممکن است ما نیاز داشته باشیم ارائه دهند.
پس فعالان حوزه تکنولوژی هنوز هم برای دستیابی به این دو عنصر کار میکنند، صدا و وسعت اطلاعات. در مورد صدا، همانطور که گفتم، الکسا، گوگل هوم، سیری و امثال آنها، فعلا به طور کامل و سیستماتیک ما را درک نمیکنند. در واقع، درک زبان انسانها دشوار است. به همان اندازهای که به کلمات مربوط میشود به کاربرد و مفهومشان هم مربوط میشود. به لهجهها یا سروصدا محیط اطراف فکر کنید. همچنان برای آمریکاییها خیلی دشوار است که فرانسویهایی را که انگلیسی حرف میزنند درک کنند،
پس میتوانید تصور کنید که این مقوله چقدر میتواند برای یک ربات سخت باشد؟
بنابراین فعالان تکنولوژی سخت دارند روی این موضوع کار میکنند. در سال ۲۰۱۸، گوگل یک برنامه سرمایهگذاری برای استارتآپهایی راهاندازی کرد تا با مجموعههای گوگل هوم خود کار کنند. و از آن موقع تا الان، آنها بر روی بیش از ۱۵ شرکت سرمایهگذاری کردند. آمازون ۱۰,۰۰۰ کارمند استخدام کرده است تا بر روی تکنولوژیهای صوتی الکسا کار کنند. بنابراین آنها در نهایت مشکلات صوتی را رفع خواهند کرد. دستیاران هوشمند قادر خواهند بود تا هرچه ما میگوییم را درک کنند، حتی معنی کلمات با مفهوم درستشان. برای مثال، دارم از دستیار هوشمندم استفاده میکنم و به موسیقی گوش میدهم، و سپس میگویم: «تغییر بده».
وی.ای: سلام کارن. آیا میخواهی که دمای اتاق را تغییر دهی؟
کارن: خب، واضح است که این هنوز کار نمیکند، اما در آینده، درک خواهد کرد که من در مورد تغییر آهنگ حرف میزنم، نه تغییر دادن دمای اتاق. همچنین درخواستهای طولانی و پیچیده ما را درک خواهد کرد. میدانید، وقتی که شروع به گفتن چیزی میکنیم و سپس در میان جمله حرفمان را تغییر میدهیم. اما این به اینجا ختم نمیشود. با سیستم تشخیص گفتار از راه دور، شما قادر خواهید بود از آن در فاصلهای به اندازه یک اتاق آنطرفتر استفاده کنید. حتی با وجود نویزهای محیطی مثل سروصدای بچهها یا ترافیک.
اخیراً پیشرفتهای چشمگیری در این زمینه صورت گرفته است، که عمدتاً به دلیل تلاشهای آمازون بر روی تکنولوژی اسپیکرهای اکو است. البته نه فقط این. قادر خواهد بود که حالت روحی شما را — اعم از شادی، غم، ناراحتی — درک کند و این احساسات را تقلید کند. همانطوری که فرایند پردازش زبان طبیعی در حال پیشرفت است — تکنولوژی پشت این فرایند هم با پیشرفت روزافزون خود، تعاملات صوتی را پیوسته بهبود میبخشد.
حالا، چالش دوم و به نظر من بزرگترین آن، حول محور پیشنهادهای ارائه شده میچرخد. توانایی آنها — دامنه اقدامات آنها به چه صورت خواهد بود؟ آیا آنها به کارهای بسیار خاصی محدود میشوند، یا میتوانند به یک همراه واقعی در طول روز تبدیل شوند که میتوانید هر چه را که بخواهید از او درخواست کنید؟ برای مثال، یادداشتبرداری کردن در یک جلسه یا سفارش دوباره شیر یا حتی مربیگری سلامتی روانی. آیا آنها خواهند توانست به شما پیشنهادهایی در مورد دستهبندی محصولات ارائه دهند؟ امروزه، شرکتهایی پیشنهادهای خاصی در یک دستهبندی خاص به ما ارائه میدهند. برای مثال، میتواند به ما کمک کند تا بین دو لباس یا دو کتاب انتخاب کنیم. در آینده، دستیاران هوشمند در واقع خواهند توانست به ما در انتخاب خرید یک کتاب و یا یک لباس کمک کنند.
بنابراین برای اینکه بتوانند این طیف وسیع و یکپارچه از پیشنهادها را عرضه کنند، تیمهای فنی دستیاران هوشمند باید الگوریتمهای درستی طراحی کنند. و این الگوریتمها باید به اندازهای قدرتمند باشند تا نقطه دادههای بیشماری را پردازش کنند، الگوها را شناسایی کنند، مدلسازی دورههای اقدامات را انجام دهند، و همچنین از بازخوردهای نهایی کاربران نتیجهگیری کنند. اما در جهانی که در آن دستیاران هوشمند اجتنابناپذیر میشوند به معنی اولویتهای جدید برای همه شرکتهاست نه فقط کاربران دستیاران هوشمند. هر کسب و کاری در آینده نیاز خواهد داشت تا به شدت در دادهها و الگوریتم، و تعاملات صوتی پیشرفت سریعی داشته باشد. و همچنین نیاز خواهند داشت تا مشتریانشان در ارائه پیشنهادها به آنها اعتماد داشته باشند. به همین خاطر دوست دارم مطلب را در سه کلمه خلاصه کنم، در سه امر مهم که عبارتند از : داده، فناوری و اعتماد. بنابراین زمانی که چالش وسعت اطلاعات و صدا حل شوند، نقطه عطفی در در استفاده و پذیرش دستیار هوشمند توسط مشتریان خواهد بود.
امروزه، آیا میتوانید بدون تلفن هوشمندتان زندگی کنید؟ به نظرم نه، درسته؟ چند سال دیگر، دستیار هوشمند شما، یار راحت، قدرتمند و قابل اعتماد شما خواهد بود که در روزهای عمرتان به او نیاز خواهید داشت. به طوری که بدون او نخواهید توانست زندگی کنید. و این برخلاف تلفنهای هوشمندتان، میتواند در هر دستگاهی در دور و برتان تعبیه شود. البته که در خود تلفن هوشمندتان، اما همچنین در ماشین، آینهها، یخچال، عینک شما و چه کسی میداند چه دستگاههای دیگری در آینده وجود خواهند داشت.
پس آیا شما برای یک زندگی هوشمندانهتر آماده هستید؟
وی.ای: بله کارن، من آمادهام.