آینده دستیارهای صوتی هوشمند: نسل بعدی سیر، الکسا و دستیار گوگل

0

کارن للوچ تورجمن : فرض کنید صبح دوشنبه است. شما همین الان یک اعلان صوتی از طرف دستیار صوتی خود دریافت کردید.

دستیار صوتی: صبح بخیر. یک شلوار جدید در فروشگاه مورد علاقه‌تان به فروش می‌رسد. هفته قبل، زمانی که عینک هوشمندتان را به چشم داشتید، به یکی مانند همین که همکارتان داشت علاقه نشان دادید. آیا تمایل دارید که آن را در جشن روز پنجشنبه بپوشید؟ به شما پیشنهاد می‌کنم سینما رفتن فردا شب را بی‌خیال شوید تا بتوانید آن را بخرید. برای تایید خرید بگویید «بله». به من اجازه بدهید که در صورت لزوم هدیه‌ای هم برای میزبانتان پیدا کنم. من می‌توانم بر اساس بودجه شما و صفحه عمومی اینستاگرام او پیشنهاداتی ارائه کنم. برای ادامه بگویید «بله».

کارن للوچ تورجمن: بله.

خب، هیجان‌انگیزه یا ترسناک؟ چون به زودی آینده ما همین‌گونه خواهد بود. به عنوان یک مادر شاغل، به نظرم هیجان‌انگیز است. من دوست دارم که از جستجوها در گوگل، تلف کردن وقت با بالا و پایین کردن آمازون، محاسبه بودجه و یا بهینه‌سازی برنامه‌ام دست بکشم. آنچه هیجان‌انگیز است امید به داشتن یک یار است که نیازها و درخواست‌هایم را دقیقاً برآورده می‌کند. فقط تصور کنید که چه کارهایی می‌تواند انجام دهد، مثلاً با کمک ضربان قلبم سفارش استارباکس من را برای کاهش کافئین تغییر دهد. می‌تواند بر اساس ناهارم و میزان قدم‌هایی که در پیاده‌روی پیمودم یک تمرین ورزشی به من پیشنهاد دهد. حتی می‌تواند با دستیار هوشمند دوستم برای برنامه‌ریزی برنامه‌های شبانه که متناسب با بودجه، زمان و موقعیت‌های هر دویمان باشد همکاری کند.

بدیهی است که این قضیه می‌تواند به سادگی وجه ترسناک به خود بگیرد. به همین دلیل است که مقرراتی باید وضع شوند. تمام کاربران و مصرف‌کنندگان باید نظارت کاملی بر داده‌هایی که به اشتراک می‌گذارند و هرگونه پیشنهادی که آن را می‌پذیرند و یا رد می‌کنند، داشته باشند.

در حال حاضر، موتورهای پیشنهاد کننده‌ای که با هوش مصنوعی کار می‌کنند چیز جدیدی نیستند به هیچ وجه. ما در واقع چندین بار در روز از آنها استفاده می‌کنیم. به طور متوسط، ۷۰ درصد زمان سپری شده در یوتیوب صرف ویدیوهای پیشنهادی توسط الگوریتمش می‌شود. و ممکن است خودتان مچ‌بندی داشته باشید که از آن برای ردیابی خوابتان یا نظارت بر تمرین ورزشی خود استفاده کنید. و اولین نسل از دستیارهای مجازی با قابلیت صوتی وجود دارند. می‌دانید، مثل گوگل هوم یا آمازون الکسا که می‌توانید برای تغییر دمای اتاقتان از آنها استفاده کنید. ماشین شما نیز احتمالاً به همان چیزهایی مجهز هست که به شما در مدیریت موسیقی‌تان، یا مسیریابی و حالت هندزفری کمک می‌کند.

اما یک چیز مشترک بین همه این ابزارها وجود دارد. آن‌ها از هوش مصنوعی استفاده می‌کنند تا به شما در ناحیه خاصی از زندگیتان کمک کنند. خانه شما، اتومبیل شما، سلامتی شما. در همه اینها می‌توانند باشند. حالا نسل جدیدی از دستیارهای صوتی را تصور کنید که هر کاری از آنها ساخته است، هر چیزی را همگام‌سازی می‌کنند.

بنابراین ممکن است شما بپرسید که چرا این قبلاً اتفاق نیفتاده است؟ زیرا دو قسمت تکنولوژیکی که برای تحقق این امر حیاتی هستند هنوز بدست نیامده‌اند. اولی صداست. این ابزارها باید قادر باشند تا هرچه که ما می‌گوییم را درک کنند. و واضح است که اکنون این‌گونه نیست. برای بچه‌های من و شاید بچه‌های شما، منبع بی‌انتهایی از سرگرمی است. آن‌ها دوست دارند که سؤالات بسیار ساده بپرسند و هنوز هم جواب‌های بسیار گیج‌کننده‌ای دریافت می‌کنند. دومی، وسعت اطلاعات است. آنها باید بتوانند طیف وسیعی از پیشنهادات را برای پوشش هر آنچه ممکن است ما نیاز داشته باشیم ارائه دهند.

پس فعالان حوزه تکنولوژی هنوز هم برای دستیابی به این دو عنصر کار می‌کنند، صدا و وسعت اطلاعات. در مورد صدا، همانطور که گفتم، الکسا، گوگل هوم، سیری و امثال آنها، فعلا به طور کامل و سیستماتیک ما را درک نمی‌کنند. در واقع، درک زبان انسان‌ها دشوار است. به همان اندازه‌ای که به کلمات مربوط می‌شود به کاربرد و مفهومشان هم مربوط می‌شود. به لهجه‌ها یا سروصدا محیط اطراف فکر کنید. همچنان برای آمریکایی‌ها خیلی دشوار است که فرانسوی‌هایی را که انگلیسی حرف می‌زنند درک کنند،

پس می‌توانید تصور کنید که این مقوله چقدر می‌تواند برای یک ربات سخت باشد؟

بنابراین فعالان تکنولوژی سخت دارند روی این موضوع کار می‌کنند. در سال ۲۰۱۸، گوگل یک برنامه سرمایه‌گذاری برای استارت‌آپ‌هایی راه‌اندازی کرد تا با مجموعه‌های گوگل هوم خود کار کنند. و از آن موقع تا الان، آن‌ها بر روی بیش از ۱۵ شرکت سرمایه‌گذاری کردند. آمازون ۱۰,۰۰۰ کارمند استخدام کرده است تا بر روی تکنولوژی‌های صوتی الکسا کار کنند. بنابراین آن‌ها در نهایت مشکلات صوتی را رفع خواهند کرد. دستیاران هوشمند قادر خواهند بود تا هرچه ما می‌گوییم را درک کنند، حتی معنی کلمات با مفهوم درستشان. برای مثال، دارم از دستیار هوشمندم استفاده می‌کنم و به موسیقی گوش می‌دهم، و سپس می‌گویم: «تغییر بده».

وی.ای: سلام کارن. آیا می‌خواهی که دمای اتاق را تغییر دهی؟

کارن: خب، واضح است که این هنوز کار نمی‌کند، اما در آینده، درک خواهد کرد که من در مورد تغییر آهنگ حرف می‌زنم، نه تغییر دادن دمای اتاق. همچنین درخواست‌های طولانی و پیچیده ما را درک خواهد کرد. می‌دانید، وقتی که شروع به گفتن چیزی می‌کنیم و سپس در میان جمله حرفمان را تغییر می‌دهیم. اما این به اینجا ختم نمی‌شود. با سیستم تشخیص گفتار از راه دور، شما قادر خواهید بود از آن در فاصله‌ای به اندازه یک اتاق آن‌طرف‌تر استفاده کنید. حتی با وجود نویزهای محیطی مثل سروصدای بچه‌ها یا ترافیک.

اخیراً پیشرفت‌های چشمگیری در این زمینه صورت گرفته است، که عمدتاً به دلیل تلاش‌های آمازون بر روی تکنولوژی اسپیکرهای اکو است. البته نه فقط این. قادر خواهد بود که حالت روحی شما را — اعم از شادی، غم، ناراحتی — درک کند و این احساسات را تقلید کند. همانطوری که فرایند پردازش زبان طبیعی در حال پیشرفت است — تکنولوژی پشت این فرایند هم با پیشرفت روزافزون خود، تعاملات صوتی را پیوسته بهبود می‌بخشد.

حالا، چالش دوم و به نظر من بزرگترین آن، حول محور پیشنهادهای ارائه شده می‌چرخد. توانایی آنها — دامنه اقدامات آنها به چه صورت خواهد بود؟ آیا آن‌ها به کارهای بسیار خاصی محدود می‌شوند، یا می‌توانند به یک همراه واقعی در طول روز تبدیل شوند که می‌توانید هر چه را که بخواهید از او درخواست کنید؟ برای مثال، یادداشت‌برداری کردن در یک جلسه یا سفارش دوباره شیر یا حتی مربی‌گری سلامتی روانی. آیا آنها خواهند توانست به شما پیشنهادهایی در مورد دسته‌بندی محصولات ارائه دهند؟ امروزه، شرکت‌هایی پیشنهادهای خاصی در یک دسته‌بندی خاص به ما ارائه می‌دهند. برای مثال، می‌تواند به ما کمک کند تا بین دو لباس یا دو کتاب انتخاب کنیم. در آینده، دستیاران هوشمند در واقع خواهند توانست به ما در انتخاب خرید یک کتاب و یا یک لباس کمک کنند.

بنابراین برای اینکه بتوانند این طیف وسیع و یکپارچه از پیشنهادها را عرضه کنند، تیم‌های فنی دستیاران هوشمند باید الگوریتم‌های درستی طراحی کنند. و این الگوریتم‌ها باید به اندازه‌ای قدرتمند باشند تا نقطه داده‌های بیشماری را پردازش کنند، الگوها را شناسایی کنند، مدل‌سازی دوره‌های اقدامات را انجام دهند، و همچنین از بازخوردهای نهایی کاربران نتیجه‌گیری کنند. اما در جهانی که در آن دستیاران هوشمند اجتناب‌ناپذیر می‌شوند به معنی اولویت‌های جدید برای همه شرکت‌هاست نه فقط کاربران دستیاران هوشمند. هر کسب و کاری در آینده نیاز خواهد داشت تا به شدت در داده‌ها و الگوریتم، و تعاملات صوتی پیشرفت سریعی داشته باشد. و همچنین نیاز خواهند داشت تا مشتریانشان در ارائه پیشنهادها به آن‌ها اعتماد داشته باشند. به همین خاطر دوست دارم مطلب را در سه کلمه خلاصه کنم، در سه امر مهم که عبارتند از : داده، فناوری و اعتماد. بنابراین زمانی که چالش وسعت اطلاعات و صدا حل شوند، نقطه عطفی در در استفاده و پذیرش دستیار هوشمند توسط مشتریان خواهد بود.

امروزه، آیا می‌توانید بدون تلفن هوشمندتان زندگی کنید؟ به نظرم نه، درسته؟ چند سال دیگر، دستیار هوشمند شما، یار راحت، قدرتمند و قابل اعتماد شما خواهد بود که در روزهای عمرتان به او نیاز خواهید داشت. به طوری که بدون او نخواهید توانست زندگی کنید. و این برخلاف تلفن‌های هوشمندتان، می‌تواند در هر دستگاهی در دور و برتان تعبیه شود. البته که در خود تلفن هوشمندتان، اما همچنین در ماشین، آینه‌ها، یخچال، عینک شما و چه کسی می‌داند چه دستگاه‌های دیگری در آینده وجود خواهند داشت.

پس آیا شما برای یک زندگی هوشمندانه‌تر آماده هستید؟

وی.ای: بله کارن، من آماده‌ام.

 

ارسال یک پاسخ

آدرس ایمیل شما منتشر نخواهد شد.