هوش مصنوعی یک خصلت دیگر انسان‌ها را هم یاد گرفت: دیگر صدای انسان از ماشین قابل تشخیص نیست

1

به نظر می‌رسد صدا و لهجه خصلت دیگری است که انسان‌ها به ماشین‌ها دادند تا هرچه بیشتر شبیه خودشان شوند!

گوگل در ماه جاری یک مقاله پژوهشی را منتشر کرده است که نشان می‌دهد دیگر تشخیص صدای انسان از ماشین امکان‌پذیر نیست. در این مقاله، یک سیستم تبدیل متن به گفتار ماشینی مبتنی بر هوش مصنوعی به نام Tacotron 2 معرفی شده است که می‌تواند یک متن را همانند یک انسان بخواند.

سیستم Tacotron 2 دومین نسل از فناوری اختصاصی گوگل برای تولید صدای انسان توسط ماشین‌ها است. این سیستم از دو شبکه عصبی عمیق سود می‌برد.

نزدیک شدن گفتار ماشین‌ها به انسان‌ها

اولین شبکه عصبی متن را به یک اسپکتروگرام (Spectrogram) تبدیل می‌کند؛ روشی بصری برای نشان دادن فرکانس‌های صوتی در طول زمان. اسپکتروگرام الگوی صدای به دست آمده را به یک شبکه عصبی دیگر به نام WaveNet می‌دهد.

لیزر هموروئید درمان بواسیر در کلینیک تخصصی هموروئید تهران

سیستم WaveNet در آزمایشگاه هوش مصنوعی DeepMind شرکت آلفابت توسعه داده شده است و می‌تواند نموداری از عناصر صوتی برای تلفظ یک متن را ترسیم کند. دقت این سیستم بسیار بالا است و یک صدا را به صد میلی‌ثانیه یا هزار میلی‌ثانیه تجزیه می‌کند تا عناصر صدا مشخص شود.

به دو صدای زیر گوش کنید:

به نظر شما کدام‌یک توسط هوش مصنوعی گوگل خوانده شده و دیگری توسط یک انسان؟ بسیار سخت و در واقع غیرقابل‌تشخیص است.

 

یک مثال دیگر:

 

البته؛ می‌توان با مراجعه به سورس گوگل و یافتن نام فایل‌ها هر صدا و مطالعات دیگر می‌توان فهمید کدام‌ توسط هوش مصنوعی خوانده شده ولی در حالت عادی این دو صدا بسیار شبیه هم هستند.

محققان گوگل می‌گویند سیستم Tacotron 2 می‌تواند کلمات سخت را نیز درست تلفظ کند یا برخی کلمات بولد شده و مهم در متن را به حالتی بخواند که شنونده متوجه شود روی آن‌ها تاکید بیشتری هست.

برخلاف بسیاری از تحقیقاتی که در گوگل انجام می‌شود؛ طراحی سیستم Tacotron 2 می‌تواند

در آینده برای گوگل بسیار مفید و کاربردی باشد. گوگل شرکتی است که چندین محصول صوتی هوشمند وارد بازار کرده است و از Tacotron 2 می‌تواند روی Google Assistant و غیره بهره ببرد یا به صورت یک سرویس مستقل به بازار عرضه کند.

راستی در دو مثال بالا، صداهای دوم را هوش مصنوعی گوگل تولید کرده است.

منبع

PlayPlay
   

پستهای اخیر

به مناسبت سالمرگ انور خوجه بخوانید: کتاب انور خوجه، مشت سرخ آهنین، نوشته بلندی فوزیو، ترجمه بیژن…

انور خوجه مردی کتابخوان، خوش برخورد و خوش سیما بود اما زیر این لایه بیرونی شخصیتی به غایت متعصب، بیگانه ستیز، بدگمان و خونریز آرمیده بود. از بخت بد مردم آلبانی، این مرد که خود را مارکسیست لنینیست می‌نامید زمام امور این کشور را در پی…

این کرم صدپا برای در امان ماندن از شکارچیان خود و ترساندن آنها خود را به شکل ددپول یا جمجمه‌ای با دو…

استتار جانداران یا ایجاد ویژگی‌های ظاهری که باعث در امان ماندنشان از شکارچیان می‌شوند، گاهی بسیار عجیب می‌شوند و آدم درمی‌ماند که چه سیر تکاملی برای ایجاد هر یک از آنها طی شده است. یکی از عجیب‌ترین از مکانیسم‌ها را یک کرم صدپای خاص دارد.…

جدیدترین دستاورد شرکت نورا لینک ایلان ماسک: میمونی که با کمک یک تراشه کاشتنی در مغز بازی «پونگ»…

استارتاپ Neuralink ایلان ماسک ویدئویی از یک میمون منتشر کرده که با تسلط کامل و براساس دستورات ذهنی‌اش دارد پونگ بازی می‌کند. این تازه‌ترین دستاورد نمایشی از پروژه «brain-machine interface» قابل کاشتن است که شرکت نورالینک از سال ۲۰۱۷ در…

کتاب سفر به سیارات ناشناخته – نوشته رابرت سیلوربرگ – بریده‌ای از کتاب برای تجدید خاطره

فکر کنم کتاب سفر به سیارات ناشناخته را وقتی 10 سالم بود، خواندم. یکی از بهترین علمی تخیلی‌های غیرآسیموفی بود و ایده‌ها و داستان‌پردازی بسیار عالی داشت. در این داستان یکی از سیاراتی که سابق بر این مستعمره زمین بود، وقتی با تهدید نژاد وحشی…

۱۰ ترفند عیب‌یابی و رفع مشکل گجت‌هایی که روزانه با آن‌ها سروکار داریم؛ بدون نیاز به دانش یا هزینه‌…

هر مشکلی بر اثر یک مسئله به وجود آمده است و کافی است منشا آن مشکل را پیدا و بعد رفع کنید. با این وجود، بسیاری از رایج‌ترین مشکلات فناوری دارای راه‌حل‌هایی آسان و سرراست هستند. در ادامه می‌خواهیم به ۱۰ مورد از این ترفندهای عیب‌یابی و رفع…

انحصار حتی در چین هم جریمه می‌شود: علی بابا ۲.۸ میلیارد دلار به خاطر تخطی از قوانین ضدانحصار جریمه…

از سوی مقامات نظارت کننده بر قوانین چین، شرکت علی بابا به پرداخت 18.23 میلیارد یوان، معادل 2.8 میلیارد دلار، جریمه به خاطر سرپیچی از قوانین ضدانحصار جریمه شده است. گفته می‌شود که این غول فناوری از برتری خود در بازار سوء استفاده کرده است.…

1 نظر
  1. سید سروش هاشمی می گوید

    سلام.
    به نظرم صدایی که فرمودین توسط انسان تولید شده، در واقع توسط یک سیستم قدیمی‌تر تولید شده.
    با تشکر از متن‌های خوبتون

لغو پاسخ

آدرس ایمیل شما منتشر نخواهد شد.