مرورگر مایکروسافت اج Edge حالا می‌تواند متن‌های فارسی را با دقت قابل قبول بخواند + نمونه‌ای از کیفیت تبدیل متن به گفتار یک متن فارسی

1

خیلی وقت‌ها آرزوهای فناورانه ما در ایران تا زمانی که شرکت‌های بزرگ فناوری دنیا برایمان دست نجنبانند محقق نمی‌شود.

یکی از چیزهای فناورانه بسیار مورد نیاز ما، نرم‌‌افزارهای هوشمند تبدیل متن به گفتار یا صورت text to speech هستند. این امر کاربردهای بی‌شماری می‌تواند داشته باشد:

-تصور کنید که بتوانید در حین سفرهای درون شهری یا برون شهری، چشم‌هایتان را ببندید و نرم‌افزار صفحه وب دلخواهتان را برای شما قرائت کند.

-فرض کنید که بتوانید متن یک کتاب را برای خودتان صوتی کنید و در اوقات فراغت یا مرده به آن گوش کنید.

-چقدر خوب می‌شود که با این نرم‌افزارهای خوانندگان ما بتوانند در صورت نیاز، به متن‌های ما گوش کنند. مخصوصا آنهایی که شکیبایی خواندن متن‌های طولانی را ندارند.

-اصلا شاید بشود از این نرم‌افزارها برای ساختن شبه‌پادکست هم استفاده کرد.

-و البته مهم‌ترین کاربرد این نرم‌افزارهای تبدیل متن به گفتار، کمک به کسانی است که مشکل بینایی دارند.

در طی سال‌ها نرم‌افزارهای تبدیل متن به گفتار برای زبان‌های فرنگی، پیشرفت بسیار خوبی کرده‌اند و آنها حالا دیگر علاوه بر متن‌های عمومی می‌توانند از پس قرائت متن‌های نسبتا تخصصی هم برآیند. اما در مورد زبان فارسی، چنین پیشرفتی ملاحظه نمی‌شد.

البته معدود شرکت‌های ایرانی هستند که در این زمینه سرمایه‌گذاری قابل توجهی کرده‌اند، اما هنوز هم خروجی محصول آنها، کیفیت پایه لازم را ندارد. باید به تلاش این شرکت‌های احترام گذاشت، اما به هر حال نتیجه نهایی کار آنها در حدی نیست که من نوعی بتوانم چشمانم را ببندم و انتظار داشته باشم که متن یک مقاله برایم به صورت قابل درک و شیوایی قرائت شود. به علاوه محصول این شرکت‌ها رایگان نیست و نباید هم انتظار داشته باشیم که چنین محصولی را یک شرکت ایرانی رایگان ارائه بدهد.

اما خوشبختانه امشب مطلع شدم که مرورگر اج مایکروسافت Edge ، ویژگی تبدیل متن به گفتار را برای زبان فارسی هم فعال کرده است.

برای استفاده از این ویژگی شما نخست باید مرورگر خود را به روز کنید. بعد از منوی مرورگر گزینه Read aloud را انتخاب کنید.

توجه کنید که ممکن است لازم باشد در قسمت voice option، گوینده فارسی را انتخاب کنید. گوینده‌ای با صدای یک زن با نام دل‌آرا:

کیفیت تبدیل و خواندن شدن متن‌ها قابل قبول است، اما نباید انتظار زیادی از آن داشته باشید.

مثلا فعلا اعداد فارسی خوانده نمی‌شوند. همچنین اگر واژه‌های انگلیسی در لابلای متن فارسی وجود داشته باشد، آنها هم خوانده نمی‌شوند.

هنوز هوشمندی نرم‌افزار به اندازه‌ای نشده که با توجه به مفهوم یک متن، متوجه شود که مثلا کلمات متفاوت با املای مشابه را چطور باید بخواند، مثلا اگر در جمله‌ای نوشته شده باشد «خلق و خو»، نرم‌‌افزار ممکن است بگوید : خَلق و خو! و تشخیص ندهد که باید از تلفظ خُلق استفاده کند.

بعضی از کلمات هم فعلا به صورت عجیبی به صورت پیش فرض تلفظ اشتباه دارند، مثلا طب، فعلا به صورت طَب تلفظ می‌شود!

به نظر می‌رسد که اگر متن شما نشانه‌گذاری خوبی داشته باشد و از ویرگول به خوبی در آن استفاده شده باشد، کمک زیادی به روان خوانده شدن متن می‌کند.

من خودم امتحان نکرده‌ام، شاید اگر اعراب کلمات مشکل‌دار درج شد، نرم‌افزار بهتر عمل کند. مثلا مدیتیشن را به صورت مُدیتیشن تلفظ نکند!

هنوز جا برای پیشرفت نرم‌افزارهای تبدیل متن به گفتار بسیار زیاد است. پیشرفت هوش مصنوعی حتما، در سال‌های آتی، کمک زیادی در این بخش به ما خواهد کرد.

یک نکته جانبی هم این است که اگر شرکت‌های بزرگ اندک سود مالی مستقیم از جانب کاربران فارسی برای خود تصور می‌کردند به توسعه ویژگی‌های فارسی محصولات خود اهمیت بسیار بیشتری می‌دادند. اما شرایط تحریم و انزوا و نبود ارتباط مستقیم با این شرکت‌ها باعث شده روند توسعه محصولات آنها برای ما بسیار کند باشد. می‌توان تصور کرد که مثلا مترجم گوگل در شرایط و اتمسفری متفاوت، می‌توانست در قسمت زبان فارسی پیشرفت بسیار بیشتری کند. یا تصور کنید که شما می‌توانستید مثلا ویدئوهای فارسی یوتیوب را با زیرنویس خودکار فارسی ببینید و این ویژگی چه کمک بزرگی به ایرانی‌های ناشنوا که نمی‌کرد.

در پایان برای آشنایی شما با کیفیت مرورگر اج در قرائت متن‌های فارسی، بخشی از خوانش یکی از پست‌های یک پزشک را برایتان اینجا درج می‌کنم:

 
1 نظر
  1. عطاملک می گوید

    سلام علیکم
    اگر توجه کنید صوت فارسی اج لهجه افغانستانی داره
    احتمال میدم سر قضایایای خروج امریکا از افغانستان، امریکا داره با اینکار خودش رو برای افغانستانی ها موجه و دلسوز نشون میده

    اگر حمایت از نرم افزارهای ماهور و پارس اوا میشد الان جامعه نابینایی از صداهای طبیعی اینها استفاده می کردند ولی الان توسعه هردو متوقف شده
    با گفتگویی که با یکی از مسئولین پارس آوا داشتم ایشون گفتند مخابرات صدای طبیعی فارسی رو داره ولی به ما نمیده و قیمت بسیار گرانی رو میده که برای خریدار مقدور نیست پرداختش

ارسال یک پاسخ

آدرس ایمیل شما منتشر نخواهد شد.