مرورگر مایکروسافت اج Edge حالا میتواند متنهای فارسی را با دقت قابل قبول بخواند + نمونهای از کیفیت تبدیل متن به گفتار یک متن فارسی
خیلی وقتها آرزوهای فناورانه ما در ایران تا زمانی که شرکتهای بزرگ فناوری دنیا برایمان دست نجنبانند محقق نمیشود.
یکی از چیزهای فناورانه بسیار مورد نیاز ما، نرمافزارهای هوشمند تبدیل متن به گفتار یا صورت text to speech هستند. این امر کاربردهای بیشماری میتواند داشته باشد:
-تصور کنید که بتوانید در حین سفرهای درون شهری یا برون شهری، چشمهایتان را ببندید و نرمافزار صفحه وب دلخواهتان را برای شما قرائت کند.
-فرض کنید که بتوانید متن یک کتاب را برای خودتان صوتی کنید و در اوقات فراغت یا مرده به آن گوش کنید.
-چقدر خوب میشود که با این نرمافزارهای خوانندگان ما بتوانند در صورت نیاز، به متنهای ما گوش کنند. مخصوصا آنهایی که شکیبایی خواندن متنهای طولانی را ندارند.
-اصلا شاید بشود از این نرمافزارها برای ساختن شبهپادکست هم استفاده کرد.
-و البته مهمترین کاربرد این نرمافزارهای تبدیل متن به گفتار، کمک به کسانی است که مشکل بینایی دارند.
در طی سالها نرمافزارهای تبدیل متن به گفتار برای زبانهای فرنگی، پیشرفت بسیار خوبی کردهاند و آنها حالا دیگر علاوه بر متنهای عمومی میتوانند از پس قرائت متنهای نسبتا تخصصی هم برآیند. اما در مورد زبان فارسی، چنین پیشرفتی ملاحظه نمیشد.
البته معدود شرکتهای ایرانی هستند که در این زمینه سرمایهگذاری قابل توجهی کردهاند، اما هنوز هم خروجی محصول آنها، کیفیت پایه لازم را ندارد. باید به تلاش این شرکتهای احترام گذاشت، اما به هر حال نتیجه نهایی کار آنها در حدی نیست که من نوعی بتوانم چشمانم را ببندم و انتظار داشته باشم که متن یک مقاله برایم به صورت قابل درک و شیوایی قرائت شود. به علاوه محصول این شرکتها رایگان نیست و نباید هم انتظار داشته باشیم که چنین محصولی را یک شرکت ایرانی رایگان ارائه بدهد.
اما خوشبختانه امشب مطلع شدم که مرورگر اج مایکروسافت Edge ، ویژگی تبدیل متن به گفتار را برای زبان فارسی هم فعال کرده است.
برای استفاده از این ویژگی شما نخست باید مرورگر خود را به روز کنید. بعد از منوی مرورگر گزینه Read aloud را انتخاب کنید.
توجه کنید که ممکن است لازم باشد در قسمت voice option، گوینده فارسی را انتخاب کنید. گویندهای با صدای یک زن با نام دلآرا:
کیفیت تبدیل و خواندن شدن متنها قابل قبول است، اما نباید انتظار زیادی از آن داشته باشید.
مثلا فعلا اعداد فارسی خوانده نمیشوند. همچنین اگر واژههای انگلیسی در لابلای متن فارسی وجود داشته باشد، آنها هم خوانده نمیشوند.
هنوز هوشمندی نرمافزار به اندازهای نشده که با توجه به مفهوم یک متن، متوجه شود که مثلا کلمات متفاوت با املای مشابه را چطور باید بخواند، مثلا اگر در جملهای نوشته شده باشد «خلق و خو»، نرمافزار ممکن است بگوید : خَلق و خو! و تشخیص ندهد که باید از تلفظ خُلق استفاده کند.
بعضی از کلمات هم فعلا به صورت عجیبی به صورت پیش فرض تلفظ اشتباه دارند، مثلا طب، فعلا به صورت طَب تلفظ میشود!
به نظر میرسد که اگر متن شما نشانهگذاری خوبی داشته باشد و از ویرگول به خوبی در آن استفاده شده باشد، کمک زیادی به روان خوانده شدن متن میکند.
من خودم امتحان نکردهام، شاید اگر اعراب کلمات مشکلدار درج شد، نرمافزار بهتر عمل کند. مثلا مدیتیشن را به صورت مُدیتیشن تلفظ نکند!
هنوز جا برای پیشرفت نرمافزارهای تبدیل متن به گفتار بسیار زیاد است. پیشرفت هوش مصنوعی حتما، در سالهای آتی، کمک زیادی در این بخش به ما خواهد کرد.
یک نکته جانبی هم این است که اگر شرکتهای بزرگ اندک سود مالی مستقیم از جانب کاربران فارسی برای خود تصور میکردند به توسعه ویژگیهای فارسی محصولات خود اهمیت بسیار بیشتری میدادند. اما شرایط تحریم و انزوا و نبود ارتباط مستقیم با این شرکتها باعث شده روند توسعه محصولات آنها برای ما بسیار کند باشد. میتوان تصور کرد که مثلا مترجم گوگل در شرایط و اتمسفری متفاوت، میتوانست در قسمت زبان فارسی پیشرفت بسیار بیشتری کند. یا تصور کنید که شما میتوانستید مثلا ویدئوهای فارسی یوتیوب را با زیرنویس خودکار فارسی ببینید و این ویژگی چه کمک بزرگی به ایرانیهای ناشنوا که نمیکرد.
در پایان برای آشنایی شما با کیفیت مرورگر اج در قرائت متنهای فارسی، بخشی از خوانش یکی از پستهای یک پزشک را برایتان اینجا درج میکنم:
سلام علیکم
اگر توجه کنید صوت فارسی اج لهجه افغانستانی داره
احتمال میدم سر قضایایای خروج امریکا از افغانستان، امریکا داره با اینکار خودش رو برای افغانستانی ها موجه و دلسوز نشون میده
اگر حمایت از نرم افزارهای ماهور و پارس اوا میشد الان جامعه نابینایی از صداهای طبیعی اینها استفاده می کردند ولی الان توسعه هردو متوقف شده
با گفتگویی که با یکی از مسئولین پارس آوا داشتم ایشون گفتند مخابرات صدای طبیعی فارسی رو داره ولی به ما نمیده و قیمت بسیار گرانی رو میده که برای خریدار مقدور نیست پرداختش