مژده: گوگل به سال‌های طولانی انتظار ایرانی‌ها برای داشتن یک برنامه کارای تبدیل عکس به متن فارسی OCR پایان داد!

34

بسیاری از موارد ما نیاز پیدا می‌کنیم که یک فایل گرافیکی را به متن تبدیل کنیم:

– دانشجو هستیم و لازم می‌شود ده – بیست صفحه از کتاب مرجع فارسی را به صورت تایپ‌شده داشته باشیم.

– محقق هستیم و لازم می‌شود به سرعت تایپ‌شده ده‌ها کتاب و مقاله را داشته باشیم، تا در فصت بعدی روی آنها تحقیق کنیم و ویرایش‌شان کنیم.

– یک کتاب و مجله قدیمی داریم و دوست داریم، این کتاب را در محیط اینترنت با دیگران به اشتراک بگذاریم.

در همه این موارد نیاز به دسته‌ای از نرم‌افزارها پیدا می‌شود به نام OCR یا Optical Character Recognition که به سرعت، یک فایل گرافیکی را هوشمندانه به متن تبدیل کند و ما را از مشقت تایپ کُند رها کند.

گرچه سالهاست که OCRهای خوب به زبان انگلیسی و نیز تعداد قابل توجهی از زبان‌های دیگر در دسترس بودند، اما به جرأت می‌توانم بگویم که هیچ OCR خوبی به زبان فارسی در دسترس نبود.

من شخصا با زحمت زیاد چند OCR گران‌قیمت به زبان فارسی را تهیه کرده‌ام و باید بگویم که نتایج آنها واقعا وحشتناک بودند! تعداد قابل توجهی آنها در واقع تنها از هسته OCRهای مشهور مثل Readiris استفاده می‌کردند و با یک رابط کاربری جدید، سعی می‌کردند که بقبولانند کار جدیدی در عرصه OCR انجام داده‌اند.

5-10-2015 7-01-11 PM

غالبا فایل متنی که این OCRها ارائه می‌دادند، آنقدر پراشتباه بود که  شما راحت‌تر بودید که خودتان متن را تایپ کنید تا اینکه متن را به آنها بسپارید.

اما ششم ماه می – یعنی 4 روز پیش- روز خوبی برای ما ایرانی‌ها و نیز شهروندان ده‌ها کشور دیگر دنیا بود. چرا؟

چون گوگل اعلام کرد که ویژگی OCR را برای 200 زبان دنیا به گوگل درایو خود افزوده است!

یعنی الان شما می‌توانید یک فایل تصویری یا یک PDF اسکن شده به زبان فارسی را در گوگل درایو آپلود کنید و بعد از مدتی، فایل متنی فارسی، آن را با میزان دقت بسیار خوب و حداقل اشتباه دریافت کنید.

پیداست که اگر وضوح اسکن یا عکس شما خیلی پایین باشد، OCR گوگل نمی‌تواند معجزه کند. اما طبق آزمایش من، OCR گوگل در وضوح‌هایی که OCRهای روتین، معمولا اشتباهات خیلی زیاد داشتند، به راحتی می‌تواند کار کند.

کار با OCR گوگل آسان است:

1- به گوگل درایو خود بروید و فایل مورد نظر را آپلود کنید.

2- بعد از مدتی در کنار فایل آپلود شده اصلی، یک فایل متنی با اسم مشابه ایجاد می‌شود.

3- روی این فایل راست کلیک کنید و از open with، گزینه google docs را انتخاب کنید و فایل متنی را دریافت کنید.

البته باید خاطرنشان کنم که متن‌های ایجادشده با این روش هنوز به ویرایش نهایی کاربر نیاز دارند. گاهی هم اختلالاتی مثل از قلم افتادن برخی از سطرها هنگام تبدیل به متن مشاهده می‌شوند.

گاهی هم اگر پشت‌زمینه متن رنگی باشد، نتایج بسیار عجیب و غریب می‌شوند. مثلا:

5-10-2015 6-52-46 PM

5-10-2015 6-54-31 PM

به نظر می‌رسد که اگر وضوح اسکن یا عکس‌های دریافتی در حد متوسط باشند، دقت OCR گوگل بسیار قابل توجه است.


اما فراتر از این خبر، چیزی که کنجکاوم بدانم این است که شیوه کار و برنامه‌نویسی OCR گوگل به چه صورت بوده است. به نظر می‌رسد که گوگل از شیوه‌های روتین برای OCR خود استفاده نکرده است.


اگر خواننده جدید سایت «یک پزشک»  هستید!
شما در حال خواندن سایت یک پزشک (یک پزشک دات کام) به نشانی اینترنتی www.1pezeshk.com هستید. سایتی با 18 سال سابقه که برخلاف اسمش سرشار از مطالب متنوع است!
ما را رها نکنید. بسیار ممنون می‌شویم اگر:
- سایت یک پزشک رو در مرورگر خود بوک‌مارک کنید.
-مشترک فید یا RSS یک پزشک شوید.
- شبکه‌های اجتماعی ما را دنبال کنید: صفحه تلگرام - صفحه اینستاگرام ما
- برای سفارش تبلیغات ایمیل alirezamajidi در جی میل یا تلگرام تماس بگیرید.
و دیگر مطالب ما را بخوانید. مثلا:

هوش مصنوعی میدجرنی Midjourney تصور می‌کند که اساتید رشته‌های مختلف باید چه ظاهری داشته باشند؟ گالری…

کودک و نوجوان که بودم برای خودم یک پا Midjourney  بودم. کتاب‌ها را که می‌خواندم از روی توصیف چهره‌ها و مکان‌ها و اشیا تصور می‌کردم که مثلا کاپیتان نمو یا ربات آر دانیل الیواو باید چطوری باشد، فضاها را تصور می‌کردم و آب و رنگ به آنها در ذهن…

سرژ ورونوف: پزشکی که بیضه‌های میمون‌ها را به مردها پیوند می‌زد تا آنها را جوان کند!

یکی از پر شورترین ارائه‌ها و سخنرانی‌ها در کنگره بین‌المللی جراحان در لندن در سال 1923 توسط جراح فرانسوی متولد روسیه به نام سرژ ورونوف انجام شد.سه سال پیش‌تر، ورونوف با آزمایش‌های بحث‌برانگیز پیوند غده‌ که به ادعای خودش آدم‌ها را چند…

عکس‌هایی از ترسناک‌ترین ساختمان‌های دنیا – آلبوم عکس

چرا برخی از ساختمان‌ها و خانه‌ها خیلی ترسناک به نظر می‌رسند. اینها دسته از سکونت‌گاه‌ها طیف گسترده‌ای دارند:- آنهایی که سایه روشن شب ترسناک‌شان می‌کند و هنگام روز یک ساختمان تقریبا عادی هستند.- آنهایی که مدت‌ها متروک مانده‌اند و…

سری جدیدی از عکس‌های جذاب مقایسه‌ای زمان قدیم و جدید مکان‌ها و شهرها

عکس‌های «قبل و بعد» یا عکس‌های یک مکان بعد از گذشت زمان مدید، به چند دلیل جالب از آب درمی‌آیند:دگرگونی دیداری: انسان‌ها به طور طبیعی به سمت تغییرات و دگرگونی‌های بصری گرایش دارند. عکس‌های قبل و بعد تصویری واضح و قابل توجه از پیشرفت،…

۲۰ برنده عکاسی از طبیعت در سال ۲۰۲۲ در مسابقه عکاسی IPA

جوایز بین المللی عکاسی (IPA) در سال 2022 بار دیگر از مجموعه‌ای خیره کننده از عکس های طبیعت پرده‌برداری کرد که قلب و ذهن بینندگان در سراسر جهان را تسخیر کرده است. این تصاویر برنده استثنایی ما را به قلمروهای مسحورکننده طبیعت منتقل می‌کنند،…

عجیب ولی واقعی: چشم‌های این زن در این عکس آبی نیست! + ویدئو

در یک خطای دیداری بسیار جالب که به تازگی دین جکسون در تیک تاک منتشر شده، چهره عادی زنی را می‌بینیم که برخلاف ظاهر امر، چشمان او آبی نیست و در واقع حاکستری است.دین جکسون در زمینه ایجاد خطاهای دیداری، یک حرفه‌ای محسوب می‌شود. ویدئوی او در…
آگهی متنی در همه صفحات
دکتر فارمو / شیشه اتومبیل / نرم افزار حسابداری / خرید سیلوسایبین / هوش مصنوعی / قیمت وازلین ساج / مقاله بازار / شیشه اتومبیل / نهال بادام / قیمت ایمپلنت دندان با بیمه /سپتیک تانک /بهترین دکتر لیپوماتیک در تهران /بهترین جراح بینی در تهران / آموزش تزریق ژل و بوتاکس / دوره های زیبایی برای مامایی / آموزش مزوتراپی، PRP و PRF /کاشت مو / مجتمع فنی تهران /قیمت روکش دندان /Hannover messe 2024 /خدمات پرداخت ارزی نوین پرداخت / درمان طب / لیست قیمت تجهیزات پزشکی / دانلود آهنگ / سریال ایرانی کول دانلود / دانلود فیلم دوبله فارسی /داروخانه اینترنتی آرتان /جارو استخری /میکروبلیدینگ / اشتراك دايت /فروشگاه لوازم بهداشتی /داروخانه تینا /لیفت صورت در تهران /فروش‌ دوربین مداربسته هایک ویژن /سرور مجازی ایران /مرکز خدمات پزشکی و پرستاری در منزل درمان نو /توانی نو / ثبت برند /حمل بار دریایی از چین /سایت نوید /پزشک زنان سعادت آباد /کلاه کاسکت / لمینت متحرک دندان /فروشگاه اینترنتی زنبیل /ساعت تبلیغاتی /تجهیزات پزشکی /چاپ لیوان /خرید از آمازون /بهترین سریال های ایرانی /کاشت مو /قیمت ساک پارچه ای /تولید محتوا /دانلود نرم افزار /
34 نظرات
  1. جواد می گوید

    تو وبلاگ google research یه توضیحات مختصری در مورد شیوه کارش داده:
    http://goo.gl/EDw48C

  2. محسن می گوید

    بعد از مدتی یعنی دقیقاً چن دقیقه؟

    1. M.M.M می گوید

      روی فایل راست کلیک کنید و گزینه open with google doc را بزنید متن در زیر تصویر قابل مشاهده است

  3. رضوان می گوید

    واسه من برعکس نشون میده
    مثلا کلمه “فردا” رو بصورت “ادرف” مینویسه؟
    دلیل خاصی داره؟

    1. امیرحسین می گوید

      منم هم همینطور

  4. محمد گلزار می گوید

    ممنون که اطلاع رسانی کردین. برای من خیلی مفیده. تست کردم. همین پست شما رو print screen کردم و بدون اشتباه برام تبدیل به متن کرد.

  5. یحیی می گوید

    گوگل کارش درسته، تست شد و نتیجه قابل قبول بود و از این پس زندگی برایمان آسان‌تر خواهد شد.

  6. محمد می گوید

    خبر خوش فوق‌العاده‌ای بود. خیلی ممنون از زحمات شما

  7. حسن دی می گوید

    یعنی بعد از این همه سال این اوج حقارت ما ایرانی ها رو در پیشرفت تکنولوژی نشون میده
    تهش هم یکی مثل گوگل باید بیاد ما رو تر و خشک کنه!

  8. حسن می گوید

    یادمه سال 86 یه شرکتی تو الکامپ یه نرم افزار ocr ساخته بود ( به احتمال زیاد یه نسخه خارجی رو دستکاری کرده بود) و قیمتی که روش گذاشته بود یک میلیارد تومن بود!!!!!
    اگر فکر میکنید همچین نرم افزاری با همچین قیمتی اصلا خریدار نداره اشتباه میکنید چون ادارات دولتی به شدت به چنین نرم افزارهای گرون قیمتی نیاز دارن تا از یک میلیارد تومن صد هزار تومنش رو به اون شرکت مثلا نرم افزاری بدن و بقیش رو بزارن تو جیب مبارکشون.

  9. ستار. م می گوید

    عملکردش عالیه.متن یک فایل 4 صفحه ای اسکن شده رو در زمان کوتاهی استخراج کرد. اون هم با کمترین خطا.

  10. arthur می گوید

    با اینکه دقت‌اش واقعا خیلی خوبه اما ده صفحۀ یک فایل رو بیشتر تبدیل نمی‌کنه؛ یک اشکال دیگه‌اش هم اینه که اگه توی یک صفحه چندستون باشه به شیوۀ ستون بندی انگلیسی از ستون چپ به راست مطالب رو پشت سر هم می‌گذاره.

    1. ا می گوید

      می توانید فایل پی دی اف تان را با نرم افزارهایی به راحتی به چند فایل 10 صفحه ای تبدیل کنید و بعد تبدیلشان کنید.

  11. Babak می گوید

    فونتارو بهم میریزه 3 4 تا pdf خوانا امتحان کردم همه اینجوری میشن … تنظیمات خاصی داره ؟:::

    نارهت هاگشناد هتسشنزاب داتسا
    هدیکچ نیوزق هب زیربت زا ار یوفص تختیاپ یرمق یرجه 962 لاس رد لوا بسامهت هاش و اه غاب و اه خاک زا بکرم یا هناختلود داد روتسد رهش نیا رد رارقتسا یارب و داد لاقتنا دش رومأم هاش نامرف هب نامز نآ فورعم رعاش یدیون گیب یدبع .دوش داجیا اه نمچ هک دیارسب ندع تانج ناونع تحت یا هموظنم هناختلود یاه خاک و تارامع ندید زا سپ یعس هلاقم نیا رد .تفر یم رامش هب نامز نآ هتسجرب ناشاقن زا ییاه هراگنراوید رگنایامن رظن زا نآ نیماضم و اه یشاقن نیا زا گیب یدبع هنارعاش فیصوت هک تفرگ رارق نآ رب .درذگب هلاقم ناگدنناوخ
    و اه خاک حرش نمض ،ندع تانج هموظنم رد بسامهت هاش رصاعم رعاش گیب یدبع هک تسا هتخادرپ یشاقن زا ییاه هنحص فیصوت هب نیوزق رد یوفص هناختلود یاه غاب نیا .تسا هدوب رگ هولج هناختلود یاه خاک زا یضعب یاهراوید رب تسد هریچ یناشاقن طسوت یاه شزرا تخانش یارب ،دنا هداد تنیز ار تداعس فورعم غاب تارامع هک اه هراگن راوید چگ یاهرشق ریز رد ییاه

    1. محسن می گوید

      آقا بابک فایل pdf رو به عکس تبدیل کن و بده بهش این مشکلت حل میشه یا یا با یه نرم افزار دوباره همون فایل رو به PDF تبدیل کن

  12. مهدی می گوید

    ههه. کلا یه شعر دیگه ساخته: نماز من عماز بود!! آخ عمازو از کجا آورده.
    فکر کنم بیشتر کاربردش ساختن هایکو باشه!

  13. M.M.M می گوید

    در مورد جا انداختن برخی خطوط یک فایل با همین مشکل را به دو قسمت کوچکتر تقسیم کردم خط جا افتادده را تبدیل کرد

  14. reihaneh می گوید

    خیلی خوب بود. به جرات میشه گفت چند ثانیه بیشتر طول نمیکشه.بهم ریختگیهاش جزئیه. فقط علائم و فرمولها رو نمیشناسه.

  15. مهدی می گوید

    اصلا متنی نمیاره که بشه ادیتش کردم یه راهنمایی کنید دانلود میکنم به صورت عکسه بازم،یه اموزش بزارید.

    1. محسن می گوید

      بالای صفحه عکس هست پایینش هم متن تبدیل شده رو نشون می ده ، اگه تبدیل نکرده فایلت رو دوباره تبدیل به عکس کن.شاید هم رزولیشن پایینه

  16. امیر می گوید

    خیلی عالی بود. مدتها بود مشکل داشتم. از شما تشکر میکنم. کار با اون بسیار ساده و نتیجه کاملا قابل قبول بود.

  17. ابراهیم می گوید

    نتیجه‌ای که من گرفتم از تبدیل متن خیلی خیلی فراتر از انتظارات من بود، یعنی خیلی بیشتر از حد نرم‌افزارهای ocr دیگه، مخصوصا فارسی‌هاش. البته هنوز اونطور نشده کخ فایل رو بدی و متن تحویل بگیری! D:

  18. فرشاد می گوید

    واقعاً خبر عالی‌ای بود!
    نتیجه تبدیل شما نشون میده که انگار گوگل داره از یه دیکشنری هم کمک میگیره!

  19. سیامک می گوید

    منم امتحان کردم ولی کار نکرد
    همون رویه ای که گفته بودین رو انجام دادم
    شاید واسه همه کار نمی کنه

  20. thipax می گوید

    آقا ممنون . منو که از تایپ کردن نجات دادی

  21. ا ر ف می گوید

    گمانم باید گزینه زبان را در ویندوز خودمان ردیف کنیم وزبان اصلی رو روی فارسی بگذاریم .اخرین گزینه تغییر زبان رو میگم .

  22. Ali می گوید

    باسلام
    خبر خوبی بود
    خوب هم کار کرد
    یکی از نکات مهم که تاثیر در عملکرد این سیستم دارد ، فونت متن هست .
    هر چه فونت غیر متداولی استفاده شود تشخیص سخت تر و نتیجه دور از هدف تر خواهد بود.

    موفق باشید

  23. محقق می گوید

    خیلی ممنون. خدا خیرتون بده اطلاع رسانی کردید.

  24. amir می گوید

    به نام خدا
    با سلام
    1) لارم میدانم که تشکر فراوان خود را به خاطر اطلاع رسانی این موضوع اعلام نمایم.
    2) متن شعری را که در بالا ذکر کرده بودی به صورت یک1 ستون ، یعنی مصراع های اول شعر را در drive gooogle امتحان کردم به خوبی پاسخ داد. پس مرتبط با رنگ زمینه نبود
    با آرزوی موفقیت وتشکر مجدد
    ع

  25. علی می گوید

    بیشتر این عقب افتادگی نرم افزاری در ایران به خاطر عدم اجرای صحیح قوانین کپی رایت و حقوق مولف است.

  26. محمد حسین می گوید

    آقا با این کارت شاید مسیر زندگیمو عوض کردی…

  27. وحيد می گوید

    آیا شرکتهای ایرانی قادر خواهند بود از این امکان بسیار ارزشمند استفاده کنند و نرم افزارهایی تهیه کنند که قابلیت OCR با دقت بالا رو داشته باشه؟

  28. ا می گوید

    چقدر از Readiris 15 بهتر است؟ هر کدام چه نمره ای از 100 می گیرند؟

  29. رضا می گوید

    برنامه ای که گوگل استفاده میکنه tesseract نام دارد که رایگان بوده و بر روی ویندوز هم قابل نصب هست.

ارسال یک پاسخ

آدرس ایمیل شما منتشر نخواهد شد.

••4 5