معرفي بهترين نرم افزارهاي تبديل تصوير به متن يا OCR
هرچند امروزه و در اين دوره تقريبا همه چيز حالت ديجيتال پيدا كرده است، بايد گفت هنوز استفاده از كاغذ در مواردي مانند جزوه رايگانها، قبوض، روزنامهها و... رواج دارد. براي تبديل اسناد متني به نسخههاي ديجيتال راهكاري به نام OCR وجود دارد كه مخفف عبارت «تشخيص كاراكتر اپتيكال» است. نرمافزارهاي OCR امكان ديجيتالي كردن اسناد نوشتاري پرينتشده و تبديل آنها به نسخههاي قابل ويرايش را فراهم ميكنند.
تشخيص كاراكتر اپتيكال يا OCR برنامهاي است كه تصاوير اسكن شدهي متون چاپشده يا دستنويس را به فرمتهاي متني قابل خواندن براي ماشين تبديل ميكند. ممكن است جزوه رايگان يا رسيدي داشته باشيد كه سالها پيش تايپ يا نوشته شده است و بخواهيد بدون تايپ مجدد، نسخهي ديجيتال آن را داشته باشيد؛ در چنين مواردي OCR بسيار كارآمد است.
از اين فناوري كارآمد ميتوان براي استخراج متن از تصاوير نيز بهره برد. به علاوه، با استفاده از OCR ميتوانيد جدولهاي موجود در متن چاپشده را به فرمت اكسل تبديل كنيد و جزوه رايگانهاي قديمي را به گونهاي PDF كنيد كه متن موجود در تصاوير آنها نيز توسط نرمافزاري كه PDF را با آن باز ميكنيد، قابل جستجو باشد. در اين مقاله از اخبار تخصصي، علمي، تكنولوژيكي، فناوري مرجع متخصصين ايران، بهترين نرمافزارهاي رايگان و پولي OCR را به شما معرفي خواهيم كرد.
بهترين نرمافزارهاي OCR موجود
وقتي سراغ دانلود نرمافزاري براي تبديل عكس به نوشته ميرويد، اصليترين سؤال در ذهن شما اين خواهد بود كه كدام نرمافزار بهتر است. براي رسيدن به پاسخ اين سؤال بايد موارد زير را مد انديشه متخصصين قرار دهيد.
۱. ريدآيريس ( Readiris)
ريدايريس يكي از نرمافزارهاي OCR قدرتمند موجود بهشمار ميرود كه كار با آن بسيار ساده است. هرچند اين برنامه پولي است، اما ارزش هزينهاي كه ميپردازيد را دارد. ريدايريس از اكثر فرمتها همراهي ميكند و قابليتهاي جذابي دارد كه روند تبديل را تسهيل ميكند. براي مثال، در ريدايريس، تصاوير ميتوانند از دستگاههاي مختلف مانند انواع اسكنر گرفته شوند و امكان تنظيم پارامترهاي مختلف از جمله DPI نيز براي متخصص فراهم است.
پس از پايان كار، ريدايريس بخشهاي متني تصوير را تشخيص ميدهد و نقاطي كه امكان استخراج متن از آنها وجود دارد را مشخص ميكند. ريدايريس به قابليت كمنظير ذخيرهي ابري نيز مجهز است كه به متخصصان امكان ذخيرهي متون استخراجشده را در گوگلدرايو، واندرايو، دراپباكس و... ميدهد. ريدايريس به قابليتهاي ويرايش و پردازش متعددي نيز مجهز است كه به متخصصان امكان اسكن باركدها را نيز ميدهد. استفاده از ريدايريس براي ۱۰ روز رايگان است و پس از آن براي برخورداري از امكانات اين نرمافزار بايد حداقل ۹۹ دلار بپردازيد.
۲. ابي فاينريدر ۱۴ (ABBYY FineReader 14)
اين ابزار را ميتوان قدرتمندترين ابزار تشخيص كاراكتر اپتيكال موجود قلمداد كرد. ابي فاين ريدر ۱۴ از سرعت و دقت بالايي در تشخيص متون برخوردار است. اين نرمافزار به خوبي از پس حجم بالاي كار برميآيد و از ابزار پيشرفتهي اصلاح متون نيز برخوردار است. اين ابزار در مواردي كه در صحت كلمهي تشخيص داده شده ترديد وجود دارد، به راحتي با انجام مقايسهي دقيق با تصوير اصلي، اشكال را برطرف ميسازد.
ابي فاينريدر ۱۴ عملكردي فراتر از آنچه كه از يك نرمافزار OCR انتظار داريد ارائه ميدهد. اين ابزار جزوه رايگاني ۵۰۰ صفحهاي را با دقت تمام به پيدياف تبديل ميكند. همچنين ميتوانيد متون موجود در عكسهايي كه در اينترنت پيدا ميكنيد را با اين برنامه استخراج كنيد. به علاوه، امكان تبديل اسناد اسكن شده به فرمت HTML يا ePub نيز وجود دارد. كمترين هزينه براي تهيهي نسخهي پولي اين نرمافزار ۱۹۹ دلار است؛ هرچند كه ميتوانيد به مدت ۳۰ روز به صورت رايگان از ابي فاينريدر ۱۴ استفاده كنيد.
۳. ابي فاينريدر الكترونيك
اگر ميخواهيد از امكانات ابزار قدرتمند ابي بدون متحمل شدن هزينهي آن برخوردار شويد، ميتوانيد نسخهي الكترونيك فاينريدر را امتحان كنيد. فاينريدر الكترونيك از فرمتهاي ورودي بسياري از قبيل PDF ،JPG ،PNG ،DCX ،PCX ،TIF ،TIFF و BMP همراهي ميكند. فرمتهاي خروجي اين ابزار الكترونيك نيز PDF، وورد، اكسل و e-Pub را شامل ميشود.
نسخهي رايگان اين ابزار اجازهي تبديل ۱۰ صفحه در ماه را پس از نامنويسي رايگان در آن به شما خواهد داد؛ اما اگر ميخواهيد ماهانه تعداد صفحات بيشتري را تبديل كنيد، بايد يكي از اشتراكهاي پولي آن را خريداري كنيد. ارزش اين اشتراكها از ۴۹ دلار براي ۲۴۰۰ صفحه در سال شروع شده به ۱۴۹ دلار بابت ۱۲ هزار صفحه در سال ختم ميشوند. علاوه بر اين، ميتوانيد با پرداخت ۱۶۹.۹۹ دلار، اشتراك نامحدود و مادامالعمر ابي فاينريدر پرو را تهيه كنيد.
۴. مايكروسافت واننوت (Microsoft OneNote)
يكي از قابليتهاي واننوت كه شايد كمتر كسي به آن توجه كرده باشد، تشخيص كاراكتر اپتيكال است. در اين برنامه كه بيشتر جهت نگهداري يادداشتها از آن استفاده ميشود، گزينهاي تحت عنوان Copy text from picture وجود دارد كه به شما امكان استخراج متن از تصاوير را ميدهد. آنچه كه واننوت را از ساير ابزارها متمايز ميكند سادگي كار با آن است. كافي است تصوير را به واننوت بدهيد و روي آن كليك راست كنيد و گزينهي يادشده را انتخاب كنيد تا واننوت ادامهي كار را انجام دهد. متن تشخيص داده شده در كليپبورد ذخيره ميشود و شما قادر خواهيد بود آن را در فايل ورد يا هر برنامهي ديگري كه ميخواهيد پيست كنيد؛ اما توجه داشته باشيد كه اين برنامه قادر به تشخيص و استخراج جدولها و ستونها نيست.
۵. سيمپل OCR
سيمپل OCR ابزار كارآمدي است كه ميتواند به راحتي متون پرينتشدهي شما را به فايلهاي متني با قابليت ويرايش تبديل كند. اگر اسناد دستنويس زيادي داريد كه ميخواهيد آنها را به فايلهاي متني قابلويرايش تبديل كنيد، سيمپل OCR بهترين گزينه براي شما خواهد بود؛ اما بايد بدانيد كه تشخيص دستنوشته محدوديت داريد و تنها به مدت ۱۴ روز ميتوانيد به صورت رايگان از آن بهره ببريد. در عوض، تشخيص متن پرينتشدهي ماشيني هيچ محدوديتي ندارد. يك مطالعهكنندهي املا نيز در اين نرمافزار تعبيه شده است كه ميتوانيد براي اصلاح مواردي كه به درستي تشخيص داده نشدهاند استفاده كنيد. همچنين ميتوانيد سيمپل OCR را طوري تنظيم كنيد كه مستقيما تصوير دريافت شده توسط اسكنر را مورد پردازش قرار دهد. متأسفانه، سيمپل OCR نيز مانند مايكروسافت واننوت از ستونها و جدولها همراهي نميكند.
۶. Free OCR
فري OCR از موتور Tesseract كه ابتدا توسط HP ساخته شد و سپس توسط گوگل بهبود داده شد، استفاده ميكند. تسراكت موتور بسيار قدرتمندي است كه گفته ميشود يكي از دقيقترين موتورهاي روز OCR در دنيا است. فري OCR فرمتهاي پيدياف را به خوبي تشخيص ميدهد و از دستگاههايي مانند دوربينها و اسكنرها همراهي ميكند. به علاوه، همراهي از تمام فرمتهاي تصويري و فايلهاي چندصفحهاي TIFF نيز براي اين نرمافزار در انديشه متخصصين گرفته شده است. ميتوانيد از فري OCR براي استخراج متن از تصاوير با دقت بالا استفاده كنيد. همانند ساير برنامههاي رايگان تشخيص كاراكتر اپتيكال، فري OCR نيز از ستونها و جداول همراهي نميكند.
۷. باكسافت فري OCR
باكسافت فري OCR ابزار كارآمد ديگري جهت استخراج متن از انواع تصوير است. كار با اين ابزار رايگان بسيار ساده است و امكان تحليل دقيق متون چندستوني نيز وجود دارد. باكسافت از چندين زبان از جمله انگليسي، اسپانيايي، ايتاليايي، آلماني، فرانسوي، پرتقالي و بسياري زبانهاي ديگر همراهي ميكند. سرعت و دقت عملكرد باكسافت فري OCR در تشخيص متن تايپي بر خلاف دستنوشته بسيار بالا است.
۸. تاپ OCR
اين نرمافزار در بسياري از جنبهها نسبت به ساير نرمافزارهاي معرفيشده متفاوت است، اما كار تشخيص متن را به همان دقت و ظرافت انجام ميدهد. تاپ OCR با دوربينهاي ديجيتال و اسكنرها به خوبي كار ميكند و محيط متخصصي آن داراي دو پنجره، يكي براي قرارگيري تصوير منبع و ديگري براي متن استخراجشده است. پس از آنكه تصوير مورد انديشه متخصصين از دوربين يا اسكنر در پنجرهي سمت چپ بارگذاري شود، متن استخراجشده از آن در پنجرهي سمت راست كه نوعي ويرايشگر متن است نمايان خواهد شد. اين نرمافزار از فرمتهاي تصويري GIF ،JPEG ،BMP و TIFF همراهي ميكند و خروجي كار نيز ميتواند به صورت PDF، HTML ،TXT و RTF باشد. به علاوه، تنظيمات فيلتر تصوير نيز براي افزايش كيفيت عكس ورودي در تاپ OCR در انديشه متخصصين گرفته شده است.
جمعبندي
در پايان ميتوانيد از جدول زير براي مقايسهي اجمالي نرمافزارهاي فوق بهره بگيريد.
نرم افزار | امتياز (از ۵) | رايگان يا پولي | چندزبانه بودن | دسكتاپ يا الكترونيك | همراهي ۲۴ ساعته |
---|---|---|---|---|---|
ريدايريس | ۵ | پولي (داراي دورهي آزمايش رايگان) | بله | دسكتاپ | خير |
ابي فاينريدر ۱۴ | ۴ | پولي | بله | دسكتاپ | بله |
ابي فاينريدر الكترونيك | ۴ | رايگان | خير | الكترونيك | خير |
مايكروسافت واننوت | ۳.۵ | رايگان | بله | دسكتاپ | بله |
سيمپل OCR | ۳ | رايگان | بله | دسكتاپ | خير |
فري OCR | 3 | رايگان | خير | الكترونيك | خير |
باكسافت فري OCR | ۳.۵ | رايگان | خير | دسكتاپ | خير |
تاپ OCR | ۳ | پولي | خير | دسكتاپ | خير |
كلام آخر
نرمافزارهاي زيادي براي تبديل تصوير به متن وجود دارند كه به كمك آنها ميتوانيد زحمت تايپ مجدد متون را كم كنيد؛ اما مناسبترين گزينه نرمافزاري است كه بتواند علاوه بر متن، اشكال و جداول موجود در منبع را به شكل صحيح تبديل كند. اميدواريم از اين مطلب استفادهي لازم را برده باشيد. ميتوانيد هم انديشي ها و تجربيات خود را در بخش انديشه متخصصيناتها با اخبار تخصصي، علمي، تكنولوژيكي، فناوري مرجع متخصصين ايران به اشتراك بگذاريد.
هم انديشي ها