正確にOCRを掛ける方法 No.1

スキャネックスsにはABBYY社のFinereader10という世界的に評価の高いOCRソフトエンジンが搭載されており、日本語はもちろん31言語をOCR変換することが出来ます。

PDFファイル形式OCRを掛けて保存すると検索機能が便利ということを2014年11月28日のブログで紹介させて頂きました。スキャネックスsOCR認識率が高く、PDFの検索機能を十分に発揮することができます。また、スキャネックスsでスキャンしたデータをWord形式で保存しますと、自動的にOCRが掛かり文字を修正したり編集したりすることができます。

実際に単行本をスキャンした際のOCRの結果をブログの最後に載せていますので参考にしてください。

お客様よりOCRの認識精度が思ったよりも高くないという声を頂戴することがありますが、その原因を調べますと、スキャナーのカメラを被写体から離しすぎてスキャンしていることが多いのです。被写体がプレビュー画面に出来るだけ大きく表示されるように、カメラの位置を下げてスキャンしますと、スキャン画像が綺麗になり、ご満足頂けるOCR認識を実現することが出来ます。

本のOCRの認識率を高めたい場合は、本を見開きでなく1ページずつスキャンする方法をとれば、カメラの位置を被写体により近づけることが出来ます。

実際に単行本(片面A5版)をスキャンしてみましたところ、以下のような結果となりました。

単行本(片面A5版)を見開きでスキャン

OCR認識率:99.4%(誤認識した文字数=3文字/総文字数:521文字)

単行本(片面A5版)を1ページずつカメラの位置を被写体に近付けてスキャン

OCR認識率:99.8%(誤認識した文字数=1文字/総文字数:521文字)

OCRの実用例はこちらで紹介しています。

[`yahoo` not found]

コメントを残す