月別アーカイブ: 2015年4月

正確にOCRを掛ける方法 No.2

前回(4月16日)のブログに続きます。

スキャネックスのOCR認識率(99%程度)は高く、通常の使用では問題ありません。しかし、100%近い認識率を必要とする場合もあります。

例えば、視力が弱くて文字が読みずらいので、文章をOCRで電子化して音声読み上げソフトで音声に変換したい場合などです。

その場合は、スキャネックスsでスキャンしたデータを、日本語辞書機能を内蔵したOCR専用ソフト(別途ご購入が必要)を使ってOCR変換すると、100%近くの認識率で変換をすることができます。

OCR専用ソフトには「読取革命」(Panasonic)、「e.Typist」(メディアドライブ)などがあります。

外部OCRソフトの使い方は以下の通りです。

  • スキャネックスsで文書または本をスキャンする。
  • 保存形式からTIFF形式を選択して保存する。
  • TIFF形式で保存したファイルを外部OCRソフトを使って読み込み、OCR変換を掛ける。

TIFF形式は画像のファイル形式ですが、複数ページを1つのファイルとして保存することができるので、外部OCRソフトを使って読み込む際に、複数ページを一括変換できるので大変に便利です。

外部OCRソフトでOCR変換を掛ける際にも、前回(4月16日)のブログでお伝えした通り、スキャナーのカメラを低くし、被写体をプレビュー画面に出来るだけ大きく写すと認識率が向上します。

[`yahoo` not found]

正確にOCRを掛ける方法 No.1

スキャネックスsにはABBYY社のFinereader10という世界的に評価の高いOCRソフトエンジンが搭載されており、日本語はもちろん31言語をOCR変換することが出来ます。

PDFファイル形式OCRを掛けて保存すると検索機能が便利ということを2014年11月28日のブログで紹介させて頂きました。スキャネックスsOCR認識率が高く、PDFの検索機能を十分に発揮することができます。また、スキャネックスsでスキャンしたデータをWord形式で保存しますと、自動的にOCRが掛かり文字を修正したり編集したりすることができます。

実際に単行本をスキャンした際のOCRの結果をブログの最後に載せていますので参考にしてください。

お客様よりOCRの認識精度が思ったよりも高くないという声を頂戴することがありますが、その原因を調べますと、スキャナーのカメラを被写体から離しすぎてスキャンしていることが多いのです。被写体がプレビュー画面に出来るだけ大きく表示されるように、カメラの位置を下げてスキャンしますと、スキャン画像が綺麗になり、ご満足頂けるOCR認識を実現することが出来ます。

本のOCRの認識率を高めたい場合は、本を見開きでなく1ページずつスキャンする方法をとれば、カメラの位置を被写体により近づけることが出来ます。

実際に単行本(片面A5版)をスキャンしてみましたところ、以下のような結果となりました。

単行本(片面A5版)を見開きでスキャン

OCR認識率:99.4%(誤認識した文字数=3文字/総文字数:521文字)

単行本(片面A5版)を1ページずつカメラの位置を被写体に近付けてスキャン

OCR認識率:99.8%(誤認識した文字数=1文字/総文字数:521文字)

OCRの実用例はこちらで紹介しています。

[`yahoo` not found]