Word」タグアーカイブ

正確にOCRを掛ける方法 No.1

スキャネックスsにはABBYY社のFinereader10という世界的に評価の高いOCRソフトエンジンが搭載されており、日本語はもちろん31言語をOCR変換することが出来ます。

PDFファイル形式OCRを掛けて保存すると検索機能が便利ということを2014年11月28日のブログで紹介させて頂きました。スキャネックスsOCR認識率が高く、PDFの検索機能を十分に発揮することができます。また、スキャネックスsでスキャンしたデータをWord形式で保存しますと、自動的にOCRが掛かり文字を修正したり編集したりすることができます。

実際に単行本をスキャンした際のOCRの結果をブログの最後に載せていますので参考にしてください。

お客様よりOCRの認識精度が思ったよりも高くないという声を頂戴することがありますが、その原因を調べますと、スキャナーのカメラを被写体から離しすぎてスキャンしていることが多いのです。被写体がプレビュー画面に出来るだけ大きく表示されるように、カメラの位置を下げてスキャンしますと、スキャン画像が綺麗になり、ご満足頂けるOCR認識を実現することが出来ます。

本のOCRの認識率を高めたい場合は、本を見開きでなく1ページずつスキャンする方法をとれば、カメラの位置を被写体により近づけることが出来ます。

実際に単行本(片面A5版)をスキャンしてみましたところ、以下のような結果となりました。

単行本(片面A5版)を見開きでスキャン

OCR認識率:99.4%(誤認識した文字数=3文字/総文字数:521文字)

単行本(片面A5版)を1ページずつカメラの位置を被写体に近付けてスキャン

OCR認識率:99.8%(誤認識した文字数=1文字/総文字数:521文字)

OCRの実用例はこちらで紹介しています。

[`yahoo` not found]

多様な保存形式

スキャネックスはスキャンした資料を、お客様の用途に合わせて多様なファイル形式で保存することができます。

写真やイラストをスキャンした場合は、JPEGBMPTIFFPNGで保存すると便利です。

写真スキャン例:http://www.amtworld.co.jp/SHOP/XC0011.html

それらのフォーマットで保存しますと画像編集ソフトなどを使い、自由に画像を編集・加工することができます。画像の色合いなども編集ソフトでお好みの色合いにできますので、スキャン画像をより自然な色味にすることも可能です。

文章を保存する場合には、PDFPDF・OCRWordRTFがお勧めです。

特にPDF・OCR形式で保存しますと、文字がテキストとして認識され、スキャンした文章の中の語句を検索することができます。そうしますと、スキャナで取りためた資料を後から見つけ出したい時などに、とても便利です。

OCRはOptical Character Recognitionの略、光学文字認識のことで、スキャナで取り込んだ画像をコンピュータで編集できる形式に変換することです。

Word形式で保存しますと、文章がWord形式のテキストに変換され、Wordで編集することが可能です。スキャンした文章を編集(修正)して資料を作成する時などにとても便利です。また、文字データだけでなく画像データもWordに貼り付けることが出来ますので、活用の幅が広がります。

ホームページでPDF・OCRWordの活用例を紹介していますので、是非、ご覧ください。

http://www.amtworld.co.jp/hpgen/HPB/entries/7.html

[`yahoo` not found]