ビジネスの現場では、会議での配付資料やFAXなど、まだまだ紙ベースでの書類のやり取りが健在だ。それらの文書を電子的に保存しておきたいとき、オススメなのがOCR(文字認識)ソフトを利用してテキストをデータ化する方法。電子データ化しておけば、キーワードでファイルを検索することができるし、別の書類への流用も簡単にできる。そのOCR、各社からいろいろな製品が出ているが、忙しいビジネスパーソンにイチ押しは、メディアドライブが提供するスマートフォン向けアプリ「e.Typist Mobile」だ。
「e.Typist Mobile」は、スマートフォンのカメラで書類を撮影し、その書類に含まれる文字列をOCRにかけてデータ化するアプリ。外出先で空き時間などを使って、いつでもどこでもOCR処理できるのがいい。iPhoneやiPadに対応した「e.Typist Mobile for iPhone」、Android OSを搭載したスマートフォン向けの「e.Typist Mobile for Android」の2種類があり、価格はいずれも900円。機能は基本的にほぼ同じということで、今回はiPhoneを使って「e.Typist Mobile」を試した。
使い方はいたって簡単。App Storeから「e.Typist Mobile」のアプリをダウンロードし、起動するとメインメニューの表示が出てきて「カメラ撮影後、文字認識を行う」をタップする。カメラが起動するので、OCRにかけたい書類を撮影するだけ。カメラの特性上、光量が足りないとノイズがのってしまい、どうしても読取り精度が落ちてしまうので、できるだけ明るい場所で撮影することがポイントだ。また、被写体に影ができると読取りが難しくなってしまう。屋外では影のできにくい場所、屋内では部屋を明るくして、影になりにくい環境をつくろう。
撮影後は、テキスト化したい部分を選択して処理を開始する。処理範囲にもよるが、10秒ほどでOCR処理の結果を表示。間違って認識していた場合は、その部分を修正すればいい。撮影した画像とテキストデータを同時に参照できるので、簡単に修正することができる。テキストの修正部分にカーソルを合わせると、画像データ内の該当位置を表示してくれるので、画像を参照しやすい。認識結果を保存しておいて、時間のあるときに修正することができるのが便利。保存件数は100件までだ。
気になる認識精度はどうか。フリーマガジン『BCNランキング』11月号の5ページに掲載している「ニュースなデジタル」で試した。横5.5×縦3cmのなかに200文字ほど詰まっている記事の場合、ドロップキャップ(文頭の大きな文字)以外の部分で、すべての文字を正しくテキスト化することができた。
さらに大きなサイズの書類でも試した。メディアドライブが発表した「e.Typist Mobile」のプレスリリースをA4サイズにプリントし、本文に該当する部分をOCR処理した。このプレスリリースは、文字の大きさなど一般的な会議用の資料と同じ。結果は、残念ながら、誤認識の部分が多かった。詳しく傾向をみてみると、ヤクモノ(カギ括弧や丸括弧など)やアルファベットの多い部分で誤認識が目立つ。しかし、日本語が連続する部分の認識精度は良好だった。
撮影の腕の問題か、それともOCRエンジンの問題かを検証するために、プレスリリースをスキャナで読み込み、その画像データをOCRにかけた。画像データのサイズは1653×2291ピクセル。iPhone4で撮影した画像と比べて、ひと回りほど小さいサイズだ。その結果、認識精度は95%以上を記録した。つまり、撮影さえうまくできれば、A4サイズの文書でも問題なく認識できるということだ。
「e.Typist Mobile」のメイン画面
読取り時間は約10秒、認識結果は良好
「e.Typist Mobile」は、スマートフォンのカメラで書類を撮影し、その書類に含まれる文字列をOCRにかけてデータ化するアプリ。外出先で空き時間などを使って、いつでもどこでもOCR処理できるのがいい。iPhoneやiPadに対応した「e.Typist Mobile for iPhone」、Android OSを搭載したスマートフォン向けの「e.Typist Mobile for Android」の2種類があり、価格はいずれも900円。機能は基本的にほぼ同じということで、今回はiPhoneを使って「e.Typist Mobile」を試した。
iPhoneやiPad、Androidスマートフォンに対応
使い方はいたって簡単。App Storeから「e.Typist Mobile」のアプリをダウンロードし、起動するとメインメニューの表示が出てきて「カメラ撮影後、文字認識を行う」をタップする。カメラが起動するので、OCRにかけたい書類を撮影するだけ。カメラの特性上、光量が足りないとノイズがのってしまい、どうしても読取り精度が落ちてしまうので、できるだけ明るい場所で撮影することがポイントだ。また、被写体に影ができると読取りが難しくなってしまう。屋外では影のできにくい場所、屋内では部屋を明るくして、影になりにくい環境をつくろう。
影ができないように気を配りながら撮影しよう
撮影後は、テキスト化したい部分を選択して処理を開始する。処理範囲にもよるが、10秒ほどでOCR処理の結果を表示。間違って認識していた場合は、その部分を修正すればいい。撮影した画像とテキストデータを同時に参照できるので、簡単に修正することができる。テキストの修正部分にカーソルを合わせると、画像データ内の該当位置を表示してくれるので、画像を参照しやすい。認識結果を保存しておいて、時間のあるときに修正することができるのが便利。保存件数は100件までだ。
元の画像を参照しながら修正できる
気になる認識精度はどうか。フリーマガジン『BCNランキング』11月号の5ページに掲載している「ニュースなデジタル」で試した。横5.5×縦3cmのなかに200文字ほど詰まっている記事の場合、ドロップキャップ(文頭の大きな文字)以外の部分で、すべての文字を正しくテキスト化することができた。
特殊なレイアウト以外の部分はすべて問題なく読み取れた
さらに大きなサイズの書類でも試した。メディアドライブが発表した「e.Typist Mobile」のプレスリリースをA4サイズにプリントし、本文に該当する部分をOCR処理した。このプレスリリースは、文字の大きさなど一般的な会議用の資料と同じ。結果は、残念ながら、誤認識の部分が多かった。詳しく傾向をみてみると、ヤクモノ(カギ括弧や丸括弧など)やアルファベットの多い部分で誤認識が目立つ。しかし、日本語が連続する部分の認識精度は良好だった。
約物やアルファベットの多い場面で誤認識が目立つが、日本語の連続する部分は良好
撮影の腕の問題か、それともOCRエンジンの問題かを検証するために、プレスリリースをスキャナで読み込み、その画像データをOCRにかけた。画像データのサイズは1653×2291ピクセル。iPhone4で撮影した画像と比べて、ひと回りほど小さいサイズだ。その結果、認識精度は95%以上を記録した。つまり、撮影さえうまくできれば、A4サイズの文書でも問題なく認識できるということだ。
プレスリリースをスキャナで読み込んだ画像データをOCR処理した。ここではA4書類も問題なく変換した
関連記事
外部リンク
- スマートフォンでOCR! 「e.Typist Mobile」
スマートフォンでOCR! いつでもどこでも書類を電子化できる「e.Typist ...
独立起業家ウェブデジタルビジネスブログ:実践起業!成功への道。blogで人脈は作れるか? - 2011-11-04 10:11:33





























