■目的
 印刷文書のイメージをテキストに変換します。
 使用するのはBrother DCP-J925N複合機+eTypistです。

■構成
 スキャナー:Brother DCP-J925N
 ソフトウェア:Mediadrive eTypist 13
 OS:Win7/64
  Configuration
 eTypistのページはこちら

■イメージ取り込み
 eTypistを起動します。
 [スキャナー読込][スキャナードライバー選択=TW-Brother DCP-925N LAN]でスキャナー設定画面を開きます。
 文書タイプ/解像度/サイズ等を設定して[スキャン開始]で取り込み開始です。
 scan
■レイアウト解析/認識
 [レイアウト]でテキスト行/表/図形に分類しレウィアウトを自動解析します。
 結果はマニュアルで修正可能です。
 [認識]でテキスト変換や図の切り出しなどを実行します。
 recognition
■Word出力
 [ワンタッチ転送-Word][テキスト転送]で認識結果をワードに転送します。
  word
■編集
 Word側で認識結果やテキストやレイアウトを調整/編集します。

■サンプル
 以下は電子化した記念誌サンプルです。
 「スキーおだわら50年のシュプールを辿って」 2011/10/02
 
■結果
 印刷文書の電子化を完了しました。
 今回の文書は全111ページの記念誌です。
 テキストの認識にはほぼ誤りはありませんでした。
 時間を要したのは入力よりWordでのレイアウト調整です。
 効率向上には入力時のノイズ低減が効果的です。

  blog      MovableType