■目的
 文書イメージをスキャナー入力しpdfで保存していますが大容量です。
 画質劣化を回避し解像度/階調最適化でメール送信も支障ない容量に低減します。

■文書サンプル
 今回テストに使ったのはA4の2色印刷文書で文字と部分的にグラデーションの背景を持ちます。

■スキャナー/ソフトウェア
 今回使用するスキャナーやPDF変換ソフトウェアなどは以下です。
 スキャナ:Canon MP600+ScanGear(スキャンドライバー)
 画像処理:Photoshop EL7
 PDF出力:primoPDF
 
■取込/変換/保存
 スキャナを使用して紙文書のイメージを取り込み電子化してPDFファイルで出力します。
 また画質保持のための階調変換を実行します。
 文書取込(MP600):
  モード:雑誌(カラー) 解像度:300dpi サイズ:A4
 階調変換(Photoshop):8bitグレー -> 1bitモノクロ2値 (誤差拡散法..ディザ指定)
 PDF変換(primoPDF):画質="印刷"

[参考]:ScanGear(MP600)設定項目
モード 内容 備考
原稿 写真 /雑誌 (カラー)
文書 (グレー)
新聞(白黒)
16 /24 /32bit カラー
1/4/8bitモノクロ
1bitモノクロ
用途 印刷 (300DPI)
表示 (150DPI)
OCR (300DPI)
出力解像度: 以下を指定可能
 75 /150 /300 /600 /1200
サイズ A4/B5など

■画質/容量
 以下は電子化後の画質と非圧縮およびPDFファイルの容量を確認した結果です。
モード 画質(300dpi) 容量 (A4サイズ)
カラー /24bit 25,481 KB
 818KB (pdf)
グレー/8bit 8,495 KB
 685KB (pdf)
モノクロ2値
(グレー/8bit から階調変換)
1,069 KB
 96KB (pdf)
モノクロ2値 1,069 KB
 36KB (pdf)
■結果
 A4/300dpi/24bitカラーpdf文書の容量は1MB/ページが目安と思われます。
 A4/300dpi/8bitグレースケールpdf文書の容量は500KB/ページが目安と思われます。
 A4/300dpi/1bitモノクロ2値pdf文書の容量は100KB/ページが目安と思われます。
 モノクロ2値/8bitグレー/24bitカラー取り込みの容量比は画像圧縮なしで理論的に1:8:24です。
 解像度150/300/600dpi取り込の容量比は画像圧縮なしで理論的に1:4:16です。
 MP600スキャナーモノクロ2値デフォルト設定では中間色(赤色グラデーション部)が取り込めません..当たり前?
 モノクロ2値で中間色を保持するには誤差拡散法ディザによるカラー/グレーからの階調変換が有効です。
 これによりモノクロ2値で朱色の印影などが消えてしまう問題に対応します。
 さらに容量削減が必要なときは以下の条件設定が一般的と思われます。
  解像度:文字などのサイズに合わせて300/200/150の順に低減します。
  カラーモード:カラー階調に合わせて32/24/16bitの順に低減します。
  グレースケール:グレースケール階調に合わせて8/4bitの順に低減します。

  blog      MovableType