●HOME

1.「スキャナー で pdf」

紙文書電子文書化

スキャニング作業

製本されているものは、背を切り落として、ADF ( Automatic Document Feader ) で読み取れるようにします。

従って、元の状態に戻すことができません。

原本そのままの状態を保つことも可能ですが、手差しの作業となりますので、時間と費用がかかります。

また、この場合、見開き部分にノイズが入ります。

スキャナーで読込んで pdf や tiff 型式の画像ファイルにします。

pdf がハンドリングし易いと思います。

400dpiで読込むとファイルサイズは大きくなりますが、それでもA4サイズを白黒二値で読込んで、640MBのCDに4.5万ページは入る計算になります。

作業は概ね下記のようになります。

 

客先との事前確認次項(pdfの場合)

1. 納期、単価

2. ステープルの取外し、製本されたものであれば解体する旨(バインダー型式で無い限り復元できない旨)の確認

3. 読み取り解像度の決定

4. 検索方法の確認

(1) フォルダやファイルの命名方法

(2) ノンブルやテキストの埋込みの有無

(3) ページの開き方

(4) サムネイルの有無

(5) ページ番号設定の有無

(6) 製作者等の書込みの有無

(7) ウォーターマーク、フィールド、ノート等の有無

(8) 検索用に透明文字を入れるか否か

5. 記録媒体の確認(CD, MO, HDD或いはDVD)

実作業

A.  前工程

金具等取外し、又は本の解体作業

B. スキャン(Adobe Acrobat が必要)

スキャンpdf化ファイル・フォルダ命名保存繰返し)

C. 後工程

1. 読み取り結果の確認及び修正作業
(1) 総ページ数

(2) 傾き修正(PhotoShop等の画像処理ソフトが必要)

(3) 修正不可能のページは再スキャン

(4) 必要ならばサムネイルの作成

(5) 追加次項の書き込み

(6) OCR 入力と同様校正が必要になる為あまりやりたくない作業。)

(7) テキスト埋込み(BookMark や Link を付けるため。透明なOCR結果を埋込むので、文字検索も可能になる。また、Index が必要になっても比較的楽に作ることが出来る。)

(8) ウォーターマーク、フィールド、ノート等の有無

(9) 階層化するか、インデックスをどうするか

2. 「しおり」「リンク」「インデックス」の動作確認

3.  メディアへ書き出し

4. ラベル作成

実作業はA:B:C=1:3:6 の割合

後工程の方が時間が掛かるのでスキャナーの稼働時間は全体の三割以下に。その為にも最初から精度の良いモノを作らないと、後工程で時間が足りなくなる。

留意しておかなければならないのは、原稿自体が傾いているということ。特に製本されたものは、折り断裁の工程を経てきたものなので、小口と行が直角とは限らず、スキャナーが取込む方向によって傾きが大きくなる場合もある。0.5度傾いていると、目立つ。原稿の傾きについては、客先に了解して貰う。そこまで修正する場合は、別途料金を考えて貰う。スキャナードライバーには「傾きの自動修正機能」がタイガイあるのだが、あまり当てにはできない。

当然だが、スキャナーの精度に負うトコロが大きくなる。

ファクターとしてはADFの善し悪しが効いてくる。

両面機の場合、反転させて裏面を読むものはジャムを起しやすい。

そこでワンパスで両面読むスキャナーもある。

 

2.「データ を pdf」

様々な文書データ(テキストや画像)をpdfファイルにします。

テキストなので、ファイルサイズは小さくなります。

また、文書内検索が容易になります

客先との事前確認次項(pdfの場合)

1.  データの種類

2. 納期、単価

3. 解像度の決定

4. 検索方法の確認

(1) フォルダやファイルの命名方法

(2) ノンブルやテキストの埋込みの有無

(3) ページの開き方

(4) サムネイルの有無

(5) ページ番号設定の有無

(6) 製作者等の書込みの有無

(7) ウォーターマーク、フィールド、ノート等の有無

(8) 階層化するか、インデックスをどうするか

5. 記録媒体の確認(CD, MO, HDD或いはDVD)

実作業

A.  前工程

データが格納されたメディアをチェック

B. 所要のpdfファイルを作成(Adobe Acrobat)

1. 必要ならば、テキストの埋込み

2. データpdf化ファイル・フォルダ命名保存繰返し)

3. pdfファイルに「しおり」「リンク」の作成作業

4. インデックス作成作業

5. ウォーターマーク、フィールド、ノート等

C. 後工程

1. 「しおり」「リンク」「インデックス」の動作確認

2. メディアへ書き出し

3. ラベル作成