大阪から東京への引越しを機に、前からやってみたいと思っていた本の電子化をすることにしました。
理由
2DKから3DKへの引越し。もともとは増えた一部屋ぶんの壁を本棚で埋め尽くそうと計画していたのですが。
電子化の実行に踏み切った理由は、荷造りで部屋を埋め尽くした本入り段ボール箱の山を見て「うへぇ」と思ったからです。これは減らしていかないといつか地震で押し潰されて死んじまうなと。
もう一つの理由は、通勤で電車に乗る時間が片道40分に増えたから。職場が近いと家賃が高いし電車が混む場所なので、40分かかっても座れる方を選んだのです。往復80分あれば随分と本が読めますよね。
普通に本持ってけって話ですが、時間を考えると2〜3冊は持ち歩きたいところ。なので嵩張らないように持ち歩けるのはありがたいのです。
前置きが長くなりましたが、以下に俺自身が試行錯誤して落ち着いたスキャニングの方法について書いていきます。「漫画の電子化の方法」(以下、「電子化」)を参考にさせていただきました。
電子化する本
漫画は容量圧縮と軽快に読むためにJPEGにしてZIP圧縮、それ以外の本はOCRをかけてテキスト検索ができるようにPDFにします。
サンプルとして取り込むのは「神聖モテモテ王国」の6巻です。理由。最初の画像を「電光石火供えガイ」の戦闘シーンにしたかったから。
使用機材
scansnap S1500
FUJITSU ScanSnap S1500 FI-S1500
販売元:富士通
発売日:2009-02-07
おすすめ度:
「電子化」で紹介されているスキャナの新型ですが、実売37000円ぐらいと、より安くなっています。そして嬉しい誤算がそのサイズ。A4プリンタぐらいの大きさを想定していたのですが、思いのほか小さい! これなら常に机の上に置いていてもほとんど邪魔になりません。
サイズ比較
S1500Mという型もあって、どちらを買えばいいのか迷ったのですが、S1500MはMAC用でした。
裁断機 PK-513L
プラス 断裁機 裁断幅A4 PK-513L 26-106
販売元:プラス
発売日:2009-09-01
おすすめ度:
こちらも新型ですが、変わったところはカットラインを照射するための電池が単2から単3になっただけの模様。で、こちらは3万強。「電子化」では実売2万強とありますので、旧型から随分価格が上がっています。スキャナが安くなってる分とでトントンですかね。
ちなみに取説は刃の交換時の分解方法とか大事なことが書いてあるにも関わらずペラ1枚の頼りないものなので、記念すべき初スキャン対象となりました。
合わせて7万弱。高いと見るか安いと見るかは人それぞれ。「本を置く空間分の家賃を考えたら得」なんて意見もありますが、俺はそれを支持しません。だって本はそこにある事自体嬉しいんだもの。
まあそれで収まりきらなくなったから電子化するんですけどね。
裁断(本)
「電子化」と同じ。カッターで本を裁断機に入る厚さに分割したら、背表紙部分を4〜5ミリ切り落とします。紙の束が一気に「ブルルルッ」っと切れる手応えが気持ちいい。
分割
アンド裁断
本を裁断するという行為は、初めのうちは結構心にダメージがきます。「やっちゃった感」というか。なので慣れるまでは比較的どうでもいい本からやるといいと思います。コンビニ売りの漫画総集編とか。
また、糊残りには本当に注意が必要です。S1500はダブルフィード(重なり)検出機能がついているので、ページがくっついてしまうぐらいならすぐにやり直しが効くので良いのですが、読み取り面に糊がついてしまうと、これがなかなか落ちないのでかなり切ないことになります。(体験済み)
糊残りに限らず、読み取り面の汚れは致命的なので俺はレンズ掃除の定番、無水エタノールとキムワイプを購入しました。専用のクリーナーは少々高いので。
無水エタノールP 500ml
販売元:健栄製薬
発売日:2007-03-29
おすすめ度:
武藤工業 キムワイプ 12×21.5cm /1箱(200枚入) S-200
販売元:武藤工業
おすすめ度:
ちなみに切り落とした背表紙の部分ですが、これがしっかりと糊付けされた「丈夫な紙の棒」と化します。「かしこい主婦」ならうっかり小物入れや小物入れや小物入れを作ってしまいそうな素材感ですが、残しておいても何の役にも立たないのでとっとと捨てましょう。
雑誌の背表紙。立派なのでなんとなく捨てづらい
裁断(カバー)
作者が渾身の力を込めて描いた漫画のカバーは、どうせならカラーで残しておきたいところ。いろいろ取り込み方法を考えたのですが、
広げてそのままscansnapで取り込み
→ どうしても折り曲げ癖のところで影ができる。 アイロン等で伸ばしてみては?
→ めんどい。あとたぶん熱で表面が溶ける。 フラットベッドスキャナで取り込み
→ 後でトリミングが必要
ということで、これらの方法は断念。背表紙は断腸の思いで諦めて切り落とし、表紙・裏表紙に分けて取り込む事にしました。
糊残りの心配はないので、本のサイズに合わせてカット。背表紙部分のたるみは刃の横のガイドが押さえてまっすぐにしてくれるのでそのまま行っちゃってOK。
ピシッと伸ばしてくれる
折り返しの部分はそのまま読み込ませるので、伸ばさずに。たまに折りが甘い本があるので、逆にしっかり折っておきましょう。俺は風邪薬の小瓶でぐぐっとしごいています。
下拵え完了
取り込み設定
scansnapの設定。俺の場合は「ファイン」「カラー」「両面読み取り」で「継続読み取り有効」。オプションで「文字をくっきりにします」にチェック。その他自動補正系のオプションはOFF。
とにかく「楽に・早く」電子化できることを主眼に置いているので、取り込みに時間がかかる設定はNG。取り込み後もレタッチやサイズ圧縮が不要、なおかつ画質もあまり劣化しない設定を探して色々試したところ「ファイン」に落ち着きました。
取り込みスピードやHDDの容量に対して、自分の画質に対する許容範囲、本への思い入れを天秤にかけて決めれば良いかと思います。俺も本によっては「スーパーファイン」や「エクセレント」で取り込むつもりでいます。
なお、白黒の漫画もカラーでスキャンします。理由は後述。
スキャン(本)
スキャン開始。一度に全部は読み込めないので適当に分けて読み込ませます。継続読み取りを有効にしてあるので、分割しても1つのファイルとして保存されます。
「電子化」にならって原稿は横向き。縦に入れると確かにずれます。原因は、原稿の幅が完全には一致していないから。裁断するときに本が押しつぶされるので、少しだけ歪むんですね。それがズレを生む。多少の傾きは気にしないのならば後の回転処理が省略できるので、縦に読み込ませるのも有りです。
ブックエンドをストッパー代わりに
このブックエンドが重要。これがないと吐き出された原稿が滑ってしまって、順番どおりに重ならない場合が多々あります。もし汚れなどでスキャンがやり直しになった場合を考えてください。背表紙なしでページを正しく並べ替えるのは想像以上の苦行です。(体験済み)
悪いことは言いませんので、100円ショップにでも行ってブックエンドは用意しておきましょう。
(2010/3/7修正)本体上面がまるごとガパッと開いて排紙トレイになりました。ブックエンド要らないわ。コメント7番さんご指摘ありがとうございます。富士通さんごめんなさい。
(2010/3/9追記)原稿のサイズにもよると思いますが、ブックエンドの方が安定するかも。排紙トレイの上で滑っちゃうので。
スキャン(カバー)
漫画本編をスキャンし終えたら、一旦名前をつけて保存。カバーのスキャンをします。継続読み取りでひとつのファイルにまとめることも可能ですが、カラーとグレースケールで後の処理が異なるのであえて別のファイルに分けます。
カバーは折り返し部分から読み込むように原稿をセットします。逆にするとめくれて折れ曲がってぐしゃぐしゃになって、ひどい目に遭います。
(体験済み)
さて、カバーを折ったままスキャンすると、ダブルフィード検出機能が働いてエラーが出ます。
エラーメッセージ
ここで最後に読み取った原稿を「残す」にチェックして「読み取り中止」を選択。読み取ったファイルを削除するかどうか再度確認されるので「いいえ」を選択。これでスキャン結果を保存できます。これを表紙と裏表紙に対して行い、それぞれ別のファイルとして保存。
ちなみに俺は「本の名前_表紙.pdf」「本の名前_本編.pdf」「本の名前_裏表紙.pdf」という名前で保存しています。こうすると文字コードが表>本>裏の順なので、名前でソートされるビューワを使うといい感じで順番どおりに表示されるのです。
以上、ここまででスキャンは終了。
回転と書き出し
scansnapにはAdobe Acrobatがバンドルされています。以降の処理はAcrobat上で行います。
PDFファイルを開いて、「文書」→「ページの回転」(ショートカットはCtrl+Shift+R)で偶数ページ・奇数ページをそれぞれ逆方向に90度回転。回転の方向はスキャンさせた向き次第。
回転
次に、ファイルサイズ圧縮&ビューワで軽快に読むためにJPEG書き出しをして圧縮します。が、pdf上での回転はどうも書き出しファイルには反映されないようです。
そこで、Acrobatの良くわかんない仕様を利用します。カラースペースの変換をさせると何故か回転が反映されて書き出されるのです。
白黒の漫画をグレースケールではなくカラーでスキャンした理由がここにあります。「ファイル」→「書き出し」→「画像」→「JPEG」を選択、「名前をつけて保存」ウィンドウが出たら「設定」ボタンを押してカラースペースを「グレースケール」に設定。
JPEGとして保存 の設定
これでJPEGに書き出すと、正しい向きでグレースケールの画像が出力されます。ここにたどり着くまでにえらい時間かかったよ…。
カラーで保存したい表紙・裏表紙は仕方ないので横向きのまま書き出してJPEGを回転。回転にはPicasaを使っています。フリー・ロスレス回転・複数ファイルのドラッグ選択可能というのが選んだ理由。
漫画をグレースケールでスキャンして横向きのまま書き出し、Picasaでカバーと一緒に回転させるという手もあるのですが、200枚前後のJPEG保存って意外と時間がかかるんです(2〜3分ぐらい)。
Acrobatからの書き出しで時間をかけて、回転後の保存でさらに倍。マシンパワーに依存する部分が大きいと思いますが、俺の環境ではカバーと本を分けて処理するのが一番早かったということです。もっとも、オールカラーの本は素直にJPEGにしてから回転させるしかありませんが。
最後に全てのページをzip圧縮して保存。以上、ここまでで12〜3分。JPEG書き出し中に次の本の下拵えをして時間の無駄をなくせば、1時間で5冊といったところ。ファイルサイズは本によりますが40M〜60Mぐらいになります。
画質はこんなもん(等倍で切り出し)。
サンプル1
サンプル2
等倍だとモヤッとしたモスキートノイズが気になるかもしれませんが、ビューワーで縮小されるとほとんど分かりません。解像度的にフリガナがつぶれないか不安だったのですがバッチリ読めます。
ポツポツと見える汚れのようなものは、紙の粒子がスキャンされて、モスキートノイズがまとわりついたもの。これも縮小されればどうってことないのですが、どうしても気になるならばレタッチして消しましょう。
漫画以外
漫画以外はPDFで保存するので、Acrobat上で回転させたらおしまい。必要に応じて「文書」メニューからOCRをかけて検索可能に。小説ならはじめからグレースケールでスキャンしてしまえばいいし、読み取りオプションの傾き補正や原稿の向き判別も文字相手ならかなり賢く働いてくれるので、手間も時間も漫画よりずっと少なく済みます。
一番めんどくさい漫画がちゃんとスキャンできるようになれば、大抵の本は応用でどうとでもなります。用途に合わせてカスタマイズしましょう。
読む方法
漫画(JPEG)はleeyes(PC)とicomic(iPhone)。
PDFはAcrobat(PC)とGoodReader(iPhone)で読んでいます。
icomic
iPhoneの小さい画面でも漫画が十分に読めるのに驚き(流石にフリガナは潰れますが)。電車で立っていても吊り革を掴みながら片手で本が読める。素晴らしい。たくさん本を持ち歩ける以上のメリットかもしれません。じっくり読みたければPCで開けばいいしね。
向いてる人
以上で電子化手順の説明終わり。最後に自分でやってみて、「こういう人は電子化するといいんじゃない?」というのを挙げていきます。
2DKから3DKへの引越し。もともとは増えた一部屋ぶんの壁を本棚で埋め尽くそうと計画していたのですが。
電子化の実行に踏み切った理由は、荷造りで部屋を埋め尽くした本入り段ボール箱の山を見て「うへぇ」と思ったからです。これは減らしていかないといつか地震で押し潰されて死んじまうなと。
もう一つの理由は、通勤で電車に乗る時間が片道40分に増えたから。職場が近いと家賃が高いし電車が混む場所なので、40分かかっても座れる方を選んだのです。往復80分あれば随分と本が読めますよね。
普通に本持ってけって話ですが、時間を考えると2〜3冊は持ち歩きたいところ。なので嵩張らないように持ち歩けるのはありがたいのです。
前置きが長くなりましたが、以下に俺自身が試行錯誤して落ち着いたスキャニングの方法について書いていきます。「漫画の電子化の方法」(以下、「電子化」)を参考にさせていただきました。
電子化する本
- 完結している漫画
- 文庫と新書の小説
- 実用書・参考書の一部
- カタログ系の雑誌
漫画は容量圧縮と軽快に読むためにJPEGにしてZIP圧縮、それ以外の本はOCRをかけてテキスト検索ができるようにPDFにします。
サンプルとして取り込むのは「神聖モテモテ王国」の6巻です。理由。最初の画像を「電光石火供えガイ」の戦闘シーンにしたかったから。
使用機材
scansnap S1500
FUJITSU ScanSnap S1500 FI-S1500
販売元:富士通
発売日:2009-02-07
おすすめ度:
「電子化」で紹介されているスキャナの新型ですが、実売37000円ぐらいと、より安くなっています。そして嬉しい誤算がそのサイズ。A4プリンタぐらいの大きさを想定していたのですが、思いのほか小さい! これなら常に机の上に置いていてもほとんど邪魔になりません。
サイズ比較
S1500Mという型もあって、どちらを買えばいいのか迷ったのですが、S1500MはMAC用でした。
裁断機 PK-513L
プラス 断裁機 裁断幅A4 PK-513L 26-106
販売元:プラス
発売日:2009-09-01
おすすめ度:
こちらも新型ですが、変わったところはカットラインを照射するための電池が単2から単3になっただけの模様。で、こちらは3万強。「電子化」では実売2万強とありますので、旧型から随分価格が上がっています。スキャナが安くなってる分とでトントンですかね。
ちなみに取説は刃の交換時の分解方法とか大事なことが書いてあるにも関わらずペラ1枚の頼りないものなので、記念すべき初スキャン対象となりました。
合わせて7万弱。高いと見るか安いと見るかは人それぞれ。「本を置く空間分の家賃を考えたら得」なんて意見もありますが、俺はそれを支持しません。だって本はそこにある事自体嬉しいんだもの。
まあそれで収まりきらなくなったから電子化するんですけどね。
裁断(本)
「電子化」と同じ。カッターで本を裁断機に入る厚さに分割したら、背表紙部分を4〜5ミリ切り落とします。紙の束が一気に「ブルルルッ」っと切れる手応えが気持ちいい。
分割
アンド裁断
本を裁断するという行為は、初めのうちは結構心にダメージがきます。「やっちゃった感」というか。なので慣れるまでは比較的どうでもいい本からやるといいと思います。コンビニ売りの漫画総集編とか。
また、糊残りには本当に注意が必要です。S1500はダブルフィード(重なり)検出機能がついているので、ページがくっついてしまうぐらいならすぐにやり直しが効くので良いのですが、読み取り面に糊がついてしまうと、これがなかなか落ちないのでかなり切ないことになります。(体験済み)
糊残りに限らず、読み取り面の汚れは致命的なので俺はレンズ掃除の定番、無水エタノールとキムワイプを購入しました。専用のクリーナーは少々高いので。
無水エタノールP 500ml
販売元:健栄製薬
発売日:2007-03-29
おすすめ度:
武藤工業 キムワイプ 12×21.5cm /1箱(200枚入) S-200
販売元:武藤工業
おすすめ度:
ちなみに切り落とした背表紙の部分ですが、これがしっかりと糊付けされた「丈夫な紙の棒」と化します。「かしこい主婦」ならうっかり小物入れや小物入れや小物入れを作ってしまいそうな素材感ですが、残しておいても何の役にも立たないのでとっとと捨てましょう。
雑誌の背表紙。立派なのでなんとなく捨てづらい
裁断(カバー)
作者が渾身の力を込めて描いた漫画のカバーは、どうせならカラーで残しておきたいところ。いろいろ取り込み方法を考えたのですが、
→ どうしても折り曲げ癖のところで影ができる。
→ めんどい。あとたぶん熱で表面が溶ける。
→ 後でトリミングが必要
ということで、これらの方法は断念。背表紙は断腸の思いで諦めて切り落とし、表紙・裏表紙に分けて取り込む事にしました。
糊残りの心配はないので、本のサイズに合わせてカット。背表紙部分のたるみは刃の横のガイドが押さえてまっすぐにしてくれるのでそのまま行っちゃってOK。
ピシッと伸ばしてくれる
折り返しの部分はそのまま読み込ませるので、伸ばさずに。たまに折りが甘い本があるので、逆にしっかり折っておきましょう。俺は風邪薬の小瓶でぐぐっとしごいています。
下拵え完了
取り込み設定
scansnapの設定。俺の場合は「ファイン」「カラー」「両面読み取り」で「継続読み取り有効」。オプションで「文字をくっきりにします」にチェック。その他自動補正系のオプションはOFF。
とにかく「楽に・早く」電子化できることを主眼に置いているので、取り込みに時間がかかる設定はNG。取り込み後もレタッチやサイズ圧縮が不要、なおかつ画質もあまり劣化しない設定を探して色々試したところ「ファイン」に落ち着きました。
取り込みスピードやHDDの容量に対して、自分の画質に対する許容範囲、本への思い入れを天秤にかけて決めれば良いかと思います。俺も本によっては「スーパーファイン」や「エクセレント」で取り込むつもりでいます。
なお、白黒の漫画もカラーでスキャンします。理由は後述。
スキャン(本)
スキャン開始。一度に全部は読み込めないので適当に分けて読み込ませます。継続読み取りを有効にしてあるので、分割しても1つのファイルとして保存されます。
「電子化」にならって原稿は横向き。縦に入れると確かにずれます。原因は、原稿の幅が完全には一致していないから。裁断するときに本が押しつぶされるので、少しだけ歪むんですね。それがズレを生む。多少の傾きは気にしないのならば後の回転処理が省略できるので、縦に読み込ませるのも有りです。
ブックエンドをストッパー代わりに
(2010/3/7修正)本体上面がまるごとガパッと開いて排紙トレイになりました。ブックエンド要らないわ。コメント7番さんご指摘ありがとうございます。富士通さんごめんなさい。
(2010/3/9追記)原稿のサイズにもよると思いますが、ブックエンドの方が安定するかも。排紙トレイの上で滑っちゃうので。
スキャン(カバー)
漫画本編をスキャンし終えたら、一旦名前をつけて保存。カバーのスキャンをします。継続読み取りでひとつのファイルにまとめることも可能ですが、カラーとグレースケールで後の処理が異なるのであえて別のファイルに分けます。
カバーは折り返し部分から読み込むように原稿をセットします。逆にするとめくれて折れ曲がってぐしゃぐしゃになって、ひどい目に遭います。
(体験済み)
さて、カバーを折ったままスキャンすると、ダブルフィード検出機能が働いてエラーが出ます。
エラーメッセージ
ここで最後に読み取った原稿を「残す」にチェックして「読み取り中止」を選択。読み取ったファイルを削除するかどうか再度確認されるので「いいえ」を選択。これでスキャン結果を保存できます。これを表紙と裏表紙に対して行い、それぞれ別のファイルとして保存。
ちなみに俺は「本の名前_表紙.pdf」「本の名前_本編.pdf」「本の名前_裏表紙.pdf」という名前で保存しています。こうすると文字コードが表>本>裏の順なので、名前でソートされるビューワを使うといい感じで順番どおりに表示されるのです。
以上、ここまででスキャンは終了。
回転と書き出し
scansnapにはAdobe Acrobatがバンドルされています。以降の処理はAcrobat上で行います。
PDFファイルを開いて、「文書」→「ページの回転」(ショートカットはCtrl+Shift+R)で偶数ページ・奇数ページをそれぞれ逆方向に90度回転。回転の方向はスキャンさせた向き次第。
回転
次に、ファイルサイズ圧縮&ビューワで軽快に読むためにJPEG書き出しをして圧縮します。が、pdf上での回転はどうも書き出しファイルには反映されないようです。
そこで、Acrobatの良くわかんない仕様を利用します。カラースペースの変換をさせると何故か回転が反映されて書き出されるのです。
白黒の漫画をグレースケールではなくカラーでスキャンした理由がここにあります。「ファイル」→「書き出し」→「画像」→「JPEG」を選択、「名前をつけて保存」ウィンドウが出たら「設定」ボタンを押してカラースペースを「グレースケール」に設定。
JPEGとして保存 の設定
これでJPEGに書き出すと、正しい向きでグレースケールの画像が出力されます。ここにたどり着くまでにえらい時間かかったよ…。
カラーで保存したい表紙・裏表紙は仕方ないので横向きのまま書き出してJPEGを回転。回転にはPicasaを使っています。フリー・ロスレス回転・複数ファイルのドラッグ選択可能というのが選んだ理由。
漫画をグレースケールでスキャンして横向きのまま書き出し、Picasaでカバーと一緒に回転させるという手もあるのですが、200枚前後のJPEG保存って意外と時間がかかるんです(2〜3分ぐらい)。
Acrobatからの書き出しで時間をかけて、回転後の保存でさらに倍。マシンパワーに依存する部分が大きいと思いますが、俺の環境ではカバーと本を分けて処理するのが一番早かったということです。もっとも、オールカラーの本は素直にJPEGにしてから回転させるしかありませんが。
最後に全てのページをzip圧縮して保存。以上、ここまでで12〜3分。JPEG書き出し中に次の本の下拵えをして時間の無駄をなくせば、1時間で5冊といったところ。ファイルサイズは本によりますが40M〜60Mぐらいになります。
画質はこんなもん(等倍で切り出し)。
サンプル1
サンプル2
等倍だとモヤッとしたモスキートノイズが気になるかもしれませんが、ビューワーで縮小されるとほとんど分かりません。解像度的にフリガナがつぶれないか不安だったのですがバッチリ読めます。
ポツポツと見える汚れのようなものは、紙の粒子がスキャンされて、モスキートノイズがまとわりついたもの。これも縮小されればどうってことないのですが、どうしても気になるならばレタッチして消しましょう。
漫画以外
漫画以外はPDFで保存するので、Acrobat上で回転させたらおしまい。必要に応じて「文書」メニューからOCRをかけて検索可能に。小説ならはじめからグレースケールでスキャンしてしまえばいいし、読み取りオプションの傾き補正や原稿の向き判別も文字相手ならかなり賢く働いてくれるので、手間も時間も漫画よりずっと少なく済みます。
一番めんどくさい漫画がちゃんとスキャンできるようになれば、大抵の本は応用でどうとでもなります。用途に合わせてカスタマイズしましょう。
読む方法
漫画(JPEG)はleeyes(PC)とicomic(iPhone)。
PDFはAcrobat(PC)とGoodReader(iPhone)で読んでいます。
icomic
iPhoneの小さい画面でも漫画が十分に読めるのに驚き(流石にフリガナは潰れますが)。電車で立っていても吊り革を掴みながら片手で本が読める。素晴らしい。たくさん本を持ち歩ける以上のメリットかもしれません。じっくり読みたければPCで開けばいいしね。
向いてる人
以上で電子化手順の説明終わり。最後に自分でやってみて、「こういう人は電子化するといいんじゃない?」というのを挙げていきます。
- 本が多すぎて部屋が埋もれそう
- 大前提
- 古本屋によく本を売りに行く
- 二束三文で売るぐらいなら…という話
- 同じ本を何度も読む人
- デジタルデータは痛まない
- 古い本をいっぱい持っている
- 茶色く焼けた本もグレースケール化で新品のよう
- 古本屋と相性抜群
- モバイルで閲覧する手段がある
- 蔵書をデジタルライブラリ化するメリットが飛躍的に上昇します。どこにでも大量の本を持ち歩けるというのは想像以上に便利
- ジョジョを全巻持ち歩いていつでも読めます
- ある程度大雑把な人
- 75点ぐらいのスキャンは簡単にできますが、そこから100点に近づけていこうとすると、とんでもなく手間がかかります。ページごとに傾き補正、ガンマ調整、ノイズ除去…
- 完璧主義者は労力が割に合わないのでやめといたほうが無難です