Archive for February, 2010

PDFのタイトル、著者を一括変更するlrf-epub-tools

Tuesday, February 2nd, 2010

使い様によっては非常に便利なツールです。

Sony ReaderやKindleはPDFをサポートしているので、PDFファイルをそれらのリーダに入れれば読むことができます。その際(少なくともSony Readerでは)PDFのメタデータに登録されているタイトルや著者がそのままTitle, Authorとなるので、PDFのメタデータをきちんと設定しておかないと、書籍を管理するのが大変になります。また、Sony Readerでは、本文中では日本語が表示できるものの、Home画面や書籍一覧の画面では日本語が表示されないため、タイトルや著者が日本語のPDFは事前に修正しておくことが不可欠です。

このPDFのメタデータはAcrobat等を使えば編集できるものの、一括編集はできないので(訂正。バッチ処理とJavaScriptを組み合わせれば一括編集出来そうです。AcrobatのJavaScriptの仕様書はこちらです)、例えば青空キンドルである著者の本をたくさんPDFにしてそれらを編集する場合等はそれなりに大変な作業になります。一括して編集するスクリプトを作成すれば良い訳ですが、コマンドラインからPDFを扱う定番ツールPDFTKは残念ながらMacOSX 10.6に対応しておらず、portからもソースからのビルドも失敗してしまいます。

このような場合に便利なのがlrf-epub-tools。本来はLRFをEPUBやPDF等に変換するJavaプログラムなのですが、その機能の一つに、ファイル名が”著者名-タイトル.pdf”となっているPDFファイルに対して著者名、タイトルを設定するというものがあり、これとファイル名を編集するユーティリティを組み合わせることで大量のPDFのメタデータを容易に編集・修正することが可能です。実際に試してみたところ、ASCIIはもちろん、日本語も文字化けすることなくタイトル・著者に反映されました。

lrf-epub-tools : Convert LRF (Sony BeBB) files to EPUB, PDF, RTF, and HTML. Also converts PDF and DOCX to EPUB.

また、まだ試してはいませんがPDFをePubに変換する機能もあるようです。

詳細な使い方はプロジェクトページを参照して下さい。