PDF ファイルを HTML化 するには pdf2htmlEX が便利

pdf2htmlEX

これです。

インストール方法

公式ドキュメントにはコンパイルする方法が書かれていますが、普通にパッケージで入ってしまいます。嬉しいですね。

$ sudo apt-get install pdf2htmlex

使い方

まずは公式ドキュメントの Quick Start を読みましょう。その後、Command Line Options を眺めていろいろ試してみるとよいでしょう。

補足

単純に画像化をしたいなら convert コマンド(ImageMagick)でよいでしょう。単純にテキスト化をしたいなら pdftotext でよいでしょう。

Powered by はてなブログ