geln12の日記: 複数PDFから特定のページを抽出 1
何かお題になってるみたいなので。
http://slashdot.jp/journal/542133/GUI-considered-harmful
http://slashdot.jp/journal/542150/
http://slashdot.jp/journal/542157/
そりゃghostscriptの役割じゃないのかなぁ。
適当に検索しながらオプション試行してみたら、以下でいけそう。
% ghostscript -dBATCH -dSAFER -dNOPAUSE -dFirstPage=1 -dLastPage=1 -sDEVICE=pdfwrite -sOutputFile=input_page1.pdf input.pdf
で、これをループで回して連結すれば、・・・・って試してみたら複数ファイルを入力で指定すれば、各ファイルの表紙ページだけを連結したPDFができた。
% ghostscript -dBATCH -dSAFER -dNOPAUSE -dFirstPage=1 -dLastPage=1 -sDEVICE=pdfwrite -sOutputFile=all_page1.pdf input1.pdf input2.pdf
で、input1.pdfとinput2.pdfの表紙ページをまとめたのがall_page1.pdfになった。
ghostscriptすげー。
以上は、CentOSで確かめました。
windowsならgswin入れて、バッチファイル作っておけばみかけGUIでできるかもしれない(そこまで確かめる気はない)
#追記:英語PDFで確かめたので、日本語入ったPDFのときにうまく動くかはAYORで。