知っていることだけ

勉強していて役に立つ、理解の助けになるようなポイントを書いていきます。

jupyter notebook でPDFを画像に変換

Anacondaを使ってpdf2imageを入れるときに手間取ったので紹介
方法

  1. Poppler for Windowsからpoppler-0.68.0_x86をダウンロードする。
    blog.alivate.com.au
  2. 解凍する. 解凍用ソフトが無ければ 7-Zipをダウンロード sevenzip.osdn.jp
  3. システム環境変数のPathにbinファイルのPathを追加する。
  4. PC再起動
  5. Pathが通っていることを確認.
    ターミナル(windows power shellなど)でpdfinfo.exeと打ち込みエラーが出なければOK
  6. Anaconda Navigator を開く。
  7. Environments を開きroot の右三角から Open Terminal を選択。ターミナルが開く。
  8. pip install pdf2image
    と打つ

これでインストール終了です。PDFを用意し、以下のプログラムで動作確認しましょう

from pdf2image import convert_from_path
images = convert_from_path('test.pdf')
images[0].save('test.png', 'png')

PDFがpng画像として生成されていたら成功です。