jupyter notebook でPDFを画像に変換
Anacondaを使ってpdf2imageを入れるときに手間取ったので紹介
方法
- Poppler for Windowsからpoppler-0.68.0_x86をダウンロードする。
blog.alivate.com.au - 解凍する. 解凍用ソフトが無ければ 7-Zipをダウンロード sevenzip.osdn.jp
- システム環境変数のPathにbinファイルのPathを追加する。
- PC再起動
- Pathが通っていることを確認.
ターミナル(windows power shellなど)でpdfinfo.exeと打ち込みエラーが出なければOK - Anaconda Navigator を開く。
- Environments を開きroot の右三角から Open Terminal を選択。ターミナルが開く。
- pip install pdf2image
と打つ
これでインストール終了です。PDFを用意し、以下のプログラムで動作確認しましょう
from pdf2image import convert_from_path images = convert_from_path('test.pdf') images[0].save('test.png', 'png')
PDFがpng画像として生成されていたら成功です。