PDF

提供: 作業療法大百科事典OtWiki

見た目と印刷環境をどの環境でも同じになるように整える技術。

textを抜き出す技術

PDFを分析するためにテキストデータを扱いたいことがある。

pdfからtextを抜き出す試行錯誤のメモ|Kan Hatakeyama

Pythonのライブラリを使う方法

2024/02/24時点、PyMuPDFがよいとのこと。[1]