PDF

提供: 作業療法大百科事典OtWiki
2024年2月24日 (土) 00:01時点におけるOtfighter (トーク | 投稿記録)による版 (→‎textを抜き出す技術)
(差分) ← 古い版 | 最新版 (差分) | 新しい版 → (差分)

見た目と印刷環境をどの環境でも同じになるように整える技術。

textを抜き出す技術

PDFを分析するためにテキストデータを扱いたいことがある。

pdfからtextを抜き出す試行錯誤のメモ|Kan Hatakeyama

Pythonのライブラリを使う方法

2024/02/24時点、PyMuPDFがよいとのこと。[1]