「PDF」の版間の差分
提供:作業療法大百科事典OtWiki
編集の要約なし |
|||
(同じ利用者による、間の1版が非表示) | |||
2行目: | 2行目: | ||
==textを抜き出す技術== | ==textを抜き出す技術== | ||
PDFを分析するためにテキストデータを扱いたいことがある。 | |||
[https://note.com/kan_hatakeyama/n/n1773c588ecb4 pdfからtextを抜き出す試行錯誤のメモ|Kan Hatakeyama] | |||
===Pythonのライブラリを使う方法=== | ===Pythonのライブラリを使う方法=== | ||
2024/02/24時点、PyMuPDFがよいとのこと。<ref>[https://note.com/kan_hatakeyama/n/n1773c588ecb4 pdfからtextを抜き出す試行錯誤のメモ|Kan Hatakeyama]</ref> | 2024/02/24時点、PyMuPDFがよいとのこと。<ref>[https://note.com/kan_hatakeyama/n/n1773c588ecb4 pdfからtextを抜き出す試行錯誤のメモ|Kan Hatakeyama]</ref> |
2024年2月24日 (土) 00:01時点における最新版
見た目と印刷環境をどの環境でも同じになるように整える技術。
textを抜き出す技術
PDFを分析するためにテキストデータを扱いたいことがある。
pdfからtextを抜き出す試行錯誤のメモ|Kan Hatakeyama
Pythonのライブラリを使う方法
2024/02/24時点、PyMuPDFがよいとのこと。[1]