「PDF」の版間の差分

提供: 作業療法大百科事典OtWiki
2行目: 2行目:


==textを抜き出す技術==
==textを抜き出す技術==
[https://note.com/kan_hatakeyama/n/n1773c588ecb4 pdfからtextを抜き出す試行錯誤のメモ|Kan Hatakeyama]


===Pythonのライブラリを使う方法===
===Pythonのライブラリを使う方法===


2024/02/24時点、PyMuPDFがよいとのこと。<ref>[https://note.com/kan_hatakeyama/n/n1773c588ecb4 pdfからtextを抜き出す試行錯誤のメモ|Kan Hatakeyama]</ref>
2024/02/24時点、PyMuPDFがよいとのこと。<ref>[https://note.com/kan_hatakeyama/n/n1773c588ecb4 pdfからtextを抜き出す試行錯誤のメモ|Kan Hatakeyama]</ref>

2024年2月24日 (土) 00:01時点における版

見た目と印刷環境をどの環境でも同じになるように整える技術。

textを抜き出す技術

pdfからtextを抜き出す試行錯誤のメモ|Kan Hatakeyama

Pythonのライブラリを使う方法

2024/02/24時点、PyMuPDFがよいとのこと。[1]