yzlyyds 发表于 2025-3-28 13:48

PDF文档文本提取工具

本帖最后由 yzlyyds 于 2025-3-28 14:18 编辑

介绍:可提取PDF文档中的文本信息可按页查看文本信息。
也可以指定个输出目录将所有的信息全部生成到与源PDF文件同名的txt文档中。
暂时只支持提取文本对于PDF中图片中的文本不支持。





下载地址:https://www.123684.com/s/ERudvd-w7uPA?提取码:52pj
是个压缩包,下载下来之后解压运行PDFGetText.exe即可

yzlyyds 发表于 2025-4-3 08:36

nnaa11 发表于 2025-4-1 15:10
有个小问题,怎么不是按照顺序识别,有些页面下方的文字识别后到正文上面了

是按文档结构提取的,不是上下顺序,不过可以根据段落位置从上往下做个排序的,后边有时间了我加上排序

xcaoyi520 发表于 2025-3-28 21:51

这个是一个OCR综合进去吗

schtg 发表于 2025-3-29 05:33

希望加入图片的pdf转文本的功能!

bin87521 发表于 2025-3-29 07:31

用起来很顺手

rexhan 发表于 2025-3-29 08:02

感谢分享,下载试用一下,多谢多谢

nice2meetyou 发表于 2025-3-29 09:25


感谢分享,先下载了

Lange1868 发表于 2025-3-29 09:43

{:1_921:}已收藏,说不定以后能用到

wwww3333 发表于 2025-3-29 09:54

这个真是顶级了现在的文本提取要么就要冲会员 要么就要登录

kashliu 发表于 2025-3-29 10:12

一会儿试下看看识别怎样.

Asd123456don 发表于 2025-3-29 10:36

这个很有用,很不错,比OCR更便捷,谢谢
页: [1] 2 3 4 5 6 7
查看完整版本: PDF文档文本提取工具