PDF文档文本提取工具
本帖最后由 yzlyyds 于 2025-3-28 14:18 编辑介绍:可提取PDF文档中的文本信息可按页查看文本信息。
也可以指定个输出目录将所有的信息全部生成到与源PDF文件同名的txt文档中。
暂时只支持提取文本对于PDF中图片中的文本不支持。
下载地址:https://www.123684.com/s/ERudvd-w7uPA?提取码:52pj
是个压缩包,下载下来之后解压运行PDFGetText.exe即可 nnaa11 发表于 2025-4-1 15:10
有个小问题,怎么不是按照顺序识别,有些页面下方的文字识别后到正文上面了
是按文档结构提取的,不是上下顺序,不过可以根据段落位置从上往下做个排序的,后边有时间了我加上排序 这个是一个OCR综合进去吗 希望加入图片的pdf转文本的功能! 用起来很顺手 感谢分享,下载试用一下,多谢多谢
感谢分享,先下载了 {:1_921:}已收藏,说不定以后能用到 这个真是顶级了现在的文本提取要么就要冲会员 要么就要登录 一会儿试下看看识别怎样. 这个很有用,很不错,比OCR更便捷,谢谢