好友
阅读权限25
听众
最后登录1970-1-1
|
本帖最后由 6khome 于 2025-5-18 13:56 编辑
20250515
pdf提取工具:
1、支持文本、表格、图片提取
2、非OCR
3、文本提取保留文本相对位置,方便定位内容,只删除完全不含可见字符的空行
4、表格已做内容自动换行、单元格线框加黑
下载:https://wwqq.lanzoub.com/iD8372w9j7je 密码:52pj
20250518更新:
1、主要加了图片提取方式“源图识别”,上一个版本的提图方式保留为“区域裁剪”
“区域裁剪”是识别图片的坐标范围,进行暴力提取(类似截图),不区分图片层及其上层文本层,因此提取的图片可能带文本内容
“源图识别”是另外一个路线,区分图片层及其上层文本层,不带不属于源图本身的的文本内容,尽量保留源图的格式和细节
2、增加了“停止”功能,中断运行进程
3、其他细节优化
4、有点大......
下载:https://wwqq.lanzoub.com/i72rU2wk00uf 密码:52pj
|
免费评分
-
查看全部评分
|
发帖前要善用【论坛搜索】功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。 |
|
|
|
|
|