吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1156|回复: 9
收起左侧

[其他原创] 不可复制PDF转成双层可复制PDF的方式(源码+工具)

[复制链接]
1000374 发表于 2023-11-1 14:44
本帖最后由 1000374 于 2023-11-2 15:57 编辑

PDF分两种,
一种可复制,可直接通过工具坐标提取
一种不可复制,需要通过OCR识别图片然后再转成PDF,
转成PDF分为两种,一种为保持原有样式需要生成双层PDF,当然也可以直接生成pdf,但是会和原格式有出入(线框、字号大小颜色等)

工具界面示意:
1698820371310.png

可以单独解析图片:

1698821018035.png

其他功能可自行尝试

直接下载地址:


也可按照下放代码自己编译使用以下开源库,遵循MIT协议
PdfiumViewer PDF预览及可编辑PDF的提取
PDFsharp 生成PDF
PaddleSharp 对图片OCR识别
欢迎Start、PR
源码地址:https://github.com/1000374/HM.PdfOcr

免费评分

参与人数 1吾爱币 +1 热心值 +1 收起 理由
TheSSS + 1 + 1 谢谢@Thanks!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| 1000374 发表于 2023-11-1 14:47
注:由于OCR的限制 提取可复制pdf支持x86、x64,不可复制pdf只能X64的系统;ocr识别吃CPU
本机win10 64位无压力
 楼主| 1000374 发表于 2023-11-6 09:25
1000374 发表于 2023-11-1 14:47
注:由于OCR的限制 提取可复制pdf支持x86、x64,不可复制pdf只能X64的系统;ocr识别吃CPU
本机win10 64位 ...

直接下载地址:
https://cloud.189.cn/web/share?code=qyqiuizMRjqi(访问码:0uoi)
阿里云下载:https://www.aliyundrive.com/s/o4KTpMLQyU9
tailor001 发表于 2023-11-6 09:50
TheSSS 发表于 2023-11-6 13:10
谢谢分享!!..
 楼主| 1000374 发表于 2023-11-6 13:43
tailor001 发表于 2023-11-6 09:50
OCR的文字种类有哪些?

用的百度的飞浆,中文、英文都没问题

免费评分

参与人数 1吾爱币 +1 热心值 +1 收起 理由
tailor001 + 1 + 1 谢谢@Thanks!

查看全部评分

careyyu 发表于 2023-11-6 17:25
好东西,正好需要
unruffle 发表于 2024-1-21 21:34
感谢分享,下载尝试一下
三滑稽甲苯 发表于 2024-1-22 09:18
OCR 的准确率怎么样
 楼主| 1000374 发表于 2024-4-7 11:17

效果很不错 估计能达到98%
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则 警告:本版块禁止灌水或回复与主题无关内容,违者重罚!

快速回复 收藏帖子 返回列表 搜索

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-4-29 21:01

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表