吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 13895|回复: 393
收起左侧

[原创工具] PDF Font Fixer v1.3 永久免费,修复PDF文档不能复制粘贴问题。

    [复制链接]
Suxinlan 发表于 2026-4-6 19:38
本帖最后由 Suxinlan 于 2026-4-13 06:51 编辑

经常遇到PDF文件可以浏览,但是无法复制粘贴文本的问题。复制文本之后粘贴到记事本,就会发现乱码。

1.PNG

为什么复制粘贴就乱码了呢?这就要提到一个字体中的概念----Unicode映射。字体文件的本质就是矢量绘图,而复制粘贴需要知道文字的Unicode码,把这个码放到剪贴板里面,其它的软件才会知道是什么字。正规的字体文件,都会带一个Unicode映射表,这个表会告诉软件字体中的第几个字对应的是Unicode中的哪一个字的编码。然后我们才能正确地复制粘贴。由于某些PDF文档在制作的时候,有意将Unicode映射表删掉了,造成我们无法得知复制的字对应的是Unicode的哪一个字,所以无法复制粘贴文档中的文本。这是一个很简单,也很有效的文档反拷贝手段。

为了解决这个问题,我写了一个软件PDFontFixer v1.0,采用OCR识别PDF文档中的字体里面的每一个字形,得到对应的Unicode编码,再将这些编码做成ToUnicode映射表,保存到PDF文档的字体里。这样,我们就可以正常复制粘贴文本了。

2.PNG

3.PNG

其实,修复PDF字体并不难,市面上也有若干软件支持修复,只是大多为商业版。实现字体修复的难点不在于为PDF字体创建Unicode映射,而在于如何快速准确识别几百~几千个汉字。前些年不怎么具备本机仅使用CPU进行快速OCR的条件,去年随着OCR小模型的进步,目前已经可以实现本机使用普通CPU对汉字进行快速识别。经测试,小模型仅依赖CPU就可以对印刷体汉字进行识别,几百个汉字图像的识别耗时只有1~2秒。不考虑特殊符号的话,实测识别准确率可以达到100%。这就给PDF修复字体缺失的Unicode映射解决了最大的麻烦。
于是,PDFontFixer v1.0诞生了。

蓝奏云下载  v1.3下载    https://charltsing.lanzoum.com/iFfmB3mn6ekj

需要说明的是,按照PDF规范推荐,每页的汉字要求采用字体子集的方式嵌入在页面资源当中。字体子集最大的数量一般不超过3000个汉字,大部分在几百~一两千之间。字体子集的好处是渲染页面速度快。坏处自然也很明显,如果每页一个字体子集的话,整个文档假如有1000页,那就是一千个字体。然而,实际上很多文档为了排版好看,经常在一个页面嵌入十几个乃至几十个字体。这样整个文档的字体数量就非常可观了。即使字体子集可以复用,整个文档的字体数量也会有几百个。如果没有复用,那么整个文档的字体数量会多达两三万个。

考虑到需要人工审核OCR结果并进行个别字符的校正,所以,字体修复是一个极其耗时的工作。

4.PNG

软件使用方法:
1、文件菜单打开PDF。或者直接拖拽文档到软件窗口。
2、点击字体名称,查看字体属性,是否嵌入。本软件只处理嵌入字体,不处理Type3类型的pdf自绘字体。
3、按F4,识别右侧窗口中渲染出来的全部字符。点击字符图像可以人工校正。具有插入、删除、修改、修改并继续,等多个功能。
4、按F2,保存当前字体的Unicode映射。
5、如此循环,处理全部需要补充映射的字体。
6、文件菜单--保存PDF

运行环境:
1、由于使用最新的Direct2D构建UI,操作系统要求Windows 22H2或更高,64位操作系统。并安装最新补丁。
2、需要CPU支持SSE4.2、AES、AVX2指令集,否则本软件无法启动。
3、需要显卡支持DirectX 11, Direct 2D。
4、由于OCR比较吃CPU和内存,运行速度与CPU和内存大小有关。电脑配置不要低于8G内存。处理大量字体建议32G内存。
5、不支持Windows7、8、vista和早期的Windows10版本(低于1809)。
6、不支持32位操作系统。

如果觉得软件对你有用,请给个评分。

免费评分

参与人数 108吾爱币 +105 热心值 +93 收起 理由
★星太子★ + 1 + 1 我很赞同!
mf_yanyan + 1 + 1 谢谢@Thanks!
wang1anfu + 1 + 1 谢谢@Thanks!
xiaolycon + 1 谢谢分享,暂时还没有用到,应该还有用
bzjwjl + 1 + 1 用心讨论,共获提升!
zckiszj + 1 + 1 热心回复!
riverianbow + 1 谢谢@Thanks!
jbg666 + 1 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!
虚空之承 + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
wang82530 + 1 + 1 鼓励转贴优秀软件安全工具和文档!
wanfen11 + 1 我很赞同!
nywthy + 1 + 1 我很赞同!
ikerli + 1 + 1 谢谢@Thanks!
DUDU666 + 1 + 1 谢谢@Thanks!
zhyasi + 1 + 1 谢谢@Thanks!
bensonhb + 1 + 1 我很赞同!
AngIos + 1 谢谢@Thanks!
qsj521521 + 1 + 1 用心讨论,共获提升!
PartyShaker + 1 + 1 我很赞同!
伤心的笔 + 1 + 1 很有意思的软件
conan4803 + 1 + 1 谢谢@Thanks!
qingyuan29 + 1 + 1 热心回复!
hurric + 1 谢谢@Thanks!
cntjgaowei + 1 + 1 谢谢@Thanks!
flyfly888 + 1 + 1 谢谢@Thanks!
jinbo0201 + 1 + 1 我很赞同!
流水007 + 1 我很赞同!
chang1321 + 1 谢谢@Thanks!
远水涵秋 + 1 我很赞同!
keqing_yu + 1 我很赞同!
wind-mill + 2 + 1 用心讨论,共获提升!
duomilaozi + 1 + 1 我很赞同!
lzq1002 + 1 + 1 谢谢@Thanks!
zhangkun803 + 1 + 1 鼓励转贴优秀软件安全工具和文档!
zj_tj + 1 + 1 我很赞同!
ohehe0503 + 1 + 1 有用
QaQ355 + 1 + 1 我很赞同!
sunxpone + 1 + 1 谢谢@Thanks!
SPXJ1234 + 1 + 1 热心回复!
1997CM + 1 谢谢@Thanks!
rockmanlz119 + 1 + 1 我很赞同!
离轩 + 1 + 1 谢谢@Thanks!
threeWHO + 1 + 1 热心回复!
wwbzmt + 1 + 1 谢谢@Thanks!
jinwandalaohu + 1 + 1 热心回复!
esMoneky + 2 + 1 NB,厉害
htdzyr + 1 + 1 热盼弄个支持win7版本
skyheavens + 1 + 1 已经处理,感谢您对吾爱破解论坛的支持!
alexxi0571 + 1 + 1 谢谢@Thanks!
3622020 + 1 我很赞同!
linsun + 1 谢谢@Thanks!
lijia06420 + 1 + 1 我很赞同!
wangyongdesign + 1 + 1 谢谢@Thanks!
liyongtao + 1 + 1 我很赞同!
beibeibei + 1 + 1 我很赞同!
Kent2214 + 1 我很赞同!
RRZFS + 1 + 1 谢谢@Thanks!
springlu + 1 我很赞同!
aobai + 1 热心回复!
huanyi + 1 我很赞同!
1230123 + 1 + 1 谢谢@Thanks!
Gandalf + 1 谢谢@Thanks!
xlqdd + 1 谢谢@Thanks!
happyfox1999 + 1 + 1 谢谢@Thanks!
echo8100 + 1 + 1 好工具啊,涨知识了
Shenjingb + 1 + 1 我很赞同!
固相膜 + 1 + 1 我很赞同!
回忆如刀 + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
sxf6688 + 1 热心回复!
Flapjack + 1 + 1 我很赞同!
libo4026 + 1 + 1 我很赞同!
cccolin123 + 1 我很赞同!
风之暇想 + 7 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
liwei69288 + 1 + 1 我很赞同!
mhaitao + 1 + 1 我很赞同!
yueshuang98 + 1 + 1 我很赞同!
liuzhidong1217 + 1 + 1 谢谢@Thanks!
萘乙芴 + 1 + 1 真的是好专业呀
superwager + 1 我很赞同!
dkw7546 + 1 + 1 谢谢@Thanks!
gbm15651075073 + 1 热心回复!
wljylsm + 1 + 1 我很赞同!
bingshen + 1 + 1 谢谢@Thanks!
Issacclark1 + 1 谢谢@Thanks!
rig + 1 + 1 谢谢@Thanks!
sw7057 + 1 + 1 我很赞同!
bingo99 + 1 + 1 谢谢@Thanks!
newhopegroup + 1 + 1 我很赞同!
HUANGHAIFANG + 1 + 1 我很赞同!
papade + 1 热心回复!
yanglinman + 1 + 1 谢谢@Thanks!
anfeng0467 + 1 我很赞同!
mengfeijie + 1 + 1 谢谢@Thanks!
wuloveyou + 1 我很赞同!
Atnil + 1 + 1 终于等到有人做这个功能了
xianyu139 + 1 + 1 热心回复!
Ctrl十C + 1 + 1 能不能增加个“将Unicode映射表删掉”的功能
hlhstar + 1 + 1 我很赞同!
wangyftr + 1 + 1 我很赞同!
funlink + 1 谢谢@Thanks!

查看全部评分

本帖被以下淘专辑推荐:

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| Suxinlan 发表于 2026-4-6 19:41
本帖最后由 Suxinlan 于 2026-4-16 09:12 编辑


最新的版本是v1.4,修复在个别电脑上通过文件菜单退出时卡死的问题。

点评

编辑到主题帖里  详情 回复 发表于 2026-4-8 12:15

免费评分

参与人数 2热心值 +2 收起 理由
agooo + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!
alemon + 1 谢谢@Thanks!

查看全部评分

 楼主| Suxinlan 发表于 2026-4-9 19:37
本帖最后由 Suxinlan 于 2026-4-9 19:42 编辑
少马石 发表于 2026-4-9 15:17
打不开啊
PDFontFixer.exe - 快速异 裣测

如果操作系统是Win10,请升级到22H2,并在线安装最新补丁。

 楼主| Suxinlan 发表于 2026-4-9 12:17
yingxy0529 发表于 2026-4-9 08:53
非常好,虽然有些错误,识别会错位,但大部分是好的,比不能复制好多了。

错位是因为OCR漏字,所以软件提供了插入功能。

你可以提供漏字的PDF给我,如果是符号没识别那是正常的。
抱薪风雪雾 发表于 2026-4-6 20:21
看介绍,是个很实用的工具
lasx 发表于 2026-4-6 22:56
Suxinlan 发表于 2026-4-6 22:29
字体子集是各种乱七八糟的软件自己生成的,你都想象不到这些软件有多烂。

总之一句话,很少有字体子集 ...

能批量识别所有页吗?现在是每一页单独点识别。
石斑鱼 发表于 2026-4-6 19:53
厉害,明牌的打法
zgzxp 发表于 2026-4-6 19:53
学习到了新知识
asenlu7759 发表于 2026-4-6 20:02
用的不多,但非常实用的工具。谢谢分享。
wangdongjiang 发表于 2026-4-6 20:11
非常实用的工具。谢谢分享
chlong 发表于 2026-4-6 20:15
平时还没遇到这样的问题,不过涨知识了
fuvenusck 发表于 2026-4-6 20:16
谢谢分享,非常实用的工具。
qingyuan29 发表于 2026-4-6 20:22
感谢楼主分享!
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - 52pojie.cn ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2026-4-21 17:55

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表