吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 2839|回复: 42
上一主题 下一主题
收起左侧

[其他原创] 【免下载全平台支持】无损一键双层PDF制作工具

  [复制链接]
跳转到指定楼层
楼主
t00t00 发表于 2024-10-4 10:11 回帖奖励
本帖最后由 t00t00 于 2024-10-4 11:38 编辑

工具链接

在线使用:https://kazutoiris.github.io/generate-searchable-pdf/

GitHub 源代码仓库:kazutoiris/generate-searchable-pdf,欢迎 Follow 和 Star!!!

部署在 GitHub Pages 上,全部使用前端实现,加载后可以断开互联网使用。受限于国际带宽,可能需要一定加载时间,欢迎提供国内镜像。

背景

制作双层PDF(也称为带有图层的PDF或复合PDF)是指在一个PDF文档中同时包含多个可独立显示或隐藏的图层,允许用户根据需要选择性地显示或隐藏特定内容,比如文本层、图像层或注释义。这对于制作教学材料、设计草图稿、工程图纸、交互式地图等非常有用。参加国网招投标,技术商务支持文件等都要制作成双层pdf格式!

目前,市面上的双层 PDF 制作工具大部分的原理都是基于 OCR,先将 PDF 转换为图像,然后对图像进行识别。

“但是,有了原文件为什么还需要 OCR?” 于是,就有了本工具。

分析

观察使用 Acrobat 生成的双层 PDF,可以看到,在原先的 PDF 文件中,图片下方多加了一层文字。

因此,在已有文字层的情况下,只需要添加一层图片到顶部就行。这样,就不再需要 OCR 了。

思路

MuPDF 允许开发者方便地处理 PDF 和其他文档格式。它提供了一组丰富的功能,使用户能够读取、编辑和操作文档。以下是 MuPDF 的一些主要特点:

  • 易于使用:MuPDF 提供了简单易用的 API,使得处理 PDF 文档变得更加直观。

  • 多格式支持:除了 PDF,PyMuPDF 还支持多种文档格式,如 XPS、CBZ、EPUB 等。

  • 高效渲染:利用 MuPDF 的高性能渲染引擎,可以快速打开和显示大文件,保持良好的渲染质量。

  • 文本提取:可以从 PDF 中提取文本、图像和其他对象,支持文本搜索和定位。

  • 编辑功能:允许添加注释、图像、文本框等,用户可以修改和增强现有文档。

  • 页面操作:提供对文档页面的操作功能,如旋转、缩放、合并和拆分页面。

尤其是目前 MuPDF 支持 WASM,使得在跨平台支持的情况下,具有很好的性能。

实现

首先,将 PDF 的每一页转换为图像。为了保证图像质量,这里以 4 倍超分的方式生成。

page.toPixmap(this.mupdf.Matrix.scale(2, 2), this.mupdf.ColorSpace.DeviceRGB);

然后,添加图像到原页面中,拉伸为页面大小,并置于页面顶层。

const extra_contents = doc.addStream(`q ${page.getBounds()[2] - page.getBounds()[0]} 0 0 ${page.getBounds()[3] - page.getBounds()[1]} ${page.getBounds()[0]} ${page.getBounds()[1]} cm /ImageContent Do Q`, null)

最后,导出 PDF 即可。

const buffer = doc.saveToBuffer("compress").asUint8Array();

因为没有使用 OCR 和 Acrobat,运行速度相当快。

后续

最近招标制作双层PDF文件,做成以后发现在公章附近的文字不可以复制,求解! 中可以看到,Acrobat 的识别效果并不好。使用本工具,只要原 PDF 可复制,生成的 PDF 就一定是可复制的,而且目录、结构都和原来一致!

免费评分

参与人数 9吾爱币 +14 热心值 +7 收起 理由
blackfly123 + 1 + 1 这个不太好用。没有把PDF全部转图片的过程,做标书有需求。。
苏紫方璇 + 7 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!
0jiao0 + 1 + 1 谢谢@Thanks!
melooon + 1 + 1 我很赞同!
han163426 + 1 我很赞同!
qq63 + 1 + 1 谢谢@Thanks!
msnan + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
hbzy + 1 + 1 方便使用!
shengruqing + 1 我很赞同!

查看全部评分

本帖被以下淘专辑推荐:

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

推荐
shaunkelly 发表于 2024-10-4 11:58
使用福昕PDF编辑器个人版可以轻松创建双层PDF。首先,打开此工具软件。然后,点击菜单栏上的“文件”选项,选择“创建”并点击“双层PDF”。接下来,选择要添加到第一层的PDF文件,并点击“打开”。在弹出的对话框中,选择要添加到第二层的PDF文件,并点击“打开”。此工具会自动将两个PDF文件合并成一个双层PDF文件。最后,保存文件并选择保存的位置。这样,你就成功创建了一个双层PDF文件。此工具的简单操作和强大功能使得创建双层PDF变得非常容易。
推荐
shaunkelly 发表于 2024-10-4 11:57
福昕PDF编辑器个人版产品支持双层PDF功能。双层PDF是指在一个PDF文件中,可以添加两个不同的内容层,使得用户可以在同一文档中同时显示和编辑两个不同的内容。这种功能非常实用,可以用于比较两个文档的差异,或者在一个文档中同时显示原文和翻译文本。用户可以通过此工具产品轻松地创建双层PDF,只需将两个内容层分别添加到文档中,并设置透明度和显示方式。双层PDF功能不仅提高了工作效率,还使得文档的编辑和阅读更加方便和直观。
沙发
thomasyang2005 发表于 2024-10-4 10:15
3#
hbzy 发表于 2024-10-4 10:23
很好的工具!
4#
hbzy 发表于 2024-10-4 10:33
老大,怎么上传了118页的PDF文件最后找不到了,也没发现处理后的文件是怎么下载
5#
msnan 发表于 2024-10-4 10:42
楼主超厉害。。
6#
牧马小太爷 发表于 2024-10-4 10:45
不明白是什么意思,自己制作 的文档保存为PDF格式不是就能查找和复制吗?
7#
ACGZOOM 发表于 2024-10-4 10:46
感谢楼主分享~
8#
雨之幽 发表于 2024-10-4 10:59
感谢分享。
9#
 楼主| t00t00 发表于 2024-10-4 11:02 |楼主
本帖最后由 t00t00 于 2024-10-4 11:10 编辑
hbzy 发表于 2024-10-4 10:33
老大,怎么上传了118页的PDF文件最后找不到了,也没发现处理后的文件是怎么下载

处理完成后可以点击右侧“下载PDF”按钮,或者在下方预览窗口上方的工具条另存为到本地。

如果文件比较复杂或电脑性能限制,可能需要等待几分钟。如果没有任何反应,可以使用最新的 Chrome/Edge 浏览器。建议上传一份简单的 PDF 先行测试。

【更新】测试了一份 140 页的随机 PDF,总计用时在一分钟左右。

10#
 楼主| t00t00 发表于 2024-10-4 11:12 |楼主
牧马小太爷 发表于 2024-10-4 10:45
不明白是什么意思,自己制作 的文档保存为PDF格式不是就能查找和复制吗?

工程投标和归档的特殊要求,普通情况下没有需求。
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-12-15 22:23

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表