吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 12353|回复: 86
收起左侧

[Windows] 批量将下载的公众号文章html转pdf,合并pdf文件

    [复制链接]
susheng 发表于 2022-12-8 21:42
最近用python写了个html转换工具html2pdf.exe https://wwk.lanzouf.com/iSpV90fbtpqh   ,代码如下:
[Asm] 纯文本查看 复制代码
def to_pdf():
    import pdfkit
    htmls = []
    for root, dirs, files in os.walk('.'):
     for name in files:
      if name.endswith(".html"):
       print(name)
       try:
        pdfkit.from_file(name, 'pdf/'+name.replace('.html', '')+'.pdf')
       except Exception as e:
        print(e)

工具依赖wkhtmltopdf,先从https://wkhtmltopdf.org/downloads.html 下载,然后将wkhtmltopdf.exe加入环境变量,直接运行html2pdf.exe,导出的pdf文件在pdf目录:
image.png

然后用这个pdf合并工具 https://wwn.lanzouf.com/irAGD089czyj 将所有pdf合成一个文件,比如我将莫言老师的所有文章合成了一个pdf文件,看文章方便多了:
image.png

image.png


免费评分

参与人数 28吾爱币 +25 热心值 +20 收起 理由
划痕的CD + 1 + 1 劝退 Python 的配置,需要安装 pdfkit 库,用这个指令链接到存放在本地.
大毛猪Cool + 1 + 1 作者你好,这个加入环境变量后为什么转换成PDF还是为空啊?
cwyztlk + 1 + 1 谢谢@Thanks!
Mahuajie + 1 我很赞同!
windpeaceflowe + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
minpp_52 + 1 谢谢@Thanks!
菠萝2021 + 1 谢谢@Thanks!
yszx + 1 热心回复!
decai + 1 + 1 谢谢@Thanks!
mfksse001 + 1 + 1 我很赞同!
zerotwoking2 + 1 用心讨论,共获提升!
zpp123 + 1 + 1 我很赞同!
woxobo + 1 + 1 谢谢@Thanks!
DaiTian + 1 + 1 谢谢 @Thanks!
leeofwar + 1 + 1 谢谢@Thanks!
cbkxh + 1 我很赞同!
wa00000 + 1 + 1 我很赞同!
Codeman + 1 + 1 我很赞同!
Miren13 + 1 我很赞同!
抱薪风雪雾 + 1 + 1 谢谢@Thanks!
2020抢房计划 + 1 + 1 谢谢@Thanks!
meilidemm + 1 我很赞同!
JinxBoy + 1 谢谢@Thanks!
dogox + 1 + 1 我很赞同!
zpzwz + 1 + 1 用心讨论,共获提升!
hababy777 + 1 谢谢@Thanks!
laonanhai945 + 1 + 1 谢谢@Thanks!
shane2021 + 1 + 1 热心回复!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| susheng 发表于 2022-12-10 14:46
zhousong21 发表于 2022-12-10 11:52
谢谢分享,不过这跟CTRL+P比,有啥区别?

批量啊,几百篇文章怎么ctrl+p
chaoxu680 发表于 2022-12-9 10:06
ZMC0635 发表于 2022-12-8 23:21
按步骤来做了,但是打开第一个exe程序就闪退了。

免费评分

参与人数 1热心值 +1 收起 理由
cnzjqz + 1 我也是

查看全部评分

cbkxh 发表于 2022-12-9 05:06
网页上图片较多时,加载有延迟的所有图片,转成Pdf后,图片都无法显示,不知如何解决
无敌小儿 发表于 2022-12-9 09:10
acecttgd 发表于 2022-12-9 08:44
听说有个软件可以在线收藏的,好象是什么笔记。功能差不多吧

为知笔记吧
aocun 发表于 2022-12-8 23:52
那应该如何下载下载公众号文章呢?
tianyagd 发表于 2022-12-8 21:56
本帖最后由 tianyagd 于 2022-12-8 21:58 编辑

这个可以有,可以单独现在某一篇,也可以批量下载。我在CSDN下载就用过这种方法
diaoshuai 发表于 2022-12-8 22:05
好东西,值得收藏
lzs105 发表于 2022-12-8 22:22
感谢楼主分享
yuanleifke 发表于 2022-12-8 22:35
谢谢楼主
skygardon 发表于 2022-12-8 22:40
非常好的分享,把软件wkhtmltopdf.exe加入环境变量有什么需要注意的吗?
lsy832 发表于 2022-12-8 22:56
谢谢楼主的分享
Nuanse80 发表于 2022-12-8 23:39
收藏了,感谢楼主分享。我还需要好好钻研一下
超逸绝尘 发表于 2022-12-8 23:48
这个我感觉还是蛮好的。
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则 提醒:禁止复制他人回复等『恶意灌水』行为,违者重罚!

快速回复 收藏帖子 返回列表 搜索

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-5-10 11:05

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表