吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 19032|回复: 229
收起左侧

[原创工具] 10月27号更新 文章保存工具

    [复制链接]
花朝朝暮暮开 发表于 2021-6-2 11:30
本帖最后由 花朝朝暮暮开 于 2021-10-27 13:35 编辑

效果可以看看我的这个  https://gitee.com/eox/Blog-MD


我食言了,终究是又更新了一版;大概是边用边加很多加的内容都忘记了。主要是更新了可以保存   **知乎回答 **   和   ** https://linux.cn/tech/ ** 这两个网站里面的东西


知乎回答同一个问题的不同回答别保存两次,懒得特殊处理了,凑活着用吧。其他一些优化调整记不清了。


吃完饭睡觉起来更新

下载地址在这里        ------->           https://www.52pojie.cn/forum.php ... 451908&pid=40444439

================================================================================以上10月27日















刷到好的博客文章需要保存、懒得加书签、笔记类的不好用。自己写了个小程序保存博客文章。
还有一点官方的一些博客网站广告贼多,界面花里胡哨的。
所以 自己写了个小程序保存博客文章。
使用方法:
1、浏览到好的博客文章觉得想保存下来
3、复制页面的网址
9、打开exe

目前支持 博客园、CSDN、BBXMAX 、知乎专栏微信(微信太鸡贼,支持不太好)、掘金、51cto

不要问我为什么是预告。因为到点了。端午节要去浪
下周更新预告:
修复了微信下载失败的问题。
再次修复了图片添加失败的问题。总会有一些奇奇怪怪的代码导致保存图片失败。我只能照顾绝大部分。
打印日志关键节点输出方便排除问题。
新增了记录文章的原始网站为MD的功能。

2021-6-15  真的是最后一版了
new 3.txt (141 Bytes, 下载次数: 526)
图太多了为了美观

详细说明见
https://www.52pojie.cn/forum.php ... 451908&pid=38922279







2021-6-7 11:38第6版大概率是最后一版了
1、优化了处理逻辑;删除无用代码
2、MD 文件保存至exe同级目录下的Blog-saved-to-md下。方便git push
3、Blog-saved-to-md 文件夹不存在会默认创建,有内容不会覆盖


2021-6-7 9:36 第5版
增加了各种错误处理逻辑,大概率不会因为你的乱复制导致exe退出。和起不起来。
增加了51CTO
列出了支持的网站


2021-6-4 16.30 第四版=======================
5、换了个让人讨厌的图标
1、解决了转MD偶尔丢失图片的问题
4、解决了获取不同网站的MD误报的问题
a、新增掘金的支持


2021-6-3 9:43 第三版======================= 新增微信文章的保存


2021-6-2 17:29 第二版======================= 新增知乎专栏保存为MD


2021-6-2 第一版 ======================= 支持CSDN
提取码: tivs 复制这段内容后打开百度网盘手机App,操作更方便哦


image.png
我是用下面的文章做实验的
微信
https://mp.weixin.qq.com/s/--pQMMpr5p_R7ApxHTb75A
博客园
https://www.cnblogs.com/aoximin/p/14843225.html
CSDN
https://blog.csdn.net/yuanziok/article/details/117442390
BBSMAX
https://www.bbsmax.com/A/MyJx4aveJn/
知乎专栏
https://zhuanlan.zhihu.com/p/151817883
掘金
https://juejin.cn/post/6844903833278087182

免费评分

参与人数 73吾爱币 +69 热心值 +67 收起 理由
wudakai1218 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
大大连连 + 1 + 1 这样更新可以多食言几次
我心飘野 + 1 + 1 这两天用了兄弟的工具,非常不错。
WSonGG + 1 + 1 鼓励转贴优秀软件安全工具和文档!
shuihan + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
唯一神 + 1 谢谢@Thanks!
azou + 1 + 1 谢谢@Thanks!
wang66zzx + 1 + 1 谢谢@Thanks!
lanail + 1 + 1 我很赞同!
wapj3871 + 1 我很赞同!
薛定谔的你 + 1 + 1 我很赞同!
cj831124 + 1 + 1 谢谢@Thanks!
xiaopeng_faith + 1 谢谢@Thanks!
tg3051 + 1 + 1 用心讨论,共获提升!
encai070201 + 1 用心讨论,共获提升!
lemonsGL + 1 + 1 用心讨论,共获提升!
青山依旧在 + 1 支持52pojie吗?
白色噪音 + 1 + 1 谢谢@Thanks!
hug_wh + 1 + 1 谢谢@Thanks!
Muchen_L + 1 + 1 谢谢@Thanks!
ryc + 1 + 1 谢谢@Thanks!
lovevray + 1 + 1 热心回复!
wisd0m7 + 1 我很赞同!
redkickrama + 1 谢谢@Thanks!
jing0917 + 1 + 1 谢谢@Thanks!
linkesky + 1 + 1 谢谢@Thanks!
柒呀柒 + 1 + 1 谢谢@Thanks!
love871174506 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
zx5956 + 1 + 1 我很赞同!
smilekiller + 1 + 1 谢谢@Thanks!
sunshine丶 + 1 谢谢@Thanks!
莫奇 + 1 + 1 谢谢 @Thanks!
lyslxx + 1 + 1 我很赞同!
Dancingharbor + 1 我很赞同!
zai2006 + 1 + 1 谢谢@Thanks!
woxobo + 1 + 1 谢谢@Thanks!
qw56 + 1 + 1 谢谢@Thanks!
lzhgmx + 1 + 1 谢谢@Thanks!
赫鲁 + 1 + 1 谢谢@Thanks!
guoruihotel + 1 + 1 谢谢@Thanks!
冷柠 + 1 + 1 谢谢@Thanks!
白衣沽酒对月酌 + 1 + 1 热心回复!
毁我容颜 + 1 + 1 鼓励转贴优秀软件安全工具和文档!
莎士比煌 + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
剑来…… + 1 + 1 感谢,非常需要,很好的小工具
大游 + 1 + 1 谢谢@Thanks!
sgch007 + 1 + 1 谢谢@Thanks!
poetboxbak + 1 看起来不错,尽快支持52
jiyuwusheng + 1 谢谢@Thanks!
Baishu08 + 1 + 1 我很赞同!
奕起 + 1 + 1 谢谢@Thanks!
数学课代表 + 1 谢谢@Thanks!
骑蜗牛爬珠峰 + 1 + 1 用心讨论,共获提升!
YuLoo + 1 + 1 我很赞同!
chao8709 + 1 + 1 我很赞同!
jenny95 + 1 谢谢@Thanks!
wingking + 1 + 1 谢谢@Thanks!
lihui9519 + 1 + 1 我很赞同!
moonalong8 + 2 + 1 谢谢@Thanks!
萧筱小 + 1 谢谢@Thanks!
笙若 + 1 + 1 谢谢@Thanks!
mhdhwan + 1 + 1 我很赞同!
阴凉 + 1 + 1 谢谢@Thanks!
TiePiHeTao + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
qdlitiger + 1 + 1 谢谢@Thanks!
zx4444 + 1 谢谢@Thanks!
老墙 + 1 + 1 谢谢@Thanks!
liaojack8 + 1 + 1 谢谢@Thanks!
风之暇想 + 7 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
wangdanq + 1 + 1 谢谢@Thanks!
雪流星 + 1 + 1 我很赞同!
Quincy379 + 1 + 1 谢谢@Thanks!
wuboxun + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| 花朝朝暮暮开 发表于 2021-6-24 15:08
学惭淹贯 发表于 2021-6-24 11:55
好像对微信文章的支持不太好,比如这篇文章(https://mp.weixin.qq.com/s/0uFLvppvsywDRCXTOVURqA),打开 ...

作者花里胡哨的使用了很多美化特殊字体,特殊间隔。目前没工夫对这些特立独行的文章专门适配。只要绝大部分能够保存就OK了。后续你发现问题了文章不好看,缺胳膊少腿的可以看看历史记录MD《Readme.md》,直接看原文
xilidexiao 发表于 2021-6-15 19:38
[Python] 纯文本查看 复制代码
01
02
03
04
05
06
07
08
09
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
from re import sub
from re import compile
from time import sleep
from parsel import Selector
import tomd
from requests import get
 
def spider_csdn(url, ccs_head, css_text):
    """
    ccs_head  标题的class
    css_text  文本的class
    """
    title_url = url
    if not title_url:
        print('错误', '请输入网址')
        sleep(5)
        return None
    head = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36 Edg/84.0.522.52'}
    html = get(url=title_url, headers=head).text
    page = Selector(html)
    title = page.css('%s::text' % ccs_head).get()
    res = compile('[^一-龥^a-z^A-Z^0-9]')
    restr = ''
    res.sub(restr, title)
    content = page.css('%s' % css_text).get()
    content = sub('<a.*?a>', '', content)
    content = sub('<br>', '', content)
    content = sub('<li>', '', content)
    content = sub('</li>', '', content)
    content = sub('^#', '', content)
    content = sub('(<img.*?>)', '<p>\\1</p>', content)
    content = sub('loading="lazy"', '', content)
    texts = tomd.Tomd(content).markdown
    title = title.replace(' ', '')
    title = title.replace('\n', '')
    with open((title + '.md'), mode='w', encoding='utf-8') as (f):
        f.write('#' + title)
        f.write(texts)
        print('获取文章完成')
    import subprocess
    from os import getcwd
    addr = getcwd()
    subprocess.Popen('explorer %s' % addr)
 
 
if __name__ == '__main__':
    from pyperclip import paste
    url = paste()
    while True:
        if 'csdn.net/' in url:
            spider_csdn(url, '.title-article', 'article')
            input('按任意键继续 ')
            url = paste()
        elif 'bbsmax.com/' in url:
            spider_csdn(url, '.title', '.post-content')
            input('按任意键继续 ')
            url = paste()
        elif 'cnblogs.com/' in url:
            spider_csdn(url, '#cb_post_title_url > span', '.postBody')
            input('按任意键继续 ')
            url = paste()
        elif 'zhuanlan.zhihu.com/' in url:
            spider_csdn(url, '#root > div > main > div > article > header > h1', '#root > div > main > div > article > div.Post-RichTextContainer')
            input('按任意键继续 ')
            url = paste()
        elif 'weixin.qq.com/' in url:
            spider_csdn(url, '.rich_media_title', '/html/body/div[1]/div/div[1]/div[2]')
            input('按任意键继续 ')
            url = paste()
        elif 'juejin.cn/' in url:
            spider_csdn(url, '.article-title', '.article-content')
            input('按任意键继续 ')
            url = paste()
            continue
        else:
            print('你的剪切板不是文章的url,目前支持csdn,bbsmax,博客园,:下面是你的剪切板的内容\n%s' % url)
            input('按任意键继续 ')
            url = paste()
头像被屏蔽
wbzb 发表于 2021-6-2 11:35
zxsbk 发表于 2021-6-2 11:52
md好像看起来也不很舒服
wuboxun 发表于 2021-6-2 11:55
谢谢楼主的分享
zxsbk 发表于 2021-6-2 12:06
正好有用。
xixicoco 发表于 2021-6-2 13:22
感谢,非常好用的工具
moonalong8 发表于 2021-6-2 13:23
如果可以支持微信公众好那就更好了,谢谢·~~
头像被屏蔽
youximang 发表于 2021-6-2 13:34
提示: 作者被禁止或删除 内容自动屏蔽
wangdanq 发表于 2021-6-2 13:43
谢谢楼主的分享
yq海枯石烂 发表于 2021-6-2 14:50
感谢分享
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2025-5-20 21:13

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表