吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 18038|回复: 229
收起左侧

[原创工具] 10月27号更新 文章保存工具

    [复制链接]
花朝朝暮暮开 发表于 2021-6-2 11:30
本帖最后由 花朝朝暮暮开 于 2021-10-27 13:35 编辑

效果可以看看我的这个  https://gitee.com/eox/Blog-MD


我食言了,终究是又更新了一版;大概是边用边加很多加的内容都忘记了。主要是更新了可以保存   **知乎回答 **   和   ** https://linux.cn/tech/ ** 这两个网站里面的东西


知乎回答同一个问题的不同回答别保存两次,懒得特殊处理了,凑活着用吧。其他一些优化调整记不清了。


吃完饭睡觉起来更新

下载地址在这里        ------->           https://www.52pojie.cn/forum.php ... 451908&pid=40444439

================================================================================以上10月27日















刷到好的博客文章需要保存、懒得加书签、笔记类的不好用。自己写了个小程序保存博客文章。
还有一点官方的一些博客网站广告贼多,界面花里胡哨的。
所以 自己写了个小程序保存博客文章。
使用方法:
1、浏览到好的博客文章觉得想保存下来
3、复制页面的网址
9、打开exe

目前支持 博客园、CSDN、BBXMAX 、知乎专栏微信(微信太鸡贼,支持不太好)、掘金、51cto

不要问我为什么是预告。因为到点了。端午节要去浪
下周更新预告:
修复了微信下载失败的问题。
再次修复了图片添加失败的问题。总会有一些奇奇怪怪的代码导致保存图片失败。我只能照顾绝大部分。
打印日志关键节点输出方便排除问题。
新增了记录文章的原始网站为MD的功能。

2021-6-15  真的是最后一版了
new 3.txt (141 Bytes, 下载次数: 525)
图太多了为了美观

详细说明见
https://www.52pojie.cn/forum.php ... 451908&pid=38922279







2021-6-7 11:38第6版大概率是最后一版了
1、优化了处理逻辑;删除无用代码
2、MD 文件保存至exe同级目录下的Blog-saved-to-md下。方便git push
3、Blog-saved-to-md 文件夹不存在会默认创建,有内容不会覆盖


2021-6-7 9:36 第5版
增加了各种错误处理逻辑,大概率不会因为你的乱复制导致exe退出。和起不起来。
增加了51CTO
列出了支持的网站


2021-6-4 16.30 第四版=======================
5、换了个让人讨厌的图标
1、解决了转MD偶尔丢失图片的问题
4、解决了获取不同网站的MD误报的问题
a、新增掘金的支持


2021-6-3 9:43 第三版======================= 新增微信文章的保存


2021-6-2 17:29 第二版======================= 新增知乎专栏保存为MD


2021-6-2 第一版 ======================= 支持CSDN
提取码: tivs 复制这段内容后打开百度网盘手机App,操作更方便哦


image.png
我是用下面的文章做实验的
微信
https://mp.weixin.qq.com/s/--pQMMpr5p_R7ApxHTb75A
博客园
https://www.cnblogs.com/aoximin/p/14843225.html
CSDN
https://blog.csdn.net/yuanziok/article/details/117442390
BBSMAX
https://www.bbsmax.com/A/MyJx4aveJn/
知乎专栏
https://zhuanlan.zhihu.com/p/151817883
掘金
https://juejin.cn/post/6844903833278087182

免费评分

参与人数 73吾爱币 +69 热心值 +67 收起 理由
wudakai1218 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
大大连连 + 1 + 1 这样更新可以多食言几次
我心飘野 + 1 + 1 这两天用了兄弟的工具,非常不错。
WSonGG + 1 + 1 鼓励转贴优秀软件安全工具和文档!
shuihan + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
唯一神 + 1 谢谢@Thanks!
azou + 1 + 1 谢谢@Thanks!
wang66zzx + 1 + 1 谢谢@Thanks!
lanail + 1 + 1 我很赞同!
wapj3871 + 1 我很赞同!
薛定谔的你 + 1 + 1 我很赞同!
cj831124 + 1 + 1 谢谢@Thanks!
xiaopeng_faith + 1 谢谢@Thanks!
tg3051 + 1 + 1 用心讨论,共获提升!
encai070201 + 1 用心讨论,共获提升!
lemonsGL + 1 + 1 用心讨论,共获提升!
青山依旧在 + 1 支持52pojie吗?
白色噪音 + 1 + 1 谢谢@Thanks!
hug_wh + 1 + 1 谢谢@Thanks!
Muchen_L + 1 + 1 谢谢@Thanks!
ryc + 1 + 1 谢谢@Thanks!
lovevray + 1 + 1 热心回复!
wisd0m7 + 1 我很赞同!
redkickrama + 1 谢谢@Thanks!
jing0917 + 1 + 1 谢谢@Thanks!
linkesky + 1 + 1 谢谢@Thanks!
柒呀柒 + 1 + 1 谢谢@Thanks!
love871174506 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
zx5956 + 1 + 1 我很赞同!
smilekiller + 1 + 1 谢谢@Thanks!
sunshine丶 + 1 谢谢@Thanks!
莫奇 + 1 + 1 谢谢 @Thanks!
lyslxx + 1 + 1 我很赞同!
Dancingharbor + 1 我很赞同!
zai2006 + 1 + 1 谢谢@Thanks!
woxobo + 1 + 1 谢谢@Thanks!
qw56 + 1 + 1 谢谢@Thanks!
lzhgmx + 1 + 1 谢谢@Thanks!
赫鲁 + 1 + 1 谢谢@Thanks!
guoruihotel + 1 + 1 谢谢@Thanks!
冷柠 + 1 + 1 谢谢@Thanks!
白衣沽酒对月酌 + 1 + 1 热心回复!
毁我容颜 + 1 + 1 鼓励转贴优秀软件安全工具和文档!
莎士比煌 + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
剑来…… + 1 + 1 感谢,非常需要,很好的小工具
大游 + 1 + 1 谢谢@Thanks!
sgch007 + 1 + 1 谢谢@Thanks!
poetboxbak + 1 看起来不错,尽快支持52
jiyuwusheng + 1 谢谢@Thanks!
Baishu08 + 1 + 1 我很赞同!
奕起 + 1 + 1 谢谢@Thanks!
数学课代表 + 1 谢谢@Thanks!
骑蜗牛爬珠峰 + 1 + 1 用心讨论,共获提升!
YuLoo + 1 + 1 我很赞同!
chao8709 + 1 + 1 我很赞同!
jenny95 + 1 谢谢@Thanks!
wingking + 1 + 1 谢谢@Thanks!
lihui9519 + 1 + 1 我很赞同!
moonalong8 + 2 + 1 谢谢@Thanks!
萧筱小 + 1 谢谢@Thanks!
笙若 + 1 + 1 谢谢@Thanks!
mhdhwan + 1 + 1 我很赞同!
阴凉 + 1 + 1 谢谢@Thanks!
TiePiHeTao + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
qdlitiger + 1 + 1 谢谢@Thanks!
zx4444 + 1 谢谢@Thanks!
老墙 + 1 + 1 谢谢@Thanks!
liaojack8 + 1 + 1 谢谢@Thanks!
风之暇想 + 7 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
wangdanq + 1 + 1 谢谢@Thanks!
雪流星 + 1 + 1 我很赞同!
Quincy379 + 1 + 1 谢谢@Thanks!
wuboxun + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| 花朝朝暮暮开 发表于 2021-6-24 15:08
学惭淹贯 发表于 2021-6-24 11:55
好像对微信文章的支持不太好,比如这篇文章(https://mp.weixin.qq.com/s/0uFLvppvsywDRCXTOVURqA),打开 ...

作者花里胡哨的使用了很多美化特殊字体,特殊间隔。目前没工夫对这些特立独行的文章专门适配。只要绝大部分能够保存就OK了。后续你发现问题了文章不好看,缺胳膊少腿的可以看看历史记录MD《Readme.md》,直接看原文
xilidexiao 发表于 2021-6-15 19:38
[Python] 纯文本查看 复制代码
from re import sub
from re import compile
from time import sleep
from parsel import Selector
import tomd
from requests import get

def spider_csdn(url, ccs_head, css_text):
    """
    ccs_head  标题的class
    css_text  文本的class
    """
    title_url = url
    if not title_url:
        print('错误', '请输入网址')
        sleep(5)
        return None
    head = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36 Edg/84.0.522.52'}
    html = get(url=title_url, headers=head).text
    page = Selector(html)
    title = page.css('%s::text' % ccs_head).get()
    res = compile('[^一-龥^a-z^A-Z^0-9]')
    restr = ''
    res.sub(restr, title)
    content = page.css('%s' % css_text).get()
    content = sub('<a.*?a>', '', content)
    content = sub('<br>', '', content)
    content = sub('<li>', '', content)
    content = sub('</li>', '', content)
    content = sub('^#', '', content)
    content = sub('(<img.*?>)', '<p>\\1</p>', content)
    content = sub('loading="lazy"', '', content)
    texts = tomd.Tomd(content).markdown
    title = title.replace(' ', '')
    title = title.replace('\n', '')
    with open((title + '.md'), mode='w', encoding='utf-8') as (f):
        f.write('#' + title)
        f.write(texts)
        print('获取文章完成')
    import subprocess
    from os import getcwd
    addr = getcwd()
    subprocess.Popen('explorer %s' % addr)


if __name__ == '__main__':
    from pyperclip import paste
    url = paste()
    while True:
        if 'csdn.net/' in url:
            spider_csdn(url, '.title-article', 'article')
            input('按任意键继续 ')
            url = paste()
        elif 'bbsmax.com/' in url:
            spider_csdn(url, '.title', '.post-content')
            input('按任意键继续 ')
            url = paste()
        elif 'cnblogs.com/' in url:
            spider_csdn(url, '#cb_post_title_url > span', '.postBody')
            input('按任意键继续 ')
            url = paste()
        elif 'zhuanlan.zhihu.com/' in url:
            spider_csdn(url, '#root > div > main > div > article > header > h1', '#root > div > main > div > article > div.Post-RichTextContainer')
            input('按任意键继续 ')
            url = paste()
        elif 'weixin.qq.com/' in url:
            spider_csdn(url, '.rich_media_title', '/html/body/div[1]/div/div[1]/div[2]')
            input('按任意键继续 ')
            url = paste()
        elif 'juejin.cn/' in url:
            spider_csdn(url, '.article-title', '.article-content')
            input('按任意键继续 ')
            url = paste()
            continue
        else:
            print('你的剪切板不是文章的url,目前支持csdn,bbsmax,博客园,:下面是你的剪切板的内容\n%s' % url)
            input('按任意键继续 ')
            url = paste()
wbzb 发表于 2021-6-2 11:35
zxsbk 发表于 2021-6-2 11:52
md好像看起来也不很舒服
wuboxun 发表于 2021-6-2 11:55
谢谢楼主的分享
zxsbk 发表于 2021-6-2 12:06
正好有用。
xixicoco 发表于 2021-6-2 13:22
感谢,非常好用的工具
moonalong8 发表于 2021-6-2 13:23
如果可以支持微信公众好那就更好了,谢谢·~~
头像被屏蔽
youximang 发表于 2021-6-2 13:34
提示: 作者被禁止或删除 内容自动屏蔽
wangdanq 发表于 2021-6-2 13:43
谢谢楼主的分享
yq海枯石烂 发表于 2021-6-2 14:50
感谢分享
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则 提醒:禁止复制他人回复等『恶意灌水』行为,违者重罚!

快速回复 收藏帖子 返回列表 搜索

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-3-29 01:40

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表