吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 2406|回复: 16
收起左侧

[Python 转载] 再也不用女朋友帮我找资源了

[复制链接]
Oranger 发表于 2020-12-26 14:09
import os
from lxml import etree
import requests,re
headers={'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36'}
def all_text(url_name):
    res=requests.get(url_name,headers=headers)
    xiaoshuoming = re.findall('<meta property="og:novel:book_name" content="(.*?)"/>',res.text)[0]
    if not os.path.exists(f'D:小说/{xiaoshuoming}'):
        os.makedirs(f'D:小说/{xiaoshuoming}')
    urls=re.findall('<dd><a href="(.*?)" >.*?</a></dd>',res.text)
    names=re.findall('<dd><a href=".*?" >(.*?)</a></dd>',res.text)
    return urls,names,xiaoshuoming
def download(url_name):
    url='http://www.dvdspring.com'
    urls,names,xiaoshuoming=all_text(url_name)
    for i,j in zip(urls,names):
        res_text=requests.get(url+i,headers=headers).text
        zj_html=etree.HTML(res_text)
        texts=zj_html.xpath('//*[@id="content"]/text()')  #章节内容
        texts2=zj_html.xpath('//*[@id="content"]/*/text()')
        text='\n'.join(texts).strip()+'\n'.join(texts2).strip()
        try:
            with open(f'd:小说/{xiaoshuoming}/{j}.txt','a',encoding='utf8') as f:
                f.write(text)
                print(f'{xiaoshuoming}/{j}正在下载...')
        except:
            if j.startswith('?') or j.startswith('*') or '*' in j:
                zhangjie=''.join(re.findall('\d',j))
                with open(f'd:小说/{xiaoshuoming}/第{zhangjie}章.txt', 'a', encoding='utf8') as f:
                    f.write(text)
                    print(f'{xiaoshuoming}\t第{zhangjie}章 \t正在下载...')
if __name__ == '__main__':
    url_name='http://www.dvdspring.com/html/7210/'#小说名地址
    download(url_name)


#只需要更改代码末尾的url_name地址,在笔趣阁中任选一本小说,复制上面的网址

下载示例

下载示例

免费评分

参与人数 1吾爱币 +1 热心值 +1 收起 理由
paidaxingone + 1 + 1 我很赞同!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

anxun1999 发表于 2020-12-26 16:27

我还以为女盆友跟人跑了呢~~~~~~&#128527;
嫒小鹿 发表于 2020-12-26 16:11
janny82 发表于 2020-12-26 16:01
 楼主| Oranger 发表于 2020-12-26 14:11
这个是爬取这个网站上的http://www.dvdspring.com/paihangbang/小说
空空月 发表于 2020-12-26 16:32
我还以为女盆友跟人跑了呢~~~~~~
kdmq123 发表于 2020-12-26 16:35
不知道怎么用
物美电器 发表于 2020-12-26 17:15
喜欢看小说的可以了
Jacky168 发表于 2020-12-26 17:34
Oranger 发表于 2020-12-26 14:11
这个是爬取这个网站上的http://www.dvdspring.com/paihangbang/小说

用爬虫技术?
寒冰流火 发表于 2020-12-26 18:01
最近看看Python  感觉要以楼主为榜样了   就好好琢磨这些码码
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则 警告:本版块禁止灌水或回复与主题无关内容,违者重罚!

快速回复 收藏帖子 返回列表 搜索

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-4-28 08:36

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表