吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 18766|回复: 62
收起左侧

[Python 转载] 用Python爬取小姐姐磁力链接回来,慢慢看

  [复制链接]
lifeixue 发表于 2021-5-28 16:03

自从接触Python爬虫,身体一天不如一天
虽然python可以爬取图片视频什么的,不过最大的缺点就是身体营养跟不上(正在学爬虫/准备学爬虫的小伙伴们,要注意身体哦)
哈哈,不说笑了,先来几张小姐姐图片
1.png
2.png
3.png
01.gif
看了小姐姐图片后的你营养还跟的上吗?(来瓶营养快线补一下)
p.png
话不多说,直接上代码(初学python,代码写的很烂,心里很清楚)各位大佬不要见笑哦
[Python] 纯文本查看 复制代码
import requests
from lxml import etree

search = input("请输入您要查询的关键字(不要有空格/特殊符号):")
page_num = int(input("请输入需要获取的页数(如:1,2,3):"))
url = "https://www.zhaocili608.xyz/s.php?q={}".format(search)
head = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36"
}
re = requests.get(url=url, headers=head).text
h = etree.HTML(re)
p_next = h.xpath("//tbody/tr[last()]/td/a/text()")[0]  # 下一页(用于判断是否有下一页)
for p in range(1, page_num+1):  # 页码数量
    # 判断是否有下一页
    if "下一页" in p_next:
        page = h.xpath("//tbody/tr[last()]/td/a/@href")[0].replace("//", "https://")  # 页码
        baseurl = page.replace("2.html", "{}.html").format(p)  # 完整页码
    else:
        baseurl = url
    print("--------------正在为您查找(第{0}页):【{1}】的相关信息--------------".format(p, search))
    r = requests.get(url=baseurl, headers=head).text
    html = etree.HTML(r)
    lst = html.xpath("//tbody/tr/td/a[@target='_blank']")
    # 获取页面每个资源的详情数据
    for i in lst:
        fp = open(search+".txt", "a", encoding="utf-8")  # 持久化存储数据(不覆盖内容)

        href = i.xpath("./@href")[0].replace("//", "https://")  # 详情链接
        response = requests.get(url=href, headers=head).text
        tree = etree.HTML(response)

        title = tree.xpath("//div[@class='container']//h2/text()")[0]  # 标题
        fp.write("标题:" + title + "\n")  # 写入标题
        print("标题:", title)

        data = tree.xpath("//div[@class='container']//div[@class='row']/dl/dd[3]/text()")[0]  # 日期
        fp.write("日期:" + data + "\n")  # 写入日期
        print("日期:", data)

        size = tree.xpath("//div[@class='container']//div[@class='row']/dl/dd[4]/text()")[0]  # 文件大小
        fp.write("文件大小:" + size + "\n")  # 写入文件大小
        print("文件大小:", size)

        magnet = tree.xpath("//div[@class='container']//div/input/@value")[0]  # 磁力链接
        fp.write("磁力链接:" + magnet + "\n"*2)  # 写入磁力链接
        print("磁力链接:", magnet)
        print()
    # 判断是否有下一页(继续/结束循环)
    if "下一页" in p_next:
        pass
    else:
        print("资源获取完毕!")
        break

有磁力工具,我不用,就用python抓取,诶,就是玩儿
源码: 源码.zip (1.28 KB, 下载次数: 616)

免费评分

参与人数 4吾爱币 +3 热心值 +4 收起 理由
cdeath + 1 谢谢@Thanks!
Zkai-zhang + 1 + 1 谢谢@Thanks!
fanvalen + 1 + 1 没有图不知道视频内容好不好
看门猫 + 1 + 1 我很赞同!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

看门猫 发表于 2021-5-28 16:14
抓了磁力链接,我不下载,诶,就是玩儿
那年夏天52 发表于 2021-5-28 16:30
blindcat 发表于 2021-5-28 16:10
djzhao 发表于 2021-5-28 16:22
诶,就是玩儿
goodista 发表于 2021-5-28 17:01
所以我的Python水平一直保持不涨,是有具体原因的
登高闻曲 发表于 2021-5-28 17:06
我也在学习python爬虫,感谢楼主分享
rainbow270118 发表于 2021-5-28 17:24
我曾经也弄过,但是被封IP了,估计爬的有点狠了
lxhwan100 发表于 2021-5-28 17:31
5楼说的对,磁力工具呢
hshcompass 发表于 2021-5-28 18:47
感谢楼主分享源码,学习下
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则 警告:本版块禁止灌水或回复与主题无关内容,违者重罚!

快速回复 收藏帖子 返回列表 搜索

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-5-16 23:05

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表