吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 2251|回复: 6
收起左侧

[Python 转载] Python爬取高清图片网-自选最高分辨率

[复制链接]
Teachers 发表于 2021-10-16 12:33
本帖最后由 Teachers 于 2021-10-17 13:45 编辑
import os.path
import time

from lxml import etree

import requests

headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36',
    'referer': 'https://wallroom.io/',
    'sec-fetch-dest': 'image'
}

def get_images_list():
    response = requests.get(
        'https://wallroom.io/',
        headers=headers
    ).text
    html = etree.HTML(response)
    return html.xpath('//div[@class="image-list"]/div/a/@href')

def run():
    images_list = get_images_list()
    if not len(images_list):
        print('获取图片列表失败')
        return False
    if not os.path.exists('图片采集'):
        os.mkdir('图片采集')
    url = 'https://wallroom.io/img/'
    for images in images_list:
        splits = images.split('/')
        resolving = splits[1]
        name_split = splits[2]
        file_name = '图片采集/' + resolving + '-' + name_split + '.jpg'
        if not os.path.exists(file_name):
            images_content = requests.get(
                url + resolving + '/' + name_split + '.jpg',
                headers=headers
            )
            if 'image' in images_content.headers['Content-Type']:
                print(name_split + '.jpg')
                with open(file_name, 'wb') as f:
                    f.write(images_content.content)

if __name__ == '__main__':
    while True:
        run()
        time.sleep(10)

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

wss0823 发表于 2021-10-16 12:43
这个python还是比较简单的,主要包含了网页访问和图片下载,建议分为3个方法相互独立比较好
 楼主| Teachers 发表于 2021-10-16 12:56
wss0823 发表于 2021-10-16 12:43
这个python还是比较简单的,主要包含了网页访问和图片下载,建议分为3个方法相互独立比较好

就是因为简单才不用太多方法
rufan321 发表于 2021-10-16 14:22
能做一个今日头条的图片爬虫就好了,每天都下载好看的美女
 楼主| Teachers 发表于 2021-10-16 14:53
rufan321 发表于 2021-10-16 14:22
能做一个今日头条的图片爬虫就好了,每天都下载好看的美女

有地址吗
rufan321 发表于 2021-10-16 17:02

头条的,
https://www.toutiao.com/c/user/token/MS4wLjABAAAAfZMSai9lm2P4MvqFDvBXQSUiPu_4OKvk0YDWEe34WONoZyCtWzj5tuq4PvgvK6HL/?source=tuwen_detail
 楼主| Teachers 发表于 2021-10-16 18:37
rufan321 发表于 2021-10-16 17:02
头条的,
https://www.toutiao.com/c/user/token/MS4wLjABAAAAfZMSai9lm2P4MvqFDvBXQSUiPu_4OKvk0YDWEe3 ...

好的  安排
rufan321 发表于 2021-10-16 20:02

感谢老师
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则 警告:本版块禁止灌水或回复与主题无关内容,违者重罚!

快速回复 收藏帖子 返回列表 搜索

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-4-26 13:26

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表