吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1382|回复: 2
收起左侧

[学习记录] 学习百度图片爬取

[复制链接]
blue84818971 发表于 2021-4-26 15:32
import requests
import re
import os
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.85 Safari/537.36'}
# url = 'https://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=' + name + '&pn=' + str(i * 60)
num = 0
name = input('输入查找的图片:')
x = int(input('输入160张,请输入需要的数量:'))
path = 'F:\\百度图片爬取\\'
if not os.path.exists(path):
    os.mkdir(path)
for i in range(x):
    url = 'https://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=' + name + '&pn=' + str(i * 60)
    res = requests.get(url, headers=headers)
    html = res.content.decode()
    lst = re.findall('"objURL":"(.*?)",', html)
    for j in lst:
        num += 1
        try:
            img = requests.get(j)
        except Exception as e:
            print(e)
            continue
        f = open(path + name + str(num) + '.jpg', 'wb')
        print('-----------'+str(num)+"张在下载------------")
        f.write(img.content)
        f.close()
print('完成')

免费评分

参与人数 1吾爱币 +1 热心值 +1 收起 理由
曹阿蛮 + 1 + 1 我很赞同!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

头像被屏蔽
wuti90 发表于 2021-4-26 17:21
提示: 作者被禁止或删除 内容自动屏蔽
192666378 发表于 2021-4-27 12:30
本帖最后由 192666378 于 2021-4-27 12:53 编辑

失败……有验证码了

您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则 警告:本版块禁止回复与主题无关非技术内容,违者重罚!

快速回复 收藏帖子 返回列表 搜索

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-5-16 14:03

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表