吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 6608|回复: 19
收起左侧

[Python 转载] 搜索你想要的图片,并爬取

[复制链接]
18382747915 发表于 2018-9-9 22:38
本帖最后由 18382747915 于 2018-9-9 22:48 编辑

小白发帖,代码有什么改正的地方,希望大家多多指教

功能:输入图片名字,然后会自动保存到本地:
代码如下:
from urllib import request,response
import re,requests,urllib
from xpinyin import Pinyin
def she():
    n=0
    num=1
    pin = Pinyin()
    header = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:62.0) Gecko/20100101 Firefox/62.0'}
    shuru=input("请输入要搜索的图片:")
    shuru = pin.get_pinyin(shuru, "")
    date=urllib.request.Request('http://699pic.com/sousuo-%s-0-1-0-0-0.html'%shu(shuru),headers=header)
    date=urllib.request.urlopen(date)
    html=date.read().decode("utf-8")
    img=re.findall(' <img alt="(.*?)" title="(.*?)" class="lazy" src="(.*?)" data-original="(.*?)"  width="(.*?)" height="(.*?)" />  ',html,re.S)
    for i,l in enumerate(img):
        n=n+1
        url=img[3]
        name=img[1]
        url=requests.get(url).content
        with open("E:\\img\\{}.jpg".format(name),'wb')as wj:
            wj.write(url)
            print("成功下载%s张图片" % n)
def shu(sousuo):
    header = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:62.0) Gecko/20100101 Firefox/62.0'}
    date = urllib.request.Request('http://699pic.com/tupian/%s.html'%sousuo, headers=header)
    date = urllib.request.urlopen(date)
    html = date.read().decode("utf-8")
    img = re.findall('</div><a rel=\'nofollow\' href=\'/sousuo-(.*?)-0-2-0-0-0.html\' class=downPage>下一页</a>        </div>',html, re.S)
    return img[0]
if __name__ == '__main__':
     she()
1.png
2.png
3.png

免费评分

参与人数 1吾爱币 +1 热心值 +1 收起 理由
lilihuakai + 1 + 1 谢谢@Thanks!

查看全部评分

本帖被以下淘专辑推荐:

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

ebookread 发表于 2018-9-10 07:39
本帖最后由 ebookread 于 2018-9-10 07:41 编辑

from urllib import request,response 可以直接改成 import request,response
反正你都带空间名了
date=urllib.request.Request('http://699pic.com/sousuo-%s-0-1-0-0-0.html'%shu(shuru),headers=header)
date=urllib.request.urlopen(date)
而且这么用不小心你的函数名与
urllib中的函数名相同的话你就杯具了
 楼主| 18382747915 发表于 2018-9-10 10:48
麦米尔加弗德 发表于 2018-9-10 01:17
用了requests库为什么还要用urllib,代码好简单,函数名用拼音......,至少加个多进程啊,加油学习吧

哦哦,以后多加注意
头像被屏蔽
沐雨红尘 发表于 2018-9-9 22:51
A羽飞 发表于 2018-9-9 22:59
这个厉害了
 楼主| 18382747915 发表于 2018-9-9 23:00
佐佑 发表于 2018-9-9 22:58
好深奥的操作,感谢楼主分享

其实挺简单的,我也才学三天,一步一步来
 楼主| 18382747915 发表于 2018-9-9 23:09
沐雨红尘 发表于 2018-9-9 22:51
大佬这是python代码吗?有这么多代码就够了吗?config不要了吗

嗯嗯,不需要
2205 发表于 2018-9-9 23:35
3天?楼主应该是程序员尝鲜。。
kk1212 发表于 2018-9-9 23:41
不错啊,Python真是作用大
JokerX 发表于 2018-9-10 00:00
建议用英文命名 别用中文 不懂的英文查阅后用
aaa288794 发表于 2018-9-10 00:09
感觉就像隔空取物的Idear.
麦米尔加弗德 发表于 2018-9-10 01:17
用了requests库为什么还要用urllib,代码好简单,函数名用拼音......,至少加个多进程啊,加油学习吧
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-1 07:19

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表