吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 5332|回复: 42
收起左侧

[学习记录] Python爬取小姐姐图片代码的实践

  [复制链接]
l2430478 发表于 2021-1-11 13:18
本帖最后由 l2430478 于 2021-1-12 21:43 编辑

编程需要有耐心,需要有信心,不会我们可以摸索,本机环境建立好了,就可以拿别人的代码进行实践,模仿,修改。
只有摸索,才知道每一步的含义,好的代码多保存起来,便于下次我们借鉴。
朋友分享一个爬美女图片的代码,我尝试运行,并分析给大家。
此爬虫仅需要安装需要安装 pip install requests(不会的参考自学笔记七)
实践网站:https://www.vmgirls.com/(我看网站中已经打广告要出售,想练习代码的抓紧啦)
这个代码我看了,需要先找到一个带图片的网页,我随机打开了一个网页。https://www.vmgirls.com/15159.html
[Python] 纯文本查看 复制代码
# requests 请求 需要提前在Terminal中安装 pip install requests
import os
import time

import requests
# re正则
import re
# 改变自己身份
headers = {
   'User-Agent': 'asbasdf'
}
# 请求网页
print("请输入你要爬取网站的链接")
httpurl = input()
response = requests.get(httpurl,headers = headers)
print(response.request.headers)
print(response.text)
html = response.text
# 解析网页
# view-source:[url=https://www.vmgirls.com/15159.html]https://www.vmgirls.com/15159.html[/url]
# 链接前加view-source查看网页源代码
dir_name = re.findall('<h1 class="post-title h1">(.*?)</h1>',html)[-1]
if not os.path.exists(dir_name):
   os.mkdir(dir_name)
# 正则查找
urls = re.findall('<a href="(.*?)" alt=".*?" title=".*?">',html)
print(urls)
# 保存图片
for url in urls:
   time.sleep(1)
   # 图片名字
   name = url.split('/')[-1]
   response = requests.get("https:"+url,headers = headers)
   print(name+"正在下载")
   with open(dir_name+'/'+name,'wb') as f:
       f.write(response.content)
print('下载完毕')



alt+回车后,出现一个输入框,粘贴https://www.vmgirls.com/15159.html进去,并回车。
就在默认文件夹(不会看默认文件夹的看我上个帖子)下生成一个文件夹,里面是该网页的图片。
快照8.jpg
我们尝试修改网址,随机找一个。https://www.vmgirls.com/14597.html
再次运行代码,图片再次生成,来来来,大家看下效果。
2020091909034825.jpg 2020091909035044.jpg 2020091909035727.jpg

除了得到图片外,我们其实可以深入分析该代码。
代码运行后,调取了很多东西,这是已经爬成功的代码,有空的朋友可以研究研究,
可以尝试调用文字并保存到本地,能够快速提高水平。


来来来,给你们一个网址,你们练习爬。
https://www.vmgirls.com/13487.html



免费评分

参与人数 6吾爱币 +5 热心值 +5 收起 理由
yehuaguo + 1 热心回复!
卢布 + 1 + 1 谢谢@Thanks!
VXLZX + 1 + 1 用心讨论,共获提升!
Deuez + 1 我很赞同!
hpy + 1 + 1 谢谢@Thanks!
hack88888888 + 1 + 1 我很赞同!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

longling 发表于 2021-1-11 13:28
咳咳。养眼啊,哈哈
fhqiigdn 发表于 2021-1-11 13:31
列明 发表于 2021-1-11 13:31
不知道會不會因為你提供了美女圖片網站而被刪帖,總之,保存收藏就完了。
VIP007 发表于 2021-1-11 13:34
这个颜值  
colorfuldays 发表于 2021-1-11 13:36
原来PYTHON是这么用的啊,学习了
advancejar 发表于 2021-1-11 13:37
写re需要不停调试,beautifulsoup简单多了
ygxgdjj 发表于 2021-1-11 13:41
我不想爬美女 ,有没有帅哥啥的网站
Jacky168 发表于 2021-1-11 13:45
回帖支持楼主!
xiaoshan1818 发表于 2021-1-11 13:45
会代码,的都点赞,学习学习,但是没有动力
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则 警告:本版块禁止回复与主题无关非技术内容,违者重罚!

快速回复 收藏帖子 返回列表 搜索

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-5-12 23:27

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表