吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 8579|回复: 25
收起左侧

[C&C++ 转载] C++ Https 图片网络爬虫

  [复制链接]
小远zi 发表于 2018-6-6 23:24
本帖最后由 小远zi 于 2018-6-7 14:44 编辑

原创
基于WinodowsAPI(winnet.lib)
No.1 C++支持Https 开源的简单的图片爬虫

也有借鉴前人,现在开源,造福后生,不藏着掖着全部代码在附件里面
先来说一下主要的技术点:

1. 输入起始网址,解析出主机号和路径(处理http协议和 https协议 和 ftp协议)
2. 使用winnet套接字连接服务器,获取网页html代码,然后使用正则表达式解析出图片url和其他的url
3. 下载图片至创建的文件夹中,同时其他的url push进队列。
4. 为了使爬虫能够连续的工作,这里使用了BFS宽度优先搜索,也就是说一开始输入的网址作为起始网址,
push进队列,然后把能解析出来的网址在不重复的情况下都push进队列,每次取队列的top来执行下载操作,直到队列为空时终止。
可能存在bug 欢迎指正希望加入组织,共同交流
效果在图片中,一个http的例子,https要改一下正则表达式,在此不再赘述

Help shape the future of @小远zi
接受捐赠 一分也是爱

  
QQ截图20180606232122.png
QQ截图20180606232136.png
90F2F453591BA28C45B5CFCAE0BB0BDD.png

main.txt

3.82 KB, 下载次数: 392, 下载积分: 吾爱币 -1 CB

免费评分

参与人数 12吾爱币 +14 热心值 +10 收起 理由
yesido_1990 + 1 热心回复!
BLUEWIKI + 1 + 1 谢谢@Thanks!
tosm + 1 + 1 我很赞同!
13673353710 + 1 + 1 谢谢@Thanks!
snwjas + 1 + 1 谢谢@Thanks!
小坤9 + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
老是卖你们 + 2 + 1 热心回复!
wushaominkk + 3 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!
bmc410 + 1 谢谢@Thanks!
lin_xop + 1 + 1 热心回复!
莺歌燕语 + 1 请注意身体
夏日已末 + 1 + 1 谢谢@Thanks!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

wushaominkk 发表于 2018-6-7 10:35
请不要出现国内首发等敏感词语,已帮你修改下次注意!C++爬虫挺有新意,期待你下次更好的作品!
xiajin 发表于 2018-6-7 08:15
只抓图片吗?支持了,
如果支持界面操作项的供我们小白使用就好了。
zhw16868 发表于 2018-6-7 08:33
cooldog123pp 发表于 2018-6-7 08:36
用python分分钟搞定呀
EVANLEE 发表于 2018-6-7 08:43
厉害了,感谢分享。
beijing2006 发表于 2018-6-7 08:44
学习学习,很好de帖子!!!
夏日已末 发表于 2018-6-7 08:47
感谢楼主分享,c++大法好
骨灰盒下风流死 发表于 2018-6-7 08:54
谢谢LZ分享。。。。。
imk 发表于 2018-6-7 09:25
谢谢分享
葫芦炒鸡蛋 发表于 2018-6-7 09:29
感谢分享
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则 警告:本版块禁止灌水或回复与主题无关内容,违者重罚!

快速回复 收藏帖子 返回列表 搜索

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-4-25 14:11

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表