吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 183|回复: 7
收起左侧

[经验求助] 求助,如何批量下载虎扑社区健身区所有帖子内图片

[复制链接]
freexin 发表于 2026-1-9 22:08
200吾爱币
健身区 - 虎扑社区
如何批量下载虎扑社区健身区所有帖子内图片或者关键词搜索出帖子内的图片,可以加币

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

yibeijiu 发表于 2026-1-9 22:11
有具体的链接吗?可以接单试试
 楼主| freexin 发表于 2026-1-9 22:21
dashu20230088 发表于 2026-1-9 22:23
浏览器扩展里面,搜索   AIX智能下载器    这个可以提取到你打开的网页的所有图片   一键全选下载,看看行不行!
 楼主| freexin 发表于 2026-1-9 22:31
dashu20230088 发表于 2026-1-9 22:23
浏览器扩展里面,搜索   AIX智能下载器    这个可以提取到你打开的网页的所有图片   一键全选下载,看看行 ...

多谢,这个可以下载,但是我得一个帖子一个帖子去点击,我想要自动浏览帖子然后下载图片的
greatzdl 发表于 2026-1-9 22:42
把网页另存为html文件,整个文件丢给kimi,让它识别图片链接
yibeijiu 发表于 2026-1-9 23:11
本帖最后由 yibeijiu 于 2026-1-9 23:13 编辑

我打开没有一个帖子啊,https://www.52pojie.cn/forum.php ... 085520&pid=54629733 6#楼的这个方法也可以试一下。源代码给你放在下面的链接了,你可以自己试试,https://c.wss.ink/f/iwplndhr3z8 复制链接到浏览器打开
炫迈 发表于 2026-1-10 08:47
老哥这个我去年搞过,虎扑反爬挺狠的,直接爬容易被封IP,我教你个稳妥的办法,先用Python写个脚本,配合Selenium模拟浏览器操作,这样能绕过大部分反爬,关键是要设置合理的等待时间和随机滚动,别让服务器觉得是机器人,然后用BeautifulSoup解析页面提取img标签的src属性,注意虎扑的图片链接都是https开头的,你要处理一下URL拼接问题,还有个坑是虎扑用了懒加载,图片不在首屏的要滚动才能加载出来,我建议用关键词搜索功能缩小范围,比如搜腹肌或者减脂这类词,然后分页爬取,每天别爬太多,控制在1000张以内比较安全,实在要大量下载就买个代理IP池轮换,我之前用芝麻代理没被封过,对了,下载前记得检查robots.txt看看允许爬哪些目录,别惹官司,数据保存建议按日期分文件夹,我写过类似的脚本,要是需要基础代码框架我发你参考,但别直接用,要自己改改参数,老哥你慢慢搞
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - 52pojie.cn ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2026-1-13 14:29

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表