吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 796|回复: 22
收起左侧

[求助] 爬虫问题请教

[复制链接]
Cellluo 发表于 2024-1-7 22:33
大佬们请教哈我通过 python 爬虫爬取一个网页视频,它的流程是通过解析网页内容获取到 m3u8 的连接,然后再请求 m3u8 的内容,再分别下载每个 ts 文件。由于每个 ts 文件是加密了,加密的 key 的信息也在 m3u8 那个文件中,通过模拟请求去获取这个 key 的内容,返回了错误码 403 ,但是我单独新建一个脚本,去请求这个 key 的内容,就能返回 200 ,目前百思不解,我已经和朋友确定了我新建脚本使用的 headers 就是第一个脚本生成的,所以可以排除是 headers 的问题。

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

FruitBaby 发表于 2024-1-7 22:39
有可能key过期了
 楼主| Cellluo 发表于 2024-1-7 23:02

不是的呢,我在第一个脚本中,无论怎么做,状态码都是403,但我在第二个脚本中就能返回200
erichyx 发表于 2024-1-7 23:15
你说的模拟请求是怎么做的,和脚本请求有什么不同,对比下看看
Arcticlyc 发表于 2024-1-7 23:22
没看出来你两次请求的差异
sai609 发表于 2024-1-7 23:57
脚本请求,有啥不同
T4DNA 发表于 2024-1-8 00:30
你这样说的太抽象了,两次请求必然存在差异问题,不然不可能一个可以一个不可以
dysky 发表于 2024-1-8 00:57
对面有反啊,,改变请求频率。
redballoon 发表于 2024-1-8 08:00
有类似的问题,我之前做过一个爬虫脚本,在postman中请求是200,而在python脚本中就是403,排除防盗链还能是什么原因?
wapjsx 发表于 2024-1-8 08:25
我怯也认为应该是cookis在作怪。
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则 警告:本版块禁止回复与主题无关非技术内容,违者重罚!

快速回复 收藏帖子 返回列表 搜索

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-5-14 20:23

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表