吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 705|回复: 16
收起左侧

[经验求助] 请教一下关于文件爬取功能

[复制链接]
dingfeifei 发表于 2024-3-20 09:37
88吾爱币
工作项目需要 ,要爬取互联网上的文档信息,但是遇到一个问题就是要登陆验证,小弟只会java,python不会,
请教下吾爱里的大神指导一下 ,在此万分感谢。

最佳答案

查看完整内容

用request的话先登录,得到cookies再去请求下载,用selenium自动化的话正常登录再模拟点击下载按钮。

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

devilpanama 发表于 2024-3-20 09:37
用request的话先登录,得到cookies再去请求下载,用selenium自动化的话正常登录再模拟点击下载按钮。
 楼主| dingfeifei 发表于 2024-3-20 10:15
devilpanama 发表于 2024-3-20 09:50
用request的话先登录,得到cookies再去请求下载,用selenium自动化的话正常登录再模拟点击下载按钮。

能细说一下或者有例子吗 ,我看下 ,主要爬虫这块我也是第一次着手 ,
devilpanama 发表于 2024-3-20 10:37
dingfeifei 发表于 2024-3-20 10:15
能细说一下或者有例子吗 ,我看下 ,主要爬虫这块我也是第一次着手 ,

目标网址有么,我看看是啥验证
人二 发表于 2024-3-20 10:41
直接加cookie爬
 楼主| dingfeifei 发表于 2024-3-20 11:16
devilpanama 发表于 2024-3-20 10:37
目标网址有么,我看看是啥验证

https://rmfyalk.court.gov.cn/home.html  这个例库 下载几个特别案例
devilpanama 发表于 2024-3-20 11:40
zf网站,有点刑,但是也能下,刚是抓包试了,先找到搜索的接口,会返回列表,里面的id拼凑出来就是下载地址
 楼主| dingfeifei 发表于 2024-3-20 11:49
devilpanama 发表于 2024-3-20 11:40
zf网站,有点刑,但是也能下,刚是抓包试了,先找到搜索的接口,会返回列表,里面的id拼凑出来就是下载地址

我就拿几条信息  ,他这是公开的 。就是用你之前说的request 方式吗
changesmile 发表于 2024-3-20 11:53
登陆后拿cookie,java请求的时候加上这个cookie试试
devilpanama 发表于 2024-3-20 11:54
dingfeifei 发表于 2024-3-20 11:49
我就拿几条信息  ,他这是公开的 。就是用你之前说的request 方式吗

都可以用,两个方法不一样,request是找接口直接请求数据,selenium是打开浏览器模拟人工点击下载
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-12-15 13:12

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表