吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 286|回复: 10
收起左侧

[求助] Python爬取某在线文档内图片

[复制链接]
madman_ 发表于 2025-4-19 16:18
25吾爱币
本帖最后由 madman_ 于 2025-4-20 00:38 编辑

图片只能在打开时获取到URL,但是找不到含有图片的单元格。想通过表格内的关键字“图片”,来找到图片所在的列,从而实现点击图片单元格,获取图片的URL,但是找不到行列的类名。。。。

示例链接:https://docs.qq.com/sheet/DSFJnSHpxb3VreXBL?no_promotion=1&tab=BB08J2

最佳答案

查看完整内容

整个文档都是在 canvas 绘制的,爬的话要分析它的协议,或想办法注入代码到 js 自动化获取。 直接和数据源谈合作让他们提供原始表格文件或图片吧。

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

爱飞的猫 发表于 2025-4-19 16:18
整个文档都是在 canvas 绘制的,爬的话要分析它的协议,或想办法注入代码到 js 自动化获取。
直接和数据源谈合作让他们提供原始表格文件或图片吧。
devilpanama 发表于 2025-4-19 23:02
 楼主| madman_ 发表于 2025-4-20 00:38
devilpanama 发表于 2025-4-19 23:02
不发链接很难去测试

https://docs.qq.com/sheet/DSFJnSHpxb3VreXBL?no_promotion=1&tab=BB08J2
大佬可以去看下有办法吗
devilpanama 发表于 2025-4-20 12:09
madman_ 发表于 2025-4-20 00:38
https://docs.qq.com/sheet/DSFJnSHpxb3VreXBL?no_promotion=1&tab=BB08J2
大佬可以去看下有办法吗

没有权限,看不了
Tking#5366 发表于 2025-4-21 09:02
不太明白你的意思,如果要拿不到原始数据的话,你可以用opencv来实现识别点击,如果能拿到原始数据那更好办了,直接pandas处理完事
 楼主| madman_ 发表于 2025-4-21 18:51
Tking#5366 发表于 2025-4-21 09:02
不太明白你的意思,如果要拿不到原始数据的话,你可以用opencv来实现识别点击,如果能拿到原始数据那更好办 ...

朋友说这个表是二维画出来的,没办法爬,只能模拟操作,那更复杂了
 楼主| madman_ 发表于 2025-4-21 19:50
Tking#5366 发表于 2025-4-21 09:02
不太明白你的意思,如果要拿不到原始数据的话,你可以用opencv来实现识别点击,如果能拿到原始数据那更好办 ...

原始数据每天都会更新,数据量太大了。模拟操作过于复杂,我的本意是直接从在线文档中爬取指定行的图片,不用再打开文档下载图片了
 楼主| madman_ 发表于 2025-4-22 00:38
爱飞的猫 发表于 2025-4-21 23:42
整个文档都是在 canvas 绘制的,爬的话要分析它的协议,或想办法注入代码到 js 自动化获取。
直接和数据源 ...

我可以直接从在线文档上面下载图片。只是想直接爬取的话不用再打开文档去下载图片了,可以每天一键下载最新的图片
 楼主| madman_ 发表于 2025-4-22 00:39
爱飞的猫 发表于 2025-4-21 23:42
整个文档都是在 canvas 绘制的,爬的话要分析它的协议,或想办法注入代码到 js 自动化获取。
直接和数据源 ...

那没办法搞了哈哈  就这样吧
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2025-5-31 14:33

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表