吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1052|回复: 8
收起左侧

[经验求助] 网页内置excel数据如何导出

[复制链接]
q6378561 发表于 2024-4-2 18:20
25吾爱币
本想自己操作 但是发现实力有限
网页资源名字叫做easyoffice
是一个内置表格框架
想爬取这个表格数据发现是用websocket传包的 具体进一步加密就不了解 有大佬交流一下吗

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

devilpanama 发表于 2024-4-2 20:46
不发目标怎么爬
wchenfeng 发表于 2024-4-2 21:11
lemonatalk952 发表于 2024-4-2 21:20
czz404 发表于 2024-4-2 21:46
如果表格不大,最方便成熟的方法就是直接用ocr表格接口识别就解决了

如果表格很大需要拖动滚动条那种才需要研究爬取方法
fortytwo 发表于 2024-4-3 01:15
地址地址base64
h7867 发表于 2024-4-3 06:32
网页中内置的Excel数据导出通常涉及到JavaScript交互、API调用或者是直接在前端进行数据处理并生成Excel文件的过程。对于您提到的`easyoffice`表格框架,由于没有公开的官方文档可以直接参考,我们需要根据一般的网页数据抓取原理和Websocket通信的特点来推测可能的解决方案。

1. **分析WebSocket通信**:
   如果数据是通过WebSocket实时传输的,你需要监听并解析WebSocket的通信内容。这可能涉及到使用像Wireshark、Charles Proxy这样的网络抓包工具来捕获并解密Websocket通信数据,找出相关的数据包并理解其传输的数据格式。

2. **模拟请求**:
   如果WebSocket是用来更新表格数据的,你可能需要模拟客户端的行为,通过编程方式连接WebSocket服务器,并正确处理服务器推送的消息,从中提取出构建Excel所需的数据。

3. **查找导出函数或按钮触发事件**:
   查看网页源码,找到表格导出功能对应的JavaScript代码,分析它是如何获取表格数据以及如何调用后台服务或利用前端库(比如xlsx.js、FileSaver.js等)生成Excel文件的。

4. **逆向工程**:
   如果存在某种加密或混淆,可能需要进行一定程度的逆向工程来解析加密算法,然后才能正确解读出原始数据。

5. **合法合规性**:
   需要注意的是,未经授权爬取网页数据,特别是涉及加密通信的内容,可能存在法律风险。确保您的行为符合法律法规及网站的使用条款。

鉴于具体的加密机制未知,且没有明确的接口文档,您可能需要具备一定的前端开发和调试技能才能成功抓取和导出数据。另外,为了尊重网站隐私政策和版权法,确保在进行此类操作时遵循正当性和合法性原则。
小哲网络 发表于 2024-4-3 09:58
使用excel内置功能试试呢?
1. Excel“自网站”命令抓取数据的操作方法
Step1:新建一个空白的表格,在数据选项卡中找到“自网站”按钮。如下图所示:


Step2:接着用浏览器打开需要抓取数据的网址,我们复制一下当前网页的网址。

Step3:接着回到Excel中,从数据选项卡中打开自网页按钮,软件会弹出一个“从web”对话框,选择高级,URL部分处粘贴刚刚固执的网址,单击确认后会提示正在连接。随后会出现一个导航器。

Step4:导航器如下图所示,其中抓取的会有两个表格的数据,Table0是房价涨幅数据,Table1是房价跌幅数据。

现在我们选中Table1在表视图中就能预览看到数据,接着选择转换数据即可。


http://news.sohu.com/a/683622700_121124012
freelive 发表于 2024-4-3 15:46
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-12-12 13:21

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表