吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1240|回复: 12
收起左侧

[求助] phthon爬取div标签内有多少个span元素如何写,关键是网站的这个div标签是注释标签。

[复制链接]
omar111 发表于 2022-4-7 16:15
phthon爬取div标签内有多少个span元素如何写,关键是网站的这个div标签是注释标签。是不是pthon不能爬 !--<div>里面的内容啊

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

行人2019 发表于 2022-4-7 16:25
最好是截图发出来看看
无缺i 发表于 2022-4-7 16:28
YuanFang0w0 发表于 2022-4-7 16:28
Xpath解析,/div/span返回一个列表里面有所有的span对象。或者直接/div//span/text()解析div下所有的span的内容。
印象中是这么写的。我有时候写起来我也记不住具体的,按照这个思路一写试一下就行了
狂笑一君 发表于 2022-4-7 16:33
爬注释你可以用正则
情绪666 发表于 2022-4-7 17:29
xpath找到包裹注释的那个标签,提取出来,字符串替换注释的字符(<!-- 和 -->),再用xpath提取已经替换掉注释的内容,就可以了
生存 发表于 2022-4-7 19:17
直接爬网站,正则匹配<div>*</div>不行?
马了顶大 发表于 2022-4-7 19:23
那就把注释爬下来,再处理
hackerbob 发表于 2022-4-7 19:29
用正则啊,写爬虫不应该是xpath和re交替使用吗,这种情况用正则最合适
githubi 发表于 2022-4-7 19:56
hackerbob 发表于 2022-4-7 19:29
用正则啊,写爬虫不应该是xpath和re交替使用吗,这种情况用正则最合适

不推荐使用css吗
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则 警告:本版块禁止回复与主题无关非技术内容,违者重罚!

快速回复 收藏帖子 返回列表 搜索

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-5-5 17:02

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表