吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1783|回复: 22
收起左侧

[求助] python爬取数据遇到的空格问题?

[复制链接]
double07 发表于 2021-10-19 21:57
下图是网页Respon返回的信息,但不知道如何写代码清除字段间的空格?
image.png
[Python] 纯文本查看 复制代码
     html_detail = gethtml(i)
                    html = etree.HTML(html_detail)
                    b = html.xpath('//li[@class="clear"]')
                    for i in range(len(b)):
                        lst = {}
                        lst['索引'] = ''
                        lst['小区名称'] = b[i].xpath('./div/div[2]/div[1]/div/a/text()')[0]
                        lst['房屋信息'] = b[i].xpath('./div/div[2]/div[2]/text()')[1].replace('\n', '').replace('\r', '')
                        lst['出售价格'] = b[i].xpath('./div/div[2]/div[5]/div[1]/span/text()')[0]
        

导出的数据是这样的
image.png
      ↓
希望导出的数据变成这样的?
image.png

代码该如何优化?




免费评分

参与人数 1吾爱币 +1 收起 理由
wuai1023a + 1 我很赞同!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

ForGot_227 发表于 2021-10-19 22:07
[Python] 纯文本查看 复制代码
a = 'text'
b = a.replace(' ', '')

函数不知道有没有写错。

免费评分

参与人数 1吾爱币 +1 热心值 +1 收起 理由
double07 + 1 + 1 热心回复!

查看全部评分

 楼主| double07 发表于 2021-10-19 22:16
ForGot_227 发表于 2021-10-19 22:30
kk159 发表于 2021-10-19 23:15
ForGot_227 发表于 2021-10-19 22:30
我看你代码都有去掉换行了

\n\r只是去换行回车,没去空。strip()不知道能否行呢?
头像被屏蔽
qwe12344 发表于 2021-10-19 23:35
提示: 作者被禁止或删除 内容自动屏蔽
Mrstick 发表于 2021-10-20 00:34
楼主这个问题我也有遇到过,建议用replace代替,用这个.replace('\n', '').replace('\r', '').replace(" ", "").replace('\t', '')
似水流年2015 发表于 2021-10-20 01:45
有大半年没写python代码了.........差不多忘光了,哈哈
chermy 发表于 2021-10-20 02:01
没接触过py, 有没有类似trim()的函数呢. 2L的替换也是可以的
jacky98617 发表于 2021-10-20 02:53
用strip()應該可以?
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则 警告:本版块禁止回复与主题无关非技术内容,违者重罚!

快速回复 收藏帖子 返回列表 搜索

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-4-20 06:50

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表