吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1664|回复: 7
收起左侧

[求助] python 爬虫bs4求助

[复制链接]
绝版coco 发表于 2019-7-28 07:39
如图所示
QK}@6LJ)HOX~7N7EY_D001R.png

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| 绝版coco 发表于 2019-7-28 08:01
import requests
from bs4 import BeautifulSoup
#url="http://www.hzhr.com/Web/Person/List.html"
headers={"User-Agent" : "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36"}


html=requests.get("http://www.hzhr.com/Web/Person/List.html",headers=headers)
soup=BeautifulSoup(html, "lxml")
data=soup.select("div.txt_add > p.link_add")
for i in data:
    title=i.get_text

报错:Traceback (most recent call last):
  File "F:/py-lianxi/1.py", line 8, in <module>
    soup=BeautifulSoup(html, "lxml")
  File "C:\Users\Hasee\AppData\Local\Programs\Python\Python37-32\lib\site-packages\bs4\__init__.py", line 245, in __init__
    elif len(markup) <= 256 and (
TypeError: object of type 'Response' has no len()



QK}@6LJ)HOX~7N7EY_D001R.png
52sczzj 发表于 2019-7-28 08:13
soup=BeautifulSoup(html, "lxml")改为soup=BeautifulSoup(html.content, "lxml")
试一下
518 发表于 2019-7-28 08:18
daimiaopeng 发表于 2019-7-28 08:20
正解:
soup=BeautifulSoup(html.text, "lxml"),BeautifulSoup()第一个参数是文本而不是一个对象

免费评分

参与人数 1吾爱币 +1 热心值 +1 收起 理由
绝版coco + 1 + 1 谢谢@Thanks!

查看全部评分

Eric_zhao 发表于 2019-7-28 09:19
绝版coco 发表于 2019-7-28 08:01
import requests
from bs4 import BeautifulSoup
#url="http://www.hzhr.com/Web/Person/List.html"

soup=BeautifulSoup(html.text, "lxml")
是html.text


建议使用 scrapy  xpath
Eric_zhao 发表于 2019-7-28 09:20

soup=BeautifulSoup(html.text, "lxml")
是html.text


建议使用 scrapy  xpath
YXK 发表于 2019-7-28 10:17
建议使用 scrapy  xpath
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则 警告:本版块禁止回复与主题无关非技术内容,违者重罚!

快速回复 收藏帖子 返回列表 搜索

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-6-17 15:42

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表