吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 3201|回复: 37
收起左侧

[Python 原创] 【爬虫新手必看】歌曲网站爬虫案例详解

  [复制链接]
taoyuanhang 发表于 2023-9-3 07:54
本帖最后由 taoyuanhang 于 2023-9-3 07:58 编辑



项目链接:https://www.gequbao.com/

动机:大部分的音乐需要VIP才可以听,并且下载也要VIP。

所以,我想找一个不用VIP就可以听歌的音乐站,这不,就让我找到了?

最近见到什么网站都想爬一爬,所以想先拿这个网站练练手

由于我是一边分析一边写的,所以文章会长一点,新手可以慢慢看,代码写完会放在下面的,不要着急~

首先这个网站是长这样的:



然后我随便点击了一首歌曲,它的页面是这样的,没有在新标签页打开,并且刷新了,如图



所以我猜这个用的不是Ajax接口,而是由服务器渲染再返回客户端的

点击f12,刷新,我猜的果然没错



这种的话我比较喜欢用正则表达式,到时候不行再用xpath,因为正则表达式比较简单。(我的意思是我个人比较喜欢,并不是说xpath不好)

好的,我们这个主要是下载歌曲,并不是获取它的歌名、歌手等,咱们主要的目的不是自动下载吗?




这里的下载并不是直接下载了,而是访问歌曲的主页,那我们就去主页看看

这里的歌词和歌曲是分开的(像极了B站的音视频分开)



这边审查元素发现下载链接已经很明显了



我们尝试直接访问链接,好家伙,这还不是真正的下载,而是在新标签页打开歌曲,没事,这个requests可以解决的



等一下,突然发现这个是酷我音乐的外链。。。

没事没事,反正外链在手,可以下载就行

开始编写代码啦!

免费评分

参与人数 16威望 +1 吾爱币 +33 热心值 +14 收起 理由
Mapleoow + 1 + 1 我很赞同!
Tse24 + 1 + 1 用心讨论,共获提升!
嘟鲁鲁 + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
zxt200276 + 1 我很赞同!
lgq0100 + 1 我也试试去
my3240 + 1 热心回复!
Hashan + 1 + 1 我很赞同!
苏紫方璇 + 1 + 20 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
弑者 + 1 + 1 用心讨论,共获提升!
yjn866y + 1 + 1 谢谢@Thanks!
wonder120 + 1 + 1 我很赞同!
woyucheng + 1 + 1 谢谢@Thanks!
czz404 + 1 + 1 谢谢@Thanks!
wystudio + 1 + 1 用心讨论,共获提升!
Arcticlyc + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
cranelyh + 1 用心讨论,共获提升!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

shaunkelly 发表于 2023-9-3 10:52
============== RESTART: C:/Users/Administrator/Documents/gq001.py ==============
Traceback (most recent call last):
  File "C:/Users/Administrator/Documents/gq001.py", line 1, in <module>
    import requests
ModuleNotFoundError: No module named 'requests'
 楼主| taoyuanhang 发表于 2023-9-3 10:11
gzl5755 发表于 2023-9-3 09:59
您好!这个方法可以下载网抑云音乐吗

[Python] 纯文本查看 复制代码
with open(f"{input('歌名:')}.mp3",'wb') as i:    
    i.write(__import__('requests').get(f"http://music.163.com/song/media/outer/url?id={input('请输入网址:')[32:]}.mp3").content)
xxsm10 发表于 2023-9-3 09:44
gzl5755 发表于 2023-9-3 09:59
您好!这个方法可以下载网抑云音乐吗
scbzwv 发表于 2023-9-3 10:28
感谢分享
shaunkelly 发表于 2023-9-3 10:34
厉害,还得先分析才能写代码
ZYLB2023 发表于 2023-9-3 10:35
好好学习
dtsuifeng 发表于 2023-9-3 10:43
我也去爬一爬。
shaunkelly 发表于 2023-9-3 10:59
pip install requests

要安装一下模块
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则 警告:本版块禁止灌水或回复与主题无关内容,违者重罚!

快速回复 收藏帖子 返回列表 搜索

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-5-4 17:24

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表