吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 3497|回复: 13
收起左侧

[Python 转载] Python3:基于正则匹配实现的电影爬虫

[复制链接]
c0ld 发表于 2018-8-13 14:16
先上源码:
[Python] 纯文本查看 复制代码
# -*- coding: UTF-8 -*-
#Author:MercuryYe
import re
import urllib.request

def getlink(url):
	#模拟浏览器请求,防止IP被拉入黑名单
	headers = ("User-Agent","Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/38.0.2125.122 Safari/537.36 SE 2.X MetaSr 1.0")
	opener = urllib.request.build_opener()
	opener.addheaders = [headers]
	#将opener设置为全局使用
	urllib.request.install_opener(opener)
	file = urllib.request.urlopen(url)
	data = str(file.read())
	#构造正则表达式来搜索内容
	pat = '<a href="(http://www..*?|http://goudidiao.com.*?)"'
	link = re.compile(pat).findall(data)  	
	link = list(set(link))
	return link

movie = input("输入电影名称:")
print('请稍等,正在搜索中......')
#将汉字转化为URL编码,避免字符报错
movie = urllib.parse.quote(movie)
url = "http://ifkdy.com/?q="+movie
url = str(url)
linklist = getlink(url)
print('----------------------------Result-----------------------------')
for link in linklist:
	print("观看地址:"+link[0:])
print('PS:任一观看地址都可以观看哦~')


实现思路:基于正则匹配获取<a>标签href属性中的链接

免费评分

参与人数 2吾爱币 +1 热心值 +2 收起 理由
ldick123 + 1 用心讨论,共获提升!
music984 + 1 + 1 期待更多python干货!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| c0ld 发表于 2018-8-13 15:13
mengsiyiren 发表于 2018-8-13 14:33
需要在Linux里运行?

Windows系统下下载Python3
根据教程配置Python3路径
然后在cmd(命令提示符)中cd进脚本所在目录
Python3 脚本名称即可
 楼主| c0ld 发表于 2018-8-15 06:27 来自手机
吾爱看雪 发表于 2018-8-14 23:48
感觉正则表达式好难啊。。。

哈哈哈,其实还是多加以练习,有些时候那些文档光让我背我也背不完,所以还是要多用,用得多了自己就能理解了
mengsiyiren 发表于 2018-8-13 14:33
Seven_2017 发表于 2018-8-13 14:37
mengsiyiren 发表于 2018-8-13 14:33
需要在Linux里运行?

这是python源代码   下载一个就好了
music984 发表于 2018-8-13 15:13
期待更多python干货!
 楼主| c0ld 发表于 2018-8-13 15:14
music984 发表于 2018-8-13 15:13
期待更多python干货!

感谢关注,以后会长期更新python的相关内容的
mengsiyiren 发表于 2018-8-13 15:51
c0ld 发表于 2018-8-13 15:13
Windows系统下下载Python3
根据教程配置Python3路径
然后在cmd(命令提示符)中cd进脚本所在目录

谢谢您的解释,了解了
mengsiyiren 发表于 2018-8-13 15:52
Seven_2017 发表于 2018-8-13 14:37
这是python源代码   下载一个就好了

好的,谢谢
sjz960913 发表于 2018-8-13 16:19
有教程?在哪呢?。。
吾爱看雪 发表于 2018-8-14 23:48
感觉正则表达式好难啊。。。
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则 警告:本版块禁止灌水或回复与主题无关内容,违者重罚!

快速回复 收藏帖子 返回列表 搜索

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-3-29 16:04

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表