吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 2686|回复: 15
收起左侧

[Python 转载] 30行,用Xpath写个小玩意,监视教育官网的最新动态

[复制链接]
学海AoA无涯 发表于 2020-9-4 03:08
Print(“52吾爱”)


等待的时间总是漫长的,
这么些天了,还不见有录取通知下来
索性写一个小东东随时监视着教育官网的动态

感觉这个比爬图片还简单,因为网站结构很简单
a.png
步骤就是:
首先.访问官网www.sceea.cn
1.右击左边的列表,选择‘检查’
2.右击A标签
3.选择复制(copy)
4.复制Xpath路径,然后得到不同的属性值
上代码:
[Python] 纯文本查看 复制代码
import requests
import time
from lxml import etree
import webbrowser
headers = {
    'User-Agent': 'Mozilla/5.0(Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36'
}
eduurl ='http://www.sceea.cn' # 四川教育考试院官网
alll = [] # 定义一个空列表,存放已访问过的标题

while True: # 死循环
    HTMl = requests.get(eduurl, headers=headers).text
    HTMl = etree.HTML(HTMl)
    title = HTMl.xpath('//*[@id="news-left"]/li/a/@title') # 用Xpath获取文章标题
    titletime = HTMl.xpath('//*[@id="news-left"]/li/span/span[2]/text()') # 用Xpath获取发布时间
    urls = HTMl.xpath('//*[@id="news-left"]/li/a/@href') # 用Xpath获取文章连接
    keyword = ['专科', '对口招生', '旅游', '高职'] # 建立一个关键字列表

    for tit in title: # 在所有得到的标题里面遍历
        for key in keyword: # 在所有关键字里面遍历
            if key in tit: # 判断关键字出现在标题中
                if tit in alll: # 判断标题在已访问过的标题列表里面
                    pass # 在里面就不作为
                else: #
                    local = title.index(tit) # 获取标题在标题列表中的位置,用于得到发布时间
                    print(titletime[local] + '  ' + title[local] + '\n') # 打印出发布时间和文章标题
                    url = 'http://www.sceea.cn' + urls[local] # URL的拼接
                    webbrowser.open(url) # 打开浏览器,访问文章
                    alll.append(tit) # 将已访问的标题添加到列表中,防止重复访问
    time.sleep(600) # 设置延迟10分钟,相当于10分钟刷新一次吧


EXE打包文件:
教育官网监视  https://wwe.lanzouj.com/it9VWgc20mh

免费评分

参与人数 3吾爱币 +7 热心值 +3 收起 理由
苏紫方璇 + 5 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!
NuG_123 + 1 + 1 用心讨论,共获提升!
sdlyfxjjc + 1 + 1 热心回复!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

mjyai 发表于 2020-9-4 07:25
通用的监控网页插件,免费无限制的可用 Page Monitor https://chrome.google.com/webstore/detail/page-monitor/ogeebjpdeabhncjpfhgdibjajcajepgg
缺点是不再更新,只支持Chrome

还有 Distill Web Monitor https://distill.io/
功能强大,可跨设备,浏览器同步,支持Chrome和Firefox等,持续更新中
缺点是免费版跨设备同步有限制。
 楼主| 学海AoA无涯 发表于 2020-9-4 10:36
ciker_li 发表于 2020-9-4 10:02
是不是做个微信提醒更好,要不还得一直在电脑前守着

我前两天搞另外一个东西的时候就涉及到微信,用的itchat库,但是我的微信不能在网页登陆,一直调试不成功,,在pycharm里面显示未安装itchat,问了度娘,在设置里面导入,也不成功,,后来就没有了后来,,,能指点一下吗?
bright21vn 发表于 2020-9-4 05:57
xpmg 发表于 2020-9-4 07:27
高手啊,谢谢分享
 楼主| 学海AoA无涯 发表于 2020-9-4 08:06
mjyai 发表于 2020-9-4 07:25
通用的监控网页插件,免费无限制的可用 Page Monitor https://chrome.google.com/webstore/detail/page-mon ...

谢谢,,等我晚上去看看!
apoul 发表于 2020-9-4 08:55
谢谢分享
willgoon 发表于 2020-9-4 09:13
mjyai 发表于 2020-9-4 07:25
通用的监控网页插件,免费无限制的可用 Page Monitor https://chrome.google.com/webstore/detail/page-mon ...

感谢提供
ciker_li 发表于 2020-9-4 10:02
是不是做个微信提醒更好,要不还得一直在电脑前守着
no-problem 发表于 2020-9-4 10:29
方法挺多的  xpath  挺方便   可以利用一下    小程序云平台做这个监控  搭配微信通知  就可以实时的监控了
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则 警告:本版块禁止灌水或回复与主题无关内容,违者重罚!

快速回复 收藏帖子 返回列表 搜索

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-5-4 05:06

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表