吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 3991|回复: 3
收起左侧

[Python 原创] python获取豆瓣高分电影写入MYSQL+matplotlib简单可视化

[复制链接]
null119 发表于 2019-7-9 15:52
本帖最后由 null119 于 2019-7-10 20:15 编辑

图片镇楼
QQ截图20190709154934.png

获取豆瓣高分电影(500部)写入MySQL数据库:
[Python] 纯文本查看 复制代码
#-*-coding:UTF-8-*-
import requests
import json
import pymysql
from lxml import etree

def GetWriteData(url,num):
    conn = pymysql.connect(host='127.0.0.1', port=3306, user='root', passwd='root', db='mydata')
    cursor = conn.cursor()
    cursor.execute("DROP TABLE IF EXISTS db")  #如果db Base存在则删除
    cursor.execute('create table db ( id int(5) primary key, pname varchar(255), pf varchar(10) ,plnum int(10),zhpf int(10))')
    i = 0
    while i < num:
        html = requests.get(url + str(i))
        if '异常请求' in html.text:
            print('请求过于频繁,请稍后再试!')
            break
        text = json.loads(html.text[12:-1])
        i += 20
        print(i,round(i/20))
        for j in text:
            try:
                s = requests.get(j['url'])
            except:
                print('访问异常')
            else:
                ehtml = etree.HTML(s.text)
                nu = int(''.join(ehtml.xpath('//*[@id="interest_sectl"]/div[1]/div[2]/div/div[2]/a/span/text()')))
            zhpf=round(float(nu /10000 * 0.5)) + round(float(j['rate']) * 2)
            cursor.execute('INSERT INTO db(id,pname,pf,plnum,zhpf) values (%s, %s, %s ,%s,%s) ',[k,j['title'],j['rate'],nu,zhpf])
            cursor.rowcount
            conn.commit()
    cursor.close()
    conn.close()
    print('任务结束。')

if __name__ == '__main__':
    url = 'https://movie.douban.com/j/search_subjects?type=movie&tag=豆瓣高分&sort=recommend&page_limit=20&page_start='
    print('开始获取,请稍候...')
    GetWriteData(url,500)  # 500为获取影片数量


matplotlib简单可视化:
[Python] 纯文本查看 复制代码
import pymysql
import matplotlib.pyplot as plt
conn = pymysql.connect(host='127.0.0.1', port=3306, user='root', passwd='root', db='mydata',cursorclass = pymysql.cursors.DictCursor)
cursor = conn.cursor()
cursor.execute('select * from mydata.db order by zhpf desc;')
values = cursor.fetchall()
cursor.close()
conn.close()
namedata=[]
zhpf=[]
n=0
for i in values:
    if n>20:break
    namedata.append(i['pname'])
    zhpf.append(i['zhpf'])
    n+=1
plt.rcParams["font.sans-serif"]=["SimHei"]
plt.rcParams["axes.unicode_minus"]=False
plt.barh(y=namedata, width=zhpf, label='综合评分',color='steelblue', alpha=0.8, height=0.8)
for y, x in enumerate(zhpf):
    plt.text(x+2, y-0.4, '%s' % x, ha='center', va='bottom')
plt.xlabel("分值")
plt.ylabel("片名")
plt.legend()
plt.show()

免费评分

参与人数 5吾爱币 +7 热心值 +5 收起 理由
chxchxkkk + 1 + 1 热心回复!
mrcangye + 1 我很赞同!
NHloser + 1 + 1 谢谢@Thanks!
FleTime + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
wushaominkk + 5 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

葫芦炒鸡蛋 发表于 2019-7-9 16:51
requests库自带解析json功能,直接html.json就可以了

免费评分

参与人数 1吾爱币 +1 热心值 +1 收起 理由
ermao + 1 + 1 我很赞同!

查看全部评分

tianyunfari 发表于 2019-7-9 20:25
靖安 发表于 2020-11-11 14:57
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则 警告:本版块禁止灌水或回复与主题无关内容,违者重罚!

快速回复 收藏帖子 返回列表 搜索

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-4-29 11:20

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表