用AI生成的获取豆瓣电影top250，xpath和BeautifulSoup

欢乐之歌 · 发表于 2023-5-6 12:03

用AI生成的获取豆瓣电影top250
用xpath 和 BeautifulSoup AI确实牛掰，我服了，

这是AI生成的代码，我只修改了一点点，
xpath解析后保存到csv文件！

[Python] 纯文本查看 复制代码

import requests
from bs4 import BeautifulSoup
from lxml import etree
import csv
# 请安装：requests，bs4，lxml


def doubantop250beauti():
    url = 'https://movie.douban.com/top250'
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'
    }
    movies = []
    for i in range(0, 250, 25):
        params = {'start': str(i), 'filter': ''}
        response = requests.get(url, headers=headers, params=params)
        soup = BeautifulSoup(response.text, 'html.parser')
        movie_list = soup.find_all('div', class_='hd')
        for movie in movie_list:
            title = movie.a.span.text.strip()
            link = movie.a['href']
            movies.append({'title': title, 'link': link})

    for movie in movies:
        print(movie['title'], movie['link'])


def doubantop250xpath():

    # 设置UA
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}

    # 获取Top250页面
    url = 'https://movie.douban.com/top250'
    for i in range(0, 250, 25):
        params = {'start': str(i), 'filter': ''}
        response = requests.get(url, headers=headers, params=params)
        html = response.text
        # 解析页面
        selector = etree.HTML(html)
        movies = selector.xpath('//div[@class="info"]')

        # 遍历电影信息
        for movie in movies:
            # 电影名称
            title = movie.xpath('div[@class="hd"]/a/span[@class="title"]/text()')[0]

            # 电影评分
            score = movie.xpath('div[@class="bd"]/div[@class="star"]/span[@class="rating_num"]/text()')[0]

            # 电影链接
            link = movie.xpath('div[@class="hd"]/a/@href')[0]

            # 打印电影信息
            print('电影名称：', title)
            print('电影评分：', score)
            print('电影链接：', link)
            print('-----------------------')

        # 写入CSV文件
        with open('top250.csv', 'a', encoding='"utf-8_sig"', newline='') as f:
            writer = csv.writer(f)
            for movie in movies:
                title = movie.xpath('div[@class="hd"]/a/span[@class="title"]/text()')[0]
                score = movie.xpath('div[@class="bd"]/div[@class="star"]/span[@class="rating_num"]/text()')[0]
                link = movie.xpath('div[@class="hd"]/a/@href')[0]
                writer.writerow([title, score, link])



if __name__ == '__main__':
    doubantop250xpath()
	#doubantop250beauti()

博爵 · 发表于 2023-5-6 21:50

欢乐之歌发表于 2023-5-6 17:56
我最喜欢的还是易语言，但是它不懂易语言，哈哈，伤心！
有什么问题直接问就行了，有时候你表达的不清楚 ...

chat可以生成调用系统api，dll那种

欢乐之歌 · 发表于 2023-5-6 20:22

wakichie 发表于 2023-5-6 19:35
没有生成的截图啊

我只问了句：用python获取豆瓣top250再保存出来，它生成的东西就是这些代码啊，代码我只修改了百分之2，还要什么截图，发出来供大家学习练手

wty1641 · 发表于 2023-5-6 17:17

用的是哪个AI？

欢乐之歌 · 发表于 2023-5-6 17:42

wty1641 发表于 2023-5-6 17:17
用的是哪个AI？

那必须是ChatGPT

py学徒 · 发表于 2023-5-6 17:45

很赞！你怎么提问的？

欢乐之歌 · 发表于 2023-5-6 17:48

py学徒发表于 2023-5-6 17:45
很赞！你怎么提问的？

直接说：用python获取豆瓣top250就行了，用xpath解析再保存出来，就行了

py学徒 · 发表于 2023-5-6 17:50

欢乐之歌发表于 2023-5-6 17:48
直接说：用python获取豆瓣top250就行了，用xpath解析再保存出来，就行了

哈，谢谢，学习了！

欢乐之歌 · 发表于 2023-5-6 17:56

py学徒发表于 2023-5-6 17:50
哈，谢谢，学习了！

我最喜欢的还是易语言，但是它不懂易语言，哈哈，伤心！
有什么问题直接问就行了，有时候你表达的不清楚，它也理解，牛掰得很！

wakichie · 发表于 2023-5-6 19:35

没有生成的截图啊

py学徒 · 发表于 2023-5-6 19:49

欢乐之歌发表于 2023-5-6 17:56
我最喜欢的还是易语言，但是它不懂易语言，哈哈，伤心！
有什么问题直接问就行了，有时候你表达的不清楚 ...

确实可以。我刚试了试pandas。哈哈~

帐号		自动登录	找回密码
密码			注册[Register]

[Python 转载] 用AI生成的获取豆瓣电影top250，xpath和BeautifulSoup

个人中心