吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 3502|回复: 23
收起左侧

[Python 转载] python爬虫mou视频教程【师傅领进门,修行靠个人】

[复制链接]
倾情 发表于 2020-2-26 10:44

分享一个爬虫视频用于学习,仅供学习。这个用的是单线程,后期改造一下。

俗话说,师傅领进门,修行靠个人。提供一个思路爬虫视频,下面的大家自己研究吧。
代码使用的时候创一个文件夹
1582684969.jpg



import urllib
from lxml import etree
import requests

headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.90 Safari/537.36"
}

def main():
    # 请求首页地址
    url = 'http://699pic.com/media/'
    req = requests.get(url, headers=headers)
    ae_html = req.content.decode()
    # print(ae_html)

    # 获取首页需要的每个视频地址
    dom = etree.HTML(ae_html)
    ae_video_html_url_list = dom.xpath(
        '//div[@class="list-item video-list clearfix"]/ul/li/a[@class="video-name fl"]/@href')
    # 获取视频的名字和时间长度
    ae_video_name1_list = dom.xpath(
        '//div[@class="list-item video-list clearfix"]/ul/li/a[@class="video-name fl"]/h3/text()')
    ae_video_time2_list = dom.xpath(
        '//div[@class="list-item video-list clearfix"]/ul/li/a[@class="video-name fl"]/span/text()')
    # print(ae_video_time2)
    print(ae_video_html_url_list)
    # print(ae_video_name1_list)
    for name, time, url in zip(ae_video_name1_list, ae_video_time2_list, ae_video_html_url_list):
        # url=url.strip("/")
        # 找到视频网页地址
        url = "http://699pic.com" + url
        # print(url)
        # 请求这个网页
        req_video = requests.get(url, headers=headers)
        dom_url = etree.HTML(req_video.content.decode())
        # 获取这个网页中的内容,获取其中的视频高清视频地址。
        ae_video_url_list = dom_url.xpath('//div[@class="video-show"]//video/source/@src')
        # 请求这个高清视频的地址

        ae_video_url = 'http:' + ae_video_url_list[0]
        print("视频真实地址:", ae_video_url)
        # print(ae_video_url)
        req_video = requests.get(ae_video_url, headers=headers)

        # 获取视频名字和时间
        url_name = ae_video_url.split(".")
        time = time.strip("-").strip().replace(':', "-")
        video_name = name + time + "." + url_name[-1]
        # print(video_name)
        print(video_name, "正在下载………")

        # 保存
        with open(r"I:\Pchong\pc_video\ae-video\{}".format(video_name), 'wb')as f:
            f.write(req_video.content)
        print(video_name, "下载完成!!")

if __name__ == '__main__':
    main()

免费评分

参与人数 1吾爱币 +1 热心值 +1 收起 理由
shi128862 + 1 + 1 我很赞同!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

ytfrdfiw 发表于 2020-2-29 11:30

这个不是python学习代码,只是利用python代码爬别人的视频代码。

免费评分

参与人数 1热心值 +1 收起 理由
糖吉阿婆 + 1 用心讨论,共获提升!

查看全部评分

石昊荒天帝 发表于 2020-2-26 10:57
twostudy 发表于 2020-2-26 11:04
Hikiii 发表于 2020-2-26 11:08
带佬牛笔!!
wuji84131421 发表于 2020-2-26 11:13
感谢分享  向大佬学习下
wblank 发表于 2020-2-26 11:17
感谢分享。大老牛逼,
nanscript 发表于 2020-2-26 11:25
下载后还是有水印
 楼主| 倾情 发表于 2020-2-26 11:33

你需要自己创个文件夹,如文中图所示
baixiaoqiya 发表于 2020-2-26 11:50
感谢大佬提供思路
wwwyangood 发表于 2020-2-26 11:54
教程不适合我们初级菜鸟学习~
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则 警告:本版块禁止灌水或回复与主题无关内容,违者重罚!

快速回复 收藏帖子 返回列表 搜索

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-5-2 17:18

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表