吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 2742|回复: 8
收起左侧

[Python 转载] 迷站论坛图片一键批量下载PY源码

[复制链接]
xkh5823 发表于 2019-7-27 16:25
[Python] 纯文本查看 复制代码
# -*- coding: utf-8 -*-
# author: renmjchn
import requests
from bs4 import BeautifulSoup
import os
from tqdm import tqdm
import urllib3


requests.packages.urllib3.disable_warnings()


def dl_pic(url, tt):
    headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.96 Safari/537.36'}
    res = requests.request('GET', url, headers=headers, verify=False)
    html = res.text
    soup = BeautifulSoup(html, 'html.parser')
    links = soup.find_all('img', class_="zoom")
    name = tt
    pbar = tqdm(range(len(links)), desc=name)
    if os.path.exists('pics'):
        pass
    else:
        os.mkdir('pics')
    for i in links:
        pbar.update(1)
        soup2 = BeautifulSoup(str(i), 'html.parser')
        link = soup2.img['file']
        res2 = requests.request('GET', link, headers=headers, verify=False)
        cont = res2.content
        path = 'pics\\' + tt
        if os.path.exists(path):
            pass
        else:
            os.mkdir(path)
        with open(path + '\\' + str(links.index(i)) + '.jpg', 'wb+') as f:
            f.write(cont)
    pbar.close()



def dl_pic_one_page(url):
    headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.96 Safari/537.36'}
    res = requests.request('GET', url, headers=headers, verify=False)
    html = res.text
    soup = BeautifulSoup(html, 'html.parser')
    dic = soup.find_all('a', class_='s xst')[4:]
    for i in dic:
        soup2 = BeautifulSoup(str(i), 'html.parser')
        title = soup2.a.string
        link = site + soup2.a['href']
        dl_pic(link, title)


if __name__ == '__main__':
    site = '需要在这里修改论坛网址首页'  # 对应修改这里中文提示首页
    num = int(input('请输入需要下载的页数,默认从第1页开始下载:'))
    for i in range(num):
        url = '需要在这里修改论坛网址对于的下载页' % (str(i + 1))   # 对应修改这里中文提示对应下载页
        dl_pic_one_page(url)
    print('全部下载完成!')

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

q5088 发表于 2019-7-27 16:42
沙发,感谢分享思路正需要。
luopo 发表于 2019-7-27 16:45
主骑士 发表于 2019-7-27 17:25
www.52pojie.cn 发表于 2019-7-27 17:51
楼主,我怀疑你在开车但疑车无据
indian806 发表于 2019-7-29 11:11
我也想知道是什么论坛啊,现在差这一步了,其他没问题了
indian806 发表于 2019-7-29 11:39
url = 'https://www.mzitu.com/101553' % (str(i + 1))        # 对应修改这里中文提示对应下载页
这一行总是报错,求解
 楼主| xkh5823 发表于 2019-7-29 19:33
indian806 发表于 2019-7-29 11:39
url = 'https://www.mzitu.com/101553' % (str(i + 1))        # 对应修改这里中文提示对应下载页
这一行 ...

下载也就像这样,不是具体的页面,https://www.52pojie.cn/forum.php?mod=guide&view=newthread
indian806 发表于 2019-7-30 17:16
xkh5823 发表于 2019-7-29 19:33
下载也就像这样,不是具体的页面,https://www.52pojie.cn/forum.php?mod=guide&view=newthread

你这链接,让我飞到了天际现在放代码,起码让我们知道点常见错误吧,要不然百度解决不了,没办法运行的
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则 警告:本版块禁止灌水或回复与主题无关内容,违者重罚!

快速回复 收藏帖子 返回列表 搜索

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-5-7 07:32

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表