python爬取n多张养眼福利图

三木猿 · 发表于 2020-9-4 14:53

之前写了个爬取漫画的，发现貌似喜欢的人不是很多呀，在贴吧转了会后发现，正经人们喜欢的是这种类型的由于代码量不大，就不加什么注释了，兄弟们自己研究研究吧

[Python] 纯文本查看 复制代码

import time
import requests
import os

from urllib3.connectionpool import xrange


def get_document(url):
    # print(url)
    try:
        get = requests.get(url)
        data = get.content
        get.close()
    except:
        time.sleep(3)
        try:
            get = requests.get(url)
            data = get.content
            get.close()
        except:
            time.sleep(3)
            get = requests.get(url)
            data = get.content
            get.close()
    return data


def download_img(count):
    for i in xrange(count):
        src = "https://lns.hywly.com/a/1/" + str(i)+"/"
        for j in xrange(20):
            document = get_document(src + str(j) + '.jpg')
            if str(document).find("404 Not Found") > 0:
                break
            path = 'd:/SanMu/image/'+str(i)+'/'
            if not os.path.exists(path):
                os.makedirs(path)
            open(path+str(j)+'.jpg', 'wb').write(document)


download_img(1000)

三木猿 · 发表于 2020-9-4 15:16

如果评分够多，就发多线程版，哼，老想白嫖

三木猿 · 发表于 2020-9-4 15:51

多线程版，哎，记得评分啊，我想升个级

[Python] 纯文本查看 复制代码

import threading
import time
import os
import requests
from urllib3.connectionpool import xrange


def get_document(url):
    # print(url)
    try:
        get = requests.get(url)
        data = get.content
        get.close()
    except:
        time.sleep(3)
        try:
            get = requests.get(url)
            data = get.content
            get.close()
        except:
            time.sleep(3)
            get = requests.get(url)
            data = get.content
            get.close()
    return data


def download_img(start, count):
    for i in xrange(start, count):
        src = "https://lns.hywly.com/a/1/" + str(i) + "/"
        for j in xrange(50):
            document = get_document(src + str(j) + '.jpg')
            if str(document).find("404 Not Found") > 0:
                break
            path = 'd:/SanMu/image/' + str(i) + '/'
            if not os.path.exists(path):
                os.makedirs(path)
            open(path + str(j) + '.jpg', 'wb').write(document)


thread_list = []
for i in xrange(0, 3):#想要几个线程就把3改成几
    thread = threading.Thread(target=download_img, args=(i * 1000, (i + 1) * 1000))
    thread_list.append(thread)
for thread in thread_list:
    thread.start()
for thread in thread_list:
    thread.join()
while 1:
    break

MancoCL · 发表于 2020-9-4 15:02

我想看不穿衣服的那种

judgecx · 发表于 2020-9-4 14:57

他们只想白嫖哈哈哈白嫖怪

14境左右 · 发表于 2020-9-4 15:00

都是正经人

Ocisl · 发表于 2020-9-4 15:04

老哥刚才运行了一下这是怎么回事啊
完全不懂编程的色批大佬给指条明路啊

Microsoft Windows [版本 10.0.17763.1397]
(c) 2018 Microsoft Corporation。保留所有权利。

C:\Users\Ocisl>python C:\Users\Ocisl\Desktop
D:\Users\Ocisl\AppData\Local\Programs\Python\Python37\python.exe: can't find '__main__' module in 'C:\\Users\\Ocisl\\Desktop'

C:\Users\Ocisl>

芒果1981 · 发表于 2020-9-4 15:09

看到这么多好图我也想试一下，可是把代码复制到pycharm里面点运行后会这样：C:\Users\admin\Desktop\python_work\venv\Scripts\python.exe C:/Users/admin/Desktop/python_work/123.py
Traceback (most recent call last):
File "C:\Users\admin\Desktop\python_work\123.py", line 2, in <module>
import requests
ModuleNotFoundError: No module named 'requests'

Process finished with exit code 1

三木猿 · 发表于 2020-9-4 15:12

芒果1981 发表于 2020-9-4 15:09
看到这么多好图我也想试一下，可是把代码复制到pycharm里面点运行后会这样：C:%users\admin\Desktop\pyth ...

缺包，网上有下载requests包的教程

三木猿 · 发表于 2020-9-4 15:14

Ocisl 发表于 2020-9-4 15:04
老哥刚才运行了一下这是怎么回事啊
完全不懂编程的色批大佬给指条明路啊

你都没指出来运行那个文件呀，
python C:\Users\Ocisl\Desktop\test.py

mokjf · 发表于 2020-9-4 15:15

有没有教程教人怎么爬资源，新手想入手爬一下资源，例如爬视频或者图书的之类的

帐号		自动登录	找回密码
密码			注册[Register]

[Python 转载] python爬取n多张养眼福利图

免费评分

本帖被以下淘专辑推荐:

免费评分

个人中心