吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

搜索
查看: 1174|回复: 17
收起左侧

[Python] 某个按钮样式网站爬取

[复制链接]
小雨呀 发表于 2022-4-20 15:24
本帖最后由 q1287166316 于 2022-4-20 15:25 编辑

这么好的东西不爬下来岂不是很亏



写的简陋,用的时候记得将path改成要下载的位置
20220420152231.png

[Python] 纯文本查看 复制代码
import requests
import os


class Code:
    def __init__(self):
        self.url = [
            "https://api.uiverse.io/buttons?type=button&orderBy=popular",
            "https://api.uiverse.io/buttons?type=button-of-the-day&orderBy=popular",
            "https://api.uiverse.io/buttons?type=card&orderBy=popular",
            "https://api.uiverse.io/buttons?type=checkbox&orderBy=popular",
            "https://api.uiverse.io/buttons?type=input&orderBy=popular",
            "https://api.uiverse.io/buttons?type=spinner&orderBy=popular",
            "https://api.uiverse.io/buttons?type=switch&orderBy=popular",
        ]
        self.headers = {
            "user-agent": "Mozilla / 5.0(Windows NT 10.0;WOW64) AppleWebKit / 537.36(KHTML, likeGecko) Chrome / 86.0.4240.198Safari / 537.36"
        }

    def send_request(self, url):
        return requests.get(url, headers=self.headers, timeout=3).json()

    def run(self):
        for url in self.url:
            html_str = self.send_request(url)
            for val in html_str['buttons']:
                css = val['scopedCss']
                html = val['html']
                first = css.index('.')
                last = css.find(' ', first)
                print(first)
                print(css[first+1:last])

                content = (
                        '<html lang="en">'
                        '<head>'
                        '<meta charset="UTF-8">'
                        '<meta name="viewport" content="width=device-width, initial-scale=1.0">'
                        '<title > Document </title>'
                        '<style >' + css + '</style>'
                        '</head>'
                        '<body><div class="' + css[first+1:last] + '">' + html + '</div></body>'
                        '</html>'
                )
                # break
                path = "C:/Users/Administrator/Downloads/Documents"+url[36:-16]
                if not os.path.exists(path=path):
                    os.makedirs(path)
                with open(path + '/' + val['id'] + '.html', 'w',
                          encoding='utf-8') as ht:
                    ht.write(content)


def main():
    code = Code()
    code.run()


if __name__ == '__main__':
    main()

免费评分

参与人数 5吾爱币 +4 热心值 +4 收起 理由
XINJIAN9 + 1 我很赞同!
kuangkunfeng + 1 + 1 我很赞同!
MyModHeaven + 1 我很赞同!
tutou + 1 + 1 谢谢@Thanks!
a199999 + 1 + 1 热心回复!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

李佑辰 发表于 2022-4-20 15:38
学到了  学到了  学到了  学到了  
JAKE2021 发表于 2022-4-20 16:26
wantongkeji 发表于 2022-4-20 15:53
zhengsg5 发表于 2022-4-20 16:17
非常不错,学到了!
Harold123 发表于 2022-4-20 16:31
nice,感谢分享
wasm2023 发表于 2022-4-20 16:41
厉害了,感谢分享
yuechaomax 发表于 2022-4-20 16:58
这个工具不错,感谢分享。
mfchaos 发表于 2022-4-20 17:23
这怎么使用啊
1006706246 发表于 2022-4-20 17:50
看起来不错
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则 警告:本版块禁止灌水或回复与主题无关内容,违者重罚!

快速回复 收藏帖子 返回列表 搜索

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2022-7-2 23:04

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表