吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 580|回复: 6
收起左侧

[讨论] 求指点从网页获取文字有空格并且隐藏了数字

[复制链接]
456xiaobaipojie 发表于 2024-4-10 10:42
import requests
from bs4 import BeautifulSoup

url = "https://fanqienovel.com/page/7356041190682135577?enter_from=stack-room"
response = requests.get(url)

if response.status_code == 200:
    content = response.text
    soup = BeautifulSoup(content, "html.parser")

    chapter_div = soup.find("div", {"class": "chapter"})

    if chapter_div:
        chapter_items = chapter_div.find_all("div", {"class": "chapter-item"})
        for index, chapter_item in enumerate(chapter_items, start=1):
            chapter_title_a = chapter_item.find("a", {"class": "chapter-item-title"})
            chapter_title = chapter_title_a.text
            chapter_link = chapter_title_a['href']
            print(f"{index}章:{chapter_title} - https://fanqienovel.com{chapter_link}")

            # 获取章节内容
            chapter_url = f"https://fanqienovel.com{chapter_link}"
            chapter_response = requests.get(chapter_url)

            if chapter_response.status_code == 200:
                chapter_content = chapter_response.text
                chapter_soup = BeautifulSoup(chapter_content, "html.parser")

                chapter_text_div = chapter_soup.find("div", {"class": "muye-reader-content noselect"})

                if chapter_text_div:
                    chapter_text = chapter_text_div.get_text(strip=True)
                    chapter_lines = chapter_text.splitlines()
                    cleaned_chapter_lines = [line.strip() for line in chapter_lines if line.strip()]
                    cleaned_chapter_text = "\n".join(cleaned_chapter_lines)
                    print(cleaned_chapter_text)
                else:
                    print("未找到章节内容")
            else:
                print(f"请求失败,状态码:{chapter_response.status_code}")
    else:
        print("未找到分章节内容")
else:
    print(f"请求失败,状态码:{response.status_code}") 1712716862981.jpg


获取的文字被隐藏了,有没有大佬指点一下

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

鹿鸣 发表于 2024-4-10 12:36
那不是空格就是字符没显示出来,这网站有字体加密的
kiki 发表于 2024-4-10 13:30
 楼主| 456xiaobaipojie 发表于 2024-4-10 13:52
鹿鸣 发表于 2024-4-10 12:36
那不是空格就是字符没显示出来,这网站有字体加密的

大佬如何攻克难题啊
Mr.救赎 发表于 2024-4-10 14:17
网上查下,番茄或起点小说网站字体解密,顺便学习一把
风生·水起 发表于 2024-4-10 15:42
字体加密 用OCR识别或者手机端的网页
鹏路翱翔 发表于 2024-4-10 15:52
https://www.52pojie.cn/thread-1911970-1-1.html
跟这个原理差不多,学一下思路吧~
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-12-12 08:51

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表