[Python] 纯文本查看 复制代码 import win32com.client
import re
def get_ie_browser_content():
# 创建IE浏览器对象
ie = win32com.client.Dispatch("InternetExplorer.Application")
ie.Visible = True # 设置IE浏览器是否可见
# 等待用户操作,确保IE浏览器已经加载了您想要检查的网页
input("请打开IE浏览器并导航到您想要检查的网页,然后按Enter键继续...")
# 获取IE浏览器当前打开的网页的HTML内容
html_content = ie.Document.body.outerHTML
# 关闭IE浏览器
ie.Quit()
return html_content
def read_keywords(file_path):
with open(file_path, 'r', encoding='utf-8') as file:
keywords = [line.strip() for line in file.readlines()]
return keywords
def highlight_keywords_in_html(html_content, keywords):
for keyword in keywords:
html_content = re.sub(
keyword,
f'<mark style="background-color: yellow; color: black;">{keyword}</mark>',
html_content,
flags=re.IGNORECASE
)
return html_content
def main():
# 读取关键词
keywords = read_keywords('keywords.txt')
# 获取IE浏览器内容
html_content = get_ie_browser_content()
# 高亮关键词
highlighted_content = highlight_keywords_in_html(html_content, keywords)
# 输出高亮后的内容
with open('highlighted_content.html', 'w', encoding='utf-8') as file:
file.write(highlighted_content)
if __name__ == '__main__':
main()
这个脚本会打开IE浏览器,等待用户导航到想要检查的网页,然后获取网页的HTML内容,并在其中高亮显示关键词。最后,它会将高亮后的内容保存为一个HTML文件。
请注意,这个脚本需要在Windows操作系统上运行,并且需要安装IE浏览器和pywin32库。此外,由于IE浏览器已经不被微软推荐使用,并且在一些Windows版本中可能不被预装,您可能需要考虑使用其他浏览器,如Microsoft Edge,并相应地调整脚本。 |