吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 151|回复: 0
上一主题 下一主题
收起左侧

[Windows] MHT资源批量提取器V1.4.0

[复制链接]
跳转到指定楼层
楼主
HEVMedicaldll 发表于 2026-3-29 23:24 回帖奖励
本帖最后由 HEVMedicaldll 于 2026-3-29 23:27 编辑

软件简介MHT资源提取器是一款专注于解析和提取.mht(MIME HTML)文件内容的开源工具。它能够将网页归档文件中的纯文本与嵌入式图片等资源高效分离,并以结构化的方式输出。本工具采用本地运行模式,无需联网即可操作,确保了用户数据的安全性与隐私性。无论是开发者需要复用网页设计素材,研究者希望归档网页文本内容,还是普通用户想提取MHT中的图片与文档,该工具都能提供专业、高效的解决方案。
下载地址
最新版本下载地址:

https://gitee.com/halftin/mht-resource-extractor/releases
项目页面:
https://gitee.com/halftin/mht-resource-extractor

主要功能 纯文本提取
  • 智能编码修复:自动检测并修复UTF-8、GBK等常见编码导致的乱码问题,确保中文内容准确无误。
  • 内容区域限定:通过设置起始与结束标记,仅提取HTML中指定区间的文本内容,避免无关信息干扰。
  • 灵活输出模板:支持默认及自定义输出模板,可动态插入文件名、时间戳等变量,满足多样化排版需求。
图片提取
  • 广告过滤机制:基于关键词列表自动识别并过滤广告类图片(如banner、promo等),提升资源纯净度。
  • 智能重命名规则:支持按数字序列(001.jpg, 002.png...)对提取的图片进行重命名,便于管理和排序。
  • ZIP打包输出:可选将所有提取的图片打包为ZIP压缩文件,方便传输与存储。
通用功能
  • 批量处理能力:支持一次性导入整个文件夹下的多个MHT文件,实现高效批量转换。
  • 按修改时间排序合并:在合并输出模式下,可根据文件的最后修改时间自动排序,保证内容逻辑连贯。
  • 单独输出模式:允许为每个MHT文件生成独立的TXT或图片文件夹,适用于精细化管理场景。

软件界面




基本使用流程
  • 启动软件后,选择“纯文本提取”或“图片提取”工作模式。
  • 设置输入文件夹路径,包含待处理的MHT文件。
  • 指定输出路径,用于存放提取后的结果文件,不指定将默认保存到软件根目录下的“输出文件”文件夹。
  • (可选)启用内容区域限定功能,使用浏览器打开mht文件,然后再右键选择“查看页面源代码”,找到资源位置后设定起始与结束标记以截取特定内容。
  • (可选)配置自定义输出模板,利用动态变量增强输出格式灵活性。
  • 点击“开始执行”按钮启动处理任务。
  • 查看日志输出确认执行状态,并打开输出目录检查最终成果。


查看页面源代码和找到资源位置



文本提取测试和文本提取效果



图片提取测试和效果
高级配置说明
内容区域限定
通过定义起始与结束标记,可以精确控制仅提取HTML源码中的某一部分内容。此功能特别适用于只关注文章正文而忽略页眉页脚等非核心信息的场景。[td]


自定义模板变量
在输出模板中使用以下动态变量,可使每次生成的内容更具个性化和上下文关联性:[td]
变量名替换值
{filename}当前MHT文件的原始文件名
{datetime}文件的最后修改时间(格式:yyyy-MM-dd HH:mm:ss)
{date}仅日期部分(yyyy-MM-dd)
{time}仅时间部分(HH:mm:ss)
\\n插入换行符
示例模板:
\\n========== START ==========\\n文件:{filename} ({datetime})\\n
配置管理
  • 支持将当前所有配置项保存为JSON格式文件,便于后续快速加载复用。
  • 提供配置导入功能,一键恢复历史设置,提高多任务切换效率。
  • 所有配置文件均存储于项目根目录下的 config/ 子目录中,易于备份与迁移。

目前软件还存在很多不足,欢迎各位提出宝贵意见!

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - 52pojie.cn ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2026-4-9 10:08

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表