吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 24037|回复: 687
收起左侧

[原创工具] 微信数据目录瘦身(其它目录也可以)

    [复制链接]
sunbeat 发表于 2023-10-11 21:04
本帖最后由 sunbeat 于 2023-10-18 14:35 编辑

本程序的原理是扫描目标目录的所有文件,计算他们的md5值,如果一样,说明是一个文件。
统计出来所有md5值后,找到副本数量大于1的文件,只保留一份副本,然后用这份副本做硬链接到其它的几个副本文件名处。
从而尝试释放空间。
由于FAT/FAT32/EXFAT等文件系统不支持硬链接,所以这样的文件系统是不被支持的,也就不用尝试了。
(当前一般windows都是ntfs文件系统,支持硬链接)
最初写来是用来给微信数据文件夹瘦身的,因为微信的各种文件转发,图片转发什么的,都是copy,不是hard link。
注:不知个人微信在哪个版本开始,文件/图片转发,已经从copy改成hard link了。从当前测试的win10上的微信3.9.7.25版本看,转发时,微信会智能做硬链接了。
当然这么久了,肯定有历史积累,有历史包袱,历史包袱部分,还都是副本,不是硬链接,用本程序还是可以去重
对于我个人而言,改成hard link后,个人的30G占用空间,一下子就少了10G。
当然非微信的目录也是一样的可以文件去重。第一次执行时,它会自动生成一个dedup_files.ini的配置文件,
其中dirs里面指定了哪些目录是要扫描进行去重的,
cache_file:参数指定存放cache文件的路径,默认放在当前程序路径下
md5_key_file:以md5为key的hash dict,文件存放路径
to_del_file:  以md5为key的hash dict,放置了后面要删除文件改用硬链接的文件名称
ask_before_del:删除文件前,是否进行询问
max_workers:算md5时的,最大并发线程数量

image.png


dedup_files_usage.jpg


如果目标目录在不支持硬链接的盘符下,则报错退出:


可以到此下载exe的1.0版本:链接: https://pan.baidu.com/s/1CmxRMdTNMMDeoe69x6r6qg?pwd=y3gx 提取码: y3gx

到此下载exe的1.1版本:链接: https://pan.baidu.com/s/1UmyYn5Eo4g0zwZ7CCoJLag?pwd=b226 提取码: b226




到此下载exe的1.2版本: 链接: https://pan.baidu.com/s/1qDwZsRptejyuaum7hdIA8Q?pwd=udts 提取码: udts


1.1版本,增加了统计预计可以释放的空间大小(自动忽略已经做了硬链接的文件),要副本改硬链接的文件数量,以及实际执行完后释放了的空间大小。
增加了多线程并发,多个文件同时并发计算md5,加快速度。但python的GIL限制,也就能快个2-3倍左右。

1.2版本,解决了1.1版本多线程的数据一致性问题,否则cache文件记录的信息,很可能无法在下次时重新载入。


源码在:https://github.com/sunhanaix/dedup_files

免费评分

参与人数 146吾爱币 +136 热心值 +129 收起 理由
wood75 + 1 + 1 我很赞同!
快乐论坛 + 1 + 1 谢谢@Thanks!
zy1320045a + 1 我很赞同!
fancw17 + 1 + 1 我很赞同!
Oldorange + 1 谢谢@Thanks!
lin4578 + 1 + 1 热心回复!
ednarg + 1 + 1 谢谢@Thanks!
zy74521 + 1 我很赞同!
aqzt + 1 谢谢@Thanks!
89842 + 1 + 1 我很赞同!
hscj23 + 1 + 1 鼓励转贴优秀软件安全工具和文档!
ty8225 + 1 + 1 我很赞同!
alexxi0571 + 1 谢谢@Thanks!
w7456 + 1 + 1 谢谢@Thanks!
alf + 1 + 1 谢谢@Thanks!
lwkz9600 + 1 + 1 谢谢@Thanks!
fjh314 + 1 + 1 谢谢@Thanks!
空灵山人 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
huiwin + 1 谢谢@Thanks!
akki + 1 + 1 热心回复!
amwnny + 1 + 1 谢谢@Thanks!
sky9131986 + 1 我很赞同!
csllzhang + 1 谢谢@Thanks!
ofzhengyi + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
N95 + 2 + 1 谢谢@Thanks!
小猪逗凹凸曼 + 1 + 1 鼓励转贴优秀软件安全工具和文档!
dannyxinyi + 1 + 1 谢谢@Thanks!
xpcn2008 + 1 + 1 谢谢@Thanks!
thingsfly + 1 + 1 谢谢@Thanks!
zhangshouli + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
TravisScoot + 1 + 1 热心回复!
simon21 + 1 + 1 很有意义!!面对10G以上文件,很无语。。
lybsanbai-2020 + 1 + 1 谢谢@Thanks!
catoo1 + 1 热心回复!
xfsan + 1 + 1 我很赞同!
wanfon + 1 + 1 热心回复!
wanfeng304 + 1 + 1 谢谢@Thanks!
af8889 + 1 + 1 我很赞同!
sunlei658 + 1 + 1 谢谢@Thanks!
忆潇湘 + 1 + 1 谢谢@Thanks!
馒头大人 + 1 + 1 谢谢@Thanks!
card628 + 1 热心回复!
陈先生20030701 + 1 + 1 谢谢@Thanks!
阿甘兔否 + 1 + 1 谢谢@Thanks!
小年轻在奋斗 + 1 + 1 谢谢@Thanks!
happyxj + 1 谢谢@Thanks!
beibeibei + 1 + 1 我很赞同!
zzc5794 + 1 + 1 谢谢@Thanks!
cqh200 + 1 + 1 谢谢@Thanks!
Sanlinc + 1 谢谢@Thanks!
t5snakefox + 1 + 1 谢谢@Thanks!
pojie20230721 + 1 + 1 我很赞同!
yx69 + 1 + 1 我很赞同!
hinsun + 1 我很赞同!
宋宋 + 1 谢谢@Thanks!
wanglin124 + 1 + 1 瞬间就显示遍历所有目录完成,但是md5文件是空的
winxx + 1 我很赞同!
youseitei + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
pentasama + 1 热心回复!
海天一色001 + 1 + 1 谢谢@Thanks!
ind + 1 + 1 谢谢@Thanks!
leitingxiami + 1 + 1 谢谢@Thanks!
假装在伦敦 + 1 + 1 谢谢@Thanks!
yuriki2009 + 1 + 1 谢谢@Thanks!
buran68 + 1 + 1 热心回复!
癫疯灬博 + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
xuemantian0304 + 1 谢谢@Thanks!
qinluezhew3 + 1 谢谢@Thanks!感觉不会用啊,没有效果
allspark + 1 + 1 用心讨论,共获提升!
ybgarnet + 1 + 1 我很赞同!
wzl90327 + 1 + 1 <font data-immersive-translate-effect="1" data-immersive-
Zed丶小灰狼 + 1 谢谢@Thanks!
summcat + 1 + 1 我很赞同!
xtofu + 1 + 1 谢谢@Thanks!
唐三没藏 + 1 + 1 谢谢@Thanks!
quarx + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
小小鱼343 + 1 + 1 谢谢@Thanks!
valk_1 + 1 + 1 我很赞同!
mhaitao + 1 + 1 我很赞同!
18537990797 + 1 + 1 用心讨论,共获提升!
YunLong3rice + 1 + 1 我很赞同!
cookyjar + 1 谢谢@Thanks!
juminth + 1 谢谢@Thanks!
LIEJIU + 1 + 1 谢谢@Thanks!
lazhou + 1 + 1 谢谢@Thanks!
tvrcfdfe + 1 + 1 我很赞同!
sdtax + 1 + 1 https://dyds.lanzouy.com/iEUr01br33gh
GS9452 + 1 我很赞同!
DaiTian + 1 + 1 谢谢 @Thanks!
lonley + 1 + 1 谢谢@Thanks!
caszx + 1 放在微信目录下了,可是感觉没有删除任何相同文件啊,这是咋回事呢
Lyw0902 + 1 + 1 谢谢@Thanks!
Aluweila + 1 + 1 鼓励转贴优秀软件安全工具和文档!
拂你青丝 + 1 + 1 用心讨论,共获提升!
caoxuexin + 1 + 1 谢谢@Thanks!
awen1344 + 1 + 1 鼓励转贴优秀软件安全工具和文档!
jeehom + 1 + 1 谢谢@Thanks!
fmjpouyzx + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
tfl1 + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
jjuuuje + 1 插个眼,

查看全部评分

本帖被以下淘专辑推荐:

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

莫谷 发表于 2023-10-12 08:23
不知道这个怎么用,放在聊天记录文件夹了,说让修改,我也不懂怎么修改
lizhipei78 发表于 2023-10-12 10:18
win 11放在几个文件夹均没有作用,不知道怎么操作
ha88428 发表于 2023-10-12 19:18
sunbeat 发表于 2023-10-12 16:51
ini文件里面是json的数据格式,要写成:
dirs: ["F:\\微信\\wechat files"],

dommy 发表于 2023-10-12 16:53
潇未然 发表于 2023-10-12 09:49
我F盘是NTFS的。为啥提示
2023-10-12 09:49:29,445 - dedup_files.py- ERROR - None所在文件系统为None, ...

默认生成的配置文件(ini)多了一个null,删掉就好
xyzy123 发表于 2023-10-11 21:41

不错的东东,点赞
BG8HVH 发表于 2023-10-11 22:06
对于微信聊天记录文件夹几百个G的人来说,有点不敢下手
 楼主| sunbeat 发表于 2023-10-12 17:08
mingwuce 发表于 2023-10-12 08:41
会不会掉聊天数据

对聊天记录没影响。
对聊天记录里面出现的图片,文件什么的,也没啥影响,是透明的。
这个和那种清除微信N久前图片、文件的工具不同,那个清除了就是删了。
这个只是把副本多的合并为一个了,然后硬链接下原位置,使聊天记录可见。
希望其它的微信清理工具,能集成这个。毕竟有些记录,不想删。有些记录还是想删除。
闲庭信步 发表于 2023-10-11 21:48
对于40多G的 聊天记录 来说太有用了
U201213 发表于 2023-10-11 21:30

支持原创,楼主威武
wuai22222 发表于 2023-10-11 21:27
支持原创,瘦身去重工具。
lizhipei78 发表于 2023-10-11 21:30
实用的软件,马上下载
adamfh 发表于 2023-10-11 21:57
啊,NB。但是不是有些地方就打不开了呢?
zzm3436 发表于 2023-10-11 22:03
这个好,专治流氓疼
小白2021 发表于 2023-10-11 22:06
几十个G去掉了一大半,还是很不错的,感谢楼主分享。
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则 提醒:禁止复制他人回复等『恶意灌水』行为,违者重罚!

快速回复 收藏帖子 返回列表 搜索

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-4-28 09:10

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表