吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

搜索
查看: 1134|回复: 22
收起左侧

[求助] 江湖救急,批量删除文本中的简体中文

[复制链接]
With.shadows 发表于 2021-12-14 14:45
有没有大神能够帮帮忙,小弟在写bat脚本时遇到了一点问题,
带有藏语,汉语,数字,英文,常规符号,的一些srt字幕文件,我想单独删除里面的中文,其他内容不变;
但我尝试着在bat脚本中用中文编码的正则表达式去替换的时候,其他没问题,但唯独藏文不支持,最后输出藏文也给整没了,
-----------------------------------------------------------分界线----------------------------------------------
脚本内容
fr *.srt -r:"***:([\x80-\xFF])" -t

执行前后对比参照下图

执行后

执行后

执行前

执行前

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| With.shadows 发表于 2021-12-15 18:38
zpwz 发表于 2021-12-15 13:30
在word编辑,1.在查找内容中输入 [!^1-^127] 。
2.通配符前打钩,
3.在以下项中查找,选择主文档。

这个方法在之前我也尝试过;行不通,中文和藏文类似,藏文也会被检索到
列举出一段藏文可以尝试一下ཁྱོད་བསྟུད་མར་གསུམ་དགའ་ཆོག་འཛིན་གྲྭ་ཡོངས་ཀྱི་ཨང་དང་པོ།
 楼主| With.shadows 发表于 2021-12-16 10:55
zpwz 发表于 2021-12-16 10:19
在word编辑,1.在查找内容中输入[一-龥] 。
2.通配符前打钩,
3.在以下项中查找,选择主文档。

是这样吗,你说的第三步我没找到位置,但按照这个走的话,汉语是能检索到,但藏语也能检索到,能具体指明一下第三步在哪个位置吗,感谢,如果能实现藏汉语分离,对我来说是莫大的帮助
shadows_20211216105249.png
 楼主| With.shadows 发表于 2021-12-14 14:50
season123 发表于 2021-12-14 14:48
不错不错,还可以继续优化。还有很大的改动空间。

兄弟有什么高见指导指导,我尝试调用Unicdoe里面的编码范围,依旧无效,可能是我调用的方式不对
duanyi71 发表于 2021-12-14 14:55
很简单,Ctrl+H,搜索里填“找回”然后替换里不填任何东西,一替换就全没有了
 楼主| With.shadows 发表于 2021-12-14 15:02
duanyi71 发表于 2021-12-14 14:55
很简单,Ctrl+H,搜索里填“找回”然后替换里不填任何东西,一替换就全没有了

不是的.我需要处理的文件有很多,中文文字也不仅仅局限于这些,我是想删除调文件中的所有中文文字,可能涉及到中文字符编码
wysyz 发表于 2021-12-14 15:05
用python处理吧,百度一下
qiu782461893 发表于 2021-12-14 15:07
导入到 excel中
longxing 发表于 2021-12-14 18:07
你的文本贴上来看看啊 只是截图没法试啊
sail2000 发表于 2021-12-14 20:48
这种很规律的简单,直接UE录一个宏就行
mrliu133 发表于 2021-12-14 21:10
我觉得可以统计一下词频,再将这些词进行正则替换
编程天下 发表于 2021-12-14 22:39
python正则匹配删除  来个for循环批量
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则 警告:本版块禁止回复与主题无关非技术内容,违者重罚!

快速回复 收藏帖子 返回列表 搜索

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2022-5-18 23:29

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表