吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 855|回复: 7
收起左侧

[资源求助] 文本中删除不包含中文的文本行

[复制链接]
XMJOL 发表于 2021-12-18 01:26
50吾爱币
在文本中删除非中文行
例如

你好2021abc
你好2022??
ABCDEFGHIJK
你好2023
你好2024
S648.00E-310
你好2025
你好2026

修改为
你好2021abc
你好2022??
你好2023
你好2024
你好2025
你好2026

也就是把不带中文的文本行删除掉就行,不留空行
跪求一份

最佳答案

查看完整内容

帮你写了个批处理,用法: 直接将要处理的文档拖到BAT文件(不要打开BAT文件)上,松开鼠标,等待一会儿。 会在相应目录下生成一个2.txt。这就是你要的中文内容。 https://www.lanzouv.com/iJsJTxqh6ob 希望可以帮到你。

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

weliong 发表于 2021-12-18 01:26
帮你写了个批处理,用法:
直接将要处理的文档拖到BAT文件(不要打开BAT文件)上,松开鼠标,等待一会儿。
会在相应目录下生成一个2.txt。这就是你要的中文内容。

https://www.lanzouv.com/iJsJTxqh6ob

希望可以帮到你。

免费评分

参与人数 2吾爱币 +1 热心值 +2 收起 理由
妹妹有话 + 1 + 1 助人为乐
玩够你一百下 + 1 热心回复!

查看全部评分

b0y 发表于 2021-12-18 05:52
hebeijianke 发表于 2021-12-18 10:47
不知道你用什么编辑器处理文字,
我这里使用emeditor
使用(Ctrl+F)打开[查找]对话框,填入字符串【^(?!.*[一-龥]).*\n】,不包含黑方括号,下面点选【正则表达式】,点击[替换]按钮;
替换为里面什么也不填,
然后点击右侧[替换全部],就OK了
Joe66 发表于 2021-12-18 10:55
链接:https://www.aliyundrive.com/s/ZNfnEgT9N3F
输入源文件
输入结果文件
就行了
hebeijianke 发表于 2021-12-18 11:06
使用Python也行
[Python] 纯文本查看 复制代码
import re 
 
f= open("待筛选文本.txt",encoding = "utf-8")  # 打开返回一个文件对象-待筛选文本
file_handle=open('待存储文本.txt',mode='a')   #打开返回一个文件对象-待筛选文本
line = f.readline()                          # 调用文件的 readline()方法
zhmodel = re.compile(u'[\u4e00-\u9fa5]')
while line:   
    match = zhmodel.search(line)
    if match:
        file_handle.write(line)
    line = f.readline()   
file_handle.close()
f.close()
zxl1227 发表于 2021-12-18 12:09
编个程序
C语言判断字符是否中文方法之一
把字符当做char处理,

如果是标准的ASCII字符的话,字符为整数,

如果是中文的话,字符的第一个字节一定是负数.
 楼主| XMJOL 发表于 2021-12-18 17:59
Joe66 发表于 2021-12-18 10:55
链接:https://www.aliyundrive.com/s/ZNfnEgT9N3F
输入源文件
输入结果文件

能不能加一个复制到剪切板的功能
我想直接CTRL V
快速回复 收藏帖子 返回列表 搜索

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-4-25 21:38

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表