cxrm 发表于 2024-4-15 14:57

统计文本中关键字词组的数量

声明:我有一个朋友是英语专业的研究者,需要对一些文本进行关键词词组数量的统计,以进行后续的分析研究。因此我写了一个小工具,可以根据特定的关键字来统计文本中的词组数量。现在将这个工具贡献出来,让更多人能够受益。希望这个工具对大家有所帮助!不喜勿喷!!!
注:因为是自己随便搞的,可能会报毒,请自行抉择,我个人也是一名研究者,有职业操守,不屑搞什么藏毒的小把戏。
直接上界面图:


将自己的需要处理的文本放在news.txt文件中,关键字(支持['/', '\\', ',', '.', ';', ':', '|', ',', '。'])放在keywords.txt中,默认输出文件夹是output,可以自定义输出目录。
大概的效果:
+---horizontal
|       horizontal_in.txt
|       horizontal_on.txt
|       horizontal_under.txt
|       horizontal_up.txt
|
\---vertical
      vertical_in.txt
      vertical_on.txt
      vertical_under.txt
      vertical_up.txt
链接:https://pan.baidu.com/s/1pIq77zOY-sow09u0pJ4wRQ?pwd=ogpq
提取码:ogpq

xmqr 发表于 2024-4-17 16:39

支持原创,对比模型文本时试一试

cxrm 发表于 2024-4-17 16:42

天天涨停天天盈 发表于 2024-4-16 11:44
中文的话,用word
是不是就OK了?

是的,手动也可以完成,但是作为一个研究者,可能需要的是大量的数据。我朋友需要的是在几十万上百万的数据中快速检索出特定的词组进行统计,并且保存到单独的文件中。数量实在太多了,人工操作就比较耗时间,比较繁琐。希望你满意我的回复。

cxrm 发表于 2024-4-15 21:47

抱歉抱歉,第一次发帖,排版有点问题,没在境内,这个网络有点问题,导致当时那个图一直传不上去,整的不太好,还请各位见谅。在此谢过。

sxzswx 发表于 2024-4-16 04:17

这个很实用

大大连连 发表于 2024-4-16 07:17

感谢分享,支持原创!

南国风雪 发表于 2024-4-16 08:36

感谢分享,下载试试~:lol

jsdhmqh 发表于 2024-4-16 09:44

蛮好玩的,下载试试!

天天涨停天天盈 发表于 2024-4-16 11:44

中文的话,用word
是不是就OK了?

会飞的花 发表于 2024-4-16 17:23

支持原创 感谢分享!

nxcr 发表于 2024-4-16 20:28

小工具,提高工作效率

6688po 发表于 2024-4-16 21:11

这个很实用 感谢分享!
页: [1] 2 3
查看完整版本: 统计文本中关键字词组的数量