吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 255|回复: 6
收起左侧

[经验求助] 文本数据处理问题

[复制链接]
lcg888 发表于 2024-8-21 00:15
66吾爱币
本帖最后由 lcg888 于 2024-8-21 00:21 编辑

有没有什么办法或者软件能监测重复源删除重复源,再自动把相同地区的源自动归类到一块  比如     

江苏卫视,http://666.m3u8
江苏卫视,http://666.m3u8
北京卫视,http://123.m3u8
江苏卫视,http://999.m3u8

注意,网址不只是m3u8结尾,有很多直播源都是长尾字母字符等
自动监测重复的源删除重复的,然后自动把江苏卫视跟一样是江苏卫视的排在一上一下
例如:
江苏卫视,http://666.m3u8
江苏卫视,http://999.m3u8
北京卫视,http://123.m3u8

最佳答案

查看完整内容

使用 notepad++,里面有按字母,数字等等排序,还有重复去重,相邻去重

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

osmake 发表于 2024-8-21 00:15
使用 notepad++,里面有按字母,数字等等排序,还有重复去重,相邻去重
17sheng 发表于 2024-8-21 09:02
 楼主| lcg888 发表于 2024-8-21 11:10
 楼主| lcg888 发表于 2024-8-21 11:11
osmake 发表于 2024-8-21 08:31
使用 notepad++,里面有按字母,数字等等排序,还有重复去重,相邻去重

等今晚回去我试试
PGNET 发表于 2024-8-21 11:14
给一个思路,如果你需要根据网址内容进行排重的话,你需要用爬虫抓取网址打开后关键信息来判断。比如网址title这种信息。
 楼主| lcg888 发表于 2024-8-21 14:09
PGNET 发表于 2024-8-21 11:14
给一个思路,如果你需要根据网址内容进行排重的话,你需要用爬虫抓取网址打开后关键信息来判断。比如网址ti ...

不根据网址……
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-12-14 00:38

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表