吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 3406|回复: 24
收起左侧

[Python 转载] 一个简单的文本文件切割工具

  [复制链接]
klmatao 发表于 2021-10-26 23:32
本帖最后由 klmatao 于 2021-10-27 20:32 编辑

[md]## 一个简单的txt、log文本文件切割的脚本

  • 说明
    • 支持绝对路径和相对路径
    • 在文件所在目录下会创建一个cut_files文件夹,用来存放切割好的文本文件
    • 文件切分是以行数进行切分
  • 参数说明
    • filename:文件的绝对路径或者相对路径
    • cut_pattern:以固定行数进行切分
  • 库说明
    • os:用来处理路径问题
    • tqdm:用来可视化进度
    • 安装tqdm: pip install tqdm
  • 入口说明
    • start函数为入口函数
import sys

from tqdm import trange

# 切分txt、或者log文件
# 首先有文件读取的方法

# 文件内容总行数
def total_lines(filename):
    try:
        with open(filename, "rb") as file:
            contents = file.readlines()
            return len(contents)
    except Exception as e:
        print(f"【{total_lines.__name__}】函数运行出错:{e}")

# 根据文件总行数,以及想要切割的行数,分批次获取文件,内容,然后进行写入操作

# 从文件中获取到所有的行,每一行是列表中的一个元素
def get_contents(filename):
    try:
        with open(filename, "rb") as file:
            contents = file.readlines()
        return contents
    except Exception as e:
        print(f"【{get_contents.__name__}】函数运行出错:{e}")

# 写入文件
def file_save(filename, contents):
    try:
        with open(filename, "wb") as file:
            for content in contents:
                file.write(content)
    except Exception as e:
        print(f"【{file_save.__name__}】函数运行出错:{e}")

# 分割文件
def cut_file_save_many_files(filename, cut_pattern):
    if cut_pattern <= 0:
        print("参数错误,必须大于0")
        return
    try:
        # 获取总行数
        total_line = total_lines(filename)
        # 获取所有内容的列表
        contents = get_contents(filename)
        # 切分规则
        counts = int(total_line / cut_pattern) + 1
        # 新文件名的设置, 获取最后一个点的索引
        change_filename = get_file_path(filename)
        end_point_index = change_filename.rfind(".")
        for i in trange(1, counts + 1):
            new_filename = change_filename[:end_point_index] + \
                           f"_{i}" + change_filename[end_point_index:]
            cut_content = contents[(i - 1) * cut_pattern:i * cut_pattern]

            # 写入操作
            file_save(new_filename, cut_content)
    except Exception as e:
        print(f"【{cut_file_save_many_files.__name__}】函数运行出错:{e}")

def get_file_path(filename):
    import os
    current_path = os.path.abspath(filename)
    # 获取pc的系统平台
    platform = sys.platform
    if platform == "win32":
        file = current_path.split("\\")[-1]
    elif platform == "linux":
        file = current_path.split("/")[-1]
    parent_path = os.path.dirname(current_path)
    path = os.path.join(parent_path, "cut_files")
    if not os.path.exists(path):
        os.mkdir(path)
    return path + ("\\" if platform == "win32" else "/") + file

def start(filename, cut_pattern):
    cut_file_save_many_files(filename, cut_pattern)

if __name__ == "__main__":
    filename = "a.log"
    start(filename, cut_pattern=300)

免费评分

参与人数 5吾爱币 +4 热心值 +4 收起 理由
shyoldboy + 1 热心回复!
xhf34242 + 1 + 1 热心回复!
xb0wxh + 1 + 1 谢谢@Thanks!
sdaza + 1 热心回复!
yufan1123 + 1 + 1 用心讨论,共获提升!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

sdaza 发表于 2021-10-27 06:35
试试这个
fault 发表于 2021-10-27 09:15
掌上学习机的年代,单个文本太大会导致不能阅读,会用文本切割器分成一个个小段
yufan1123 发表于 2021-10-26 23:40
虽然看不懂,但我感觉对这些代码特别亲切,我应该占到沙发了
gcode 发表于 2021-10-26 23:52
支持技术分享,谢谢楼主
dayouyou 发表于 2021-10-26 23:58
确实厉害
李佑辰 发表于 2021-10-27 01:34
看起来很棒呀!
风逝998 发表于 2021-10-27 01:37
谢谢楼主分享,学习了
 楼主| klmatao 发表于 2021-10-27 07:56

谢谢尝试
ccskcq 发表于 2021-10-27 08:46
学习,感谢发帖。
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则 警告:本版块禁止灌水或回复与主题无关内容,违者重罚!

快速回复 收藏帖子 返回列表 搜索

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-4-25 15:08

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表