自用音视频转文字工具分享 v1.0

jiangjimu · 发表于 2026-1-7 23:14

自用音视频转文字工具分享！免收费 + 操作简单

经常需要把音视频转成文字，试过不少市面上的工具，要么操作繁琐步骤多，要么动辄就要收费，用着特别不方便。
忍不了这种麻烦，就去查了查相关方案，发现 OpenAI 有款开源的语音识别模型特别合适！于是干脆自己用 Python 对接了这个模型，还顺手做了个 GUI 界面，不用敲代码就能直接用，新手也能快速上手～

软件里内置了 5 个可选模型，大家可以根据自己的需求选：

tiny：体积最小，运行速度最快，识别精度相对一般，适合追求效率、对精度要求不高的场景（比如快速转写会议录音要点）；
base：速度和精度的平衡款，日常使用最常用，大部分场景下都能满足需求；
small：精度比 base 更高，运行速度会稍慢一点，追求更好识别效果又不想等太久的话选它准没错；
medium：识别精度进一步提升，但对设备计算资源要求更高；
large：精度最高，但硬件门槛也最高，运行速度也偏慢。

这里重点推荐大家选「small 模型」！识别精度足够高，日常转写视频台词、音频笔记都够用～至于 medium 和 large 模型，因为它们需要显卡支持，还要额外装显卡驱动，操作麻烦不说，打包后的安装包也会变大，所以我只保留了 CPU 版本，不用折腾显卡，普通电脑就能流畅运行。

第一次使用先下载模型！！
这是第一次发这类工具分享，要是有违规的地方，麻烦大家指出来我及时修改～有同样需求的朋友也可以留言交流呀！

图片展示：

下载链接：

通过网盘分享的文件：链接: https://pan.baidu.com/s/117-q1XnY5c8PYAd77aH-uQ?pwd=sq68 提取码: sq68

wdq365 · 发表于 2026-1-15 22:14

为什么三个模型我都试了，都卡在95%，就不向下走了。。。

[20:56:58] 检测到视频文件，正在提取音频...
[20:57:01] 音频提取完成
[20:57:02] 正在加载模型 'small' (cpu)...
[20:57:02] 正在初始化模型...
[20:57:04] 模型加载完成，开始转录...
[20:57:04] 正在处理文件: temp_audio_250216.mp4.wav
[20:57:04] 开始音频转录...
[21:52:42] 已清理 1 个临时文件
[21:52:47] 检测到视频文件，正在提取音频...
[21:52:49] 音频提取完成
[21:52:49] 正在加载模型 'base' (cpu)...
[21:52:49] 正在初始化模型...
[21:52:50] 模型加载完成，开始转录...
[21:52:50] 正在处理文件: temp_audio_250216.mp4.wav
[21:52:50] 开始音频转录...
[22:04:46] 已清理 1 个临时文件
[22:04:54] 检测到视频文件，正在提取音频...
[22:04:56] 音频提取完成
[22:04:56] 正在加载模型 'tiny' (cpu)...
[22:04:56] 正在初始化模型...
[22:04:56] 模型加载完成，开始转录...
[22:04:56] 正在处理文件: temp_audio_250216.mp4.wav
[22:04:56] 开始音频转录...

wdq365 · 发表于 2026-1-16 16:45

jiangjimu 发表于 2026-1-15 23:05
如果时长很大等待久一点，它还在处理中，cpu处理会比较慢一点

感谢答复！昨天晚上时间久，今天时间比较快！不知为什么？但也遇到新问题，就是40分钟的视频，只转换了前几分钟，后面的直接不见了？比如下面这段，就只转了前五分钟的开场白。有遇到这种情况的吗？谢谢！
[16:38:36] 检测到视频文件，正在提取音频...
[16:38:36] 音频提取完成
[16:38:37] 正在加载模型 'small' (cpu)...
[16:38:37] 正在初始化模型...
[16:38:38] 模型加载完成，开始转录...
[16:38:38] 正在处理文件: temp_audio.wav
[16:38:38] 开始音频转录...
[16:41:18] 转录完成！
[16:41:18] ==================================================
[16:41:18] 转录结果：
[16:41:18] ==================================================
[16:41:18] [00:01:00.000 --> 00:01:02.000] Hello, hello, hello,
。。。。。。
[16:41:18] [00:05:08.800 --> 00:05:13.800] 我想我们一起向杨振宁先生说一句一路走。
[16:41:18] 已清理 1 个临时文件

senlly · 发表于 2026-1-10 04:28

谢谢分享，试试你的效果

飘浮 · 发表于 2026-1-10 09:51

感谢分享下载试用中。。。

temp2005 · 发表于 2026-1-10 09:57

以前用过录音啦，效果不错，试试这款

zhoufei0507 · 发表于 2026-1-10 10:01

谢谢啦，下来试一试看看怎么样

lingdianwuhsiqi · 发表于 2026-1-10 11:26

下载模型提示失败是什么情况

示申の孑亥纟氏 · 发表于 2026-1-10 12:20

下载完才知道是音视频转文字,还以为是文字转语音

fxd680126 · 发表于 2026-1-10 12:20

请问转完后是什么效果？

jiangjimu · 发表于 2026-1-10 14:06

zhoufei0507 发表于 2026-1-10 10:01
谢谢啦，下来试一试看看怎么样

下载报错啥信息

gc12h1234 · 发表于 2026-1-10 14:41

感觉不错，收藏备用

帐号		自动登录	找回密码
密码			注册[Register]

[原创工具] 自用音视频转文字工具分享 v1.0

免费评分

本帖被以下淘专辑推荐: