吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1187|回复: 47
收起左侧

[原创工具] 自用音视频转文字工具分享 v1.0

  [复制链接]
jiangjimu 发表于 2026-1-7 23:14
自用音视频转文字工具分享!免收费 + 操作简单

经常需要把音视频转成文字,试过不少市面上的工具,要么操作繁琐步骤多,要么动辄就要收费,用着特别不方便。
忍不了这种麻烦,就去查了查相关方案,发现 OpenAI 有款开源的语音识别模型特别合适!于是干脆自己用 Python 对接了这个模型,还顺手做了个 GUI 界面,不用敲代码就能直接用,新手也能快速上手~


软件里内置了 5 个可选模型,大家可以根据自己的需求选:


  • tiny:体积最小,运行速度最快,识别精度相对一般,适合追求效率、对精度要求不高的场景(比如快速转写会议录音要点);
  • base:速度和精度的平衡款,日常使用最常用,大部分场景下都能满足需求;
  • small:精度比 base 更高,运行速度会稍慢一点,追求更好识别效果又不想等太久的话选它准没错;
  • medium:识别精度进一步提升,但对设备计算资源要求更高;
  • large:精度最高,但硬件门槛也最高,运行速度也偏慢。


这里重点推荐大家选「small 模型」!识别精度足够高,日常转写视频台词、音频笔记都够用~ 至于 medium 和 large 模型,因为它们需要显卡支持,还要额外装显卡驱动,操作麻烦不说,打包后的安装包也会变大,所以我只保留了 CPU 版本,不用折腾显卡,普通电脑就能流畅运行



第一次使用先下载模型!!
这是第一次发这类工具分享,要是有违规的地方,麻烦大家指出来我及时修改~ 有同样需求的朋友也可以留言交流呀!

图片展示:
ScreenShot_2026-01-07_230917_198.png
ScreenShot_2026-01-07_230853_278.png


下载链接:
通过网盘分享的文件:链接: https://pan.baidu.com/s/117-q1XnY5c8PYAd77aH-uQ?pwd=sq68 提取码: sq68

免费评分

参与人数 8吾爱币 +13 热心值 +8 收起 理由
barry1204 + 1 + 1 谢谢@Thanks!
zio321 + 1 + 1 鼓励转贴优秀软件安全工具和文档!
fyz2007 + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
superyangb + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
bqi153 + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
ALLANNIE + 1 + 1 谢谢@Thanks!
confiant + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
风之暇想 + 7 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!

查看全部评分

本帖被以下淘专辑推荐:

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

wdq365 发表于 2026-1-15 22:14
为什么三个模型我都试了,都卡在95%,就不向下走了。。。

[20:56:58] 检测到视频文件,正在提取音频...
[20:57:01] 音频提取完成
[20:57:02] 正在加载模型 'small' (cpu)...
[20:57:02] 正在初始化模型...
[20:57:04] 模型加载完成,开始转录...
[20:57:04] 正在处理文件: temp_audio_250216.mp4.wav
[20:57:04] 开始音频转录...
[21:52:42] 已清理 1 个临时文件
[21:52:47] 检测到视频文件,正在提取音频...
[21:52:49] 音频提取完成
[21:52:49] 正在加载模型 'base' (cpu)...
[21:52:49] 正在初始化模型...
[21:52:50] 模型加载完成,开始转录...
[21:52:50] 正在处理文件: temp_audio_250216.mp4.wav
[21:52:50] 开始音频转录...
[22:04:46] 已清理 1 个临时文件
[22:04:54] 检测到视频文件,正在提取音频...
[22:04:56] 音频提取完成
[22:04:56] 正在加载模型 'tiny' (cpu)...
[22:04:56] 正在初始化模型...
[22:04:56] 模型加载完成,开始转录...
[22:04:56] 正在处理文件: temp_audio_250216.mp4.wav
[22:04:56] 开始音频转录...
wdq365 发表于 2026-1-16 16:45
jiangjimu 发表于 2026-1-15 23:05
如果时长很大等待久一点,它还在处理中,cpu处理会比较慢一点

感谢答复!昨天晚上时间久,今天时间比较快!不知为什么?但也遇到新问题,就是40分钟的视频,只转换了前几分钟,后面的直接不见了?比如下面这段,就只转了前五分钟的开场白。有遇到这种情况的吗?谢谢!
[16:38:36] 检测到视频文件,正在提取音频...
[16:38:36] 音频提取完成
[16:38:37] 正在加载模型 'small' (cpu)...
[16:38:37] 正在初始化模型...
[16:38:38] 模型加载完成,开始转录...
[16:38:38] 正在处理文件: temp_audio.wav
[16:38:38] 开始音频转录...
[16:41:18] 转录完成!
[16:41:18] ==================================================
[16:41:18] 转录结果:
[16:41:18] ==================================================
[16:41:18] [00:01:00.000 --> 00:01:02.000] Hello, hello, hello,
。。。。。。
[16:41:18] [00:05:08.800 --> 00:05:13.800] 我想我们一起向杨振宁先生说一句一路走。
[16:41:18] 已清理 1 个临时文件

senlly 发表于 2026-1-10 04:28
飘浮 发表于 2026-1-10 09:51
感谢分享 下载试用中。。。
temp2005 发表于 2026-1-10 09:57
以前用过录音啦,效果不错,试试这款
zhoufei0507 发表于 2026-1-10 10:01
谢谢啦,下来试一试看看怎么样
lingdianwuhsiqi 发表于 2026-1-10 11:26
下载模型提示失败是什么情况
示申の孑亥纟氏 发表于 2026-1-10 12:20
下载完才知道是音视频转文字,还以为是文字转语音
fxd680126 发表于 2026-1-10 12:20
请问转完后是什么效果?
 楼主| jiangjimu 发表于 2026-1-10 14:06
zhoufei0507 发表于 2026-1-10 10:01
谢谢啦,下来试一试看看怎么样

下载报错啥信息
gc12h1234 发表于 2026-1-10 14:41
感觉不错,收藏备用
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - 52pojie.cn ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2026-1-17 05:41

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表