吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 167|回复: 4
收起左侧

[经验求助] python程序开发问题求大佬提供思路或具体方案

[复制链接]
ly0512 发表于 2024-10-9 00:39
25吾爱币
python3.9.7。
功能需求:能够实时获取电脑(Windows10)扬声器输出的内容,然后转成文字(均为中文内容,不涉及其他语言)。
特别注意事项:不能影响用户的收听音频和通过麦克风输入音频。

使用场景:视频会议时自动进行会议速记等功能。

目前没有任何思路和办法实现上述功能。恳请各位大佬提供解决思路。

最佳答案

查看完整内容

没思路,问AI啊 1、获取音频:sounddevice模块,pyaudio模块,或者audiorecorder 2、语音转文本:搜论坛,搜github,例如https://github.com/jianchang512/stt

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

helian147 发表于 2024-10-9 00:39
没思路,问AI啊
1、获取音频:sounddevice模块,pyaudio模块,或者audiorecorder
2、语音转文本:搜论坛,搜github,例如https://github.com/jianchang512/stt
surepj 发表于 2024-10-9 09:19
 楼主| ly0512 发表于 2024-10-9 09:58

好的,感谢,我今天试一试哈。
不过主要还是需求python程序的实现思路,因为其他功能已经开发好,就差这一个功能了。
 楼主| ly0512 发表于 2024-10-9 10:00
helian147 发表于 2024-10-9 08:15
没思路,问AI啊
1、获取音频:sounddevice模块,pyaudio模块,或者audiorecorder
2、语音转文本:搜论坛 ...

大佬,这两个我今天就去了解一下,如果可以就采纳
不过目前考虑到的难点就是如何获取到扬声器输出的音频,同时用户还能听到声音。并且还不能占用麦克风,让用户正常输入。
另外我也问过AI。但是都需要占用麦克风,导致用户无法正常输入音频(说话无声音)
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-12-15 23:35

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表