心开始の未来 发表于 2024-3-27 01:40

可离线的文本转语音工具MultiTTS v1.3.5.2 (听书专用,附海量语音包)

MultiTTS是一款免费可离线的文本转tts语音工具,主要是为了让其它软件调用丰富的AI语音包来实现无障碍多音色朗读发声从而达到(在)离线听书的功能,支持中英文、日语等语言及广东话、东北话等方言,弥补手机系统自带的单调枯燥且生硬的语音TTS。
简言之,只要使用具备朗读本地书功能的软件+MultiTTS此款语音发声即可基本替代第三方收费的听书类软件,至少功能无限制无广告,接近真人发音。想必用过的不会太陌生,仅作版本兼容测试更新,有需自取~~~

软件特性:
1. 可自行对语音包引擎进行编辑、添加、删除、排序和导出数据;
2.可在文件中纠正单词读音;
3.在合成语音的同时,可从自身文件中任选音乐播放以当作朗读BGM。
4.可添加规则,识别朗读文本中的角色,并用指定的发音人进行朗读。(高阶玩法)
另外可查看软件的使用帮助了解更多详情。。。

使用说明:(相关教程已有很多,仅作简明扼要)
1.首次启动MultiTTS,软件内是空白的(即空壳),需要手动导入语音包文件。下载链接所提供的语音包voice.zip分为小、中、大及超大版(其中大版及以上集合搜狗、百度、微软、edge、讯飞、Lark、msc、Vcs等多种TTS),内置各种高质量离线或在线AI主播语音。点击界面右上角三点按钮,再点“导入数据”,找到并选择形如命名“voice.zip”的压缩包就行。(此方法不用解压!!)
2.语音包导入需要花费一些时间,请耐心等待,导入过程及完成都会有提示。然后再点右上角三个点按钮,选择“设置TTS”,即可把引擎修改为MultiTTS。
3.为了提高朗读稳定性,建议给予必要权限,比如电池优化、后台运行、关联启动等等,确保不被后台杀掉。
4.至于配合朗读功能的软件,则使用阅读3.0足矣(具体自搜),无论本地亦或在线书源均可搭配食用。。

Q&A:
1. 导入数据开始时没有任何提示最后却显示导入失败?
首先说明一点,所提供的语音包已经在上传之前经过本地测试都可成功导入!!由于压缩包太大必定会有内部自解压过程,耗时自然更多。为减少出错机率,建议使用第二种方案,即以手动解压文件的方式全部解压到内部存储之下该软件的缓存数据当中,成功率会高很多。
具体该路径为:/storage/emulated/0/Android/data/org.nobody.multitts/files/voice/
若files文件夹下没有 voice文件夹的话,请自行新建,将语音包所有文件内容放进voice文件夹之内,否则软件会无法读取识别。之后在右上方菜单中选择“重载数据”即会刷新出现各种语音引擎,再者请退出重进。如下图所示:


2.为何频繁提示“未设置对话/旁白发音人 "
因先前开启了“软件设置”—“合成对话”开关,默认关闭则是单角色朗读。多角色朗读需开启此功能,单击引擎角色设置为旁白发声,长按角色设置成对话发声,二者均要设置,设置多个同类角色会轮流发声。若试听无声,请关闭“合成对话”开关再次打开。则不会有上述提示。

3. 朗读出现停顿或中断的问题
首先检查正文内容是否异常;其次检查引擎是否调用网络连接(绿标语音引擎下载为完全离线可用,蓝标引擎地球为不收费联网可用,请自行甄别);最后检查是否开启唤醒锁、后台白名单和更改省电策略等,即上述所说的给予必要权限。

主要界面:(音色太多无法一一展示,左为旁白右为对话发音人)


相关设置:(必要时可打开,识别引号的对话效果会较好)


搭配设置:(此为阅读app自带的朗读功能,并调用该软件的发声引擎)



https://static.52pojie.cn/static/image/hrline/2.gif
下载地址:
1 > > 微软盘下载    密码:6Kok
2 > > 123盘下载      密码:r2wo
3 > > 百度盘下载    密码:aium

vitrel 发表于 2024-3-29 09:14

hacucu 发表于 2024-3-28 10:49
大概你没实际使用。和微软语音很接近了。选晓晓,把语速调下,基本和在线语音差别不大。

谢谢您的回复,谢谢!
微软的语音包,我以前测试时(语音包1和2)是没有的,
直到昨天下午,最大那个语音包下载完,我试用过才发现,
里面已经包含了微软的语音包(其中就包含了您提到的“晓晓”声优),确实非常不错。

试用该软件之前(两年前吧),我一直用讯飞有声进行朗读的,
讯飞有声里有两类语音包,本地和联网,
本地的比较生硬,联网的稍好,但也很容易就能分辨出是机械发音,与真人发音有区别。
一年前曾试用过MultiTTS(本App),当时仅有语音包1和2,
我印象中,当时的语音包里只有本地语音,也包含讯飞有声的多名“声优”,
整体效果与我上面提到的、讯飞有声里的本地语音一样,比较生硬。
当然,当时已经觉得很不错,毕竟没有更好的选择。

但很快,就出现了TTS和TTS Server两款App,它们的朗读原理差不多,都需要联网使用。
它们的运行原理是,将文字数据发送到微软的服务器,依拓服务器的强大算力,将文字合成语音,再将语音文件传回手机上播放。
微软的能力无用置疑,所有声优的表现几乎与真人播音员无异(甚至超过大部分普通的真人),
抖音里大量解说类的视频都是使用微软的声优,男声中的“云希”是出现频率最高,也是我认为男声中音色最好的。
说实话,在接触TTS和TTS Server两款App之前,我根本不知道抖音中的这些视频里的配音是电脑合成出来的,一直以为是真人录播的。
没有对比就没有伤害,就是因为出现了这类朗读效果近乎真正播音员的电脑声优,
所以才对比出,原来在讯飞有声、MultiTTS里所听的本地语音包,效果比较生硬、比较机械。

当刷到本贴后,得知MultiTTS有新版本,并增加了语音包3和4,
特意下载来试试,由于没有百度网盘会员,直到昨天下午才下载完语音包4(实在太大了),马上试用。
发现语音包4增加了大量朗读引擎,除了原来的本地语音包(绿标)外,还比原来多了很多联网的语音包(蓝标)。
其中就包含了上面提到的微软的联网语音包,当然也包括了最受欢迎的云希、晓晓等声优,
试用了一下,这些微软的语音效果,与TTS和TTS Server两款App里的效果是一模一样的,非常好,
反正原理上面也提过,都是通过微软的服务器在网上合成的语音,效果能不一样吗?

最后得出一个结论,对于MultiTTS这个App,就是通过语音包的形式,
将网络上常见的朗读引擎(如讯飞有声、搜狗TTS、百度、小米、微软等等)尽可能全部集合在一起供大家随意选用,
这些朗读引擎有本地的、也有联网的,一般来说,朗读效果联网的优于本地的,
还有,由于众多朗读引擎都是收集自各个不同的公司的产品,
各公司的研发实力、产品特色有所不同,因此里面各引擎的朗读效果也有很大的差异,
MultiTTS这个App的好处就在于一次性把这些朗读引擎收集在一起,供大家对比测试,最终以选出自己喜欢的声优来为我们朗读。

yuyie 发表于 2024-3-27 21:56

本帖最后由 yuyie 于 2024-3-27 22:10 编辑

本想发个精简后的{:1_937:}图片,没有发成功。
直接发个精简包吧,建议使用包中的搜狗和百度语音。因为感觉都不错,就没有继续精简。
链接:https://www.123pan.com/s/qQx6Vv-Tvkpd.html
342M,想继续精简的可以在软件中自己删多余的语音。
/storage/emulated/0/DCIM/Screenshots/2.jpg/storage/emulated/0/DCIM/Screenshots/1.jpg

vitrel 发表于 2024-4-1 09:05

lxb 发表于 2024-3-30 13:00
云希、晓晓是在哪个压缩包呀,这个太大了,我的手机内存不够,全部都安装一遍实现不了

您好!
~楼主所提供的语音包有voice.zip、voice2.zip、voice3.zip、voice4.zip,以下简称1、2、3、4。
~语音包越大,语音越全,它们是包含的关系。
~您提到的云希、晓晓均属于微软(或Edge)语音引擎。
~我之前试用过语音包1和2,尚未包含微软(或Edge)语音引擎。
~我最近测试的是语音包4,发现已经包含了微软(或Edge)语音擎。
~至于语音包3是否也包含微软(或Edge)语音擎,我没测试过。(语音包太大了,我没有会员,下载要很久,所以我跳过了语音包3,直接下载语音包4,一步到位)
~您如果想测试云希、晓晓的效果,不一定下载语音包4,因为实在太大了,我有更好的办法。
~从网盘(https://wfhw.lanzoui.com/b047ru6vg 密码:h3cn)中下载“multitts新版配置.zip”,该语音包由网友制作,只有20MB左右,它也能用于MultiTTS,使用方法就像其它语音包的导入一样,导入完毕后,在“微软翻译”下面就能找到云希、晓晓了。(以上方法我已实测可用)

vitrel 发表于 2024-3-27 08:14

本帖最后由 vitrel 于 2024-3-27 10:42 编辑

首先感谢楼主,能写出这么详细的使用方法,使我对该软件的认识更深了一个层次。
这个软件我1年前试用过,当时还只有小、中2个语音包,
由于是离线的语音包,整体朗读效果尚可,但比较机械,
与其它真正能高仿真人发音的网络语音引擎相比,差距还是比较大的,
反正各有千秋吧,离线朗读引擎更适用于没有网络、或网络不稳定、或想省流量的情况下使用。
这次看见软件版本升级了,语音包也多了2个,大了很多,赶快试一下。

vitrel 发表于 2024-4-1 08:12

hzxs520 发表于 2024-3-30 16:46
大佬,求教,我选微软的和edge的两个,离线模式用不了,在线的就可以。。是什么原因啊?

您好!
~MultiTTS这个工具的特点是将常见的朗读引擎全部集中在一起,供我们自由选用。
~而朗读引擎分两大类,一类是离线的,一类是联网的。
~离线类的朗读引擎,会将一个十几兆到百几兆的语音包放在你的手机上,由手机完成文本文字到语音音频的转换,全过程与网络无关,但由于手机的算力有限,因此语音表现(相对)比较生硬。
~联网类的朗读引擎,在手机端只需记录服务器网址、端口号等关键信息,并没有什么语音包。每次要朗读时,手机端负责将文本文字发送到网上的服务器,由服务器转换出语音音频,再发回手机,并由手机朗读出来。全过程必须依赖于网络。由于服务器的算力强,加上AI的支持,语音表现更为理想,可以媲美真人播音员。
~有些软件,如讯飞(也包含在MultiTTS里),既有离线类的朗读引擎,效果差一些,也有联网类的朗读引擎,效果要好一些,用户可以自由选择。
~但有些朗读引擎,如微软的和Edge,则只有联网的朗读引擎,要用它,必须联网。
~其实在MultiTTS里,选择“声优”时,每位声优都是一行,在这一行的中间有个小图标,绿色的就代表它是离线使用的,选用它,不必联网。而对于蓝色图标的,则说明它是联网引擎,必须联网使用。
以上信息希望对你有所帮助。

ren35129 发表于 2024-3-27 08:48

谢谢楼主,讲解的很仔细。

zlzx01 发表于 2024-3-27 07:46

支持广东话、东北话,看起来很强大!!

sxmjsy 发表于 2024-3-27 07:39

下载安装,感谢分享

shangbieli 发表于 2024-3-27 01:54

看到v1.3.5.2还以为有新版本了 {:301_973:}

tt0808tt 发表于 2024-3-27 01:51

这个软件很实用,感谢分享。{:1_893:}

柳影风 发表于 2024-3-27 04:28

牛!非常完美!

yangyu910 发表于 2024-3-27 04:58

语音包又多了,感谢楼主分享!!!

netdna518 发表于 2024-3-27 05:10

这是一个AI的时代

andy512 发表于 2024-3-27 05:21

有度逍遥语音吗

jm1970 发表于 2024-3-27 05:35

感谢分享,备用。

zjj815 发表于 2024-3-27 05:36

谢谢分享 完美的听书软件

sxzswx 发表于 2024-3-27 05:39

语音包很不错
页: [1] 2 3 4 5 6 7 8 9 10
查看完整版本: 可离线的文本转语音工具MultiTTS v1.3.5.2 (听书专用,附海量语音包)