说下软件特色,理论上来说,Edge接口合成时,是没有字数和时长限制的,因为程序里面是没有限制的。
Edge接口的合成是将文本按照段落划分200字左右,进行分段合成,合成文件会放到软件temp 文件夹下。最后将所有语音文件自动拼接到一起生成mp3文件,并删除临时文件夹内容。已测试2万字的文本,生成一个大概40分钟的语音时长,是没有问题的。
语音处理部分,仅写了一部分,语音拼接和混合,这部分网络上的其他语音合成软件并不提供该功能。
AzureTTS 界面生成的文本 自动ssml 标签,也是为了 小白方便使用。
下载:https://www.123pan.com/s/9KtDVv-jO97A