52ky 发表于 2023-11-26 00:30:02

VALL_E_X语音克隆带6款模型-整合版

VALL-E 该实现支持三种语言(英语、中文、日语)的零尝试、单语言/跨语言文本转语音功能。

教程

1. 上传持续 3 到 10 秒的语音作为音频提示,然后输入要合成的文本。

2. 该模型将使用与音频提示相同的声音来合成给定文本的语音。

3. 该模型还倾向于保留给定演讲的情感和声学背景。




页: [1]
查看完整版本: VALL_E_X语音克隆带6款模型-整合版