VALL_E_X语音克隆带6款模型-整合版

52ky 发表于 2023-11-26 00:30:02

VALL-E 该实现支持三种语言（英语、中文、日语）的零尝试、单语言/跨语言文本转语音功能。

教程

1. 上传持续 3 到 10 秒的语音作为音频提示，然后输入要合成的文本。

2. 该模型将使用与音频提示相同的声音来合成给定文本的语音。

3. 该模型还倾向于保留给定演讲的情感和声学背景。

页: [1]

吾爱开源's Archiver