TA的每日心情 | 擦汗 11 小时前 |
|---|
签到天数: 1735 天 连续签到: 3 天 [LV.Master]伴坛终老
|
VALL-E X 可以通过仅使用未曾见过的说话者的 3 秒录音作为声学提示,合成高质量的个性化语音,即使是对于一位母语讲者,也可以在另一种语言中执行。此实现支持三种语言(英语、中文、日语)的零尝试、单语 / 跨语言文本到语音功能。
# y+ A. [% F% D1 T& b: r: X6 b4 s& u# l- N L. p
使用教程
8 j8 [, }: F8 A
5 B n% c8 Y5 d, g1.上传一个持续3到10秒的语音作为音频提示,并键入您想要合成的文本。
: y4 `* w s+ r9 U/ f: k# }* J9 p9 \
2.模型将用您的音频提示相同的声音合成给定文本的语音。% F: H! N; x6 R. m+ e2 Q0 z
3 e: D) m. a. U( K/ J0 T
3.该模型还倾向于保留您给定语音的情感和声学环境。
' ]2 z f. Z0 n, ]$ A' u$ F$ N9 }( b6 M
: t# O% L% o# J- N- S5 p8 E
8 [4 s8 y9 U* Q. h+ e# P( L
/ E& m; C2 @- s3 O) O
- i, [# D' Y7 t2 m |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即加入
x
|