Skip to content

语音模型Voice Clone实操

“中天一轮满,秋野万里香”。千百年来,月亮象征着团圆,承载着我们对家人、朋友和远方亲人的思念之情。

在又一个中秋佳节到来之际,超算互联网使用Voice Clone模型镜像,一分钟克隆声音,生成了中文、英文、法语、西班牙语等不同国家的中秋祝福语,祝大家中秋快乐,愿明月照亮我们前行的道路,愿月满人团圆。

接下来,我们手把手实操演示如何在超算互联网使用WebUI-Voice Clone,定制专属中秋祝福词。文末有详细的视频教程,零基础小白也能上手体验。

一、准备工作

1、文本提示词:Voice Clone支持中文、英文文本提示词,内容可以是简单的句子、诗歌、故事片段、电影台词等。文本内容需准确无误,含义明确、易于理解,避免发音上容易出错的字词或生僻字。
2、参考语音素材:在体验Voice Clone之前,您需要准备一段参考语音素材,以便模型能够学习并克隆声音。语音素材需要清晰、无噪音,并尽可能包含丰富的语音变化(如不同音调、语速和情绪表达),以便模型能够更准确地学习该声音的特征。

1.png 注:本文参考语音素材由超算互联网AI语音模型ChatTTS生成

二、使用步骤

第一步:超算互联网在线启动WebUI-Voice Clone

登录超算互联网https://www.scnet.cn个人账号,点击右上角“控制台”;

2.png

点击快捷入口中的“Notebook”,进入创建Notebook页面;

3.png

选择区域、加速卡,点击“模型镜像”,在列表中选择想要配置的镜像,这里我们选择jupyterlab-voice-clone,点击创建;

4.png

创建成功后,点击“jupyterLab”进入Notebook页面;

5.png

进入Notebook页面以此运行单元格;

6.png

当单元格下方出现端口链接时,则说明WebUI的服务已经启动,这里复制端口链接;

7.png

返回创建notebook的页面点击“访问自定义服务”,并粘贴端口链接中的“端口号”,点击“启动任务”,即可进入“webui”界面:

8.png

9.png

第二步:上传素材

将准备好的“文本提示词”上传到“文字”区域,将“参考语音素材”上传到“参考语音”区域;

10.png

第三步:调整参数

Voice Clone支持17种语言,包括中文(zh-cn)、英文(en)、西班牙语(es)、法语(fr)、德语(de)等,用户可以根据需求,选择不同的语言进行语音合成和克隆。

11.png

第四步:生成语音

点击界面中的“提交”按钮,Voice Clone将开始生成语音。根据提示词长度、参考语音时长等参数,生成时间可能需要几秒到几分钟不等。

12.png

第五步:下载语音

生成完成后,点击“生成语音”区域的下载箭头,即可下载生成的语音文件。

13.png

以上就是本次Voice Clone实践教程的全部内容了,希望本篇最佳实践为您提供一些有价值的信息和实践技巧。