Skip to content

语音模型Bark实操

本篇为“超链接”系列专题的第13篇最佳实践文章,我们手把手实操演示如何在超算互联网使用WebUI-Bark,一键生成音乐、有声书。

使用步骤

第一步:超算互联网在线启动WebUI-Bark

登录超算互联网https://www.scnet.cn个人账号,点击右上角“控制台”;

1.png

点击快捷入口中的“Notebook”,进入创建Notebook页面;

2.png

选择区域、加速卡,点击“模型镜像”,在列表中选择想要配置的镜像,这里我们选择jupyterlab-suno-bark,点击创建;

3.png

创建成功后,点击“jupyterLab”进入Notebook页面;

4.png

进入Notebook页面以此运行单元格;

5.png

当单元格下方出现端口链接时,则说明webUI的服务已经启动,这里复制端口链接;

6.png

返回创建notebook的页面点击“访问自定义服务”,并粘贴端口链接中的“端口号”,点击“启动任务”,即可进入“WebUI”界面;

7.png8.png

第二步:上传素材

在“Input Text”区域输入准备好的“英文提示词”,并在下方“Acoustic Prompt”区域选择对应的语言:

9.png

第三步:调整参数

a.语言选择:

Bark支持多种语言,包括中文(zh)、英文(en)、德语(de)、西班牙语(es)、法语(fr)等,且每种语言都配有十种不同的音调选择,用户可以根据需求在“Acoustic Prompt”区域选择不同的语言和声调生成语音。(注:Unconditional会根据输入的文字给出对应的语言,其他选项需要文字和语言相对应才能输出正确的语音。)

10.png

b.音乐生成:

原则上,Bark会选择将文本生成为音乐或其他音频,您可以通过在“英文歌词”前后添加音乐符号来帮助Bark更好地识别以生成音乐。在“Input Text”区域输入准备好的“英文歌词”,开头和结尾处加上“♪” 符号,并在下方“Acoustic Prompt”区域选择

“Unconditional” 。

shell
Try the prompt:♪ In the jungle, the mighty jungle, the lion barks tonight

11.png

c.速度调节:

(可选)在“生成语音”区域进行还附有声音速度调节功能,可根据个人喜好进行调整。

12.png

第四步:生成语音

点击界面中的“Run”按钮,Bark将开始生成语音。根据提示词长度、参考语音时长等参数,生成时间可能需要几秒到几分钟不等。

13.png

第五步:下载语音

生成完成后,点击“生成语音”区域的下载箭头,即可下载生成的语音文件。

14.png

以上就是本次Bark实践教程的全部内容了,希望本篇最佳实践为您提供一些有价值的信息和实践技巧。