人工智能服务
>
最佳实践
>
语音模型Bark实操
本篇为“超链接”系列专题的第13篇最佳实践文章,我们手把手实操演示如何在超算互联网使用WebUI-Bark,一键生成音乐、有声书。
第一步:超算互联网在线启动WebUI-Bark
登录超算互联网https://www.scnet.cn个人账号,点击右上角“控制台”;
点击快捷入口中的“Notebook”,进入创建Notebook页面;
选择区域、加速卡,点击“模型镜像”,在列表中选择想要配置的镜像,这里我们选择jupyterlab-suno-bark,点击创建;
创建成功后,点击“jupyterLab”进入Notebook页面;
进入Notebook页面以此运行单元格;
当单元格下方出现端口链接时,则说明webUI的服务已经启动,这里复制端口链接;
返回创建notebook的页面点击“访问自定义服务”,并粘贴端口链接中的“端口号”,点击“启动任务”,即可进入“WebUI”界面;
第二步:上传素材
在“Input Text”区域输入准备好的“英文提示词”,并在下方“Acoustic Prompt”区域选择对应的语言:
第三步:调整参数
a.语言选择:
Bark支持多种语言,包括中文(zh)、英文(en)、德语(de)、西班牙语(es)、法语(fr)等,且每种语言都配有十种不同的音调选择,用户可以根据需求在“Acoustic Prompt”区域选择不同的语言和声调生成语音。(注:Unconditional会根据输入的文字给出对应的语言,其他选项需要文字和语言相对应才能输出正确的语音。)
b.音乐生成:
原则上,Bark会选择将文本生成为音乐或其他音频,您可以通过在“英文歌词”前后添加音乐符号来帮助Bark更好地识别以生成音乐。在“Input Text”区域输入准备好的“英文歌词”,开头和结尾处加上“♪” 符号,并在下方“Acoustic Prompt”区域选择
“Unconditional” 。
Try the prompt:♪ In the jungle, the mighty jungle, the lion barks tonight ♪
c.速度调节:
(可选)在“生成语音”区域进行还附有声音速度调节功能,可根据个人喜好进行调整。
第四步:生成语音
点击界面中的“Run”按钮,Bark将开始生成语音。根据提示词长度、参考语音时长等参数,生成时间可能需要几秒到几分钟不等。
第五步:下载语音
生成完成后,点击“生成语音”区域的下载箭头,即可下载生成的语音文件。
以上就是本次Bark实践教程的全部内容了,希望本篇最佳实践为您提供一些有价值的信息和实践技巧。