在声音克隆软件中,CosyVoice 2.0的表现可以说是十分耀眼的。它不仅能完成相似度极高的声音克隆,还支持自然语言情绪控制。下面,就给大家带来CosyVoice 2.0完整克隆声音教程+自然语言情绪控制教学,一起往下看看吧。
声音克隆教程(3秒极速复刻):
1、选择推理模式:推理模式选择【
3秒极速复刻】。
2、在文案输出框输入需要合成的文案,也就是你想要AI说的话,如果是1.0版本,建议将所有的标点符号全部改成句号,能够有效避免长文本生成不稳定的情况。
3、点击上传样音或直接将样音拖入【
prompt音频文件】框中,仅需上传3-10秒的样音即可,生成速度快。
4、一边播放样音音频一边检验自动识别的【
prompt文本】内容是否完全一致,如不一致,需手动校准识别错误的问题,避免出现生成音频漏字以及胡乱朗读外星语的问题。
5、点击生成音频,等待生成即可,如不满意,鼠标滚轮上划,点击
骰子后再次点击生成音频,即可获取另一段不同的声音,满意后直接点击下载按钮即可保存。
自然语言情绪控制教程:
1、选择推理模式:推理模式选择【
自然语言控制】。
2-4、与【
3秒极速复刻】步骤完全一致
5、
输入情绪指示词,可以将语种以及情绪同时输入,如“
用四川话朗读这句话,音色低沉,情绪伤心的,语速偏慢。”
6、点击生成音频,等待生成即可,如不满意,鼠标滚轮上划,点击
骰子后再次点击生成音频,即可获取另一段不同的声音,满意后直接点击下载按钮即可保存。
通过学习这份教程,你也能熟练运用自然语言控制情绪,借助 CosyVoice 2.0就能完整克隆声音了,快去试试吧。