当前位置: 主页 > AI教程 >

AI教程

cosyvoice克隆音色怎么弄 克隆音色制作方法

2025-01-04
朴老师
AI吧
不管是训练模型还是直接使用参考音频进行克隆音生成,都需要我们提供干音作为参考,那么就有人问了,cosyvoice克隆音色怎么弄呢?其实很简单,只要参考音频满足以下条件,就能生成相似度极高的克隆音了。
首先需要先了解参考音频的注意事项,具体标准如下:
  • 时长推荐 3~10秒(生成速度快);
  • 推荐数据集中(人话:不要太多留白,留白对AI来说是废数据)

  • 不要带混响(不是在唱歌,AI不懂音乐)
  • 不要有噪音
    • 对于参考音频,除了你要需要的那个声音,其他的所有声音都是噪音;
    • 狗别叫了/洗衣机别再卷了/电扇关掉/吵架的爸妈先停一下...AI无法分辨这些声音。
  • 吐字清晰
    • 一个字一个字的咬准喽,不要连音;
    • 平翘舌不分/声韵母不分/声调念不准/不恰当的儿化音,这些没关系,可以看作是声音的特点;
    • 五行(xíng)读成 五行(háng),这种是文化程度问题,不属于口音。
  • 更高的音质(我就不和你讲采样率/保真度/位深/码率,这些东西了,举例告诉你 好/差 ):

※ 保证不了也不要勉强,毕竟专业的台式麦克风不便宜。

    • 独立的台式麦克风:最好;
    • 拿手机录的:很差;
    • 笔记本电脑录的:差
    • 几十几百块的耳机上带的麦克风:很差;
    • 大几千上万的专业耳机上的麦克风:可能好。
    •  
​克隆音色制作方法:
1、选择[3s极速复刻],在合成文本内容框中输入任意文本,建议一句即可,生成速度更快。
2、上传prompt文件,同时输入prompt文本,确保两者内容完全一致,如不一致会导致生成的音频大批量漏字或胡言乱语的情况。
3、点击生成音频,音频生成完成后进行试听,检验相似度是否达标,如未达标,根据前面制作标准检查是否有杂音等,根据标准调整参考音频即可。
4、输入音色名称后点击[保存刚刚推理的Zerp-Shot]音色,即可保存音色(保存音色前,必须先生成完毕音频后再进行保存,否则保存的音色会出错,从而导致无法使用)。

5、选择[预训练音色后]点击[刷新新增音色],就能在新增音色下拉框使用我们制作好的参考音频了。

​看到这里的你应该已经知道克隆音色怎么弄了吧,如果你还没有学会弄克隆音色,可以按照小编给的标准尝试一下哦,相信掌握方法的你也能做出一段完美的克隆音了。