Qwen3-TTS使用WebUI开发,整合了Python运行环境,新手无需手动配置。下载后解压,双击运行“启动.bat”文件,等待终端执行完毕后浏览器会自动打开WebUI界面,即可开始使用。
软件功能:
包含声音克隆功能(英伟达显存8G以上可用,推荐12GB以上)。
声音设计功能(英伟达显存8G以上可用,推荐12GB以上)。
支持语种:
中文、英语、日语、韩语、德语、法语、俄语、葡萄牙语、西班牙语、意大利语共10种主流语言,以及粤语、四川话、北京话等8种以上方言。
模型参数:1.7B
行业评分:
Qwen3-TTS在48kHz高采样率下MOS(平均主观意见分)得分高达4.53,远超行业平均水平4.1,位列行业第一梯队。在Seed-TTS-Eval基准测试中,中文词错误率(WER)仅2.12%,英文WER仅2.58%,说话人相似度达到0.89。在指令遵循评测InstructTTS-Eval中综合表现显著优于GPT-4o-mini-tts、Mimo-audio-7b-instruct等同类模型。
说明: 本软件为阿里通义千问团队开源项目,完全免费下载,免费使用,本地离线运行无任何费用。