软件介绍 heygem是帮你快速复制一个虚拟自己的软件。由南京硅基智能公司开发,而且是开源的。最大优点是不用联网、在自家电脑上就能跑,隐私有保障。 以前做数字人又贵又慢,现...
软件介绍 SeedVR2是由字节跳动Seed团队与南洋理工大学S-Lab联合研发并开源的一款AI视频修复与增强模型。它的核心目标是降低专业视频处理的技术门槛, 通过创新的算法,让搭载主流显...
FlashVSR是由清华大学等机构在2025年联合开源的一款AI视频处理模型,它能让视频超分辨率(即高清修复)处理变得既快又好。 功能特点 极速高清修复,利用单步扩散技术,在高端显卡上...
软件简介 卡卡字幕助手(VideoCaptioner)是一款基于大语言模型(LLM)的智能字幕生成工具,无需GPU即可快速合成高质量字幕视频。它提供从生成、断句、优化到翻译的全流程支持,让视...
软件介绍: 核心能力: 高保真克隆:基于 44.1 kHz 高采样率,复现音色、韵律、语速等细节。 高效合成:约 6.25 token/秒 的计算开销,合成速度较前代翻倍。 上下文表达:根据文本语义...
软件介绍: ZipVoice 是一款开源的文本转语音工具,支持从短语音样本学习并复现相近的音色,为指定文本生成语音。 支持多说话人合成,可组合不同音色生成自然的对话片段。 采用...
软件介绍 Vevo是一个很智能的AI语音模仿跟改词工具。简单说,类似一个变声器,而且只需要一段很短的声音样本(这就是零样本的意思) 不需要用海量数据去反复训练,需要8G显存运行...
软件介绍 FishSpeech是一个开源的文本转语音(TTS)工具,它的核心本领是高质量的语音克隆和多语言语音合成(英日韩语中法德语阿拉伯语和西班牙)。 你只需要提供一段10到30秒的真人录...
软件介绍 Seed Voice Conversion V2(种子音色转换V2)它是个声音克隆和转换的神器。 你给它一小段某个人的声音样本,它就能学会这个声音的特点。然后,你就可以用这个学会的声音,去说...
软件介绍 CosyVoice 3.0 是阿里最新升级的AI语音生成模型,它能让文字变成非常逼真、自然的语音。 软件功能亮点 极速音色克隆,只需要你提供一段3秒钟的录音,它就能完美克隆出说话...