当前位置: 主页 > AI软件

AI软件

KAIST-Float视频生成整合包下载

2025-12-18
豆豆
AI吧
软件介绍
FLOAT是一款由韩国科学技术院(KAIST)与DeepBrain AI公司联合研发的、基于用你的声音,让照片里的人动起来,而且表情和口型都非常自然。
 
一、核心功能:从音频到情感丰富的动态肖像
FLOAT的核心使命,你给一张人像照片和一段说话录音,它就能生成一段这个人开口说话的视频,口型对得上。
•卓越的同步质量:生成视频的唇部运动与输入音频高度匹配,确保口型的精确性。
•自然的表情与姿态:模型不仅能驱动嘴部,还能生成符合语境的面部表情(如微笑、皱眉)以及自然的头部姿态变化,使人物栩栩如生。
•创新的情感驱动:FLOAT独家支持语音驱动的情感控制。它能分析音频中所蕴含的情绪(如愤怒、快乐、悲伤等),并将这些情感自然地转化为人物的面部表情和肢体语言,从而生成表现力极为丰富的动态肖像。
二、技术特点:不只是嘴巴动,人物还会有自然的微笑、挑眉等小表情,头也会轻微转动,看起来很真实。
•生成效率飞跃:传统的AI生成视频方法(扩散模型)比较慢,像绕远路。FLOAT用的新方法(流匹配)更像一条直路,所以生成视频速度快很多。
•时间一致性更优:更重要的是,它能让视频更连贯、不闪烁。它的诀窍是:不去一帧帧地“画”每一张图,而是先理解并规划好人脸该怎么动(比如嘴角怎么上扬,头怎么转),再一气呵成地生成整个动态过程,所以动作特别顺滑。
软件图片


 
FTP下载地址: