闪豆视频下载器是一款非常实用的视频下载工具软件,支持多种视频平台的视频下载,拥有高效的下载速度和强大的视频处理功能,操作简单,使用方便。 如果你经常需要下载各种视频...
relighting-kontext(其完整名称为 relighting-kontext-dev-lora-v3)是由 Kontext社区 在Hugging Face平台发布的一款开源模型。它是社区开发者基于 Black Forest Labs(黑森林实验室) 开发的 FLUX.1-Kontext-...
FFmpeg是一款开源软件,可以处理多种多媒体媒体数据程序。是目前最受欢迎的视频和图像处理软件。 在FFmpeg基础上开发的一款自动化处理软件,以最简单的方式快速批量处理音视频文件...
STT-V2这是一个离线运行的本地语音识别转文字工具,基于 fast-whipser 开源模型,可将视频/音频中的人类声音识别并转为文字,可输出json格式、srt字幕带时间戳格式、纯文字格式。可用于...
这个模型由阿里巴巴通义千问团队研发,并于2024年底正式开源。Qwen是通义千问的英文名,代表着它属于通义大模型家族的一员。 任何人都可以免费下载和使用。Qwen3-TTS-1.7B 是一个能把...
FLUX.2-Klein模型家族由人工智能研究公司 Black Forest Labs (BFL) 开发并开源。其名称中的Klein在德语中意为小,体现了其模型紧凑、高效的特点。该系列模型(特别是4B版本)采用宽松的Apac...
软件介绍 heygem是帮你快速复制一个虚拟自己的软件。由南京硅基智能公司开发,而且是开源的。最大优点是不用联网、在自家电脑上就能跑,隐私有保障。 以前做数字人又贵又慢,现...
LTX-2-GGUF 是一款旨在让普通电脑也能本地运行高端 文/图生视频 的AI工具。它的核心功能是把文字描述或静态图片,变成一段带同步声音的、最长20秒的高清视频。 LTX-2-GGUF来源于Lightri...
HeartMuLa来源于一项发表于2026年1月的尖端学术研究,由北京大学等机构的研究团队联合发布。研究团队将全部模型、代码和论文开源,旨在打造一个能媲美商业级产品(如Suno AI)的开放...
Story-Adapter是一个专门用来把长篇文字故事,自动转换成一系列连贯图片的AI工具。你可以把它想象成一个AI连环画生成器。 Story-Adapter来源于一篇发表于2024年10月的计算机视觉学术研究。...