清华大学与极佳视界科技联合发布创新大模型
据媒体报道,北京极佳视界科技有限公司联合清华大学自动化系正式发布了我国首个超长时长、高性价比的Sora级视频生成大模型“视界一粟 YiSu”。该模型具备原生16秒的超长时长视频生成能力,并可扩展生成至1分钟以上的视频。
YiSu模型特点:成本低、速度快、端侧可用
“视界一粟 YiSu”模型不仅在生成视频时长方面有突出表现,还具备更低的成本和更快的生成速度,同时支持端侧应用。年初Sora模型的火爆,让DiT架构受到了极大的关注,许多公司和项目开始复现DiT路线。然而,“视界一粟 YiSu”并未止步于此,而是基于团队自研的视频生成大模型技术,结合了LLM和扩散模型的自研架构,优化了多模态融合、训练效率、推理效率和模型效果。
自研技术优势显著 YiSu模型持续迭代
此前,该团队曾提出WorldDreamer,全球首个以Transformer和LLM(Masked Token路线)为中心的视频生成工作。而此次发布的YiSu-Beta V0.5版本,显示了团队在视频生成技术方面的最新进展。该模型正在以每周一个小版本、每月一个大版本的速度迭代,未来几个月将在视频时长、可控性、推理速度、运行成本和理解物理世界等方面持续迎来大幅度提升。
极佳科技团队背景与成就
极佳视界科技的核心团队拥有超过十年的AI技术积累,成员来自清华大学、中科院、中科大等知名院校,已发表AI顶级论文200余篇,多次获得全球权威AI比赛世界冠军。这支技术实力雄厚的团队为“视界一粟 YiSu”的研发提供了坚实的保障。
“视界一粟 YiSu”的发布标志着我国在视频生成大模型技术领域的又一重要突破。随着模型的不断迭代和优化,这项技术将在多种应用场景中展现出广阔的前景,推动视频生成技术的发展。