清华大学联合生数科技最近推出了中国首个创新视频大模型Vidu,这一全新的AI技术已经成为业界焦点。Vidu模型整合了Diffusion和Transformer技术的U-ViT架构,能够一键生成高达1080P分辨率、长达16秒的清晰视频内容,其画质与国际上的Sora模型相媲美。
业界专家认为,AI技术在数字化时代中扮演着越来越重要的角色,并持续推动科技创新。Vidu模型的问世不仅标志着人工智能进入了一个新的发展阶段,还体现了该模型在模拟真实世界和展现丰富想象力方面的突破。Vidu具备优越的多镜头生成能力和高时空一致性,是继Sora之后全球首个在视频大模型领域取得重大突破的AI技术,与国际顶尖水平齐头并进。
展望未来,Vidu将支持生成更加多样和更长时长的视频内容,其灵活的架构也适应更多的模态,推动多模态通用能力的持续扩展。