通信世界网消息(CWW)7月30日上午,生数科技宣布旗下AI视频生成工具Vidu全球上线,可在Web端www.vidu.studio访问,最快推理速度为30秒。
今年4月,清华大学人工智能研究院副院长、生数科技首席科学家朱军在2024年2024年中关村论坛上发布了Vidu。生数科技称,该模型生成视频时长最长为16秒,全面对标Sora。
据悉,Vidu模型采用了团队原创的Diffusion与Transformer融合的架构U-ViT,支持一键生成长达16秒、分辨率高达1080P的高清视频内容。
性能方面,Vidu不仅能够模拟真实物理世界,生成细节复杂且符合真实物理规律的场景,如合理的光影效果和细腻的人物表情,还拥有丰富的想象力,能够创造出具有深度和复杂性的超现实主义内容。此外,Vidu能够生成复杂的动态镜头,实现远景、近景、中景、特写等不同镜头的切换,不再局限于简单的固定镜头。特别值得一提的是,Vidu能够理解并生成熊猫、龙等特有的中国元素,展现了对中国传统文化的深刻理解。