可灵视频 O1 模型上线，实现多模态视频生成一体化可灵 AI 今日推出全球首个统一多模态视频模型——可灵视频 O1，整合视频生成、编辑与理解功能于单一引擎

可灵视频 O1 模型上线，实现多模态视频生成一体化

可灵 AI 今日推出全球首个统一多模态视频模型——可灵视频 O1，整合视频生成、编辑与理解功能于单一引擎。新模型支持图片、文字、视频等多模态输入，可执行文生视频、视频内容增删、风格重绘及镜头延展等多项任务，用户仅需输入指令即可完成复杂创作。

据官方介绍，O1 模型采用 Multimodal Transformer 与多模态长上下文技术，并引入 Multi-modal Visual Language（MVL）实现更深层的语义融合。内部评测显示，O1 在视频生成效果上领先 Google Veo 3.1 与 Runway Aleph。

可灵 AI

🍀在花频道 🍵茶馆 📮投稿新鲜事