可灵视频 O1 模型上线,实现多模态视频生成一体化
可灵 AI 今日推出全球首个统一多模态视频模型——可灵视频 O1,整合视频生成、编辑与理解功能于单一引擎。新模型支持图片、文字、视频等多模态输入,可执行文生视频、视频内容增删、风格重绘及镜头延展等多项任务,用户仅需输入指令即可完成复杂创作。
据官方介绍,O1 模型采用 Multimodal Transformer 与多模态长上下文技术,并引入 Multi-modal Visual Language(MVL)实现更深层的语义融合。内部评测显示,O1 在视频生成效果上领先 Google Veo 3.1 与 Runway Aleph。
可灵 AI
🍀在花频道 🍵茶馆 📮投稿新鲜事
可灵 AI 今日推出全球首个统一多模态视频模型——可灵视频 O1,整合视频生成、编辑与理解功能于单一引擎。新模型支持图片、文字、视频等多模态输入,可执行文生视频、视频内容增删、风格重绘及镜头延展等多项任务,用户仅需输入指令即可完成复杂创作。
据官方介绍,O1 模型采用 Multimodal Transformer 与多模态长上下文技术,并引入 Multi-modal Visual Language(MVL)实现更深层的语义融合。内部评测显示,O1 在视频生成效果上领先 Google Veo 3.1 与 Runway Aleph。
可灵 AI
🍀在花频道 🍵茶馆 📮投稿新鲜事