
2024年2月16日,OpenAI发布首款文生视频大模型Sora,可以快速生成60秒、准确反映用户提示的视频,在多镜头一致性等维度表现出色。
国信计算机观点:1)OpenAI发布首款文生视频大模型Sora,可以快速生成60秒、准确反映用户提示的视频,其在视频长度、多角度视频一致性、物理世界理解等领域具有优势;2)Sora技术原理:通过已知Patches推测下一Patches,将Transformer和Diffusion相结合;3)多模态大模型拉动训练算力需求提升。4)投资建议:多模态大模型拉动全球算力需求快速增长,关注国产AI算力侧机会,建议关注国产AI算力龙头公司海光信息。5)风险提示:宏观经济复苏不及预期,云厂商资本开支不及预期,市场竞争加剧,产品研发不及预期,国产AI算力芯片导入不及预期等。
2024年2月16日,OpenAI发布首款文生视频大模型Sora,可以快速生成60秒、准确反映用户提示的视频,其具有60秒超长长度、多角度视频一致性、对物理世界理解等特性。
Sora可生成60秒超长视频。相较于RunwayMLGen-2、Pika等文生视频大模型,Sora可以生成60秒一镜到底的视频,视频逻辑顺畅、主人物及背景的行人均非常稳定,文生视频大模型能力进一步提升。
Sore多角度视频一致性。Sore可以在单个生成视频中创建多个镜头,以准确保留角色和视觉风格。根据OpenAI官网发布的Demo,59秒的视频中,有多角度镜头,且主人物保持了完美的一致性。