OpenAI Sora
产品简介
Sora是OpenAI开发的一款文生视频(text-to-video)模型,能够根据文本指令生成长达60秒的视频。这些视频不仅包含高度细致的背景和复杂的多角度镜头,还能展现富有情感的多个角色。Sora的目标是让AI理解并模拟物理世界中的运动,以帮助解决需要真实世界互动的问题。
功能与特点
视频生成能力:Sora能够生成最长达一分钟的视频,这些视频在视觉质量和对用户提示的遵循方面都保持了高标准。
复杂场景生成:Sora能够生成包含高度详细的场景、复杂的摄像机运动以及充满活力的情感的多个角色的视频。
技术架构:Sora采用了扩散模型和Transformer架构,这使得它能够在不同的时长、分辨率和宽高比的视频及图像上进行训练。
三维空间连贯性:Sora生成的视频具有动态相机运动,人物和场景元素在三维空间中保持连贯的运动。
模拟数字世界:Sora能够模拟人工过程,如视频游戏中的场景和动态。
长期连续性和物体持久性:Sora能够有效地模拟短期和长期的依赖关系,确保视频中同一角色的外观在整个视频中一致。
https://openai.com/sora/