Sora是一款人工智能视频生成工具。就像Dall-E或Midjourney,只不过是为了运动。
Open AI于2024年2月首次预览了该软件,并最终向公众发布。到目前为止,只有少数人能够进入苍井空。
坏消息是:它还没有在英国上市。
除了英国、瑞士和欧洲经济区以外,用户可以在ChatGPT可用的任何地方访问Sora。我们正在努力在未来几个月进一步扩大访问范围,”开放AI博客写道。
这也不是我们在2月份看到的Sora版本,也不是你今年早些时候在网上看到的许多Sora生成视频示例的模型。Sora Turbo是一款新车型,比原来的Sora“快得多”。
这意味着Sora Turbo需要更少的处理器时间来生成视频,使其更适合广泛发布。那些在英国以外订阅ChatGPT Plus或Pro的用户可以使用Sora来生成长达20秒的视频。
Sora是OpenAI公司开发的一种新的人工智能扩散模型,该公司已成为现代人工智能领域的典型代表。
这些类型的软件可以创建与它们所训练的数据非常相似的新内容。以Sora为例,AI可以根据你输入的指令制作长达一分钟的超现实视频。它还可以延长视频,使其更长。
人工智能扩散模型是生成式人工智能的另一种形式。它们的工作原理是通过将图像变成难以区分的像素来“破坏”图像,然后颠倒这个过程来创建一个连贯的图像。一种看待它的方式是,人工智能正在揉皱并抚平一张上面有涂鸦的纸。
一旦经过训练,扩散模型就可以在用户的指导下从数据块中制作出非常详细的视觉效果。
用OpenAI的话说:“Sora能够生成具有多个角色、特定运动类型以及准确的主题和背景细节的复杂场景。
“这个模型不仅能理解用户在提示中提出的要求,还能理解这些东西在现实世界中的存在方式。”
至少可以说,结果令人瞠目结舌。为了展示Sora的能力,OpenAI分享了一系列逼真的演示视频,包括人类和动物在运动的场景,一辆汽车在土路上的跟踪镜头,淘金热时期的加利福尼亚镜头,培养皿中的CGI小熊猫,以及艺术画廊的内部。
与其他人工智能图像一样,仔细观察你可能会发现一些错误,比如一只多了一只爪子的猫,或者一张漂浮的椅子,让你觉得自己在看一个故障的电子游戏。
OpenAI表示,Sora是在可变持续时间、分辨率和长宽比的数据上进行训练的,它声称这可以更准确地反映现实。
与此同时,人工智能专家认为它可能已经连接到虚幻引擎5,这是一款旨在构建交互式3D体验的视频游戏引擎。这个巨大的工具箱提供了核心元素,从物理到逼真的灯光和声音设计,为开发者创造更逼真的游戏。
更广泛地说,OpenAI认为像Sora这样的视频生成模型提供了“构建物理世界通用模拟器的途径”。
我们随时都在等莫斐斯的电话。
ChatGPT Plus和ChatGPT Pro的用户可以使用Sora,但在英国和欧洲还没有。
此外,用户还可以创建多达50个分辨率为480p(旧DVD格式的分辨率)的视频。或者在720p分辨率下“更少”。这些片段最长可达20秒。
ChatGPT Pro的用户将获得“10倍的使用率”,更高的分辨率选项和更长的剪辑运行时间,但Open AI表示,Sora的全部潜力将在2025年得到充实,“为不同类型的用户量身定制定价”。
不难想象,在用他们的作品污染互联网之前,想要成为人工智能电影制作人的人计划在苍井空上狠下功夫。
与其他人工智能工具一样,OpenAI表示,它将禁止违反其内容指南的视频,包括包含极端暴力、性内容、仇恨图像、名人肖像或他人知识产权的视频。
目前,OpenAI正在预览它的研究,让公众对即将到来的东西有所了解。或者,它正在寻求收回最近被竞争对手人工智能产品所失去的一些炒作,包括ChatGPT的竞争对手谷歌Gemini和同行视频生成器Pika。
当Sora最终问世时,我们认为访问可能会受到限制,就像OpenAI的图像生成器Dall-E一样。所以,你可以免费制作一些视频,然后为额外的片段付费。
然而,鉴于人工智能的耗电量巨大,OpenAI可以选择将Sora作为ChatGPT Plus用户的高级功能。