OpenAI 推出 Sora,一种可以生成超逼真视频的人工智能

ChatGPT 的创建者 OpenAI 刚刚发布了一种引人注目的新型生成视频模型,名为 Sora,它可以将简短的文本描述转换为详细的视频剪辑。以下是我们对他的了解。

虽然谷歌刚刚发布了新的 Gemini 1.5 AI,但 OpenAI 立即推出了其首款功能强大的工具 Sora 进行反击将文本转换为视频d'最长持续时间为一分钟。Sora 不仅仅是数字工具箱中的另一个应用程序,而且似乎是创作者和公众未来的象征。

事实上,我们离提出的结果还很远Runway AI,另一种能够生成视频的技术几秒钟的相当模糊、断断续续、扭曲,有时甚至令人不安。

OpenAI 将其新系统命名为 Sora,日语单词的意思是“夏尔”。据报道,该技术背后的团队,包括研究人员蒂姆·布鲁克斯和比尔·皮布尔斯,选择这个名字是因为“唤起无限创造潜力的想法»。

OpenAI 分享了一些由其新人工智能生成的视频片段,至少可以说,结果是惊人的。在其中一张上,我们可以读到以下请求:“美丽的雪城东京正如火如荼地进行着。镜头沿着繁忙的城市街道移动,跟随几个人享受美丽的雪天并在附近的摊位购物。美丽的樱花花瓣随着雪花在风中飞舞”。根据要求,生成的视频发生在东京的街道上,并清楚地表明:Sora 学会了物体如何在 3D 中组合在一起。然后镜头深入场景,跟踪一对夫妇走过一排商店。

OpenAI 工具的视频比其他现有工具提供的视频更有说服力,即使我们有时仍然会注意到一些小缺陷。在其中一张照片上,我们看到一名妇女在街上行走,我们注意到例如在一些图像中,他的腿没有正确跟随运动。

另请阅读OpenAI 真的想用正在开发的新搜索引擎杀死 Google

Sora 尚未向所有人开放

目前,Sora 仍处于开发阶段,因此尚未向公众开放。然而,OpenAI 已经与某些学者和其他研究人员共享了该工具,他们将把它提交给“红队”。这是一小群人,他们负责研究滥用它的所有方法,目的是了解此类技术所带来的危险。

可以肯定的是,OpenAI 必须找到一种方法来确保他们的视频不被用于传播错误信息,因为我们认为有些人可能会喜欢制作可能引起争议的虚假视频。本月早些时候,OpenAI 宣布在其 DALL-E 3 文本到图像转换工具中添加水印,但表示它们可以“轻松删除”。因此,我们希望该公司正在研究一种新方法,以确保其假视频易于识别。

OpenAI 还提供对精选视觉艺术家、设计师和电影制作人的反馈。她指出,现有模型可能无法准确模拟复杂场景的物理原理,并且可能无法正确解释某些因果关系的情况,这就是为什么该技术在得到更广泛应用之前仍需成熟。


询问我们最新的!

  • 最佳智能手机:2024 年该购买哪种型号?

    2024 年最好的智能手机是什么?有几种型号正在竞争中,完全值得在我们的选择中占有一席之地。想要让一款智能手机脱颖而出非常困难,因为需要考虑很多标准。系统、电源、...

    智能手机购买指南