在与ChatGPT甚至Midjourney和Dall-E的AI竞赛中措手不及,谷歌在这场激烈的竞争中努力追赶。在 Gemini 令人印象深刻的演示之后,山景公司刚刚推出了 Lumière,一款绝对令人惊叹的视频生成人工智能。
在科技巨头目前领先的人工智能竞赛中,谷歌有些落后。假设山景城公司并没有真正预见到 ChatGPT 现象的到来,以及随后基于人工智能的消费工具(如 Dall-E 或 Midjourney)的爆炸式增长。
无论如何,Alphabet 子公司一直在努力重返市场,首先是Bard,它的对话式人工智能。但在 2023 年 12 月,谷歌推出 Gemini 重磅出击,一种全新的人工智能,其效率明显高于其主要竞争对手:聊天GPT。让我们指出,双子座已经融入Pixel 8 Pro,至少在美国。在欧洲,GDPR 放慢了这一进程。
谷歌推出 Lumière,其绝对令人难以置信的视频生成人工智能
但谷歌并不打算就此止步,恰恰相反。事实上,这家网络巨头刚刚透露Lumière,一个致力于视频生成的人工智能。这是比生成图像更加艰巨和复杂的任务。有充分的理由,要从头开始生成视频,人工智能必须考虑多种因素,例如移动或与装饰可能的互动(碰撞、困难地形等)。
还需要实现一种相对流畅的顺序,其中动作彼此连贯地进行。要做到这一点,而不是像卡通那样组合一系列图像,Lumière 通过对物体及其运动的同步管理,从头到尾创建了视频。“U-Net 时空架构通过模型的单次传递一次性生成视频的整个时间持续时间。这与现有的视频模型形成鲜明对比,现有的视频模型合成遥远的关键帧,然后进行时间超分辨率,这种方法本质上使整体时间连贯性变得困难。”解释该项目背后的研究人员。
为了让我们了解光的能力,科学家 Hila Chefer 分享了一些摘录和演示X。具体来说,Lumière 可以生成清晰度约为 5 秒的视频1024 x 1024 像素。为此,它可以基于文本命令行,也可以基于图像。它还可以为静态图像的某些部分添加动画(例如我们在上面的视频中看到的机车冒出的烟雾)。无论如何,潜力是存在的,而且结果已经令人印象深刻。目前,Lumière 仍处于项目阶段,谷歌尚未透露其计划。
询问我们最新的!
2024 年最好的智能手机是什么?有几种型号正在竞争中,完全值得在我们的选择中占有一席之地。想要让一款智能手机脱颖而出非常困难,因为需要考虑很多标准。系统、电源、...
智能手机购买指南