再见photoshop?此AI允许您从提示中编辑照片

再见photoshop? Google刚刚推出了一个新的AI,能够根据简单的人声请求修改您的图像。不再花时间掌握复杂软件,您只需要要求AI向祖母加帽子,或者将客厅转变为热带丛林。

学分:123rf

Google刚刚改善双子座2.0闪光灯,一个模型,能够像创建文本一样轻松地生成和编辑图像。 Google AI上的新颖性直接适合聊天机器人界面,有望使图像的版本民主化,并使我们与摄影修饰的关系感到不安。

Gemini 2.0 Flash于上周启动,现在通过Google AI Studio访问所有人,由它在同一AI模型中处理文本和图像的能力。这种多模式的方法标志着现有解决方案的突破,该解决方案通常要求使用文本和图像的不同模型。

- 双子座现在可以为您阅读YouTube视频,以下是它的工作原理

Gemini 2.0 Flash希望比以前更具通用性

Gemini 2.0 Flash在照片编辑方面的功能大而多样:

  • 在图像中添加或删除对象
  • 套装和照明的修改
  • 视角
  • 缩放前后
  • 去除菲格兰人(尽管这会影响图像质量)

根据Google的说法,由于对大量数据组合图像和文本进行培训。因此,该模型对视觉和文本概念有深入的了解,从而使其可以直接生成图像,以响应用户请求。

Google的方法从其他技术巨头(例如OpenAI)中脱颖而出,该巨头使用了不同的文本模型(CHATGPT)和Image(DALL-E)。从技术角度来看,您可以想象,文本和图像的同时处理在计算资源中非常贪婪。这部分解释了为什么Gemini 2.0 Flash产生的图像的质量尚未达到Dall-E等专业模型的质量。

坏消息是,从道德上讲,这些多模型可以处理图像的容易性引起了合理的担忧。创建令人信服的深击或为恶意目的处理照片可能会变得更加简单,这在虚假信息和隐私保护方面构成了新的挑战。


问我们的最后一个!

  • Google想省钱,人工智能花费太多

    Google具有设计自己的AI芯片的野心,以减少其对Broadcom和Nvidia的依赖。为此,设想与Mediatek建立合作伙伴关系。 Google迅速将自己确立为人工智能的领导者之一。但是训练...

    ia

  • 这些电动摩托车很快可能会被禁止

    在争议的核心中发现了某种类型的电摩托车。这些汽车快速而沉默,将越来越多地参与犯罪,包括飞行。面对他们日益普及的当局正在寻找...

    自行车和摩托车