再见photoshop? Google刚刚推出了一个新的AI,能够根据简单的人声请求修改您的图像。不再花时间掌握复杂软件,您只需要要求AI向祖母加帽子,或者将客厅转变为热带丛林。

Google刚刚改善双子座2.0闪光灯,一个模型,能够像创建文本一样轻松地生成和编辑图像。 Google AI上的新颖性直接适合聊天机器人界面,有望使图像的版本民主化,并使我们与摄影修饰的关系感到不安。
Gemini 2.0 Flash于上周启动,现在通过Google AI Studio访问所有人,由它在同一AI模型中处理文本和图像的能力。这种多模式的方法标志着现有解决方案的突破,该解决方案通常要求使用文本和图像的不同模型。
读- 双子座现在可以为您阅读YouTube视频,以下是它的工作原理
Gemini 2.0 Flash希望比以前更具通用性
Gemini 2.0 Flash在照片编辑方面的功能大而多样:
- 在图像中添加或删除对象
- 套装和照明的修改
- 视角
- 缩放前后
- 去除菲格兰人(尽管这会影响图像质量)
根据Google的说法,由于对大量数据组合图像和文本进行培训。因此,该模型对视觉和文本概念有深入的了解,从而使其可以直接生成图像,以响应用户请求。
Google的方法从其他技术巨头(例如OpenAI)中脱颖而出,该巨头使用了不同的文本模型(CHATGPT)和Image(DALL-E)。从技术角度来看,您可以想象,文本和图像的同时处理在计算资源中非常贪婪。这部分解释了为什么Gemini 2.0 Flash产生的图像的质量尚未达到Dall-E等专业模型的质量。
坏消息是,从道德上讲,这些多模型可以处理图像的容易性引起了合理的担忧。创建令人信服的深击或为恶意目的处理照片可能会变得更加简单,这在虚假信息和隐私保护方面构成了新的挑战。
问我们的最后一个!
Google具有设计自己的AI芯片的野心,以减少其对Broadcom和Nvidia的依赖。为此,设想与Mediatek建立合作伙伴关系。 Google迅速将自己确立为人工智能的领导者之一。但是训练...
ia