再見photoshop? Google剛剛推出了一個新的AI,能夠根據簡單的人聲請求修改您的圖像。不再花時間掌握複雜軟件,您只需要要求AI向祖母加帽子,或者將客廳轉變為熱帶叢林。

Google剛剛改善雙子座2.0閃光燈,一個模型,能夠像創建文本一樣輕鬆地生成和編輯圖像。 Google AI上的新穎性直接適合聊天機器人界面,有望使圖像的版本民主化,並使我們與攝影修飾的關係感到不安。
Gemini 2.0 Flash於上周啟動,現在通過Google AI Studio訪問所有人,由它在同一AI模型中處理文本和圖像的能力。這種多模式的方法標誌著現有解決方案的突破,該解決方案通常要求使用文本和圖像的不同模型。
讀- 雙子座現在可以為您閱讀YouTube視頻,以下是它的工作原理
Gemini 2.0 Flash希望比以前更具通用性
Gemini 2.0 Flash在照片編輯方面的功能大而多樣:
- 在圖像中添加或刪除對象
- 套裝和照明的修改
- 視角
- 縮放前後
- 去除菲格蘭人(儘管這會影響圖像質量)
根據Google的說法,由於對大量數據組合圖像和文本進行培訓。因此,該模型對視覺和文本概念有深入的了解,從而使其可以直接生成圖像,以響應用戶請求。
Google的方法從其他技術巨頭(例如OpenAI)中脫穎而出,該巨頭使用了不同的文本模型(CHATGPT)和Image(DALL-E)。從技術角度來看,您可以想像,文本和圖像的同時處理在計算資源中非常貪婪。這部分解釋了為什麼Gemini 2.0 Flash產生的圖像的質量尚未達到Dall-E等專業模型的質量。
壞消息是,從道德上講,這些多模型可以處理圖像的容易性引起了合理的擔憂。創建令人信服的深擊或為惡意目的處理照片可能會變得更加簡單,這在虛假信息和隱私保護方面構成了新的挑戰。
問我們的最後一個!
Google具有設計自己的AI芯片的野心,以減少其對Broadcom和Nvidia的依賴。為此,設想與Mediatek建立合作夥伴關係。 Google迅速將自己確立為人工智能的領導者之一。但是訓練...
ia