蘋果新人工智慧可以根據自然語言句子修改圖像

蘋果推出的AI模型MGIE有望透過解釋文字指令來改變圖像編輯,標誌著企業AI輔助創意的重大突破。

資料來源:arxiv

人工智慧在領域的發展圖片創作已經實現了重要的里程碑,尤其是 Microsoft 的 Bing Image Creator,為使用者提供生成圖像的能力文字描述。這項創新,還有隨後速度和效率的提高,證明公司在使用上的快速進步人工智慧為了創意應用程式

微軟最近超越了蘋果就估值而言,主要得益於其在人工智慧領域的承諾和重大進展,這一點可以從ChatGPT-4 和 Copilot Pro 的成功。在此背景下,MGIE d'Apple此舉是為了保持其在人工智慧領域的競爭力而做出的戰略反應。

蘋果推出新的人工智慧影像編輯模型

這是蘋果與加州大學聖塔芭芭拉分校研究人員合作的成果。MGIE(MLLM-Guided Image Editing)因其理解和執行能力而脫穎而出文字命令用於像素級的精確操作。這種轉換文字指令的能力簡單或模稜兩可明確而精確的指令開啟了新的可能性直覺的圖像編輯。該模型在 ICLR 2024 會議上提出,展示了卓越的效率。它提供了經過用戶認可的準確結果,同時工作很快並且不浪費資源。

MGIE 因其實現目標的能力而脫穎而出廣泛的修改影像,範圍從簡單的顏色調整到複雜的物件變換。該模板還可以全域優化照片並允許針對性的修飾關於特定領域。它擅長裁剪、調整大小、旋轉影像以及調整亮度、對比度和色彩平衡,所有這些都來自簡單的文字提示。該程式以開源形式提供,可透過 GitHub 輕鬆訪問,並提供演示筆記本和 Web 演示等其他資源,網址為擁抱臉部空間,方便用於各種編輯應用程式。

來源 :arxiv