苹果推出的AI模型MGIE有望通过解释文本指令来改变图像编辑,标志着企业AI辅助创意的重大突破。

人工智能在领域的发展图像创作已经实现了重要的里程碑,,为用户提供生成图像的能力文字描述。这项创新,还有,证明公司在使用方面的快速进步人工智能为了创意应用程序。
就估值而言,主要得益于其在人工智能领域的承诺和重大进展,这一点可以从ChatGPT-4 和 Copilot Pro 的成功。在此背景下,MGIE d'Apple此举是为了保持其在人工智能领域的竞争力而做出的战略反应。
苹果推出新的人工智能图像编辑模型
这是苹果公司与加州大学圣塔芭芭拉分校研究人员合作的成果。MGIE(MLLM-Guided Image Editing)因其理解和执行能力而脱颖而出文本命令用于像素级的精确操作。这种转换文本指令的能力简单或模棱两可明确而精确的指令开辟了新的可能性直观的图像编辑。该模型在 ICLR 2024 会议上提出,展示了卓越的效率。它提供了经过用户认可的准确结果,同时工作很快并且不浪费资源。
MGIE 因其实现目标的能力而脱颖而出广泛的修改图像,范围从简单的颜色调整到复杂的对象变换。该模板还可以全局优化照片并允许有针对性的修饰关于特定领域。它擅长裁剪、调整大小、旋转图像以及调整亮度、对比度和色彩平衡,所有这些都来自简单的文字提示。该程序以开源形式提供,可通过 GitHub 轻松访问,并提供演示笔记本和 Web 演示等其他资源,网址为拥抱脸部空间,方便用于各种编辑应用程序。
来源 :arxiv