埃隆·马斯克(Elon Musk)的人工智能看到,说话和理解...但尚未在所有智能手机上

XAI开发的人工智能Grok越过了新的帽子。助手现在可以实时分析手机的相机看到什么。这还不是全部:它也变得多语言和更具互动性。

学分:123rf

几个月来大公司技术加速人工智能。与Chatgpt一起Openai,Google与Gemini,现在xai格罗克乘以公告。这些助手不再满足于回答问题。他们从新容量:看,说话,听,退缩。目标很明确:创建能够与现实世界实时互动的助手

最新的发展,Grok现在可以“查看”什么拍摄智能手机的相机。受洗Grok Vision,此功能使您可以分析对象,文档或实时场景,以立即回答您的问题。该选项可在L'Application iOS,但尚未在Android上。它在各种元素上工作:街头面板,名片,​​产品,包装或印刷文本。例如,这可以解释符号的含义,帮助您翻译海报或识别存储中的对象。

Grok成为视觉,发声和多语言,并具有新的交互功能

除了愿景,xai部署新的人声功能。 Grok现在明白了几种语言可以回答,有点像Gemini Live或模式人声de chatgpt。这种声音互动还可以简单地通过讲话。这些新功能可通过Supergrok计划除了Grok Vision,所有iOS用户仍然免费,每月收取45.60欧元的收费。

格罗克还集成了内存,能够保留与用户提供的过去交流更多个性化的答案。 “工作室”功能还允许您通过语音或Visual命令生成文档或应用程序。随着这些添加,Xai试图将自己定位为占主导地位的混凝土替代品。真实的时间愿景与流体互动相结合,使后者更接近真正的智能助手,能够理解上下文,对象和语言。

在语音模式下引入Grok Vision,多语言音频和实时搜索。现在可用。

格罗克说西班牙语
格罗克说法语
戈说土耳其语
Groku会说日语
格雷斯说印地语pic.twitter.com/lcasyty2n5

-Ebby Amir(@ebbyamir)2025年4月22日