去年六月,苹果提出了苹果情报(Apple Intelligence)的面纱,即AI的新型愿景。这场革命尤其是使iOS的声乐助理Siri和Chatgpt的整合以寻求更相关的响应。 WWDC 2024的有吸引力的示威活动充满了强烈的期望。
但是,去年八月,您已经可以通过Apple Intelligence发现新Siri的第一印象。 iOS 18.1的Beta版本终于允许开发人员测试WWDC 2024年期间提出的这一主要开发项目。当时,记者9to5mac Fernando Silva已经共享关于声乐助理表现有限的混合观察。
不幸的是,这首先是对失望的味道。最近几天进行的更高级测试表明,令人担忧的情况更加令人担忧。新的Siri确实确实退缩了在其操作的某些关键方面。
灾难性的结果
美国程序员兼博客作者约翰·格鲁伯(John Gruber)是大胆的火球网站的创建者,也是Markdown Language的共同创建者,与朋友一起,刚刚将声乐苹果助理纳入了测试。超级碗结果的测试是最终的!
在58个问题简单放置在Siri,只有20个响应是正确的。CE66%的错误率更令人不安的是,在同一测试中,其他助手(例如Chatgpt或Duckduckgo)表现出完美的分数。
更有问题的是,新的Siri有时会完全幻想答案。例如,助手在费城的老鹰队赢得了33场胜利,而球队在所有历史上只有一个。一个特别令人不安的近端趋势。
难以理解的回归
约翰·格鲁伯(John Gruber)声称,没有苹果情报局的前西里(Siri)在尖锐的问题上自相矛盾。面对一个关于当地体育成绩的复杂质疑,他只是承认他不知道答案,并为您提供了相关的链接。
最令人惊讶的是,Chatgpt,但通过Apple Intelligence集成了Siri,在直接使用时会系统地提供正确的答案。这种性能的降级对两个系统之间的整合质量产生了疑问。
这些Siri失败让人联想到Apple Intelligence的另一个功能已经引起争议。