如果你知道如何回答这个问题，那么你比 ChatGPT 更聪明

研究人员在一个简单的逻辑问题上测试了许多人工智能模型，但几乎所有模型都失败了。你能找到答案吗？

在你看来，人工智能比人类优越吗？这不是预览中的哲学学士学位主题，而是当我们看到这项技术令人眼花缭乱的进步时，我们可以合理地问自己的问题。在某些地区，甚至令人恐惧。AI轻松从医学院毕业例如，并且已经用于识别许多专家未能发现的疾病。这很简单：人工智能可能比我们更人性化。

然而，一学习LAION组织的成立表明我们距离机器的统治。许多语言模型已经过测试：GPT-3,GPT-4等GPT-4o d'OpenAI,关闭 3 个工作德人类，双子座谷歌,目标火焰,米斯特拉尔混合体...测试协议非常简单，因为它涉及响应所谓的《爱丽丝梦游仙境》问题。几乎全部都失败了。

人工智能无法正确回答这个简单的逻辑问题

这是提出的问题：“爱丽丝有 [X] 个兄弟，还有 [Y] 个姐妹。艾丽丝的哥哥有几个姐妹？”。使用了多种变体，人工智能的反应令人惊讶。来自 Meta 的 Llama 3 被授予“爱丽丝有四个兄弟和一个姐妹”他解释说，每个兄弟都有……只有一个妹妹，爱丽丝本人。除此之外他们各有2个，爱丽丝和另一个姐姐提到。最糟糕的是AI 沉浸在它的解释中 坚信。

另请阅读——这个AI可以造出26秒行走的机器人，终结者逼近？

正如研究指出的那样，“[...]模型还表达了对其有缺陷的解决方案的过度自信，同时提供了常常荒谬的解释[…]证明和支持他们明显错误的答案的有效性，使它们看起来合理”。最后还是孤身一人GPT-4o 在 65% 的情况下正确响应而荣获殊荣，取决于所选择的配方。这些结果更加令人惊讶，因为测试的语言模型取得了良好的 MMLU 分数，对于“多任务语言理解”，其中评估人工智能解决问题的能力。研究人员没有解释这种差异，但指出需要审查测量结果。

询问我们最新的！