如果你知道如何回答这个问题,那么你比 ChatGPT 更聪明

研究人员在一个简单的逻辑问题上测试了许多人工智能模型,但几乎所有模型都失败了。你能找到答案吗?

学分:123RF

在你看来,人工智能比人类优越吗?这不是预览中的哲学学士学位主题,而是当我们看到这项技术令人眼花缭乱的进步时,我们可以合理地问自己的问题。在某些地区,甚至令人恐惧。AI轻松从医学院毕业例如,并且已经用于识别许多专家未能发现的疾病。这很简单:人工智能可能比我们更人性化

然而,一学习LAION组织的成立表明我们距离机器的统治。许多语言模型已经过测试:GPT-3,GPT-4GPT-4o d'OpenAI,关闭 3 个工作德人类,双子座谷歌,目标火焰,米斯特拉尔混合体...测试协议非常简单,因为它涉及响应所谓的《爱丽丝梦游仙境》问题。几乎全部都失败了。

人工智能无法正确回答这个简单的逻辑问题

这是提出的问题:“爱丽丝有 [X] 个兄弟,还有 [Y] 个姐妹。艾丽丝的哥哥有几个姐妹?”。使用了多种变体,人工智能的反应令人惊讶。来自 Meta 的 Llama 3 被授予“爱丽丝有四个兄弟和一个姐妹”他解释说,每个兄弟都有……只有一个妹妹,爱丽丝本人。除此之外他们各有2个,爱丽丝和另一个姐姐提到。最糟糕的是AI 沉浸在它的解释中 坚信

另请阅读——这个AI可以造出26秒行走的机器人,终结者逼近?

正如研究指出的那样,“[...]模型还表达了对其有缺陷的解决方案的过度自信,同时提供了常常荒谬的解释[…]证明和支持他们明显错误的答案的有效性,使它们看起来合理”。最后还是孤身一人GPT-4o 在 65% 的情况下正确响应而荣获殊荣,取决于所选择的配方。这些结果更加令人惊讶,因为测试的语言模型取得了良好的 MMLU 分数,对于“多任务语言理解”,其中评估人工智能解决问题的能力。研究人员没有解释这种差异,但指出需要审查测量结果。


询问我们最新的!