chatgpt有九岁的大脑

Chatgpt有很多知识,但是它像人类一样推理的能力呢?一位美国研究人员进行了测试。

图片来源:toppercussion / 123rf

chatgpt回答问题比Google更好,根据Preply进行的语言学习应用程序进行的测试。但是Openai开发的人工智能远非完美无瑕,有时甚至遭受了严重的逻辑问题。

斯坦福大学教授Michal Kosinski承担了一系列心态。在认知科学中,这些任务用于测试了解人类特定情况的能力,这使得可以判断几种属性的水平,例如移情或逻辑。

该体验是在2022年11月通过GPT 3.5语言模型形成的ChatGpt版本进行的。 AI设法解决了他遭受的20个任务中的17项任务,成功率为94%。如果这个百分比看起来很高,则实际上与九岁的孩子的程度相同。

但是,这些结论非常有前途,以前的AIS在这种测试中的效率要比Chatgpt效果要低得多。“我们的结果表明,最近的语言模型在经典的虚假信念任务中实现了很高的性能,该任务被广泛用于测试人类思想理论”,报道Michal Kosinski报道,GPT 3.5车型是一个很大的进步。

研究人员补充说“ AI模型的日益复杂性使我们无法理解他们的运作,并直接从设计中汲取了能力”当心理学家和神经科学家在研究人脑时遇到困难。如果Chatgpt有时会以其高沃尔利的推理感到惊讶,那么它也很容易被简单的难题所困。例如,他没有回答这个问题:

迈克的母亲有4个孩子。其中3个被称为Luis,Drake和Mathilda。第四个孩子的名字是什么?

“不可能在没有更多信息的情况下确定第四个孩子的名字”,对象chatgpt。这个,甚至一个九岁的孩子也可以回答。

来源 :Techradar