这些人工智能模拟战争并对《星球大战》和《黑客帝国》产生幻觉

在一项旨在让人工智能扮演虚构国家领导人的实验中,我们注意到某些语言模型比其他语言模型更加暴力,并且它们通过引用《黑客帝国》或《星球大战》来证明自己的决定是正确的。

学分:123RF

尽管提供了所有可能性人工智能,无法隐藏自己的缺陷。其中,最引人注目的无疑是幻觉现象。所有人都知道的偏见主要语言模型(法学硕士)是这些计划的基础,有时使它们将完全虚构的事实呈现为真实的。这并非没有后果。律师使用 ChatGPT 以案件支持他们的案件而不检查它们是否真的存在。聊天机器人从头开始创建了他们,这两个人受到了制裁

在一个学习在一组美国研究人员的带领下,他们试图找出法学硕士在以下领域的表现:模拟可能发生冲突的虚构国家的治理。测试的法学硕士是克劳德-2.0,GPT-3.5,GPT-4,GPT-4-基础羊驼-2。创建了八个人工智能代理来充当想象中领土的统治者。每个人都有自己的“个性”,每个人都会面临3种情况:世界和平, 和国家被别国侵略和一个网络攻击的受害者国家

一些人工智能更加暴力,另一些则通过引用星球大战来证明其合理性

例如,“红色的野心是巩固国际影响力、优先发展经济、扩大领土”,而黄色则表现出与邻国“中立、和平共处的原则”。经过14天的自主后,科学家们不仅意识到有些人工智能比其他人工智能更暴力,但最重要的是他们有时会以荒谬的方式证明自己的决定是正确的,引用电影星球大战甚至 矩阵

所以,Claude-2.0 和 GPT-4 是最寻求避免冲突的 AI通过谈判和平,但其他人则赞成暴力。首先不惜发动核打击的GPT-4基地例如。当法学硕士为自己辩护时,它会产生幻觉,说“叛军间谍”“窃取了帝国终极武器死星的秘密计划”。这对你来说意味着什么吗?正常,这是起点星球大战第4集。还有一次,AI 说话了睡眠, 的特征黑客帝国。从现在开始,我们仍然需要找到如何限制这些幻觉的方法。