这种新方法允许像DeepSeek这样的AI无需审查就可以做出响应

保持对人工智能反应的控制仍然很困难。一家美国公司声称已经找到了一种简单的方法来规避某些模型的审查制度。该解决方案可以改变在敏感部门中使用AI的方式。

学分:123rf

L'人工智能东方越来越多地使用自Chatgpt到来以来的所有领域。但是在他的才能后面问题坚持:一些模型拒绝回答对某些人问题被认为是敏感的。这种自动审查制度的形式引起了辩论,尤其是用途极限专业人士或教育。

为了回答这个问题,美国初创公司CTGT已经开发了一个新方法。与通常的技术不同,它不需要重新编程人工智能或重新读取数小时。他们的方法是精确的确切块然后在模型中的答案调整这些元素使人工智能自由,不损害其可靠性或精度。公司坚持认为他们的系统允许您撤回不必要的审查制度没有打开危险答案的大门,自AI以来是一个敏感的主题埃隆·马斯克·格罗克(Elon Musk Grok 3)发射时聚集或者DeepSeek能够提供指南以制造化学武器

CTGT有望删除AI的审查,而不会影响其正常功能

在提出100个敏感问题的测试中,基本的DeepSeek模型几乎没有回答32%。用CTGT方法修改后,他有回答了96%的问题,没有滑倒或危险内容。使用AI时,该技术直接起作用,这允许改变您的行为没有触摸其原始编程。该系统也是可逆的:可以随时停用或调整设置。

这项进步可能会让许多想使用AI的公司感兴趣尊重自己的内部规则。 CTGT解释了其解决方案避免大量投资在重新编程时,使模型更多适应不同用途。而模型则喜欢DeepSeek被美国当局视为潜在风险,更好地控制该技术可以或不能说的内容成为网络安全,金融或健康等领域的关键问题。

来源 :CTGT