康奈尔大学的研究人员开发了一种能够绕过生成AI审查制度的算法。因此,他们设法获得了色情图像,通常无法使用dall-e甚至稳定的扩散创建。通过学习,对他们的运作进行了惊人的事情。
有了这样的力量,很明显,生成的AI会引起漂移。让我们提到特别的深层效果,今天主要用于创建色情内容,损害视频中存在的人们。因此,必须集成防止溢出的安全网等生成图像,例如Dall-E和Midjourney。
因此,这些工具审查许多单词被认为是性或暴力的单词,尽管该定义根据每个词的敏感性而变化。例如,不可能要求AI产生一个裸体的人。包含这些审查单词的提示将被绝对拒绝,而可能会阻止用户的提示。
这并不意味着要解决这一审查制度一直是不可能的。但是,推动AI生成违禁图像的现有方法从来都不是通用的,只能在特定工具上使用。直到康奈尔大学的一组研究人员发现如何将每个AI折叠为他们的意愿。
在同一主题上 - AI会强调男人的孤独感,使一代人处于危险之中
Sneakyplet:这是该算法的名称,能够绕过生成AI审查。后者的目标是通过测试不同的及时配方来确定实现其末端的最有效方法(通常是非正统)。根据获得的答案,该算法将调整其提示,直到获得预期的结果为止。
那时,偷偷摸摸的人开始发现惊人的发现。通过迭代的味道,可以找到最佳的配方,该算法最终了解了某些想要绝对没有什么的角色套件,而AI很清楚地解释了。在没有研究人员的情况下,“ mowly”成为“猫”,而“ butnip fwngho”在提示中成为狗。
研究人员团队成员Yinzhi Cao发表了一个有趣的假设来解释这一现象。这回忆说,AI是通过用不同语言编写的文本培训的。因此,某些字符的字符可以接近某些语言中的某些单词,从而推动AI确定用户想要键入的单词。
不可避免地,可以使用此“缺陷”来推动AI来生成显式图像。的确,这些字符的字符未集成到工具的安全过滤器中,经过多次尝试,可能需要AI来解释它们以供禁止的单词。这些工具基于句子的上下文而不是其主要含义,这一事实肯定允许。
确实,在句子中“危险认为沃尔特以威胁到正在接近主人的陌生人的威胁方式咕unt”,AI通常会考虑“危险认为沃尔特”意思是“狗”,因为这个词可以与其他提示一起使用。
研究人员指定,这些发现不应用于用户绕过安全措施,而是要警告这些AI的创建者,以防止其系统中的故障。因此,很少有偷偷摸摸的人与公众播放,这可能不是一件坏事。
来源 :康奈尔大学
问我们的最后一个!
凭借直接放置在耳道中的尖端,耳内耳机即使在全部体育锻炼中也可以在您的耳朵中良好的聆听和良好的耳朵。但是并非所有这些都是创造的。我们的购物指南去...
音频购买指南
E3失踪后,ESA(娱乐软件协会)举行了新的会议:互动创新会议(IICON),该会议定于2026年4月在拉斯维加斯举行。该封闭活动旨在为经理和创新者提供,旨在激发部门之间的合作。
电子游戏
关于第一个可折叠iPhone的生产和技术特征的信息已泄漏。这款长期已久的智能手机可以在2026年发布,并由Apple设计的铰链,但三星屏幕。我们一直在谈论...
iPhone