研究:用诗歌就能让AI说违禁内容,成功率达62%
[综合] 时间:2025-12-25 13:29:50 来源:山西某某烘焙维修网点 作者:综合 点击:121次
IT之家 12 月 1 日消息,研究用诗事实证明,违禁只需一点创意,内容资阳市某某生态科技运营部便足以绕过人工智能聊天机器人的成功安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的率达一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,研究用诗成功绕过了多种大语言模型(LLM)的违禁安全限制。
![]()
该研究指出,内容“诗歌形式可作为一种通用型越狱操作符”,成功资阳市某某生态科技运营部实验结果显示,率达整体上有 62% 的研究用诗成功率诱使模型生成被禁止的内容,包括涉及制造核武器、违禁儿童性虐待材料以及自杀或自残等相关信息。内容
IT之家注意到,成功研究测试了多款主流大语言模型,率达包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。
尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”
(责任编辑:热点)
相关内容
- 国民党和民众党民意代表宣布将提案弹劾赖清德
- 预计三季度上市/续航901km 岚图知音官图发布
- 9小时票房仅61万,成龙新片票房崩塌,成本超3.6亿,回本无望
- 50岁的女性夏天怎么穿衣?配色不暗沉、穿衣不老气,简单时尚
- 画面公开!菲方人员挥长刀挑衅中国海警
- 40岁正是最优雅的年纪,试试这些高级穿搭,穿出来的贵妇感
- 花100个亿,这回轮到她当冤大头了
- 渝川皖等地积极应对降雨天气
- 柬埔寨内政部:柬泰冲突已致20名柬平民死亡
- 俄称乌使用美国资金筹划暗杀普京
- 简洁的穿搭,总是给人一种素雅魅力,帮中年女人打造清丽气质
- 公安部:截至6月底全国新能源汽车保有量达2472万辆
- 柬埔寨内政部:柬泰冲突已致20名柬平民死亡
- 中年女性想维持体面,穿衣牢记这3个法则,这么穿越看越高级
精彩推荐
- 乌能源设施遭袭 部分地区大范围停电
- 中年女性想维持体面,穿衣牢记这3个法则,这么穿越看越高级
- 美妆胶卷
- 今日热点:《长相思2》今日开播;时代少年团方已报警......
- 我国发现新矿物!正式命名为金秀矿
- 上海环球金融中心71层将被二次拍卖,起拍价降至3亿元
热门点击
- 四十岁女人怎么打扮精致?少穿卫衣换成这几款秋装,更显气质 views+
- 吉利公布全新SUV的申报图 配备越野套件 views+
- 全红婵:给妈妈买金镯子金项链,全妈骄傲展示,幸福写在脸上 views+
- 伊姐十一热推:电影《出入平安》;综艺《你好种地少年2》...... views+
- 多家银行官宣存量房贷利率调整细则 views+
- 今秋最流行的鞋子,“红色”更时髦! views+
- 以军再次向贝鲁特南郊一地居民发出撤离令 views+
- 跟上特斯拉,一直游到海水变蓝 views+
- 伊姐十一热推:电影《危机航线》;电视剧《舍不得星星》...... views+
- 独居女孩必备!12件好用的租房神器!好看又便宜! views+
