研究:用诗歌就能让AI说违禁内容,成功率达62%
[时尚] 时间:2025-12-28 14:33:05 来源:盘锦市某某化品运营部 作者:综合 点击:32次
IT之家 12 月 1 日消息,研究用诗事实证明,违禁只需一点创意,内容陇南市某某环保机械设备教育中心便足以绕过人工智能聊天机器人的成功安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的率达一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,研究用诗成功绕过了多种大语言模型(LLM)的违禁安全限制。
![]()
该研究指出,内容“诗歌形式可作为一种通用型越狱操作符”,成功陇南市某某环保机械设备教育中心实验结果显示,率达整体上有 62% 的研究用诗成功率诱使模型生成被禁止的内容,包括涉及制造核武器、违禁儿童性虐待材料以及自杀或自残等相关信息。内容
IT之家注意到,成功研究测试了多款主流大语言模型,率达包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。
尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”
(责任编辑:时尚)
相关内容
- 雷达数据显示美军战机在委内瑞拉首都附近空域活动
- 能从6岁背到60岁的双肩包,City不City?
- 18年赋能,李书福看中了LEVC什么
- 她才是中年女性的穿衣榜样!不装嫩、不沉闷,显瘦又显气质
- 委内瑞拉向安理会提交公报 谴责美国“海盗行径”
- 新款奥迪Q8将于7月22日正式上市!最大功率335马力,配备四驱
- 今日热点:《RoadToKingdom》第二季;729声明......
- 中年女性变时髦的秘籍,竟然是戴帽子,这样搭回头率爆棚
- 为继续销售货机 波音公司向美航管局申请排放豁免
- 预计三季度上市/续航901km 岚图知音官图发布
- 多地有大到暴雨 中央气象台今早发布暴雨黄色预警
- 皮肤不够白,这么穿更好看
- 美乌称最新会谈有“建设性” 外媒:无“显著突破”
- 新增城市记忆领航功能 宝骏云朵OTA 3.0正式推送
精彩推荐
- 国台办发言人陈斌华答记者问
- 售价51.98万起 全新奔驰CLE敞篷轿跑车上市
- 吐槽张曼玉造型太夸张?她明明美到爆
- 网络文学“一键出海” 世界青年何以读懂中国
- 江西省政协党组成员、副主席尹建业被查
- 小鹏、蔚来都在转战纯视觉方案,特斯拉:谁还有梦想
热门点击
- 高考依然是普通人改变命运的最优途径 views+
- 库里:无法接受没有克莱 他通常休赛期消失并10月回归&这次不会了 views+
- 转发这篇索斯盖特,你也能运气爆棚! views+
- 胡塞武装称联合伊拉克民兵武装 袭击以色列目标 views+
- 黎以冲突持续 黎真主党称袭击多个以色列军事目标 views+
- 成都民办学校遇冷出现关停潮?官方辟谣,小升初报名率达209.4% views+
- 35岁重考清华大结局,李龙公布高考成绩626分,全省排名4631名 views+
- 补课狂欢开始,是谁“绑架”了孩子的暑假? views+
- 珠海边检总站今年出入境客流突破1亿人次 views+
- 中新健康丨小暑节气如何养生?专家建议→ views+
