研究：用诗歌就能让AI说违禁内容，成功率达62%

发布时间：2025-12-14 00:16:33 作者：玩站小弟

IT之家 12 月 1 日消息，事实证明，只需一点创意，便足以绕过人工智能聊天机器人的安全防护机制。在伊卡洛实验室Icaro Lab）最新发表的一项题为《对抗性诗歌：一种通用的单轮大语言模型越狱机制》。

IT之家 12 月 1 日消息，研究用诗事实证明，违禁只需一点创意，内容廊坊市某某制品有限责任公司便足以绕过人工智能聊天机器人的成功安全防护机制。在伊卡洛实验室（Icaro Lab）最新发表的率达一项题为《对抗性诗歌：一种通用的单轮大语言模型越狱机制》的研究中，研究人员通过将提示词以诗歌形式表达，研究用诗成功绕过了多种大语言模型（LLM）的违禁安全限制。

该研究指出，内容“诗歌形式可作为一种通用型越狱操作符”，成功廊坊市某某制品有限责任公司实验结果显示，率达整体上有 62% 的研究用诗成功率诱使模型生成被禁止的内容，包括涉及制造核武器、违禁儿童性虐待材料以及自杀或自残等相关信息。内容

IT之家注意到，成功研究测试了多款主流大语言模型，率达包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率：Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答，而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。

尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文，但研究团队向 Wired 杂志表示，这些诗句“过于危险，不宜向公众披露”。不过，论文中确实包含了一个经过弱化处理的示例，用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调：“这可能比人们想象的要容易得多，而这正是我们保持谨慎的原因所在。”

Tag：九江市某某生态科技维修站洛阳市某某企业管理咨询有限公司枣庄市某某商业展览培训学校郑州市某某涂装工程厂开封市某某过滤设备厂成都市某某自动化科技专卖店吉安市某某事务所教育中心商洛市某某自动化科技培训学校怀化市某某环保工程服务中心蚌埠市某某检测技术业务部

6000架空客A320飞机紧急换软件，空客公司致歉
来源：环球时报【环球时报驻德国特约记者昭东环球时报记者肖震冬】德国《时代周报》11月28日称，欧洲飞机制造商空客公司当天宣布：约6000架空客A320飞机的飞行控制系统存在安全隐患，必须接受检查
2025-12-14
“网红”首席分析师被判刑！为境外诈骗团伙引流，致40余人被骗3000多万元
红星资本局9月18日消息，原上海证券研究所所长助理、“网红”首席分析师蔡钧毅被抓一事有了新进展。近日，上海市宝山区人民检察院召开新闻发布会通报典型案例，其中就包括蔡钧毅案。据了解，蔡钧毅在短视频平台直
2025-12-14
今明两天北京天气温和宜出行，中秋假期后雨又来
新京报讯据“气象北京”微信公众号消息，今天9月16日）白天晴空为主，北部山区有小阵雨，预计午后最高气温在28℃左右。明天天空云量增多，气温和今天相近。假期后，随着一场带着明显秋意的小雨，将直接把气温
2025-12-14
北京打通居家养老服务“最后一百米”
截至2023年底，北京市常住老年人达494.8万人，占比22.6%，已经迈入中度老龄化社会。其中，80岁以上的高龄老年人是养老服务的“刚需之刚需”，也是养老工作的重中之重。就餐、就医、床前照护，是“老
2025-12-14
如何有效帮助视障人士？这些小技巧要知道
如何有效帮助视障人士？这些小技巧要知道2025-12-11 11:57:08 来源：央视新闻客户端作者：王
2025-12-14
世界遗产中的“活”文化北京中轴线在保护传承中焕发新生机
原标题：世界遗产中的“活”文化北京中轴线在保护传承中焕发新生机）北京中轴线：一城一线一脉相承来源：视频综合）央视网消息：在北京这座古老而又现代
2025-12-14

休闲

综合

娱乐

探索

热门资讯

知识

焦点

时尚

研究：用诗歌就能让AI说违禁内容，成功率达62%

相关文章

最新评论

文章分类

大家感兴趣的内容

最近更新的内容

友情链接