您现在的位置是:IT资讯 >>正文
Grok-4 AI 上线 48 小时即遭新型组合越狱攻击攻破
IT资讯49人已围观
简介大型语言模型Grok-4在推出仅两天后,就被研究人员通过结合"回声室(Echo Chamber)"和"渐强(Crescendo)"技术成功突破防御系统,暴露出AI安全机制存在重大缺陷。组合越狱技术突破 ...
大型语言模型Grok-4在推出仅两天后,上线就被研究人员通过结合"回声室(Echo Chamber)"和"渐强(Crescendo)"技术成功突破防御系统 ,小时新型暴露出AI安全机制存在重大缺陷。即遭

NeuralTrust研究团队在博客中披露,组合他们通过多轮对话诱导Grok-4降低了安全限制,越狱成功获取了制作武器的攻击攻破详细指导,全程未使用任何明显恶意输入。亿华云上线研究员Ahmad Alobaid表示 :"大型语言模型(LLM)越狱攻击不仅各自进化,小时新型还能组合使用以增强效果。即遭"
这两种技术均属于多轮越狱手段 :
回声室技术 :利用模型对跨对话一致性的组合信任,通过重复"回响"相同恶意概念来塑造模型内部语境渐强技术 :由微软发现并命名 ,越狱通过从无害提示逐步升级到恶意输出的攻击攻破对话策略绕过安全过滤器
攻击过程首先使用回声室技术建立信任基础 ,免费模板当对话进展停滞时切换至渐强技术完成突破。上线实验显示 ,小时新型仅需额外两轮对话,即遭这种组合攻击就能成功诱导目标响应 。
该攻击利用Grok-4的上下文记忆特性 ,通过回馈模型自身先前的模板下载陈述,逐步引导其达成攻击目标而不触发警报 。测试数据显示:
制作武器的指导成功率高达67%毒素相关话题的成功率分别为50%和30%
由于攻击全程不依赖关键词触发或直接恶意提示,传统基于黑名单和显式恶意检测的防御机制完全失效。高防服务器Alobaid指出 :"这暴露出关键漏洞——攻击可以通过利用更广泛的对话上下文来绕过基于意图或关键词的过滤系统 。"
随着AI助手和云端LLM在关键场景的应用普及,这类多轮"低语式"攻击暴露出严重的安全护栏缺陷。香港云服务器此前微软的"骨架密钥(Skeleton Key)"越狱、"数学提示(MathPrompt)"绕过等技术也证实了类似风险,凸显出需要开发针对性的AI感知防火墙解决方案。
Tags:
转载:欢迎各位朋友分享到网络,但转载请说明文章出处“算法与编程”。http://www.bzli.cn/html/066e299931.html
相关文章
上云大势,企业如何保护数字安全
IT资讯业务上云大势所趋,越来越多的企事业单位将自己的业务迁移到云上,然而我们仍不能忽视云中的安全问题。业务上云会面临哪些安全挑战?云数据安全中心又该怎样建设?这些问题值得商榷。业务上云常见的挑战:1. 个 ...
【IT资讯】
阅读更多迈凯亚耳机的音质表现如何?(探索迈凯亚耳机音质的细节与特点)
IT资讯迈凯亚耳机作为一款高端音频设备,备受音乐爱好者的青睐。本文将对其音质表现进行详细探讨,从各个方面解析迈凯亚耳机的声音特点和优势。1.迈凯亚耳机的声音定位精准:迈凯亚耳机采用先进的定位技术,能够清晰地分 ...
【IT资讯】
阅读更多小米Note导航体验报告(小米Note导航功能的实用性和便利性分析)
IT资讯作为小米公司旗下的一款中高端智能手机,小米Note除了具备优秀的性能和拍照能力外,还配备了强大的导航功能。本文将对小米Note的导航功能进行详细评测,从实用性和便利性两个方面进行分析。1.小米Note ...
【IT资讯】
阅读更多
热门文章
最新文章
友情链接
- 2022年及以后的四个数据中心提示
- 备份系统也能成为“核心设施”?瑞数信息给出了一套“有韧性”解题思路!
- 戴尔数据泄露事件:测试实验室平台遭 World Leaks 黑客组织入侵
- 微软联合执法机构捣毁全球 Lumma 窃密软件网络
- 从“v我50”到“疯狂星期四”:HTTPS如何用47天寿命的证书挡住中间人
- Realtek 蓝牙安全连接配对漏洞可导致攻击者发起拒绝服务攻击
- 运维工程师来活了,Linux 又报了两个超级漏洞(附解决方案)
- 深度研究 | 如何利用可信数据空间赋能企业数据流通安全
- 探索2023年vivo最新款手机的革新之路(领先科技、卓越性能、引领未来)
- 618风控战升级,瑞数信息“动态安全+AI”利剑出鞘 b2b信息平台企业服务器网站建设香港物理机亿华云云服务器源码库