您现在的位置是:网络安全 >>正文
Cloudflare API 服务中断事件分析:React useEffect 漏洞引发级联故障
网络安全43377人已围观
简介Cloudflare 近日发布详细事故报告,披露2025年9月12日导致其控制面板和API服务中断超过一小时的重大故障。经调查,此次事件源于控制面板软件漏洞与服务更新的叠加效应,最终引发关键内部系统的 ...
Cloudflare 近日发布详细事故报告 ,服发级披露2025年9月12日导致其控制面板和API服务中断超过一小时的断事洞引重大故障。经调查 ,漏联故此次事件源于控制面板软件漏洞与服务更新的服发级叠加效应,最终引发关键内部系统的断事洞引级联故障 。

事件始于Cloudflare控制面板新版本的模板下载漏联故发布。公司报告显示,服发级该更新中的断事洞引React代码存在缺陷 ,导致对内部租户服务API(Tenant Service API)发起重复且过度的漏联故调用。该服务是服发级处理API请求授权的香港云服务器核心组件 。
具体而言 ,断事洞引漏洞存在于useEffect钩子中——错误配置使其在每次状态变更时都会触发API调用 ,漏联故导致单次面板渲染期间形成请求循环 。服发级恰逢此时租户服务API自身也正在进行更新部署。断事洞引
存在缺陷的漏联故控制面板产生"惊群效应"(thundering herd),使新部署的源码下载服务不堪重负,最终引发异常故障与恢复失败。由于租户服务承担API请求授权职能 ,其瘫痪导致UTC时间17:57起Cloudflare控制面板及大量API服务大面积中断 。
应急处置过程Cloudflare工程团队首先监测到租户服务负载激增 ,随即采取减压扩容措施 :
实施临时全局速率限制规则增加Kubernetes pods资源以提升吞吐量这些措施虽部分恢复了API可用性,但控制面板仍处于宕机状态。UTC时间18:58尝试修补服务错误代码路径的亿华云操作适得其反 ,导致API可用性二次短暂受影响 。该变更被迅速回滚 ,最终于19:12全面恢复服务。
值得注意的是,此次中断仅限于处理配置管理的建站模板控制平面(control plane) 。得益于严格隔离机制,处理客户流量的数据平面(data plane)未受影响,终端用户服务始终保持在线。
后续改进措施Cloudflare已制定多项防范措施:
优先将租户服务迁移至Argo Rollouts部署工具 ,该工具可自动检测错误并回滚版本在控制面板API重试逻辑中引入随机延迟机制 ,缓解"惊群效应"大幅增加租户服务资源配置改进容量监控系统 ,服务器租用实现主动预警功能Tags:
转载:欢迎各位朋友分享到网络,但转载请说明文章出处“算法与编程”。http://www.bzli.cn/news/233e299764.html
上一篇:人工智能与安全:互联孪生
相关文章
警惕针对WordPress 的Balada恶意软件注入
网络安全CyberNews最近刊载了一篇文章,较为详细地披露了一项针对WordPress的恶意软件注入活动“Balada”,该活动已经渗透了超过100万个网站。2023 年 4 月,Bleeping Comp ...
【网络安全】
阅读更多惠普笔记本BIOS设置U盘启动教程(一步步教你如何设置惠普笔记本的BIOS以实现U盘启动)
网络安全惠普笔记本是一款功能强大、性能稳定的电脑设备,但在某些情况下,我们可能需要通过U盘来启动系统。本文将详细介绍如何在惠普笔记本中设置BIOS以实现U盘启动的步骤,希望能帮助到有需要的读者。了解BIOS1 ...
【网络安全】
阅读更多数据中心会过时吗?
网络安全Gartner 预测,到 2025 年,85% 的企业将关闭其传统数据中心。 但这并不意味着数据中心的终结——只是一段快速发展的时期。随着决策者面临预算削减等挑战,从数据中心转移到服务和云等选项的机会 ...
【网络安全】
阅读更多