您现在的位置是:人工智能 >>正文
阿里云全球故障凸显“云集中”风险
人工智能7人已围观
简介阿里云12日发生的全球性故障再次将“云集中风险”推上风口浪尖。这一公有云史上罕见的事件不仅影响了数以万计的企业和服务,也引发了对云服务集中化趋势的深刻反思。2023年11月12日17:44(GMT+8 ...
阿里云12日发生的云集中全球性故障再次将“云集中风险”推上风口浪尖。这一公有云史上罕见的阿里事件不仅影响了数以万计的企业和服务 ,也引发了对云服务集中化趋势的云全深刻反思 。

2023年11月12日17:44(GMT+8)开始,球故阿里云基础设施发生严重故障,障凸导致阿里巴巴大量产品无法连接,显风险“阿里云盘崩了”“淘宝又崩了”“闲鱼崩了”“钉钉崩了” 等话题相继登上热搜,云集中阿里系诸多产品受到影响 。阿里
故障期间阿里云控制台无法正常登录 ,云全API调用异常 ,球故导致阿里云全系列产品服务及全球区域(包括阿里云位于中国内地、障凸港澳台 、显风险亚洲其他地区、建站模板云集中欧洲、阿里北美、云全中东 、政务云以及金融云等)数据中心均受影响。
故障恢复期间 ,一些用户抱怨由于DNS服务也出现问题,导致无法做故障转移,“想跑都跑不了”。
根据阿里云发布的通知,故障持续了3个多小时后才基本完全恢复 :
17:50——阿里云确认故障原因与某个底层服务组件有关 ,工程师正在紧急处理中 。18:54——经过工程师处理 ,杭州 、北京等地域控制台及API服务已恢复 ,其他地域控制台服务逐步恢复中 。高防服务器19:20——工程师通过分批重启组件服务,绝大部分地域控制台及API服务已恢复。19:43——异常管控服务组件均已完成重启 ,除个别云产品(如消息队列MQ、消息服务MNS)仍需处理,其余云产品控制台及API服务已恢复。20:12——北京 、杭州等地域消息队列MQ已完成重启,其余地域逐步恢复中。21:11——受影响云产品均已恢复,因故障影响部分云产品的数据(如监控 、账单等)可能存在延迟推送情况,不影响业务运行。阿里云此次全球性故障的严重程度 、模板下载影响规模和范围在公有云历史上都极为罕见 ,严重打击了各行业用户对公有云可靠性和安全性的信心 ,进一步凸显了Gartner三季度风险报告中强调的“云集中”风险。
“云集中”名列五大新兴风险榜单根据Gartner最新公布的2023年三季度新兴风险报告,云集中风险连续第二年进入“五大新兴风险”综合榜单:

在美国和中国市场 ,云集中风险则更为突出(排名分别上升至第三) :

Gartner法律风险与合规实践部门研究总监徐然表示 :“云服务集中化风险正在成为大多数企业的共识。许多企业和机构现在面临这样的处境 :一旦单个云服务商出现故障,将导致业务发生严重中断。”
“云集中”的三大风险导致“云集中风险”的原因有很多,香港云服务器许多组织为了降低IT复杂性、成本和技能要求,选择将IT服务集中在少数几个战略云供应商手中;而加剧这一风险的是 ,少数几个云计算巨头凭借其技术能力优势、业务覆盖范围和合作伙伴生态系统 ,在全球和区域市场占据主导地位。
徐然表示 :“对于那些选择将其IT服务托管在公共云中的组织来说 ,要避免云集中风险的同时又获得云服务的好处 ,很难兼顾。此外,国家和次国家层面的源码下载法规在处理集中风险、反竞争 、数据主权和云服务隐私规则方面存在分歧,这进一步复杂化了情况 。”
根据Gartner的说法 ,云集中目前主要有三大风险 :
超大的事件“爆炸半径” :越多的应用程序(和业务流程)依赖于特定的云提供商,云服务问题可能带来的影响范围就越广 ,这可能加剧业务连续性的担忧。高度的供应商依赖和锁定:对特定供应商的服务器租用集中依赖可能会减少未来技术选择 ,并允许供应商对组织的技术未来施加重大影响。监管合规失败 :组织可能无法满足不同监管机构对处理集中风险的要求,这些机构对集中风险的处理方法可能各不相同 。如何缓解云集中风险徐然表示 :“目前,如果公共云的优点对企业战略至关重要 ,企业迫切需要制订一个完备的连续性计划 ,以应对可能面临的任何重大云服务风险。”
知名密码学专家布鲁斯施奈尔认为,增加云服务商数量并不能从根本上降低“云风险”,他在IEEE Spectrum上撰文指出:
在全球科技巨头和云服务商争先恐后“大炼数据”的生成式人工智能时代,企业和个人对存放于云端数据的安全焦虑与日俱增 ,一个可行的策略是将身份 、数据和行为解耦合。
“企业不应再对云服务商的数据安全能力和意愿抱有幻想,企业唯一的出路是将数据安全重新掌握在自己手中。”施奈尔说道 。
Tags:
转载:欢迎各位朋友分享到网络,但转载请说明文章出处“算法与编程”。http://www.bzli.cn/html/726e599268.html
相关文章
谷歌正寻求提高 C++ 内存安全
人工智能谷歌 Chrome 安全团队称其一直在致力于改善 Chrome 浏览器的内存安全;近期,该团队正在研究使用 heap scanning 技术来提高 C++ 的内存安全。虽然从内存安全方面出发,Rust ...
【人工智能】
阅读更多ENISA有关数据威胁的调查
人工智能1主要调查结果在2021年,即便受疫情影响,数据收集、共享和分析也并未减弱。根据Statista的数据,全世界总共生产和消费了79ZB数据,预计到2025年将增长到180ZB以上。Verizon数据泄 ...
【人工智能】
阅读更多CISO如何克服如今日益复杂的安全挑战
人工智能作为一名CISO,你如何在保持技术能力与需要用简单的术语向利益相关者沟通复杂问题之间取得平衡?我一直在想,“如果你不了解它的工作原理,你永远不会知道如何确保它的安全。”这种思维过程驱使我学习关于新技术 ...
【人工智能】
阅读更多