您现在的位置是:人工智能 >>正文
因拼写错误,17个数据库被删除,微软 Azure DevOps 罢工十小时
人工智能557人已围观
简介The register 网站披露,巴西南部地区部署的 Microsoft Azure DevOps 服务”罢工“了约十个小时。随后,微软首席软件工程经理 Eric Mattingly 为本次中断事件 ...
The 因拼register 网站披露 ,巴西南部地区部署的写错 Microsoft Azure DevOps 服务”罢工“了约十个小时 。随后 ,误个微软微软首席软件工程经理 Eric Mattingly 为本次中断事件公开道歉,数据删除并透露中断原因是库被一个简单拼写错误致使 17 个生产数据库被删除 。
Mattingly 表示 Azure DevOps 工程师会定期对生产数据库进行快照(Snapshot)处理 ,因拼以便及时调查报告上来的写错问题或测试性能是否改进 ,这些举动都依赖一个每天运行的误个微软后台系统,该系统会在特定时间删除旧的数据删除快照 。
在 Azure DevOps 工程师近期进行的服务器租用库被一次代码升级中,用支持的因拼 Azure.ResourceManager.*NuGet 包取代了弃用的 Microsoft.Azure.Management.*包,此举引起一个大型的写错拉取请求 ,其中更换了旧包和新包中的误个微软 API 调用。
然而拉取请求中却出现了拼写错误 ,数据删除误将删除快照数据库的库被调用改成了删除托管数据库的 Azure SQL Server 的调用 ,导致后台快照删除作业删除了整个服务器 。

Mattingly 指出 Azure DevOps 有专门的源码下载测试来捕捉此类问题,但是错误的代码只在某些特定条件下才得以运行,因此在现有的测试中没有很好的覆盖到。(据推测,这些条件需要存在于一个足够“老”的数据库快照 ,以便被删除脚本所捕获。)
Mattingly 进一步指出由于没有任何快照数据库 ,Sprint 222 的内部部署(第0环)没有发生任何意外,几天后 ,香港云服务器软件变更被部署到客户环境(第1环)被用于南巴西规模单位(一个特定角色的服务器集群)。该环境中有一个快照数据库,其年龄“老”到足以触发该错误 ,最终导致后台工作删除了该规模单位的“整个 Azure SQL 服务器和所有 17 个生产数据库”。
经过十多个小时的努力 ,微软方面已经全部恢复了数据库,为防止此类问题再次发生 ,微软已经采取各种修复和重新配置措施 。花费如此长时间的原因如下:
第一 :由于客户自己无法恢复 Azure SQL Server, 必须由 Azure 工程师来处理这一问题,这一过程大约需要一个小时:第二:数据库具有不同的高防服务器备份配置 ,一些数据库被配置为区域冗余备份 ,另一些数据库被设置为最近的地理区域冗余备份,协调这种不匹配的冗余备份 ,需要花费几个小时;最后一个原因:在数据库开始恢复在线后 ,由于自身网络服务器存在一系列复杂问题,使用这些数据库的客户也无法立刻访问整个规模单元。据悉,这些问题由服务器预热任务引起,该任务通过测试调用在可用数据库列表中反复进行 ,恢复过程中的数据库出现了一个错误 ,源码库就会触发预热测试 执行指数回退重试 ,导致预热平均需要 90 分钟,在正常情况下此操作只需要几秒钟 。
更为复杂的是 ,整个恢复过程交错进行,一旦有一两台服务器开始接受客户流量,就会出现过载现象,然后停机 。因此,恢复服务需要阻断所有到巴西南部规模单位的流量 ,直到一切都充分准备好后 ,才重新加入负载平衡器并处理流量 。建站模板
文章来源 :https://www.theregister.com/2023/06/03/microsoft_azure_outage_brazil/
Tags:
转载:欢迎各位朋友分享到网络,但转载请说明文章出处“算法与编程”。http://www.bzli.cn/html/95c699898.html
相关文章
新型网络钓鱼方式,黑客利用云存储进行短信钓鱼
人工智能近日,安全研究人员揭露了一系列利用亚马逊 S3、谷歌云存储、Backblaze B2 和 IBM 云对象存储等云存储服务的犯罪活动。这些活动由未具名的威胁行为者发起,目的是将用户重定向到恶意网站,利用 ...
【人工智能】
阅读更多微软:超1万家企业遭受钓鱼攻击
人工智能微软表示,从2021年9月开始,已经有超过10,000个组织受到网络钓鱼攻击,攻击者会利用获得的受害者邮箱访问权进行后续的商业电子邮件破坏BEC)攻击。攻击者使用登陆页面欺骗Office在线认证页面, ...
【人工智能】
阅读更多企业部署到云的 API 驱动应用程序应注意这些安全事项
人工智能在过去几年中,API 驱动的应用程序在企业级云平台上部署以扩展规模兴起。它们能够根据用户需求进行扩展,彻底改变了应用程序的编写和部署方式。通常,这些分布式应用程序部署在 ...
【人工智能】
阅读更多
热门文章
最新文章
友情链接
- 解决未安装音频输出设备的问题(如何在没有音频输出设备的情况下获得音频输出?)
- VivoY55L(一款性价比高、功能强大的手机选择)
- 电脑连接宽带教程-一步步教你如何连接宽带网络(简单易懂的连接宽带教程,助您快速上网畅享互联网世界)
- 改变logo,创造独特品牌形象的教程(简单易学的Logo设计教程,助你打造独特品牌)
- EA888发动机(卓越性能、可靠稳定、绿色环保的EA888发动机)
- 安卓手机怎么空手接电话
- 雨林木风系统盘教程(轻松操作,让电脑重获新生)
- 三星galaxy xcover3配置怎么样
- 以miss定制版黑轴怎么样?(打造专属个性化机械键盘)
- 2021年显卡性价比排行榜(显卡巅峰战) 亿华云企业服务器b2b信息平台源码库云服务器网站建设香港物理机