您现在的位置是:系统运维 >>正文
破局智算中心挑战,施耐德电气的应对之道
系统运维6256人已围观
简介2022年底,ChatGPT的横空出世引爆了全球对生成式人工智能的关注热潮。紧随其后,多模态大模型、AI视频生成、代码自动生成等技术的突破,正在重塑千行百业的创新范式。AI技术的飞速发展,在推动企业业 ...
2022年底 ,破局ChatGPT的智算中心之道横空出世引爆了全球对生成式人工智能的关注热潮。紧随其后,挑战多模态大模型、施耐AI视频生成 、德电代码自动生成等技术的应对突破 ,正在重塑千行百业的破局创新范式 。AI技术的智算中心之道飞速发展,在推动企业业务创新,挑战提高企业生产效率的施耐同时,也给数据中心带来了前所未有的香港云服务器德电压力。
然而,应对在这场看似属于算法与数据的破局竞赛背后 ,却是智算中心之道一场关于算力 、供配电与制冷能力硬核基础设施的挑战较量 。
AI加速数据中心技术变革,基础设施面临三重考验近年来,AI大模型发展被按下“提速键”,加速向多场景渗透,以前所未有的深度和广度改变数据中心的传统面貌 。中国信通院数据显示,模板下载截至2024年6月 ,我国在用算力中心超过830万标准机架,算力规模达到246 EFLOPS(FP32),智算同比增速超过65% 。
在笔者看来 ,大模型应用爆发增长的背后,是AI工作负载对数据中心基础设施提出的严峻挑战 。主要有以下三点:
一是功率密度大幅跃升 。传统数据中心单机柜功率通常在5-10kW,而AI服务器集群直接将这一数字推高至30kW、50kW甚至100kW以上。以英伟达最新的源码库GB200为例,更是将单机柜功率密度推向120kW。
二是电力质量要求严苛。AI训练任务通常需要连续运行数周甚至数月 ,任何电力中断都可能导致训练任务失败,造成巨大经济损失。同时 ,AI工作负载具有剧烈动态波动特性 ,50毫秒内可达30%-165%波动 ,对供配电系统的可靠性提出了极高要求 。
三是制冷瓶颈凸显。随着芯片功耗不断提升,服务器租用风冷已逐渐触及物理极限 。未来 ,单个GPU功耗超过1kW或将成为常态 ,传统风冷方式无法有效解决高密度计算节点的散热问题 ,液冷将成为必然趋势 。
近期,在施耐德电气卡车巡展北京站现场,施耐德电气关键电源业务 ,IMDC及边缘计算产品经理汤熠指出,当前,芯片性能提升速度已经超越了摩尔定律 ,机柜功率密度及功耗均将实现指数跃迁 。毫无疑问,智算中心将以惊人的速度进化,云计算AI更将突破奇点。

施耐德电气关键电源业务,系统业务产品经理连博指出,AI驱动下的算力变革亦在深刻重塑电力需求与使用模式。为有效应对能源供应的严峻挑战,数据中心亟待部署更多 、更优质的电力资源。
施耐德电气的应对之道 :创新产品与解决方案面对AI时代数据中心面临的诸多挑战,施耐德电气凭借其深厚的技术积累和前瞻性的市场洞察,建站模板推出了一系列创新产品和解决方案。其中 ,冷板式液冷CDU系统 、Galaxy VXL UPS和IMDC智能模块化数据中心尤为引人注目,这也是本次施耐德电气卡车巡展北京站活动中所展示的重点产品。
一)风冷液冷融合,打破散热瓶颈
前文提到 ,机柜功率密度的不断提升使得制冷成为摆在用户面前的一大挑战。数据中心运营者不仅亟需升级制冷方式,如何降低数据中心的整体能耗,符合国家节能减排政策的要求,也成为重点考虑的问题。
汤熠表示,单机柜的功率密度未来3年将会达到500 kW,5年内有望达1 MW。单机柜功率密度超过50 kW,液冷将会变成必选项,即风冷无法满足50 kW机柜散热的问题。
为满足高密度数据中心的散热需求,施耐德电气基于对客户需求的深刻洞察 ,推出的冷板式液冷CDU系统 ,提供液-液(Liquid to Liquid) 、液-气(Liquid to Air)等多种热交换方式 ,并提供支持机柜内安装、落地式安装等多种型号,覆盖温度控制、流量控制 、压力控制、流体处理 、热交换与隔离五大关键功能,为高密度人工智能集群获得更佳的制冷效果提供有效支持。不止于此,冷板式液冷CDU系统将为用户带来芯片性能和可靠性提升、能效更高 、占用空间更小、总拥有成本更低、噪音更低等多项优势。

尽管液冷技术优势明显 ,但传统风冷对于较低机柜功率密度的小型AI集群仍是比较受欢迎的冷却方案。汤熠指出,目前较为典型的风液比配置为3:7,在短期内 ,液冷并不能完全取代风冷,部分非主流芯片的热量依然会由传统的风冷和风墙带走,而CPU、GPU主芯片将采用液冷解决方案。无疑 ,风液融合将成为行业发展的必然选择 。
二)IMDC智能模块化数据中心,智算边缘部署全新路径
聚焦边缘AI多样化应用场景 ,以及各行业企业对数据处理低时延、高效性的多样化需求,施耐德电气IMDC智能模块化数据中心交出了一份满意的答卷 ,以打通大模型“最后一公里” 。该解决方案集成了电源、配电、制冷 、机柜、环境监控管理等在内的物理基础设施单元,全部物理组件可在到达客户现场前实现工厂预制及全面检测,通过边缘控制层级的智能管理及数字化运维软件APP ,帮助客户实现快速部署,实现端到端一站式交付和远程数字化管理。

据介绍 ,IMDC智能模块化数据中心支持AI机柜的模块化部署,不仅可以在通道内做长度扩展,支持20个机柜一组,最大可延展到40个IT机组。同时 ,用户可以采用微模块方式 ,用户可根据自身的智算需要,实现弹性扩容 。
值得一提的是,IMDC智能模块化数据中心基于AI加持的智能运维方式,集成2台算力服务器 ,支持每8秒判定内部环境情况,对内部空调温度等进行精准智能调控。通过AI的主动干涉,空调能耗每年可下降30% ,实现能效与运维效率的双重提升。
IMDC智能模块化数据中心部署了2米高的机柜屏幕 ,支持数字孪生的全景可视化,以满足相关行业与企业的量身定制需求 。用户可以在该屏幕上,查看UPS的状态 、每一台空调的状态以及AIDC里面每一台服务器的状态,从而进一步保障资产安全性 ,并提升智能监控与运维能力,避免业务无关人员误操作导致训练中断。
三)供配电革新:重新定义兆瓦级电力保障
随着AI应用场景不断拓展深入 ,供配电系统的要求日趋严苛。施耐德电气Galaxy VXL UPS凭借在空间利用率 、功率密度和安全性能方面的三重突破 ,为各类AI场景大规模电力负载提供可靠保障 。
在优化空间利用率方面 ,Galaxy VXL UPS实现了革命性突破 ,单机功率最高可达1.25 MW ,其紧凑的设计仅占地面积1.2 m2,从而为IT负载的部署释放更多空间 。数据中心灰区(辅助设备间)和白区(IT机房面积)的占比可能由1:1演化为7:3,而Galaxy VXL UPS能大幅降低传统配电面积,提供更多的空间给到白区,适配智算中心需要 。

为了更加直观地了解这些数据背后的意义,此处可以通过一组对比进行详细介绍 。传统1MW以上的UPS占地面积基本都在4 m2以上 ,或是宽度基本在4m以上。Galaxy VXL UPS将占地面积减少了约70%,无疑为用户释放了更多宝贵空间用于IT设备部署 。
此外,Galaxy VXL UPS率先突破了行业3U空间的功率模块极限,实现125 kW的更高输出功率 ,基于可扩展的模块化设计,Galaxy VXL支持4台UPS并机运行 ,在仅4.8 m2空间内即可实现5 MW的功率输出,客户可根据自身当前与未来发展需求 ,灵活增加电力模块 ,有效降低资本支出。
不止于此, Galaxy VXL UPS在能效突破方面同样表现出色 。其在双变换模式下整机效率可达97.5%,在E变换模式下系统效率高达99%。E变换作为施耐德电气率先提出的概念 ,历经长期实践验证,已经在全球多个地区广泛应用,客户使用率超过70%。

针对高功率密度带来的散热挑战,Galaxy VXL UPS采用多极传导创新设计和动态气流散热设计,满载时可降低20%的散热量 。产品在0-40℃工况下可不降容运行 ,即使在50℃极端环境下 ,也能在满足一定负载条件下保持高性能运行。
连博表示 ,在着力提升UPS核心性能参数的同时 ,厂家更需要将“高安全可靠”理念贯穿产品全生命周期 。为了保证工作人员在更换设备中的安全性 ,Galaxy VXL UPS具备在线插拔(Live Swap)功能,该功能获得了德国莱茵TÜV集团签发的全球首张Live Swap认证证书。“在线插拔与市面上常见的热插拔有本质区别。” 连博强调 ,传统热插拔需要操作人员穿特殊的PPE防护装置,并经过严格培训才能操作 ,仍存在闪弧 、拉弧 、短路的危险。而在线插拔功能可以保证即使发生拉弧现象,拉弧能量也能被有效控制在1.2cal/cm²以下,从而确保在最大限度内保障操作人员安全。”
以创新应对挑战 ,以合作共创未来众所周知,面对AI时代带来的复杂性挑战,任何一家企业靠单打独斗无法满足客户的全方位需求。为此,施耐德电气积极与行业领导者建立战略合作,共同构建完整的AI就绪基础设施生态 。
在英伟达GTC巴黎大会上,施耐德电气宣布与英伟达深化合作,助力下一代“AI工厂”的建设和发展 。此外 ,施耐德电气也与联想 、戴尔开展战略合作,合力布局智算产业。从设施供电、制冷 、IT机房等领域,为适配未来的智算中心提供更好的解决方案。
在人工智能重塑世界的过程中,算力基础设施是这一变革的物质基础。施耐德电气凭借其在供配电 、制冷和数字化领域的深厚积累 ,从冷板式液冷CDU系统、IMDC智能模块化数据中心到Galaxy VXL UPS ,为AI时代的数据中心提供了全面保障,更推动行业的技术进步和标准制定 。
这些解决方案不仅在空间利用率 、功率密度 、安全性能等方面实现了突破,更通过模块化设计 、智能化运维和生态合作 ,为客户提供灵活性、可扩展性和可持续性 。
未来,随着AI技术从前沿探索走向规模化应用 ,施耐德电气将继续加大研发投入,深化与合作伙伴的关系 ,为全球智算基础设施的建设和发展提供更强有力的支持。
Tags:
转载:欢迎各位朋友分享到网络,但转载请说明文章出处“算法与编程”。http://www.bzli.cn/news/476b299521.html
下一篇:新兴的硬件安全技术
相关文章
大模型集体失控!南洋理工新型攻击,主流AI无一幸免
系统运维业界最领先的大模型们,竟然集体“越狱”了!不止是GPT-4,就连平时不咋出错的Bard、Bing Chat也全线失控,有的要黑掉网站,有的甚至扬言要设计恶意软件入侵银行系统:这并非危言耸听,而是南洋理 ...
【系统运维】
阅读更多引人注意的十大由AI造成的灾难案例
系统运维2017年,《经济学人》宣称数据已取代石油成为世界上最有价值的资源,这一说法自此一直被重复。跨越各个行业的企业一直在投资数据和分析,并将持续大举投资,但就像石油一样,数据和分析也有其阴暗面。根据《CI ...
【系统运维】
阅读更多迈向6G——通感一体化(ISAC)的安全问题
系统运维1、ISAC背景知识1.1 ISAC在6G网络中的价值6G网络不只是对通信速率的简单提升,它也被视作一场伟大的范式革命,是未来智能世界的新引擎。除了空天地一体化通信的实现,6G还将使智慧城市、智能工业 ...
【系统运维】
阅读更多
热门文章
最新文章
友情链接
- win10系统使用隐藏的小技巧有哪些
- 极云普汇云电脑致命错误的原因与解决方法(探究极云普汇云电脑的常见致命错误,并提供解决方案)
- win11百度网盘下载安装教程
- 电脑计算器输入数字错误的问题(探讨计算器输入数字错误的原因和解决方法)
- 电脑报read错误的解决方法(遇到电脑报read错误如何应对,尝试这些方法解决问题)
- 360极速浏览器中添加扩展工具的方法
- win10开机突然变慢了
- 电脑移动硬盘频繁识别错误的原因与解决方法(解析电脑移动硬盘频繁识别错误的几种情况及解决方案)
- 新主机怎么装win10操作系统
- 彩泥平板电脑制作教程(DIY彩泥平板电脑,打造独一无二的创意科技玩具) 亿华云源码库云服务器b2b信息平台网站建设企业服务器香港物理机