您现在的位置是:数据库 >>正文
一文看懂英伟达的产品体系和命名规则
数据库68人已围观
简介英伟达这几年很火。因为AI的带动,它几乎成为全球最受关注的公司。我们总是会在网上看到和英伟达有关的一些名词,例如:A100、B100、H100、GH200、GB200、NVLINK、NVSwitch、 ...
英伟达这几年很火。文看伟达因为AI的懂英的产带动 ,它几乎成为全球最受关注的品体公司 。
我们总是系和会在网上看到和英伟达有关的一些名词 ,例如 :
A100、命名B100 、规则H100、文看伟达GH200、懂英的产GB200、品体NVLINK、系和NVSwitch 、源码下载命名DGX、规则HGX 、文看伟达Quantum 、懂英的产Spectrum、品体BlueField 、CUDA等等。
这些名词看多了 ,就有点晕。搞不懂到底是什么,有什么关系。
今天这篇文章 ,小枣君就给大家详细梳理一下这些名词概念,顺便普及一下相关的知识。服务器租用
算力芯片——V100/A100/H100/B200等这些名词,应该是大家最常见的。
没错,这些都是AI算力卡 ,也就是GPU卡的型号。
GPU卡(6块)
英伟达的GPU,每隔几年就会出一个新的架构 。每个架构,都会以一个著名科学家的亿华云名字命名,如下所示:
图片
所以,基于某个架构的卡,一般就会以这个架构名称的首字母开头(游戏显卡除外)。
例如,基于Volta(伏特)架构的V100,基于Ampere(安培)架构的A100,基于Hopper(赫伯)架构的H100、H200 ,基于Blackwell(布莱克威尔)架构的B100 、免费模板B200等 。
图片
某200一般是某100的升级版 。例如H200,就是H100的升级版(采用了HBM3e内存等升级) 。
L40和L40s名字稍微有点特别,两者基于Ada Lovelace(世界上第一个女程序员的名字)架构 ,后者是前者的升级版。两个卡都是针对数据中心市场推出的香港云服务器,主打低成本和性价比。
还有1个型号大家应该比较熟悉——H20 。
这是英伟达因为美国出口限制而推出的阉割版(特供版) 。据说B200也会有对应的阉割版B20。
英伟达的下一代AI平台是Rubin(罗宾) ,计划于2026年推出 。大家一开始以为下一代GPU就是R100、R200 。但英伟达给出的高防服务器路线图 ,又说是X100 。所以,还有待观望。
2028年 ,英伟达会推出下下一代平台——Feynman(费曼) 。
超级芯片——GH200 、GB200等GPU是英伟达的算力核心硬件单元。但他们并不是只有GPU。围绕GPU ,他们还有很多的产品和解决方案 。
英伟达早期的时候是和IBM POWER CPU合作,后来,可能是感觉IBM不给力,于是自己开始研发CPU。例如 ,基于ARM架构研发的Grace CPU(Vera CPU在路上)。
英伟达采用NVLink技术,将GPU和CPU进行配对 ,就变成了所谓的超级芯片平台(Superchip)。
例如GH200、GB200 ,以及不久前新发布的GB300(Blackwell Ultra) 。
由一个Grace CPU和两个Blackwell B200 GPU组成的平台,就是GB200(取Grace和Blackwell的首字母),据说性能是H100的7倍。
GB200
类似的 ,GH200,就是Grace CPU和Hopper GPU的组合搭配 。
超级计算机平台——DGX/EGX/IGX等再往上一个层级,就是计算机了 。其实刚才GB200 ,已经是个计算机了 。
基于刚才的各种芯片平台,英伟达构建了对应的计算机平台,或者说 ,叫做超级计算机平台 ,包括DGX 、EGX、IGX、HGX、MGX等。
具体的区别如下,我就不多解释了,看下表:
图片
DGX还是见得比较多。当年黄仁勋送给OpenAI的 ,就是第一代的DGX-1 。
图片
现在的DGX,基本上都是土豪金配色,价格也很昂贵 。
面向桌面市场,英伟达还推出了DGX Spark和DGX Station,相当于工作站。
图片
DGX Spark和DGX Station
节点内部连接 :Scale Up(超节点)——DGX GB200 NVL72等接下来 ,要涉及到通信方面的技术了。
之前小枣君给大家介绍超节点的时候(最近很火的“超节点”,到底是干啥的?) ,提到过NVLINK。
NVLINK是英伟达推出的GPU卡间互连技术,主要是取代PCIe。刚才也提到,CPU和GPU之间,也是NVLINK技术。
图片
NVLINK多节点,就不好直连了,要引入交换芯片 。于是 ,就有了NVLink Switch,也叫NVSwitch。后来,芯片又变成了设备。
图片
NVLINK可以把很多的GPU连起来,组成看似很多计算机 ,但实际上属于一个逻辑节点(超节点)的平台。
近年来,我们经常听说DGX GB200 NVL72 。
DGX GB200 NVL72 ,采用了NVLINK5,包含了18个GB200 Compute Tray(计算托架) ,以及9个NVLink-network Switch Tray(网络交换托架) 。如下图所示 :
图片
NVL72机柜
每个Compute Tray包括2颗GB200超级芯片。所以,就是36个Grace CPU(18×2),72个B200 GPU(18×2×2) 。
8个DGX GB200 NVL72,又可以组成一个576个GPU的SuperPod超节点 。
图片
单节点内,不断加GPU,是Scale Up(纵向扩展) 。单节点到了一定规模 ,就不好再增加了。就要增加节点数量 ,搞节点与节点之间的互连 ,那就是Scale Out(横向扩展)。
图片
Scale Out,英伟达也有解决方案,那就是InfiniBand(IB)技术 。
InfiniBand以前是Mellanox公司的。英伟达布局深远,2019年把Mellanox收购了,InfiniBand就成了英伟达的私有技术 。
InfiniBand是技术名词,不是产品名词 。英伟达基于InfiniBand推出的产品平台是NVIDIA Quantum(“量子”的意思)。
例如 ,2024年3月 ,英伟达发布的Quantum-X800网络交换机平台 ,端到端吞吐量能够达到800Gbps 。平台包括了含Quantum Q3400交换机、ConnectX-8 SuperNIC网卡等硬件。
这些硬件 ,也都是有系列的。Quantum-X800的上一代,是Quantum-2 。ConnectX-8的前代 ,有ConnectX-6、ConnectX-7等 。
图片
ConnectX高速网卡也是来自Mellanox 。
Scale Out的两大解决方案,除了InfiniBand ,还有以太网。英伟达以太网这边也没放过 ,也有产品 ,就是Spectrum-X800。(Spectrum是“光谱”的意思。)
Spectrum-X800包括了Spectrum SN5600交换机、BlueField-3 SuperNIC网卡等硬件产品,吞吐量同样高达800Gbps 。
图片
BlueField是这些年很火的DPU 。英伟达将Mellanox的ConnectX网卡技术与自己的已有技术相结合 ,于2020年正式推出了BlueField-2 DPU和BlueField-2X DPU。现在演进到了BlueField-3。
对了,前段时间,英伟达还发布了CPO光电一体化封装网络交换机Spectrum-X Photonics和Quantum-X Photonics。
图片
英伟达还有一些其它的网卡、连接器、线缆等配件 ,就不逐个介绍了 。
黄教主前段时间透露,新一代的Rubin平台发布时,据说会带来NVLink 6 、ConnectX-9 SuperNIC和Quantum(Spectrum)-X1600 。可以期待一下。
开发框架——CUDA刚才介绍的,是英伟达的算力硬件平台家族,以及通信网络家族。
再看一个软件方面的名词——大名鼎鼎的CUDA 。
英伟达的硬件和网络做得很牛,但实际上 ,最被视为核心竞争壁垒的,反而是这个CUDA 。
CUDA(Compute Unified Device Architecture ,计算统一设备架构),是英伟达在2006年推出的并行计算平台和编程模型。它让开发者能够直接在GPU上编写代码,从而大幅提升计算速度。
如今,CUDA就像是智算开发的操作系统 ,集编程模型、编译器 、API、库和工具于一体 ,有利于用户更好地发挥英伟达硬件的能力。
CUDA不仅是个工具 ,更形成了强大的AI开发生态。它是英伟达整个业务体系的神经中枢 。
现在很多AI开发都依赖于英伟达的硬件和CUDA,换硬件其实也不是很难,但是,生态迁移更加痛苦。
图片
好啦,关于英伟达的主要产品体系和命名规则,就介绍到这里。
在不同的领域,英伟达会基于这些核心产品 ,构建不同的解决方案。有的时候 ,也会衍生出一些升级版或阉割版,大家注意一下就行 。
Tags:
转载:欢迎各位朋友分享到网络,但转载请说明文章出处“算法与编程”。http://www.bzli.cn/news/76d7899845.html
相关文章
浅谈ICT供应链安全风险管理与应对机制
数据库近年来,针对ICT供应链的安全攻击事件呈快速增长态势,开源软件频繁曝出的高危漏洞、软件厂家为维护便利而内置的默认权限或后门、源代码泄露造成的0Day、nDay漏洞攻击事件等,都给ICT供应链带来了巨大 ...
【数据库】
阅读更多绿色算力助推双碳落地,新华三携手英特尔共话“可持续”
数据库4月12日,2023英特尔可持续发展高峰论坛在京举办,紫光股份旗下新华三集团受邀参会,新华三集团计算存储产品线副总裁刘宏程发表主题演讲,并与英特尔等众多产业生态伙伴以“可持续”为核心话题展开圆桌对话, ...
【数据库】
阅读更多Web应用中的Cookie和Session有什么区别?
数据库Cookie和SessionCookie和Session都是用于在Web应用中跟踪用户状态和存储用户信息的机制。「Cookie」是一种在Web浏览器中存储数据的小文件,由服务器发送给浏览器,并存储在浏 ...
【数据库】
阅读更多
热门文章
最新文章
友情链接
- 数据中心电源的五大趋势
- 光伏、中水、余热……2022北京13个数据中心能评展现五大趋势
- 京品电源(京品电源的)
- HP系统重装教程(详解HP系统重装步骤,让你的电脑焕然一新)
- 如何找回ID账号和密码?(有效方法帮助你找回丢失的账号和密码)
- AMDA87410处理器的性能及特点分析(探索AMDA87410处理器的优势和应用领域)
- 烈焰战神1050ti(探索烈焰战神1050ti的卓越性能与多功能特性)
- 蒸汽吸尘器的清洁效果及优点(以蒸汽吸尘器为主题的家居清洁新选择)
- 金立S5(金立S5的游戏性能如何?一起来看看吧!)
- 华为Mate9拍摄视频全方位评测(华为Mate9拍视频功能强大,画质出色,满足各类拍摄需求) b2b信息平台亿华云云服务器香港物理机源码库企业服务器网站建设