手指的速度越快声音越大，撞得越快叫的声音越-珠海业勤税务师事务所有限公司

手指的速度越快声音越大，撞得越快叫的声音越 “AI春晚”英伟达放大招：亮算力“杀器”、助游戏“捏人”；黄仁勋帮算账：GPU多买多省

　　“AI热潮”最大赢(yíng)家(jiā)之(zhī)一、英伟达背(bèi)后(hòu)的那(nà)个(gè)身穿黑色皮衣的男(nán)人又来(lái)了。

　　前脚(jiǎo)才交出亮(liàng)眼(yǎn)业绩狂(kuáng)拉股价，英伟达CEO黄仁勋后脚就在昨日的COMPUTEX大会上宣布，“我们已到(dào)达生成式AI引爆点。从此，全世界(jiè)的每个(gè)角落，都会(huì)有计算需求(qiú)。”

　　如今英伟达(dá)掌握(wò)着全球(qiú)多家科技(jì)公(gōng)司“算(suàn)力命脉”，而在这场大会上，黄仁勋激情演讲2个小(xiǎo)时，甩出了(le)多项重磅新(xīn)发布，包括算力“杀器”DGX GH200超级(jí)计算机、针对(duì)游戏的ACE代工服务、MGX服务器(qì)规范等(děng)内容。

　　算力(lì)“杀器(qì)”：DGX GH200超级计算(suàn)机+GH200超级芯片

　　先看“集成了(le)英伟达最先进加速计算和网络技术”的DGX GH200人工智能超级计算(suàn)机(jī)。

　　这款(kuǎn)超(chāo)算专为(wèi)大规模生(shēng)成式AI的负(fù)载所设计，由256块GH200超(chāo)级芯片组(zǔ)成，拥有1 exaflop超凡AI性能、144TB内(nèi)存（是(shì)英伟达目前(qián)DGX A100系统的近500倍）、150英里光纤(xiān)、2000多个风扇。

　　DGX GH200重达(dá)40000磅（约合18手指的速度越快声音越大，撞得越快叫的声音越143千克(kè)），堪比(bǐ)四只成年大象的(de)体重。

　　预计DGX GH200将于(yú)今年年底(dǐ)投入问(wèn)世，英伟达暂(zàn)未公布价格，而谷(gǔ)歌云、Meta与微软将是首(shǒu)批用户(hù)。

　　同时(shí)，英伟达也(yě)正在打造自家(jiā)基于DGX GH200的大型AI超(chāo)级(jí)计算机NVIDIA Helios，以支持(chí)其研究(jiū)和开发团(tuán)队的工作。其中采用4个DGX GH200系(xì)统(tǒng)、1024颗Grace Hopper超级芯片(piàn)，每个都将与英伟达Quantum-2 InfiniBand网(wǎng)络(luò)连接，带宽高达400Gb/s，将于今年年底上线。

　　值得一提的(de)是，黄仁(rén)勋透露，DGX GH200集成的GH200 Grace Hopper超级芯片已(yǐ)进(jìn)入全(quán)面生产。

　　“拉踩”CPU：成本、功耗、处理数据量不如GPU

　　在本次(cì)大(dà)会上，黄(huáng)仁勋还“拉踩”了一波CPU。他(tā)从功耗(hào)、处(chù)理(lǐ)数(shù)据量等方(fāng)面，指出使用GPU胜过CPU。

　　举例来说(shuō)，花费(fèi)1000万美元，可以建设一个有(yǒu)960颗CPU的数据中心，其可处理1X LMM（大(dà)语言模(mó)型）数据量(liàng)，需要11GWh功(gōng)耗；

　　同样成本下，也(yě)可以建设一个有48个GPU的数据(jù)中心，其(qí)可处(chù)理44X LLM数(shù)据量，仅(jǐn)需(xū)要3.2GWh功耗。

　　若只(zhǐ)想处理1X LMM数据(jù)量，则只需40万美元，便可拥有一(yī)个搭载2个GPU、功耗(hào)仅0.13GWh的(de)数据中(zhōng)心。

　　“买越多(duō)，省越多(duō)（The more you buy， the more you save）。”黄仁勋再次(cì)表示。

　　同时，他也列出(chū)了数据中心成本(běn)公式：数据中心总持有(yǒu)成本(běn)手指的速度越快声音越大，撞得越快叫的声音越=f[成(chéng)本(běn)（芯片(piàn)、系(xì)统(tǒng)、硬件生态系统）、吞吐量（GPU、Algo软件(jiàn)、网络、系统软件、软件生态系(xì)统）、使用(yòng)率（Algo Lib，软件生态系统）、采购运营、生命周期(qī)最佳化、电(diàn)力]。

　　ACE代工服务(wù)：用AI激活(huó)NPC生命

　　游戏一直是备(bèi)受关注的一大(dà)AI应用落地领域。英(yīng)伟达也在大会(huì)上宣布，推出面(miàn)向游戏的定制AI模型代工服务NVIDIA Avatar Cloud Engine（ACE）。

　　它(tā)能赋予非玩家(jiā)角色（NPC）更智能且不(bù)断进化的对话(huà)技能，中间件、工具和游戏开发者可使用(yòng)它来构建和(hé)部署定制(zhì)的语音、对话和动画AI模(mó)型(xíng)。

　　其(qí)中(zhōng)包(bāo)括(kuò)：英伟达NeMo，使用专(zhuān)有数据构建、定(dìng)制和部署语言模(mó)型；英(yīng)伟达Riva，用于(yú)自(zì)动语音识别和文本转语(yǔ)音实现实时语(yǔ)音对话；英伟达Omniverse Audio2Face，用(yòng)于即时创(chuàng)建游戏角色表情动(dòng)画(huà)，以匹配任何(hé)语音(yīn)轨道(dào)。

　　开发人员可选(xuǎn)择(zé)集成整个NVIDIA ACE for Games解决(jué)方案，也可仅使(shǐ)用需要的组件(jiàn)。

　　新参考工作流程：帮助(zhù)建设数(shù)字(zì)化智能(néng)工厂

　　黄仁勋表示，全球(qiú)电子(zi)制造商正在(zài)使用一种(zhǒng)全新的(de)综合(hé)参考(kǎo)工(gōng)作(zuò)流程推进工业数字(zì)化工(gōng)作，该(gāi)工作流(liú)程(chéng)结合了(le)英(yīng)伟达用于生成(chéng)式AI、3D协作、仿真(zhēn)和自主机器的技术，包括：

　　英(yīng)伟达Omniverse，其(qí)连(lián)接(jiē)了顶(dǐng)级计(jì)算机辅助设计应用以及生成式AI的API和前沿框架(jià)；用于(yú)模(mó)拟和测(cè)试(shì)机器人(rén)的英伟达(dá)Isaac Sim应(yīng)用(yòng)程序(xù)；英伟达Metropolis视觉AI框架，用于自(zì)动光学检(jiǎn)测(cè)。

　　同时，黄仁勋现场展示(shì)了(le)一个(gè)完全数字化的(de)智能工(gōng)厂的(de)演示。

　　目(mù)前富士康工业互(hù)联网、宜(yí)鼎国际、和硕、广达和(hé)纬创正在使用(yòng)这(zhè)一参考工(gōng)作流程，具体用例包括(kuò)电路(lù)板(bǎn)质保检测点自动化、光学检测自动化、建设虚拟工厂、模拟协作机器人、构(gòu)建及(jí)运营数字孪(luán)生等。

　　MGX服务器规范：快速高(gāo)效构(gòu)建百余种(zhǒng)服务(wù)器配置

　　英伟达(dá)发布NVIDIA MGX服务(wù)器规(guī)范，为系统制造商提供(gōng)模块化(huà)参考(kǎo)架构，满(mǎn)足各种(zhǒng)规模的数(shù)据中心(xīn)需求(qiú)。系(xì)统(tǒng)制造商可使用它快速且经(jīng)济高效地构建(jiàn)100多(duō)种服务器(qì)配置，以适应广(guǎng)泛的AI、HPC及NVIDIA Omniverse应(yīng)用。

　　MGX支持英(yīng)伟达(dá)全系列(liè)GPU、CPU、DPU和(hé)网络适配器、各(gè)种x86、完整软件(jiàn)堆栈及Arm处理器，还(hái)可集成到(dào)云和企业数据(jù)中(zhōng)心中(zhōng)。

　　华硕、和硕、QCT、超(chāo)微（Supermicro）等都将采(cǎi)用MGX构(gòu)建下一代加速(sù)计算机(jī)，可将开发成本削减多达3/4，并将开发时间缩短2/3至(zhì)仅需6个月。

　　其中(zhōng)，QCT和超微(wēi)基(jī)于MGX的设计(jì)将于(yú)8月面世。超微昨(zuó)日(rì)公布的ARS-221GL-NR系统将采用Grace CPU，而QCT的S74G-2U系统将(jiāng)采(cǎi)用(yòng)Grace Hopper。

　　推(tuī)出Spectrum-X网(wǎng)络(luò)平台构建超(chāo)大规模(mó)生成式(shì)AI超级(jí)计算机Israel-1

　　另(lìng)外，黄仁(rén)勋宣布推出NVIDIA Spectrum-X网(wǎng)络平台，旨在提高基于以(yǐ)太网(wǎng)的AI云的性能和效率(lǜ)。

　　相比传(chuán)统(tǒng)以太网结构，Spectrum-X可(kě)实现1.7倍的(de)整体AI性能(néng)和(hé)能效提升，并(bìng)具有(yǒu)高度(dù)通用性，可(kě)用(yòng)于各(gè)种(zhǒng)AI应用(yòng)。它使用完全基于标(biāo)准的以太(tài)网，并可与基于以(yǐ)太网的堆栈(zhàn)互操(cāo)作。该平台支持256个200Gb/s端口，通过单(dān)个交换机连接(jiē)，或在两层leaf-spine拓扑(pū)中提(tí)供16000个端口，以支持AI云(yún)增长和扩展，在(zài)保持性能的同时最大限度减少网络延迟。

　　全球领先(xiān)云(yún)计算提(tí)供商正在(zài)采用Spectrum-X平台扩展生(shēng)成式AI服务，而Spectrum-X、Spectrum-4交换机(jī)、BlueField-3 DPU等已在戴(dài)尔、联想(xiǎng)等系统(tǒng)制造商处提供。

　　此外，作为Spectrum-X参考设计的(de)蓝图(tú)和测试平(píng)台，英伟达正构建(jiàn)一台超(chāo)大规模生成式AI超(chāo)级计算机Israel-1。这台AI超算(suàn)价(jià)值数(shù)亿(yì)美(měi)元，将采用戴(dài)尔PowerEdge XE9680服(fú)务(wù)器、英伟(wěi)达HGX H100超级计算平台(tái)、内置BlueField-3 DPU和Spectrum-4交换机的Spectrum-X平(píng)台。

　　结(jié)语

　　“40年来(lái)，我们(men)创造了PC、互(hù)联网、移动、云(yún)，现在(zài)是(shì)人工智能时代。你会创造什么？不(bù)管是什(shén)么，都要像我们一样追赶(gǎn)它。要(yào)奔(bēn)跑，不要走。要么为了食物奔跑，要(yào)么作为食物奔跑。”

　　在5月27日的台湾大学发表(biǎo)了(le)毕(bì)业(yè)典礼演讲(jiǎng)上，黄仁勋再次强调(diào)了掌握(wò)AI技术的重(zhòng)要(yào)性：很多人担心，AI会(huì)抢走自己(jǐ)的工作。但真正会(huì)抢走你饭碗(wǎn)的，是掌握了(le)AI技(jì)术的人。

　　他表示，从各(gè)方面来看，AI的兴盛是计算(suàn)机产业的再生契机。在下个十年，我们(men)的产业将使用新型AI电(diàn)脑，取代价值(zhí)万(wàn)亿美元(yuán)的传统电脑(nǎo)。

　　而从(cóng)昨(zuó)日(rì)大会(huì)上黄仁勋的展示中，人工智能时代的未(wèi)来轮廓似乎已逐渐浮现。

未经允许不得转载：珠海业勤税务师事务所有限公司手指的速度越快声音越大，撞得越快叫的声音越