珠海业勤税务师事务所有限公司珠海业勤税务师事务所有限公司

手指的速度越快声音越大,撞得越快叫的声音越

手指的速度越快声音越大,撞得越快叫的声音越 “AI春晚”英伟达放大招:亮算力“杀器”、助游戏“捏人”;黄仁勋帮算账:GPU多买多省

  “AI热潮”最大赢(yíng)家(jiā)之(zhī)一、英伟达背(bèi)后(hòu)的那(nà)个(gè)身穿黑色皮衣的男(nán)人又来(lái)了。

  前脚(jiǎo)才交出亮(liàng)眼(yǎn)业绩狂(kuáng)拉股价,英伟达CEO黄仁勋后脚就在昨日的COMPUTEX大会上宣布,“我们已到(dào)达生成式AI引爆点。从此,全世界(jiè)的每个(gè)角落,都会(huì)有计算需求(qiú)。”

  如今英伟达(dá)掌握(wò)着全球(qiú)多家科技(jì)公(gōng)司“算(suàn)力命脉”,而在这场大会上,黄仁勋激情演讲2个小(xiǎo)时,甩出了(le)多项重磅新(xīn)发布,包括算力“杀器”DGX GH200超级(jí)计算机、针对(duì)游戏的ACE代工服务、MGX服务器(qì)规范等(děng)内容。

  算力(lì)“杀器(qì)”:DGX GH200超级计算(suàn)机+GH200超级芯片

  先看“集成了(le)英伟达最先进加速计算和网络技术”的DGX GH200人工智能超级计算(suàn)机(jī)

  这款(kuǎn)超(chāo)算专为(wèi)大规模生(shēng)成式AI的负(fù)载所设计,由256块GH200超(chāo)级芯片组(zǔ)成,拥有1 exaflop超凡AI性能、144TB内(nèi)存(是(shì)英伟达目前(qián)DGX A100系统的近500倍)、150英里光纤(xiān)、2000多个风扇。

  DGX GH200重达(dá)40000磅(约合18手指的速度越快声音越大,撞得越快叫的声音越143千克(kè)),堪比(bǐ)四只成年大象的(de)体重。

  预计DGX GH200将于(yú)今年年底(dǐ)投入问(wèn)世,英伟达暂(zàn)未公布价格,而谷(gǔ)歌云、Meta与微软将是首(shǒu)批用户(hù)

  同时(shí),英伟达也(yě)正在打造自家(jiā)基于DGX GH200的大型AI超(chāo)级(jí)计算机NVIDIA Helios,以支持(chí)其研究(jiū)和开发团(tuán)队的工作。其中采用4个DGX GH200系(xì)统(tǒng)、1024颗Grace Hopper超级芯片(piàn),每个都将与英伟达Quantum-2 InfiniBand网(wǎng)络(luò)连接,带宽高达400Gb/s,将于今年年底上线。

  值得一提的(de)是,黄仁(rén)勋透露,DGX GH200集成的GH200 Grace Hopper超级芯片已(yǐ)进(jìn)入全(quán)面生产

  “拉踩”CPU:成本、功耗、处理数据量不如GPU

  在本次(cì)大(dà)会上,黄(huáng)仁勋还“拉踩”了一波CPU。他(tā)从功耗(hào)、处(chù)理(lǐ)数(shù)据量等方(fāng)面,指出使用GPU胜过CPU。

  举例来说(shuō),花费(fèi)1000万美元,可以建设一个有(yǒu)960颗CPU的数据中心,其可处理1X LMM(大(dà)语言模(mó)型)数据量(liàng),需要11GWh功(gōng)耗;

  同样成本下,也(yě)可以建设一个有48个GPU的数据(jù)中心,其(qí)可处(chù)理44X LLM数(shù)据量,仅(jǐn)需(xū)要3.2GWh功耗。

  若只(zhǐ)想处理1X LMM数据(jù)量,则只需40万美元,便可拥有一(yī)个搭载2个GPU、功耗(hào)仅0.13GWh的(de)数据中(zhōng)心。

  “买越多(duō),省越多(duō)(The more you buy, the more you save)。”黄仁勋再次(cì)表示。

  同时,他也列出(chū)了数据中心成本(běn)公式:数据中心总持有(yǒu)成本(běn)手指的速度越快声音越大,撞得越快叫的声音越=f[成(chéng)本(běn)(芯片(piàn)、系(xì)统(tǒng)、硬件生态系统)、吞吐量(GPU、Algo软件(jiàn)、网络、系统软件、软件生态系(xì)统)、使用(yòng)率(Algo Lib, 软件生态系统)、采购运营、生命周期(qī)最佳化、电(diàn)力]

  ACE代工服务(wù):用AI激活(huó)NPC生命

  游戏一直是备(bèi)受关注的一大(dà)AI应用落地领域。英(yīng)伟达也在大会(huì)上宣布,推出面(miàn)向游戏的定制AI模型代工服务NVIDIA Avatar Cloud Engine(ACE)

  它(tā)能赋予非玩家(jiā)角色(NPC)更智能且不(bù)断进化的对话(huà)技能,中间件、工具和游戏开发者可使用(yòng)它来构建和(hé)部署定制(zhì)的语音、对话和动画AI模(mó)型(xíng)

  其(qí)中(zhōng)包(bāo)括(kuò):英伟达NeMo,使用专(zhuān)有数据构建、定(dìng)制和部署语言模(mó)型;英(yīng)伟达Riva,用于(yú)自(zì)动语音识别和文本转语(yǔ)音实现实时语(yǔ)音对话;英伟达Omniverse Audio2Face,用(yòng)于即时创(chuàng)建游戏角色表情动(dòng)画(huà),以匹配任何(hé)语音(yīn)轨道(dào)。

  开发人员可选(xuǎn)择(zé)集成整个NVIDIA ACE for Games解决(jué)方案,也可仅使(shǐ)用需要的组件(jiàn)。

  新参考工作流程:帮助(zhù)建设数(shù)字(zì)化智能(néng)工厂

  黄仁勋表示,全球(qiú)电子(zi)制造商正在(zài)使用一种(zhǒng)全新的(de)综合(hé)参考(kǎo)工(gōng)作(zuò)流程推进工业数字(zì)化工(gōng)作,该(gāi)工作流(liú)程(chéng)结合了(le)英(yīng)伟达用于生成(chéng)式AI、3D协作、仿真(zhēn)和自主机器的技术,包括:

  英(yīng)伟达Omniverse,其(qí)连(lián)接(jiē)了顶(dǐng)级计(jì)算机辅助设计应用以及生成式AI的API和前沿框架(jià);用于(yú)模(mó)拟和测(cè)试(shì)机器人(rén)的英伟达(dá)Isaac Sim应(yīng)用(yòng)程序(xù);英伟达Metropolis视觉AI框架,用于自(zì)动光学检(jiǎn)测(cè)。

  同时,黄仁勋现场展示(shì)了(le)一个(gè)完全数字化的(de)智能工(gōng)厂的(de)演示。

  目(mù)前富士康工业互(hù)联网、宜(yí)鼎国际、和硕、广达和(hé)纬创正在使用(yòng)这(zhè)一参考工(gōng)作流程,具体用例包括(kuò)电路(lù)板(bǎn)质保检测点自动化、光学检测自动化、建设虚拟工厂、模拟协作机器人、构(gòu)建及(jí)运营数字孪(luán)生等。

  MGX服务器规范:快速高(gāo)效构(gòu)建百余种(zhǒng)服务(wù)器配置

  英伟达(dá)发布NVIDIA MGX服务(wù)器规(guī)范,为系统制造商提供(gōng)模块化(huà)参考(kǎo)架构,满(mǎn)足各种(zhǒng)规模的数(shù)据中心(xīn)需求(qiú)。系(xì)统(tǒng)制造商可使用它快速且经(jīng)济高效地构建(jiàn)100多(duō)种服务器(qì)配置,以适应广(guǎng)泛的AI、HPC及NVIDIA Omniverse应(yīng)用。

  MGX支持英(yīng)伟达(dá)全系列(liè)GPU、CPU、DPU和(hé)网络适配器、各(gè)种x86、完整软件(jiàn)堆栈及Arm处理器,还(hái)可集成到(dào)云和企业数据(jù)中(zhōng)心中(zhōng)。

  华硕、和硕、QCT、超(chāo)微(Supermicro)等都将采(cǎi)用MGX构(gòu)建下一代加速(sù)计算机(jī),可将开发成本削减多达3/4,并将开发时间缩短2/3至(zhì)仅需6个月

  其中(zhōng),QCT和超微(wēi)基(jī)于MGX的设计(jì)将于(yú)8月面世。超微昨(zuó)日(rì)公布的ARS-221GL-NR系统将采用Grace CPU,而QCT的S74G-2U系统将(jiāng)采(cǎi)用(yòng)Grace Hopper。

  推(tuī)出Spectrum-X网(wǎng)络(luò)平台 构建超(chāo)大规模(mó)生成式(shì)AI超级(jí)计算机Israel-1

  另(lìng)外,黄仁(rén)勋宣布推出NVIDIA Spectrum-X网(wǎng)络平台,旨在提高基于以(yǐ)太网(wǎng)的AI云的性能和效率(lǜ)。

  相比传(chuán)统(tǒng)以太网结构,Spectrum-X可(kě)实现1.7倍的(de)整体AI性能(néng)和(hé)能效提升,并(bìng)具有(yǒu)高度(dù)通用性,可(kě)用(yòng)于各(gè)种(zhǒng)AI应用(yòng)。它使用完全基于标(biāo)准的以太(tài)网,并可与基于以(yǐ)太网的堆栈(zhàn)互操(cāo)作。该平台支持256个200Gb/s端口,通过单(dān)个交换机连接(jiē),或在两层leaf-spine拓扑(pū)中提(tí)供16000个端口,以支持AI云(yún)增长和扩展,在(zài)保持性能的同时最大限度减少网络延迟。

  全球领先(xiān)云(yún)计算提(tí)供商正在(zài)采用Spectrum-X平台扩展生(shēng)成式AI服务,而Spectrum-X、Spectrum-4交换机(jī)、BlueField-3 DPU等已在戴(dài)尔、联想(xiǎng)等系统(tǒng)制造商处提供。

  此外,作为Spectrum-X参考设计的(de)蓝图(tú)和测试平(píng)台,英伟达正构建(jiàn)一台超(chāo)大规模生成式AI超(chāo)级计算机Israel-1。这台AI超算(suàn)价(jià)值数(shù)亿(yì)美(měi)元,将采用戴(dài)尔PowerEdge XE9680服(fú)务(wù)器、英伟(wěi)达HGX H100超级计算平台(tái)、内置BlueField-3 DPU和Spectrum-4交换机的Spectrum-X平(píng)台。

  结(jié)语

  “40年来(lái),我们(men)创造了PC、互(hù)联网、移动、云(yún),现在(zài)是(shì)人工智能时代。你会创造什么?不(bù)管是什(shén)么,都要像我们一样追赶(gǎn)它。要(yào)奔(bēn)跑,不要走。要么为了食物奔跑,要(yào)么作为食物奔跑。”

  在5月27日的台湾大学发表(biǎo)了(le)毕(bì)业(yè)典礼演讲(jiǎng)上,黄仁勋再次强调(diào)了掌握(wò)AI技术的重(zhòng)要(yào)性:很多人担心,AI会(huì)抢走自己(jǐ)的工作。但真正会(huì)抢走你饭碗(wǎn)的,是掌握了(le)AI技(jì)术的人。

  他表示,从各(gè)方面来看,AI的兴盛是计算(suàn)机产业的再生契机。在下个十年,我们(men)的产业将使用新型AI电(diàn)脑,取代价值(zhí)万(wàn)亿美元(yuán)的传统电脑(nǎo)。

  而从(cóng)昨(zuó)日(rì)大会(huì)上黄仁勋的展示中,人工智能时代的未(wèi)来轮廓似乎已逐渐浮现。

未经允许不得转载:珠海业勤税务师事务所有限公司 手指的速度越快声音越大,撞得越快叫的声音越

评论

5+2=