英偉達(dá)今天與世界上最快的計(jì)算機(jī)的最新列表同時(shí)發(fā)布了其Selene AI超級(jí)計(jì)算機(jī)。Nvidia還介紹了基于Ampere的A100 GPU的PCIe尺寸。
Nvidia的新型內(nèi)部AI超級(jí)計(jì)算機(jī)Selene加入了第55位Top500的行列,打破了能源效率壁壘。Selene憑借27.5雙精度Linpack petaflops,在ISC 2020數(shù)字會(huì)議的今天公布的最新Top500榜單上排名第七。Selene是榜單上性能最高的第二大行業(yè)系統(tǒng),僅次于Eni的 HPC5計(jì)算機(jī),后者以35.5 HPL petaflops(還使用Nvidia GPU)排名第六。
該Top500列表標(biāo)志著兩個(gè)行業(yè)系統(tǒng)進(jìn)入前十名,而Selene是第一個(gè)這樣做的內(nèi)部IT供應(yīng)商系統(tǒng)。英偉達(dá)內(nèi)部使用超級(jí)計(jì)算機(jī)來(lái)支持芯片設(shè)計(jì)和模型開(kāi)發(fā),以及在機(jī)器人技術(shù),自動(dòng)駕駛汽車(chē),醫(yī)療保健和其他研究項(xiàng)目中的工作。
Selene是位于加利福尼亞州圣克拉拉的DGX SuperPOD,它由DGX A100尺寸內(nèi)的Nvidia的A100 GPU和AMD的Epyc Rome CPU驅(qū)動(dòng),并通過(guò)Mellanox HDR InfiniBand集群。Selene總共包含280臺(tái)DGX A100,總共容納2,240個(gè)A100 GPU和494臺(tái)Mellanox Quantum 200G InfiniBand交換機(jī),提供56 TB / s的網(wǎng)絡(luò)結(jié)構(gòu)。該系統(tǒng)包括7 PB的全閃存網(wǎng)絡(luò)存儲(chǔ)。
營(yíng)銷(xiāo)高級(jí)副總裁吉拉德·謝納(Gilad Shainer)說(shuō),Selene是使用SHARP通過(guò)網(wǎng)絡(luò)和GPU的垂直集成構(gòu)建的 ,他是通過(guò)收購(gòu)Mellanox來(lái)到英偉達(dá)的。他在為媒體舉行的簡(jiǎn)短預(yù)告中說(shuō):“ SHARP是網(wǎng)絡(luò)上進(jìn)行數(shù)據(jù)縮減的引擎,這在傳統(tǒng)的HPC模擬和深度學(xué)習(xí)中都是至關(guān)重要的部分。”
該公司表示,在Nvidia 推出Ampere之后,Selene的建造和投入運(yùn)營(yíng)不到一個(gè)月。
Nvidia還在其他三臺(tái)計(jì)算機(jī)上運(yùn)行內(nèi)部工作負(fù)載,這些計(jì)算機(jī)使其躋身Top500排名。有基于V100的DGX Superpod機(jī)器,它在最新的Top500上以9.4 Linpack petaflops排名第24;基于P100的DGX Saturn-V,于2016年部署,目前以3.3 petaflops排名第78位;Circe,另一個(gè)基于V100的Superpod,它以3.1 Linpack petaflops占據(jù)了第91梯級(jí)。
Moor Insights and Strategy的HPC和深度學(xué)習(xí)高級(jí)分析師Karl Freund提出了評(píng)論, 強(qiáng)調(diào)了這種內(nèi)部超級(jí)計(jì)算能力對(duì)Nvidia競(jìng)爭(zhēng)地位的整合作用。他對(duì)HPCwire表示: “首先是在土星5號(hào),現(xiàn)在是在Selene,現(xiàn)在Nvidia正在使用他們自己的技術(shù)來(lái)創(chuàng)建更好的產(chǎn)品,硬件和軟件,這將為某些人創(chuàng)建具有競(jìng)爭(zhēng)力的產(chǎn)品 打下堅(jiān)實(shí)的基礎(chǔ)。” “您無(wú)法想象一家初創(chuàng)公司要花費(fèi)數(shù)千萬(wàn)美元來(lái)開(kāi)發(fā)超級(jí)計(jì)算機(jī),工程師們可以用它來(lái)開(kāi)發(fā)他們的下一個(gè)芯片。使用AI,尤其是深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)來(lái)進(jìn)行后端物理設(shè)計(jì),已顯示出了巨大的創(chuàng)新。”
Nvidia的最新AI超級(jí)計(jì)算機(jī)Selene在Green500名單上排名第二,提供了20.52吉瓦/瓦的功率,成為僅有的兩臺(tái)突破20吉瓦/瓦的障礙的機(jī)器之一。排名最高的綠色機(jī)器是MN-3,由Top500新人Preferred Networks制造。MN-3的每瓦運(yùn)行記錄達(dá)到了創(chuàng)紀(jì)錄的21.1 gigaflops,Linpack得分為1.62 petaflops,在Top500中排名第394。
Nvidia GPU為T(mén)op500上十個(gè)最節(jié)能的機(jī)器中的六個(gè)提供動(dòng)力,在前20個(gè)中的十五個(gè)中為15個(gè)提供動(dòng)力。
Nvidia還通過(guò)使用新的PCIe A100 GPU卡來(lái)擴(kuò)展其Ampere產(chǎn)品組合。當(dāng)Nvidia 推出 其Ampere架構(gòu)時(shí),獲得A100 GPU的唯一方法是購(gòu)買(mǎi)Nvidia的DGX A100系統(tǒng)(可提供四GPU和八GPU配置)或HGX A100構(gòu)建塊,并由合作的云服務(wù)提供商和服務(wù)器制造商加以利用。現(xiàn)在,數(shù)據(jù)中心公司宣布服務(wù)器合作伙伴將推出基于PCIe的系統(tǒng),其配置范圍從一個(gè)GPU到十個(gè)或更多GPU。
英偉達(dá)表示,具有NVLink的SXM變體仍?xún)H作為HGX平臺(tái)的一部分提供,它具有NVLink連接性,可提供PCIe Gen4帶寬的10倍。
Nvidia出售了SXM尺寸和PCIe尺寸的上一代V100 GPU。SXM不僅限于出售HGX板,這使系統(tǒng)制造商能夠從根本上構(gòu)建自己的DGX克隆,這有可能削弱Nvidia的銷(xiāo)售額?,F(xiàn)在,英偉達(dá)正在加強(qiáng)其銷(xiāo)售策略,以便希望基于性能更高,配備N(xiāo)VLink的SXM部件提供服務(wù)器的OEM合作伙伴必須使用英偉達(dá)的四路或八路HGX板構(gòu)建基于A100的解決方案。
“這是按渠道劃分的模型;直接渠道客戶(hù)可以并且將購(gòu)買(mǎi)DGX,其他所有人都通過(guò)OEM購(gòu)買(mǎi)。” Freund說(shuō)。“這是一個(gè)非常干凈的模型。OEM注意到他們必須迅速采取行動(dòng),否則Nvidia將作為系統(tǒng)供應(yīng)商來(lái)承擔(dān)所有這些責(zé)任,對(duì)嗎?但是Nvidia并不是真的想要擁有一個(gè)足夠廣泛的銷(xiāo)售渠道來(lái)專(zhuān)門(mén)實(shí)現(xiàn)這一目標(biāo)。因此,他們?nèi)匀恍枰狾EM。”
PCIe外形在峰值性能上與SXM相匹配:9.7 teraflops FP64性能(高達(dá)19.5 teraflops FP64張量核心性能)和19.6 teraflops FP32性能(高達(dá)312 teraflops張量浮點(diǎn)32 [啟用結(jié)構(gòu)稀疏性])。但是,與SXM的400瓦相比,其功耗為250瓦,PCIe A100旨在以較低的TDP運(yùn)行。這意味著盡管最高性能相同,但持續(xù)性能會(huì)受到影響。Nvidia表示,在實(shí)際應(yīng)用中,當(dāng)在單個(gè)GPU上運(yùn)行時(shí),A100 PCIe GPU可以提供A100 SXM交付性能的90%左右。但據(jù)Nvidia稱(chēng),當(dāng)擴(kuò)大應(yīng)用程序在四個(gè),八個(gè)或更多GPU上運(yùn)行的位置時(shí),由于NVLink連接,HGX內(nèi)的SXM配置可將性能提高多達(dá)50%。
英偉達(dá)表示,PCIe配置非常適合主流加速服務(wù)器,這些服務(wù)器已進(jìn)入標(biāo)準(zhǔn)機(jī)架,每臺(tái)服務(wù)器的功耗更低。“雖然PCIe用于AI推理和某些可跨一個(gè)或兩個(gè)GPU擴(kuò)展的HPC應(yīng)用程序,但A100 SXM配置對(duì)于應(yīng)用程序可擴(kuò)展到服務(wù)器以及服務(wù)器中多個(gè)GPU的客戶(hù)來(lái)說(shuō)是理想的選擇,” Paresh Kharya說(shuō), Nvidia加速計(jì)算產(chǎn)品管理總監(jiān)。
隨著Nvidia加快其A100的上市速度,該公司期待著由A100驅(qū)動(dòng)的服務(wù)器的擴(kuò)展生態(tài)系統(tǒng)。預(yù)計(jì)今年夏天將有30個(gè)系統(tǒng),到今年年底將有20多個(gè)系統(tǒng)。預(yù)計(jì)將有眾多系統(tǒng)制造商推出這些系統(tǒng),包括華碩,Atos,思科,戴爾技術(shù),富士通,技嘉科技,惠普企業(yè),浪潮,聯(lián)想,一站式系統(tǒng),Quanta / QCT和Supermicro。Nvidia還報(bào)告說(shuō),它正在建立其經(jīng)過(guò)NGC就緒 認(rèn)證的系統(tǒng)產(chǎn)品組合 。