手机免费看国产欧美精品_久久精品国产9久久综合_免费无码一区二区三区视频_亚洲综合精品一二三区在线

您的位置:首頁>AI>

為AI功耗準(zhǔn)備數(shù)據(jù)中心的8種方法

隨著人工智能在企業(yè)環(huán)境中蓬勃發(fā)展,數(shù)據(jù)中心的功耗也將隨之增長(zhǎng)。人工智能是很多東西,但省電并不是其中之一。

對(duì)于運(yùn)行典型企業(yè)應(yīng)用程序的數(shù)據(jù)中心,機(jī)架的平均功耗約為7 kW。然而,據(jù)數(shù)據(jù)中心組織AFCOM稱,對(duì)于AI應(yīng)用而言,每個(gè)機(jī)架使用30 kW以上的功率是很常見的。這是因?yàn)锳I需要更高的處理器利用率,并且處理器(尤其是GPU)非常耗電。例如,Nvidia GPU的運(yùn)行速度可能比CPU快幾個(gè)數(shù)量級(jí),但每個(gè)芯片的功耗也要翻倍。使問題復(fù)雜化的是,許多數(shù)據(jù)中心已經(jīng)受到功率限制。

散熱也是一個(gè)問題:面向AI的服務(wù)器需要更高的處理器密度,這意味著會(huì)有更多芯片塞滿機(jī)箱,而且它們都非常熱。與典型的后臺(tái)服務(wù)器相比,更高的密度以及更高的利用率增加了對(duì)冷卻的需求。更高的冷卻要求反過來又增加了功率要求。

因此,如果出于競(jìng)爭(zhēng)原因希望采用AI,但現(xiàn)有設(shè)施的電源容量卻無法滿足AI的高密度基礎(chǔ)設(shè)施要求,您該怎么辦?這里有一些選擇。

考慮液體冷卻

一旦機(jī)架超過15 kW,風(fēng)扇冷卻通常就會(huì)失去生存能力。然而,根據(jù)企業(yè)液體冷卻產(chǎn)品制造商CoolIT Systems的說法,水的熱容量是空氣的3000倍。結(jié)果,服務(wù)器機(jī)柜制造商一直在向機(jī)柜添加液體管道,并將水管道連接至散熱器,而不是風(fēng)扇。

“對(duì)于高密度負(fù)載,液體冷卻絕對(duì)是一個(gè)很好的選擇,”數(shù)據(jù)中心開發(fā)商和運(yùn)營(yíng)商Sabey數(shù)據(jù)中心運(yùn)營(yíng)高級(jí)副總裁John Sasser說。“這消除了混亂的氣流問題。水散發(fā)的熱量比空氣散發(fā)的熱量多得多,您可以通過管道將其引導(dǎo)。許多HPC(高性能計(jì)算)都是通過液體冷卻來完成的。”

Sasser表示,大多數(shù)數(shù)據(jù)中心都是為空氣冷卻而設(shè)置的,因此液體冷卻將需要資本投資,“對(duì)于這些工作,這可能是更為明智的解決方案,尤其是如果公司決定朝[AI]的方向發(fā)展。”說。

以較低的分辨率運(yùn)行AI工作負(fù)載

Hyperion Research高級(jí)研究副總裁史蒂夫·康威(Steve Conway)表示,現(xiàn)有的數(shù)據(jù)中心也許能夠以減少的方式處理AI計(jì)算工作量。即使不是大多數(shù),許多工作負(fù)載也可以以一半或四分之一的精度而不是64位雙精度來運(yùn)行。

“對(duì)于某些問題,半精??度是可以的,” Conway說。“以更低的分辨率運(yùn)行它,減少數(shù)據(jù)量?;蚱渲械目茖W(xué)更少。”

在科學(xué)研究中,主要需要雙精度浮點(diǎn)計(jì)算,這通常是在分子水平上進(jìn)行的。在AI訓(xùn)練或深度學(xué)習(xí)模型推論中通常不使用雙精度,因?yàn)椴恍枰?。甚至Nvidia也提倡在深度神經(jīng)網(wǎng)絡(luò)中使用單精度和半精度計(jì)算。

建立一個(gè)AI收容區(qū)

人工智能將成為您業(yè)務(wù)的一部分,但不是全部,這應(yīng)該反映在您的數(shù)據(jù)中心中。“正在建造的新設(shè)施正在考慮將其設(shè)施的一部分分配給更高的能耗,”建造和運(yùn)營(yíng)數(shù)據(jù)中心的Five 9s Digital的合伙人Doug Hollidge說。“您不會(huì)將所有設(shè)施置為更高的密度,因?yàn)檫€有其他應(yīng)用程序具有較低的吸引力。”

Hollidge說,第一件事就是評(píng)估建筑物的能源供應(yīng)。“如果要增加建筑物的能源消耗,必須確保電源供應(yīng)器可以增加電源。”

免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!