在英國,微生物學(xué)家通過開創(chuàng)性的CLIMB項(xiàng)目(用于微生物生物信息學(xué)的云基礎(chǔ)設(shè)施)共享世界一流的HPC資源。
由于科學(xué)技術(shù)的飛躍發(fā)展和高性能計(jì)算的發(fā)展,基因組測序已成為醫(yī)療保健和科學(xué)研究的主流。現(xiàn)在,世界各地的人們都可以使用基因組測序來診斷和治療疾病,并開發(fā)針對(duì)癌癥,阿爾茨海默氏病和其他疾病的新療法。
基因測序?qū)氖箩t(yī)學(xué)微生物學(xué)研究的人員而言尤其重要。這是一個(gè)問題,因?yàn)樵S多微生物學(xué)家無法獲得他們進(jìn)行數(shù)據(jù)密集型研究所需的計(jì)算基礎(chǔ)架構(gòu),而這些研究通常涉及大量的基因組數(shù)據(jù)集。
這是英國微生物生物信息學(xué)云基礎(chǔ)設(shè)施(CLIMB)進(jìn)入的地方。CLIMB項(xiàng)目由國家醫(yī)學(xué)研究委員會(huì)(MRC)資助,是華威大學(xué),伯明翰大學(xué),卡迪夫大學(xué),斯旺西大學(xué),巴斯大學(xué)和萊斯特大學(xué)與Quadram生物技術(shù)研究所的合作。CLIMB致力于為微生物生物信息學(xué)開發(fā)和部署世界一流的網(wǎng)絡(luò)基礎(chǔ)設(shè)施,包括面向英國學(xué)術(shù)微生物學(xué)家的基于云的計(jì)算,存儲(chǔ)和分析工具。
CLIMB已成為英國微生物學(xué)家不可或缺的國家能力。最近的一項(xiàng)統(tǒng)計(jì)發(fā)現(xiàn),它為來自89個(gè)研究機(jī)構(gòu)的1,000多個(gè)用戶和300多個(gè)研究小組提供了服務(wù),其中包括大學(xué),公共衛(wèi)生機(jī)構(gòu)和政府組織。此外,CLIMB還為英國乃至整個(gè)巴勒斯坦,岡比亞和越南的數(shù)千名學(xué)者,學(xué)生和臨床微生物學(xué)家提供了生物信息學(xué)方面的培訓(xùn)。
在英國以外,CLIMB的影響并非沒有被忽視。該項(xiàng)目贏得了國際認(rèn)可,包括2017年HPCwire生命科學(xué)領(lǐng)域最佳HPC讀者選擇獎(jiǎng)和學(xué)術(shù)界,政府或行業(yè)的最佳HPC合作獎(jiǎng)。[1]
讓我們退后一步,從更廣泛的角度來看事情。CLIMB項(xiàng)目是通過云接口使HPC資源可用的趨勢的一部分。曾經(jīng)被鎖定在大學(xué)和行業(yè)研究實(shí)驗(yàn)室中并且僅對(duì)少數(shù)幾個(gè)人可用的系統(tǒng)現(xiàn)在正對(duì)許多用戶可用。
CLIMB絕對(duì)是這種情況。正如CLIMB在《微生物基因組學(xué)》雜志上發(fā)表的論文中所解釋的那樣,CLIMB系統(tǒng)是從頭開始設(shè)計(jì)的,可以用作基于云的計(jì)算基礎(chǔ)架構(gòu),從而提供了一個(gè)環(huán)境,微生物學(xué)家可以共享和重用方法和數(shù)據(jù),并且無需考慮即可有關(guān)底層HPC系統(tǒng)的很多內(nèi)容。
“云計(jì)算方法整合了共享的在線計(jì)算基礎(chǔ)架構(gòu),使最終用戶不必?fù)?dān)心諸如安裝,維護(hù)甚至物理計(jì)算資源的位置之類的技術(shù)問題,以及諸如系統(tǒng)管理之類的其他潛在麻煩問題,數(shù)據(jù)共享,可擴(kuò)展性,安全性和備份。”白皮書指出。
引擎蓋下的外觀
CLIMB的核心基礎(chǔ)架構(gòu)是運(yùn)行開源OpenStack操作系統(tǒng)的云系統(tǒng)。為了提高彈性,CLIMB分布在四個(gè)站點(diǎn)上,每個(gè)站點(diǎn)具有500 TB的本地暫存存儲(chǔ)。
CLIMB環(huán)境的核心是大型共享對(duì)象存儲(chǔ)系統(tǒng),該系統(tǒng)提供約2.5 PB的HPC數(shù)據(jù)存儲(chǔ),可以在站點(diǎn)之間復(fù)制。該存儲(chǔ)系統(tǒng)基于在具有Intel®Xeon®處理器的Dell EMC PowerEdge服務(wù)器上運(yùn)行的Red Hat Ceph Storage。這個(gè)社區(qū)系統(tǒng)為研究人員提供了一個(gè)存儲(chǔ)和共享非常大的微生物數(shù)據(jù)集的地方。
此外,CLIMB云環(huán)境還提供對(duì)大量內(nèi)存(超過78 TB內(nèi)存)的訪問。有了這些強(qiáng)大的功能,CLIMB可以同時(shí)運(yùn)行1000多個(gè)虛擬機(jī),并且每個(gè)VM都可以預(yù)加載軟件,由最終用戶自定義,并保存為快照,以供基礎(chǔ)架構(gòu)上的其他人重用。
重要要點(diǎn)
CLIMB項(xiàng)目是高性能計(jì)算未來的一個(gè)很好的例子,其中資源將被虛擬化并通過云服務(wù)提供給許多用戶。
在這個(gè)新世界中,需要訪問HPC資源以進(jìn)行計(jì)算和數(shù)據(jù)密集型工作的用戶將把HPC和AI視為他們所需的一切服務(wù)。反過來,HPC商店將充當(dāng)多云服務(wù)提供商,它們通過多個(gè)存儲(chǔ)系統(tǒng)提供集中的計(jì)算資源,并可以訪問多個(gè)內(nèi)部和外部云。
這個(gè)新時(shí)代將使高端處理能力和可擴(kuò)展存儲(chǔ)提供給各種規(guī)模的企業(yè),包括初創(chuàng)公司以及大學(xué)環(huán)境中的傳統(tǒng)HPC高級(jí)用戶,從而繼續(xù)HPC的民主化。