在這個(gè)大數(shù)據(jù)時(shí)代,科學(xué)計(jì)算中存在一些問題,這些問題是如此之大,如此復(fù)雜,包含的信息太多,以至于試圖解決這些問題對于大多數(shù)計(jì)算機(jī)來說都是一項(xiàng)艱巨的任務(wù)。
現(xiàn)在,圣路易斯華盛頓大學(xué)麥克凱爾維工程學(xué)院的研究人員開發(fā)了一種新算法,用于將一類常見問題(稱為線性逆問題)分解為較小的任務(wù),每個(gè)任務(wù)都可以通過在標(biāo)準(zhǔn)計(jì)算機(jī)上并行。
這項(xiàng)研究來自普雷斯頓·格林(Preston M. Green)電氣與系統(tǒng)工程系教授Jr-Shin Li的實(shí)驗(yàn)室,該研究于7月30日發(fā)表在《科學(xué)報(bào)告》雜志上。
除了提供解決此類問題的框架外,稱為并行殘差投影(PRP)的方法還提供了增強(qiáng)的安全性并減輕了對隱私的擔(dān)憂。
線性逆問題是那些試圖獲取觀測數(shù)據(jù)并試圖找到描述它的模型的問題。用最簡單的形式,他們可能看起來很熟悉:2x + y = 1,xy =3。許多高中生在沒有超級計(jì)算機(jī)幫助的情況下解決了x和y問題。
隨著越來越多不同領(lǐng)域的研究人員收集越來越多的數(shù)據(jù)以獲取更深刻的見解,這些方程式的規(guī)模和復(fù)雜性也在不斷增長。
他說:“我們開發(fā)了一個(gè)計(jì)算框架來解決成千上萬這樣的方程和變量的情況。”
這個(gè)項(xiàng)目是在研究涉及大數(shù)據(jù)的其他領(lǐng)域的研究問題時(shí)構(gòu)思的。李的實(shí)驗(yàn)室一直在與一位生物學(xué)家合作,研究與睡眠覺醒周期有關(guān)的神經(jīng)元網(wǎng)絡(luò)。
“在網(wǎng)絡(luò)推論的背景下,看著神經(jīng)元網(wǎng)絡(luò),逆問題看起來像這樣,”李博士實(shí)驗(yàn)室的研究員Vignesh Narayanan說:
給定從一堆神經(jīng)元記錄的數(shù)據(jù),描述這些神經(jīng)元如何相互連接的“模型”是什么?
納拉亞南說:“在我們實(shí)驗(yàn)室的早期工作中,我們證明了這個(gè)推理問題可以表述為線性逆問題。”
如果系統(tǒng)有幾百個(gè)節(jié)點(diǎn)(在這種情況下,節(jié)點(diǎn)是神經(jīng)元),則描述神經(jīng)元之間相互作用的矩陣可能是數(shù)百萬個(gè);那是巨大的。
“這個(gè)矩陣本身的存儲超出了普通臺式機(jī)的存儲能力,”博士學(xué)位的魏M說。李的實(shí)驗(yàn)室的學(xué)生。
此外,這樣的復(fù)雜系統(tǒng)通常是動態(tài)的,正如我們對它們的理解一樣。苗說:“說我們已經(jīng)有了一個(gè)解決方案,但是現(xiàn)在我要考慮其他一些單元的交互作用。” PRP不會引發(fā)新問題并從頭解決,而是增加了靈活性和可伸縮性。“您可以以任何方式處理問題。”
苗說,即使您碰巧擁有一臺超級計(jì)算機(jī),“通過分解大問題,您仍然有可能更快地解決它。”
除了分解復(fù)雜的問題并在不同的機(jī)器上并行解決之外,計(jì)算框架還重要的是合并結(jié)果并為初始問題計(jì)算出精確的解決方案。
PRP的意外好處是增強(qiáng)了數(shù)據(jù)安全性和隱私性。Narayanan說,當(dāng)信用卡公司使用算法來研究欺詐行為時(shí),或者醫(yī)院要分析其龐大的數(shù)據(jù)庫時(shí),“沒人愿意將所有訪問權(quán)限都授予一個(gè)人。”
納拉亞南說:“這是我們甚至沒有爭取的額外好處。”