手机免费看国产欧美精品_久久精品国产9久久综合_免费无码一区二区三区视频_亚洲综合精品一二三区在线

您的位置:首頁>互聯(lián)網(wǎng)>

機(jī)器學(xué)習(xí)將如何成為我們的甘道夫

在不久的將來,我們將使用機(jī)器閱讀研究論文并建立人類尚未建立的聯(lián)系。發(fā)表在科學(xué)雜志《自然》上的一篇論文概述了古老的科學(xué)研究論文中包含的“潛在知識”是如何被我們這些可憐的人類充分利用的。正如一個(gè)名為 Word2vec 的系統(tǒng)所證明的那樣,連接是存在的,并且它們將繼續(xù)通過機(jī)器學(xué)習(xí)以大的方式建立!

我們今天做什么

今天我們遇到了一個(gè)問題——個(gè)人收集知識與傳播知識之間存在某種脫節(jié)。以埃及金字塔為例。在某個(gè)時(shí)候,有人知道關(guān)于這些金字塔的一切——必須以某種方式知道才能建造它們。

隨著時(shí)間的推移,知識流失了。無論是缺乏了解的欲望,還是缺乏經(jīng)得起時(shí)間考驗(yàn)的知識保存方法,信息都丟失了。我們作為人類的集體記憶并沒有保留所有關(guān)于埃及金字塔的知識。

今天,我們擁有保留知識的方法,子孫后代可以依靠這些方法來立足和擴(kuò)展。問題在于,每次我們學(xué)習(xí)新知識時(shí),我們都會從自己獨(dú)特的角度解釋和/或傳播所述知識。即使我們處理看似客觀的主題,細(xì)節(jié)也可能會在此過程中丟失。

甘道夫

這種情況的另一個(gè)流行文化參考是指環(huán)王中的甘道夫。“曾經(jīng)的很多東西都丟了,”精靈領(lǐng)主加拉德瑞爾說,“因?yàn)楝F(xiàn)在沒有人記得它了。”

在米那斯提力斯的圖書館里,甘道夫從各個(gè)時(shí)代尋找信息,但幾乎都忘記了。在搜索圖書館和一堆亂七八糟的論文時(shí),甘道夫在已經(jīng)發(fā)表的論文中發(fā)現(xiàn)了一些發(fā)現(xiàn)。

甘道夫重新發(fā)現(xiàn)了力量之戒和一戒發(fā)生了什么,以及基本上所有使《指環(huán)王》的故事從那時(shí)開始向前發(fā)展的東西。當(dāng)然,這些信息是寫下來的,但我們需要一個(gè)甘道夫去尋找它,閱讀它,并將重要的部分傳達(dá)給世界,這樣我們今天就可以在這里使用這些知識。

更好地標(biāo)記

研究人員 Vahe Tshitoyan 等人寫道:“出版物包含有關(guān)作者解釋的數(shù)據(jù)項(xiàng)之間的聯(lián)系和關(guān)系的寶貴知識,為了提高對這些知識的識別和使用,一些研究側(cè)重于從科學(xué)文獻(xiàn)中檢索信息使用有監(jiān)督的自然語言處理。”

這個(gè)過程需要手工處理數(shù)據(jù)集,并且它們通常與手工標(biāo)記的數(shù)據(jù)集一起使用。同樣,在標(biāo)記過程中可能會遺漏細(xì)節(jié)。Tshitoyan 的新研究中提出的過程提出了一種新方法。

這種新方法使用來自已發(fā)表研究的材料科學(xué)知識,編碼為“沒有人工標(biāo)記或監(jiān)督的信息密集詞嵌入(詞的向量表示)”。計(jì)算機(jī)解釋信息并將其全部存儲在一個(gè)地方。

會發(fā)生什么?

一旦機(jī)器開始捕獲信息,它就會立即開始解釋所述信息。然后,該機(jī)器可能會“在發(fā)現(xiàn)材料前幾年推薦用于功能性應(yīng)用的材料”。

根據(jù) Tshitoyan 的說法,該團(tuán)隊(duì)的研究結(jié)果表明,已經(jīng)發(fā)表的研究包含“關(guān)于未來發(fā)現(xiàn)的潛在知識”,這些知識將被機(jī)器發(fā)現(xiàn)。這臺機(jī)器可能比人類早幾年做出發(fā)現(xiàn)——并且可能會發(fā)現(xiàn)人類根本無法建立的聯(lián)系!

“在每個(gè)研究領(lǐng)域都有 100 年的過去研究文獻(xiàn),每周都有數(shù)十項(xiàng)研究出來,”研究合著者 Gerbrand Ceder 說。“研究人員只能訪問其中的一小部分。我們認(rèn)為,機(jī)器學(xué)習(xí)能否在不需要人類研究人員指導(dǎo)的情況下,以無人監(jiān)督的方式利用所有這些集體知識?”

免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!