通過學(xué)習(xí)以與人類相同的方式偏離已知信息,人工智能(AI)的“成像”算法能夠從書面說明中識別以前看不見的物體。
該算法由KAUST研究人員Mohamed Elhoseiny與中央佛羅里達(dá)大學(xué)的Mohamed Elfeki合作開發(fā),為人工想象和對新動植物物種進(jìn)行自動分類鋪平了道路。
Elhoseiny解釋說:“想象力是人類智力的關(guān)鍵特性之一,它使我們不僅能夠產(chǎn)生藝術(shù)和音樂等創(chuàng)意產(chǎn)品,而且能夠理解視覺世界。”
人工智能依靠訓(xùn)練數(shù)據(jù)來發(fā)展其識別物體并響應(yīng)其環(huán)境的能力。人類也可以通過積累的經(jīng)驗(yàn)來發(fā)展這種能力,但是人類可以做AI無法做到的事情。他們可以通過想象從書面描述中得出的東西看起來是什么樣子,或者通過類似的推論來直觀地推斷出以前遇到的對象的可能分類。在AI中,隨著技術(shù)被推廣到復(fù)雜的實(shí)際應(yīng)用中(其中新對象的錯誤分類或錯誤識別可能會造成災(zāi)難性的后果),這種想象未知的能力變得越來越重要。
同樣重要的是可靠地為現(xiàn)實(shí)世界訓(xùn)練AI所需的大量數(shù)據(jù)。用AI甚至對全世界所有已知動植物物種的很小一部分的圖像進(jìn)行訓(xùn)練來進(jìn)行AI訓(xùn)練是不可行的,更不用說無數(shù)未發(fā)現(xiàn)或未分類的物種了。
Elhoseiny和Elfeki的研究旨在開發(fā)所謂的零擊學(xué)習(xí)(ZSL)算法,以基于沒有培訓(xùn)示例的班級描述來幫助識別以前看不見的類別。
Elhoseiny表示:“我們通過將ZSL與人類創(chuàng)造力聯(lián)系起來,為'看不見的'類別建立了視覺學(xué)習(xí)過程的模型,觀察到ZSL是要識別看不見的事物,而創(chuàng)造力是要創(chuàng)造'可愛的看不見的事物,” Elhoseiny說。
在創(chuàng)造力方面,新穎但令人愉悅或“討人喜歡”的事物必須與現(xiàn)有技術(shù)有所不同,但又應(yīng)如此以至于無法辨認(rèn)。以同樣的方式,Elhoseiny和Elfeki仔細(xì)地建模了一個學(xué)習(xí)信號,該信號以歸納方式鼓勵了與已見班級的背離,但并沒有推得太遠(yuǎn),以至于想象中的班級變得不切實(shí)際,并失去了已見班級的知識轉(zhuǎn)移。所得算法顯示出對ZSL最新基準(zhǔn)的持續(xù)改進(jìn)。
Elhoseiny說:“我們方法的可能應(yīng)用之一是識別未知物種。”“采用這種技術(shù)的AI可以幫助報告物種的目擊情況,而無需圖片,只需帶有語言描述即可。”