手机免费看国产欧美精品_久久精品国产9久久综合_免费无码一区二区三区视频_亚洲综合精品一二三区在线

您的位置:首頁>AI>

機器學(xué)習(xí)算法找到了創(chuàng)新的解決方案和出人意料的新策略

人工智能研究公司OpenAI的程序員最近教了一群智能人工智能(機器人)玩捉迷藏游戲。不是因為他們關(guān)心誰贏了:目標是觀察藏身者和尋找者之間的競爭如何驅(qū)動機器人尋找和使用數(shù)字工具?,F(xiàn)實生活中曾經(jīng)玩過游戲的人都熟悉這個想法。這是一種按比例縮小的軍備競賽。當(dāng)您的對手采取行之有效的策略時,您必須放棄以前所做的事情,找到一個更好的新計劃。從國際象棋到《星際爭霸2》,這是統(tǒng)治游戲的規(guī)則。這也是一種適應(yīng)性,似乎可以賦予其進化優(yōu)勢。

因此它與捉迷藏一起進行。即使AI代理商沒有收到有關(guān)如何玩的明確指示,他們也很快學(xué)會了逃跑和追逐。經(jīng)過數(shù)億游戲之后,他們學(xué)會了操縱環(huán)境以發(fā)揮自己的優(yōu)勢。例如,藏匿者學(xué)會了在其內(nèi)部建造微型堡壘并設(shè)路障。作為回應(yīng),搜尋者學(xué)會了如何使用坡道縮放墻壁并找到藏身箱。

OpenAI團隊表示,這些行動說明了AI代理如何學(xué)習(xí)如何將周圍的事物用作工具。這很重要,不是因為AI需要更好地隱藏和尋找,而是因為它提出了一種構(gòu)建可以解決開放式現(xiàn)實問題的AI的方法。

我們沒想到[盒子沖浪]會發(fā)生,但是這樣做確實令人興奮。

OpenAI的Bowen Baker

電子游戲公司Unity Technologies的計算機科學(xué)家兼AI副總裁Danny Lange說:“這是令人印象深刻的工具使用,而工具的使用對于AI系統(tǒng)來說是不可思議的。”尋找項目。這些系統(tǒng)如此迅速地找到了使用工具的方式。想象一下他們何時可以使用許多工具或創(chuàng)建工具。他們會發(fā)明梯子嗎?”

進一步推論:他們能發(fā)明出在現(xiàn)實世界中有用的東西嗎?最近的研究探索了教AI代理使用工具的方法,但是在大多數(shù)方法中,工具使用本身就是目標。捉迷藏實驗是不同的:獎勵與隱藏和查找相關(guān)聯(lián),并且工具的使用一直在發(fā)生并不斷發(fā)展。

由于游戲是開放式的,因此AI代理甚至開始以程序員未曾想到的方式使用工具。他們曾預(yù)測特工會躲藏或追逐,并會制造堡壘。但是經(jīng)過足夠的比賽,例如,搜尋者學(xué)會了即使爬上箱子也可以移動箱子。這使他們可以在OpenAI團隊的“箱子沖浪”中滑行。盡管算法并未明確禁止在箱子上攀爬,但研究人員從未見過。該策略具有雙重優(yōu)勢,將移動性與靈活地凝視墻壁的能力相結(jié)合,并且顯示出比人類程序員想象的更具創(chuàng)新性的工具使用方式。

免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!