Facebook AI Research(FAIR)開發(fā)了一種新的AI,在與Hanabi對抗時產生了令人印象深刻的結果。新的發(fā)展是Facebook AI邁出的重要一步。
Hanabi是一款類似于紙牌的紙牌游戲。盡管大多數(shù)用于此技術的游戲(例如國際象棋或圍棋)直接將AI置于人類面前,但Hanabi要求玩家相互合作以實現(xiàn)共同的目標。
Facebook雇用機器人在游戲中協(xié)同工作,直到它們超越了以前使用的AI系統(tǒng)。最新的最佳AI系統(tǒng)在游戲中獲得25分的23.92分,而新的AI系統(tǒng)在25分中達到24.61分。
早在2月,Google,DeepMind,卡內基梅隆大學和牛津大學的研究人員提出了Hanabi基準測試。他們還包括創(chuàng)建能夠玩游戲的其他AI,并將其稱為“ AI研究的新領域”。
研究人員對新開發(fā)感到興奮,因為用于幫助機器人的相同AI可能會在其他領域使用。一種可能的用途是改善虛擬助手與人互動的方式。
Facebook AI研究人員Noam Brown談到了新的AI系統(tǒng)。
“與此相關的令人興奮的事情之一是,我們正在觀察到的改進實際上與深度強化學習所觀察到的改進正交:您可以將其添加到任何策略之上,它將使它變得更加強大,鮑恩在接受采訪時表示,他對VentureBeat進行了采訪。“我們看到的結果遠遠超出了我們或其他研究人員的預期。實際上,我們從搜索中獲得的收益要強于過去使用的所有深度強化學習算法所獲得的收益。”
Facebook的AI的新發(fā)展是在研究人員不斷開發(fā)能夠與某些最復雜的游戲抗衡的軟件的時候進行的。2016年,谷歌的DeepMind的AI系統(tǒng)擊敗了中國棋盤游戲Go中最出色的人類玩家。
Hanabi圍繞團隊合作和戰(zhàn)略而建立,這是AI實現(xiàn)的重要里程碑,Hanabi現(xiàn)在被認為是測試AI的最佳游戲。在這種環(huán)境下使用時,人工智能可以改善并變得更加復雜。
Adam Lerer是Facebook研究人員,也是該論文的撰稿人。
他說:“我們轉向這些合作游戲的原因之一是,我認為我們至少在競爭性游戲方面還沒有剩下任何游戲。”
哈納比(Hanabi)由兩到五名球員組成的團隊,每人隨機獲得一張牌??ㄆ念伾煌野煌臄?shù)字,團隊將它們按顏色和正確的數(shù)字順序放在桌子上。
玩家看不到自己的牌,但隊友可以看到。允許玩家給別人提示。例如,一個隊友可以給出有關顏色的提示,從而導致另一個人玩或棄牌。
游戲中較復雜的方面之一是,玩家必須弄清楚線索及其含義。對于機器人來說,游戲的這一部分很難弄清他們所擁有的信息。