紙牌游戲Hanabi被Facebook的AI挑戰(zhàn),考慮到他們正在進(jìn)入一個(gè)領(lǐng)域,這不僅是一個(gè)對手擊敗另一個(gè)對手的問題,而且是一個(gè)“合作”的紙牌游戲,其中競爭團(tuán)隊(duì)互相幫助。
《財(cái)富》雜志的喬納森·瓦尼安(Jonathan Vanian)通過介紹游戲的方式引導(dǎo)讀者:
“ ...:兩到五名球員組成的團(tuán)隊(duì)會(huì)獲得不同顏色和代表點(diǎn)數(shù)的隨機(jī)卡。團(tuán)隊(duì)的目標(biāo)是將卡按正確的數(shù)字順序按顏色分組放在桌子上。問題是,但是,玩家無法看到自己的牌,而隊(duì)友卻能看到自己的牌,玩家可以給另一個(gè)提示,例如對某種顏色進(jìn)行備注,這會(huì)提示另一個(gè)人做諸如打牌或丟棄牌的事情。就是玩家必須推斷出隊(duì)友的線索意味著什么。”
企業(yè)領(lǐng)導(dǎo)者已顯示出對Hanabi的團(tuán)隊(duì)建設(shè)學(xué)習(xí)經(jīng)驗(yàn)的傾向;現(xiàn)在,它已經(jīng)引起了AI研究人員關(guān)于構(gòu)建出色AI系統(tǒng)的關(guān)注。
Engadget表示:“在不起眼的法國紙牌游戲中取得接近完美的分?jǐn)?shù)非常好,除Facebook之外,其他所有人都為其合作AI制定了更大的計(jì)劃。”
Facebook研究人員湯姆·勒勒(Tom Lerer)在Engadget中被引用:“我們正在尋找的是人工代理,它們可以更好地推理與人類和聊天機(jī)器人的協(xié)作交互,并可以推理與他們聊天的人為什么說他們所做的事情。 ..Chatbot可以更好地說明人們?yōu)槭裁凑f自己所做的事情而不必枚舉他們所要求的所有細(xì)節(jié),這是這種搜索技術(shù)的非常簡單的應(yīng)用。
研究人員采用了哪些人工智能策略?
Vanian確定了DeepMind以前使用的一種搜索技術(shù)。它使多個(gè)Hanabi機(jī)器人可以在相互共享信息的同時(shí)評估多個(gè)播放選項(xiàng)。結(jié)合強(qiáng)化學(xué)習(xí),F(xiàn)acebook機(jī)器人學(xué)習(xí)了如何相互玩Hanabi。
這項(xiàng)調(diào)查背后的作者寫了一篇論文,討論他們的工作,論文發(fā)表在arXiv上(發(fā)表在《人工智能》雜志上)。“ Hanabi挑戰(zhàn):人工智能研究的新領(lǐng)域”是該論文的標(biāo)題,作者說,他們將Hanabi視為“挑戰(zhàn)領(lǐng)域,其新穎的問題源于其純粹合作的游戲玩法和不完美的信息的結(jié)合(兩到三個(gè))。五人設(shè)置。”