一方面是Stockfish8。這個(gè)世界冠軍計(jì)劃像炸藥一樣處理棋子,以巨大的力量-每秒產(chǎn)生6000萬(wàn)次潛在動(dòng)作。在這數(shù)百萬(wàn)個(gè)動(dòng)作中,Stockfish選出了最好的動(dòng)作-“最佳”動(dòng)作是由計(jì)算機(jī)科學(xué)家和國(guó)際象棋大師共同設(shè)計(jì)的復(fù)雜,手動(dòng)調(diào)整的算法定義的。該算法重視典當(dāng)位置及其國(guó)王安全性等因素之間的微妙平衡。
另一方面是一個(gè)名為AlphaZero的新程序(“零”意味著循環(huán)中沒(méi)有任何人類(lèi)知識(shí)),這是一種象棋引擎,在某種程度上比Stockfish弱得多,其每秒移動(dòng)速度僅為對(duì)手的1/100 。但是AlphaZero是完全不同的機(jī)器。它沒(méi)有通過(guò)外部專(zhuān)家設(shè)計(jì)的算法來(lái)推斷“最佳”動(dòng)作,而是通過(guò)一種稱(chēng)為機(jī)器學(xué)習(xí)的人工智能技術(shù)自行學(xué)習(xí)策略。它的程序員只是用國(guó)際象棋的基本規(guī)則對(duì)其進(jìn)行了調(diào)整,并允許它自己對(duì)戰(zhàn)幾百萬(wàn)場(chǎng)比賽。據(jù)了解,AlphaZero逐漸制定了自己的策略。
頭對(duì)頭的戰(zhàn)斗是驚人的。在100場(chǎng)比賽中,AlphaZero從未輸過(guò)。AI引擎憑借令人眼花sacrifice亂的犧牲,冒險(xiǎn)的舉動(dòng)和漂亮的風(fēng)格贏得了比賽(贏得了28場(chǎng)比賽,其余比賽都吸引了其他人),這是計(jì)算機(jī)國(guó)際象棋世界中全新的風(fēng)格。
英國(guó)國(guó)際象棋大師Matthew Sadler和數(shù)學(xué)家以及國(guó)際象棋大師Natasha Regan仍在他們的新書(shū)Game Changer中拼湊出AlphaZero的策略是如何工作的。我們僅在其中一款游戲中就打破了兩招,以展示出侵略性的風(fēng)格,表現(xiàn)以及人類(lèi)可以從我們的新國(guó)際象棋冠軍那里學(xué)到什么。