玩德州撲克的「AlphaGo」來了，擊敗它可以拿走 20 萬美元

7 年前

從 1 月11 日開始，5 名頂尖德州撲克選手將在匹茲堡的賭場展開爭奪，不過，其中一名選手卻不是人類。

在這項名為「人腦 VS. 人工智慧」的對決中，4 名職業選手 Jason Lee、Dong Kim、Daniel McAulay 和 Jimmy Chou 將分別與卡內基美隆大學開發的「Libratus」人工智慧系統進行挑戰。賽程為期 20 天，總共將對戰 12 萬手牌，獎金為 20 萬美元。

▲ Dong Kim 曾在 2015 年與卡內基美隆大學的 Claudico 對戰過。（Source：CMU）

AI 與人類對決不是什麼新鮮事，但是，重點來了，本次的比拚項目是德州撲克。

我們在下象棋或圍棋的時候，能夠看得到彼此手中的棋子、排兵布陣等，這種被稱為「完整訊息博弈」。德州撲克則不同，每個玩家手中的底牌只有自己知曉，其他玩家是看不到的，所以是「非完整訊息」（Imperfect information）。

鑑於德州撲克獨特的規則，AI 想要主宰比賽並沒有那麼容易。總之，與棋類遊戲相比，德州撲克對於 AI 來說更具有挑戰性，也是近來十分流行的人工智慧測試項目。

卡內基美隆大學的 Libratus 採用的是一種名為「奈許平衡」的對戰策略，在這一策略裡，只要其他玩家的策略保持不變，單一玩家就無法透過變換策略獲益。

Libratus 要做的就是辨識沒有希望的策略，進而更快地找到奈許平衡點。經過反覆的訓練後，Libratus 已經能夠忽略那些糟糕的路徑了。

不過，Libratus 並非唯一一個會玩德州撲克的 AI，就在卡內基美隆大學宣布 Libratus 出戰的幾天前，加拿大阿爾伯塔大學搶先發表了關於撲克 AI 的論文，表示他們的 DeepStack 是世界上第一個在「一對一無限注德州撲克」上擊敗了職業撲克玩家的電腦程式。

上周，著名的論文網站 Arxiv 出現一篇題為《 DeepStack：無限下注撲克里的專家級人工智慧》（DeepStack: Expert-Level Artificial Intelligence in No-Limit Poker）的論文，作者是來自加拿大 Alberta 大學、捷克 Charles 大學、布拉格捷克理工大學的研究人員。

該論文顯示，DeepStack 在與 33 名人類選手進行的 4.4 萬手較量中，平均勝率為 492 mbb/g，一般認為人類玩家這一數據達到 50 mbb/g 就具有較大的贏面，而 750 mbb/g 就是對手每局都棄牌的節奏了。

值得一提的是，DeepStack 玩的是無限下注類的德州撲克，玩法比有限下注要複雜得多。

然而，DeepStack 雖然有先發優勢，但明顯引發的關注度不如 Libratus。

卡內基美隆大學模仿了 AlphaGo 的套路，賭場、機器與頂尖人類高手對決、20 萬美元獎金，這顯然比 DeepStack 團隊一篇論文更能吸引目光。

（Source：PopularMechanics）

與此同時，一些撲克專家也對 DeepStack 提出質疑，認為與其對戰的玩家中沒有頂級選手，而 Libratus 要面對的卻是全球排名在前的高手。

至於 20 萬美元的獎金最終將被哪方收入囊中，我們還得等上差不多 3 週時間。

（本文由愛范兒授權轉載；首圖來源：Flickr/Morgan CC BY 2.0）