谷歌旗下DeepMind研發(fā)的阿爾法狗(AlphaGo)剛以“Master”的名義戰(zhàn)勝了“當(dāng)今圍棋第一人”柯潔,宣告人工智能針對(duì)人類的又一輪勝利,引起軒然大波。緊接著,人工智能在撲克游戲中的捷報(bào)似乎又已經(jīng)發(fā)出。
≥澎湃新聞報(bào)道,來(lái)自加拿大和捷克的10位科學(xué)家近日在預(yù)印本網(wǎng)站arXiv上載了一篇題為《DeepStack:無(wú)限注德?lián)涞膶I(yè)級(jí)人工智能玩家》的論文,介紹了一種能在一對(duì)一無(wú)限注德州撲克中擊敗人類玩家的新算法DeepStack。
在過(guò)去的20年里,我們見(jiàn)證了許多游戲領(lǐng)域在人工智能面前紛紛“淪陷”,比如深藍(lán)攻陷象棋,阿爾法狗60次擊敗各路圍棋選手,而在撲克領(lǐng)域,2008年,來(lái)自阿爾伯塔大學(xué)的團(tuán)隊(duì)也曾對(duì)人類挑戰(zhàn)成功,不過(guò)是在有限制德?lián)鋵?duì)陣上。
而之所以在撲克類游戲中,人工智能的進(jìn)展不大,主要是撲克類游戲的不確定性。而圍棋等棋類游戲是完美信息游戲,也就是說(shuō),所有玩家在游戲中能獲得的確定性信息是對(duì)稱的。
在棋類游戲的對(duì)陣中,人工智能可以憑借自己的計(jì)算優(yōu)勢(shì),看到所有棋盤(pán)上的棋子,人類玩家的每一步落棋,都能被人工智能計(jì)算出所有的可能性。
但是,人類生活中還要面臨更多非完美信息的情景,正如計(jì)算機(jī)之父馮·諾依曼所說(shuō),
“現(xiàn)實(shí)世界與此不同,現(xiàn)實(shí)世界包含有很多賭注、一些欺騙的戰(zhàn)術(shù),還涉及你會(huì)思考別人會(huì)認(rèn)為你將做什么!
德州撲克就是這樣一種包含了欺騙、推測(cè)的非完美信息游戲,人工智能并不知道發(fā)牌員發(fā)出的下一張牌是什么,也不知道對(duì)手握的什么牌,只能掌握自己手上的牌,通過(guò)這種非對(duì)稱的信息與對(duì)手進(jìn)行博弈。
因此,雖然一對(duì)一無(wú)限注德?lián)溆螒蛑邪?0的160次方個(gè)決策點(diǎn),要少于圍棋,但它對(duì)人工智能的推理能力提出了更高的要求。在創(chuàng)新工場(chǎng)《人工智能戰(zhàn)略展望會(huì)》上,李開(kāi)復(fù)表示,“我們?nèi)魏蔚墓ぷ魅绻f(shuō)不經(jīng)過(guò),超過(guò)五秒鐘的思考,都是做不過(guò)機(jī)器的!
而當(dāng)人工智能被培養(yǎng)出了類似人的“直覺(jué)”,如今這項(xiàng)有時(shí)需要經(jīng)過(guò)50秒思考的游戲,或許也將在人工智能面前失守。
加拿大和捷克的合作團(tuán)隊(duì)開(kāi)發(fā)出了新算法DeepStack。在運(yùn)用深度學(xué)習(xí),反復(fù)自我博弈之后,DeepStack學(xué)會(huì)了在每一個(gè)具體情境出現(xiàn)時(shí)進(jìn)行推理。這非常接近人類玩家的“牌感”,即在當(dāng)前情境下對(duì)個(gè)人牌面大小的感覺(jué),并作出相應(yīng)的決策。
而通過(guò)這種“直覺(jué)”,DeepStack已經(jīng)取得了超出人類數(shù)十倍的成績(jī)。該團(tuán)隊(duì)邀請(qǐng)了來(lái)自17個(gè)國(guó)家的33名專業(yè)撲克選手挑戰(zhàn)DeepStack,在2016年11月7日到12月12日之間共進(jìn)行了44852次較量。DeepStack成為了 在一對(duì)一無(wú)限注德?lián)渲袘?zhàn)勝人類玩家的人工智能,并且平均勝率達(dá)到了492mbb/g(milli-big-blinds per game,一般職業(yè)玩家認(rèn)為50mbb/g是個(gè)門(mén)檻)。
鈦媒摘聲: 人工智能是人類有史以來(lái)最大的領(lǐng)域,將在各個(gè)領(lǐng)域產(chǎn)生價(jià)值,人類的普通工作一半將被機(jī)器取代,而在一些低腦力的工作,甚至90%的工作將會(huì)被取代。我們?nèi)魏蔚墓ぷ魅绻f(shuō)不經(jīng)過(guò),超過(guò)五秒鐘的思考,都是做不過(guò)機(jī)器的。
——?jiǎng)?chuàng)新工場(chǎng)董事長(zhǎng) 李開(kāi)復(fù)
轉(zhuǎn)型不是轉(zhuǎn)行,轉(zhuǎn)型走不通的原因是把轉(zhuǎn)型理解成轉(zhuǎn)行了。創(chuàng)新不需要跳到其他的行業(yè)去,不一定都要進(jìn)入新興行業(yè)。創(chuàng)新也不要求大家都去做高科技,都去做云計(jì)算、大數(shù)據(jù)。創(chuàng)新需要企業(yè)思考如何采用新技術(shù)來(lái)提高自己的效率。
投稿郵箱:chuanbeiol@163.com 詳情請(qǐng)?jiān)L問(wèn)川北在線:http://dstuf.com/