你好,歡迎來到川北在線
微信
騰訊微博
新浪微博
回合制游戲的先手優(yōu)勢有哪些平衡手段?
時間:2017-03-10 01:44   來源:Xylitogum   責任編輯:毛青青

  首先上很多人知道的策梅洛定理:

  任何透明的、確定性的雙人有限游戲,定有一方存在必不敗的策略。

  一般地,為了保證玩家的游戲體驗,回合制游戲中玩家的行為本身應當與“優(yōu)勢”有直接關聯(lián),游戲目標也經常是兩類顯性的目標:“率先達成目標”或者“盡量多得分”,或者兩者的混合。

  率先達成目標:(舉例)

  先把對面的生命打到零。

  先湊足五個子。

  先賺他一個億。

  量多得分:(舉例)

  規(guī)定時間內盡量多打倒對方。

  在局數耗盡前多賺錢。

  在雙方無處可下之前,盡量多占地盤(圍棋)。

  因此第一個進行行動的玩家在絕大多數時候也意味著第一個得到優(yōu)勢,而在上述環(huán)境里,很容易就變成先手必勝(或不敗)的游戲。當然世界上也存在后手必勝的游戲,比如“石頭-剪刀-布”變成先后手回合制,比如特定堆數組合的Nim游戲(輪流從堆中拿走棋子/火柴,直到有一方無子可拿)。

  (三堆火柴組成的Nim游戲)

  確切地說,我個人會將回合制游戲分為“行動主導”和“反制主導”,來區(qū)分這兩類游戲。

  行動主導:

  玩家的行動回合本身被視為游戲中珍貴的核心資源。

  玩家可以執(zhí)行的行動中絕大多數都會直接往游戲目標靠近,并且很多時候可以直接量化。(局部最優(yōu)解與全局最優(yōu)解很接近,因此允許“貪心法”簡化決策空間。)

  允許Strategy-stealing,也就是先手可以在第一輪進行明顯帶有優(yōu)勢的行動,然后復制后手的必勝策略(如果存在),因此普遍存在先手優(yōu)勢。

  反制主導:

  玩家根據對手前一行動的策略來進行互動和反制,對游戲目標有決定性的作用。

  相比之下,玩家執(zhí)行的行動未必對勝利都有貢獻,有時反而會幫倒忙。(局部最優(yōu)解與全局最優(yōu)解關聯(lián)不高)

 ∩以從先行者的策略中做出針對,或者從先行者身上學習失敗經驗,因此許多情況下存在后手優(yōu)勢。

  過于強調反制主導的游戲有個致命缺陷,就是即時的反饋不夠直觀,玩家難以在每一步行動中都找到樂趣(或者說,選擇意義的缺失),容易破壞“心流”。所以它們的普遍受眾比較小,因此現(xiàn)在市面上的例子還是行動主導的為主。

  要平衡一個行動主導的回合制游戲中先手優(yōu)勢的影響,可以從數值、機制等等各個角度出發(fā)來尋找可行的方案。下面分析一些值得參考的方向和思路,結合實際情況來服用。

  思路一:“讓數字說話”

  減少初始資源與選擇空間:

  基于卡牌的回合制游戲,許多時候手牌的數量意味著選擇的空間和握有的潛在戰(zhàn)斗力總和,本身也是一種資源。因此諸如三國殺,爐石傳說在內的卡牌游戲會讓后手在游戲前期的手牌上占有優(yōu)勢,以此來對沖先手的優(yōu)勢。

  同樣地,你可以通過調整初始血量,初始金幣,初始移動點數等等資源配比來避免先手有著顯著的游戲,甚至還可以在先手的計分方式和獲勝方式上做出懲罰。

  計分懲罰:

  這種方法與減少初始資源有著異曲同工的地方,對應的多數也是量化得分的游戲類型。傳承千年的經典游戲——圍棋,在現(xiàn)代就是使用“貼目”制度(具體數量各地區(qū)略有出入),讓執(zhí)黑先行的選手必須比對手多占一部分地盤才能獲得本局勝利,來保證先后手的勝率在總體上保持平衡。(如果圍棋不貼目,那么黑棋可以通過第一手下天元然后下模仿棋,這樣白棋必須制造征子否則無法破解。)

  但這種做法有個最顯然的問題:你怎么知道具體該懲罰多少分?拍腦門嗎?

  除此之外還要注意的是,純粹的量化懲罰與隱式設計(Implicit Game Design)理念有一定沖突,刻意制造了設計師的存在感,讓玩家感覺把游戲天平完全建立在了設計師拿捏的一個數值上。這樣的規(guī)則也會讓玩家?guī)е鴫毫﹂_始對局并創(chuàng)造不對稱性,破壞整體美感。更好的做法是讓兩邊玩家都清楚自己的初始優(yōu)勢在哪,是多了先行的機會,還是多了選擇的空間?

  思路二: “行動不是全部”

  讓先手需要外部資源投入:

  帶有大量養(yǎng)成玩法的回合制對戰(zhàn)游戲中(如Pokemon),許多時候會引入一個“速度”概念,來決定誰會獲得先手。這個速度屬性是一個特殊的,winner-takes-all的屬性,大多數情況下同時也會占用養(yǎng)成的資源,這意味著玩家必須自己做出策略上的選擇,是先手給我?guī)淼膬?yōu)勢重要,還是讓其他硬屬性高一些來得重要?這是一種極具趣味,且經過驗證可行的玩法,同時也會根據資源比重不同引出一條互相克制的反制鏈來,與博弈論中“上校賽局”(Blotto Game)相當接近。

  (Pokemon中追求速度與否的爭辯從未停止)

  但是它也有著局限性!八俣取备拍钍切枰獠抠Y源投入的,也就是說必須和外部的養(yǎng)成之類的玩法結合,很難有辦法在單局中實現(xiàn)平衡,同時也無法在對稱性游戲中實現(xiàn)。畢竟游戲設計上沒有完美的事不是么?

  增加反制玩法:

  上面提到的反制主導的游戲中,有許多是后手具有顯著優(yōu)勢的。其原因就是這類游戲中存在策略的相互克制,使得后手方可以學習先手方的策略,并做出針對性的調整來取得優(yōu)勢。那如果把行動主導和反制主導的思想結合起來,讓兩邊都沒法占到便宜呢?

  在Dota 2職業(yè)比賽的英雄選擇環(huán)節(jié),就使用了類似的做法。雙方按2-2-1的次序輪流禁用(ban)特定英雄和選擇(pick)特定英雄,如下圖:

  (從左往右,綠色表示綠方行動回合,紅色表示紅方行動回合,Ban表示禁用英雄,Pick表示選擇英雄)

  當然,假設英雄之間只存在 的強度差異,那么ban-pick順序無論怎么調整,先選的一方總是有利的。但Dota 2巧妙的英雄設計讓玩家在選擇英雄時不僅要考慮強度差異,還有英雄之間的專長協(xié)作與克制關系,以及雙方對英雄的熟悉程度不同,都會影響ban-pick時的選擇。這樣一來,職業(yè)比賽英雄選擇部分就不再是純粹的先手或運氣成分主導,讓比賽的觀賞性在賽前英雄選擇時就得到了充分的渲染。

  思路三:“讓游戲變得不確定”

  隨機性:

  與信息不透明度的思路一樣,在游戲中引入隨機性可以增加結果的不可預測性,從而降低其與玩家初始先后手狀態(tài)的關聯(lián)。但隨機性也是一針毒藥,用多了會讓游戲單純變成運氣,大幅降低游戲策略帶來的樂趣。要記住的是,隨機性本身并不一定會改變游戲的對稱性,但它可以沖淡因對稱性帶來的一邊倒的最優(yōu)解選擇,給最優(yōu)解的執(zhí)行帶來一定的障礙。

  (一個標準卡坦島游戲的棋盤)

  在風靡世界的桌面殖民地建設游戲《卡坦島》(Settlers of Catan)中,通過投擲兩個骰子的點數之和來決定哪些玩家得以獲取資源。同時初始兩個基地的放置也是按照 從前到后 再 從后到前 的順序,避免先行玩家對 資源點的壟斷控制。

  另一個提到隨機性便不得不說的例子就是《爐石傳說》。在爐石中從抽牌到效果發(fā)動無時無刻不充斥著隨機結果的影響, n抽3再3選1的發(fā)現(xiàn)機制也是隨機性與決策的結合,更有甚者如尤格薩隆,一張牌隨機性的表現(xiàn)在極端情況下便可直接左右比賽的勝負。

  在這樣的游戲中,隨機性使游戲充滿了變數,使后手玩家相信先手優(yōu)勢并不可怕,也使每局游戲玩家都有期待。但一如之前所言,過分的隨機性會讓玩家失去自主感,讓游戲的成敗變?yōu)槁犔煊擅慕箲]過程,需要好好把握;另外隨機性與反制鏈的結合不當,也會讓游戲變成石頭剪刀布那樣純粹開局定勝負的游戲。

  挖掘游戲深度:

  策梅洛定理假設雙方都是“完美的玩家”,但在實際游戲中,先手優(yōu)勢的大小不僅撒于其潛在收益,還得考慮玩家具體能做到多少。這里游戲“深度”一詞指得便是技能上的深度,尤其是指即使最優(yōu)解存在,人類因技能限制也無法達成完美的情況。

 ≠個例子,足球籃球等體育比賽有先手優(yōu)勢嗎?足球也是確定性的,信息透明的游戲,但沒有人能保證自己能完美控制自己的身體(當然經過訓練可以得到提升),球權的更迭很頻繁。雙方很多時候較量的就是這種身體控制能力,而先獲得球權的優(yōu)勢雖然存在,但絕大多數時候并不足以扭轉比賽的天平---更何況在半場過后會輪換到另一隊開球。

  同樣地,在國際象棋中,先手的白棋也普遍有著2%-5%的勝率優(yōu)勢。但由于決策樹的深度和復雜度,國際象棋先手必勝與否目前還是處于猜想階段,更別提讓人腦去思考和執(zhí)行了。所以哪怕對先手優(yōu)勢完全沒有實質性的平衡手段,國際象棋的平衡也處于玩家普遍可接受的范圍內。

  (一個X方先行的井字棋游戲的完美平局)

  反過來說,深度過淺的游戲先手優(yōu)勢會被放大。比如Tic-tac-toe(井字棋)游戲,因為深度太淺且無隨機性,很容易被大多數玩家找到最優(yōu)解且容易實現(xiàn)。在這種情況下,先手優(yōu)勢不僅很大,而且很容易找到并實現(xiàn)不敗策略,因此現(xiàn)在在成年人之間的娛樂對弈活動幾乎完全不會考慮井字棋。

  延續(xù)游戲長度:

  某些時候,你已無法直接對游戲規(guī)則進行大刀闊斧的改革了,那你怎么進一步對先手優(yōu)勢進行限制呢?

  一個辦法就是,讓大家輪流坐莊,在一定局數之后再判定總體勝負,如同斯諾克比賽那樣要打十幾局乃至三十幾局來決出勝負。這樣既可以降低隨機性對結果的影響,又可以讓先手優(yōu)勢得到壓縮。然而缺點是會嚴重放慢游戲節(jié)奏,同時依舊無法對單局比賽的體驗產生影響。

  除此之外,還能拉長單局游戲的長度,像文明系列那樣一局能打幾百個回合,讓游戲中后期沖淡前期先手的影響(至少是心理影響)。但同樣會嚴重放慢游戲節(jié)奏,對不確定性較低的游戲而言還不一定會起到削弱先手的效果。

  信息不透明度:

  同樣是可以用紙筆進行的回合制游戲,帶有信息不透明度的Battleship的先手優(yōu)勢就完全不如Tic-tac-toe那么夸張(但是依舊存在)。在Battleship中,由于雙方自身的海域布局對對手不可見,玩家需要輪流猜測敵船的擺放位置來進行炮擊的選擇。

  (一個10x10的常見Battleship棋盤,用x標記炮擊位置)

  顯然,如果把Battleship的海域布局改成對雙方完全公開的形式,那么這游戲的先手就會變成必勝——先手能先把對方船轟完。但考慮到實際上初始階段玩家只有大約1/3的概率命中有效目標(事實上與引入了隨機性等價),先手就并不能保證對先行優(yōu)勢的轉化,只有少數極端情況下先手正好比后手快一步擊潰對手才會體現(xiàn)出優(yōu)勢。而這個可以通過一個小小的規(guī)則修改來避免,并達成完美對稱性:

  先手擊沉敵人所有船只后,還會允許后手再進行一次炮擊;如果后手也因此擊沉了敵人所有的船只,則該局計為平局。

  延伸閱讀:海盜分金與用餐者困境

  海盜分金講述的是多人按順序分配財產的博弈問題:

  有五個理性的海盜,A, B, C, D和E,找到了100個金幣,需要想辦法分配金幣。

  海盜們有嚴格的等級制度:A比B職位高,B比C高,C比D高,D比E高。

  海盜世界的分配原則是:

  - 等級 的海盜提出一種分配方案。

  - 所有的海盜投票決定是否接受分配,包括提議人。并且在票數相同的情況下,提議人有決定權。

  - 如果提議通過,那么海盜們按照提議分配金幣。

  - 如果沒有通過,那么提議人將被扔出船外,然后由下一個 職位的海盜提出新的分配方案。

  海盜們基于三個因素來做決定。

  - 首先,要能存活下來。

  - 其次,自己得到的利益最大化。

  - 最后,在所有其他條件相同的情況下,優(yōu)先選擇把別人扔出船外。

 ∩能很多人都已經見過海盜分金的概念了。最優(yōu)策略為[98,0,1,0,1]。推理過程可以在百度百科找到:海盜分金_百度百科

  這里提出這個概念是為了說明,在足夠的空間下,第一個行動的玩家潛在的優(yōu)勢在多人游戲中可以是相當巨大的,尤其是合理利用其他玩家存在的相互競爭關系時。但有的時候,有的游戲規(guī)則并不完全等同于海盜分金這樣的動態(tài)博弈,而是更接近于一個用餐者困境,也就是囚徒困境的多人版:

  有若干人出去吃飯,在點菜之前他們達成了一致:

  - 所有人平攤買單的錢(AA制)。

  - 現(xiàn)在每個人要么點貴的菜肴,要么點便宜的菜肴。

  假設貴的菜肴比便宜的要好(即效用高),但是如果一個人單獨進食的話,不能保證為貴的菜肴多付的錢一定值得(即性價比低)。

  每個人都這么推想:眾人將會點便宜的菜肴,而由于點了更貴的菜肴而額外加的錢將被眾人攤分,所以額外加的錢是很少的,而菜肴的味道卻會有較大的改善,因而多花這點錢是劃算的。每個人都這樣推想,最后的結果是他們都花錢點了更貴的菜肴,而原本他們認為點便宜的菜肴要比點貴的對每個人都要好些。

  在用餐者困境中,假如沒有任何信任和交流的建立,每個人都會選擇更貴的菜肴,使團體總體上得到損失。究其原因,其實在于決策制定過程的不透明性,假定的是每個人是同時或私下做出點餐決定的。如果我們把它與與海盜分金結合起來看,便可以制定一個新的規(guī)則,來解決用餐者困境。

  有若干人出去吃飯,在點菜之前他們達成了一致:

  - 所有人平攤買單的錢(AA制)。

  - 現(xiàn)在每個人要么點貴的菜肴,要么點便宜的菜肴。

  - 每個人按次序點菜,點完之后公開自己的選擇。

  - 所有人可以投票決定是否接受這次選擇,如果不接受則將該點餐人排除在外。

  假設貴的菜肴比便宜的要好(即效用高),但是如果一個人單獨進食的話,不能保證為貴的菜肴多付的錢一定值得(即性價比低)。被眾人排除在這次用餐外則是最糟糕的體驗,而少一個人一起吃飯也會給團體每個人帶來些許的不快。

  上述規(guī)則事實上并沒有做出太大的變化,只是把靜態(tài)博弈變成了動態(tài)博弈,鼓勵了信息交流,每個人需要大家的同意才能做出選擇。從決策上看,每個人選擇便宜菜肴對別人都沒有損失,而選擇貴的菜肴就要冒潛在的被踢出的風險,單純地踢出選擇便宜菜肴的人對自己也沒有收益,因此可以達成的納什均衡則是 的——大家都會選擇便宜的菜肴。

  同樣地,規(guī)則設計可以極大程度上左右決策。在多人游戲中,把游戲從海盜分金那樣的純競爭關系的零和博弈改為用餐者困境那樣帶有合作關系的非零和博弈,并合理掌握信息透明度,可以很大程度上通過合作規(guī)則來平衡局面。在War3、帝國時代那樣的RTS游戲中進行過多人混戰(zhàn)模式的玩家可能還會記得,當一家獨大的時候,其他玩家便會考慮群起而攻之。在《卡坦島》這樣的回合制策略游戲中也是一樣的道理,在充分自由的交易規(guī)則下,玩家可以通過合作和對抗來嘗試抵消任何已在游戲中存在的優(yōu)勢。

  結語

  回合制游戲的先后手平衡有著許多種不同的思路來幫助解決,最重要的還是知道我們的目的是什么:我是要讓游戲展現(xiàn)出完美的對稱性,還是僅僅需要保證玩家不會因先后手優(yōu)勢問題損傷游戲體驗?

  其實包括大富翁、飛行棋在內的絕大多數回合制游戲都或多或少具有先手優(yōu)勢,但并沒有帶來破壞性的影響。上面這些思路許多時候并不一定能完全抹平先手優(yōu)勢影響,也有的在過度使用時會破壞游戲體驗,但最重要的是能夠合理結合運用,來達成你的目的。

   投稿郵箱:chuanbeiol@163.com   詳情請訪問川北在線:http://www.dstuf.com/

川北在線-川北全搜索版權與免責聲明
①凡注明"來源:XXX(非在線)"的作品,均轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責,本網不承擔此類稿件侵權行為的連帶責任。
②本站所載之信息僅為網民提供參考之用,不構成任何投資建議,文章觀點不代表本站立場,其真實性由作者或稿源方負責,本站信息接受廣大網民的監(jiān)督、投訴、批評。
③本站轉載純粹出于為網民傳遞更多信息之目的,本站不原創(chuàng)、不存儲視頻,所有視頻均分享自其他視頻分享網站,如涉及到您的版權問題,請與本網聯(lián)系,我站將及時進行刪除處理。



圖庫
合作媒體
金寵物 綠植迷
法律顧問:ITLAW-莊毅雄律師