首先上很多人知道的策梅洛定理:
任何透明的、確定性的雙人有限游戲,定有一方存在必不敗的策略。
一般地,為了保證玩家的游戲體驗(yàn),回合制游戲中玩家的行為本身應(yīng)當(dāng)與“優(yōu)勢”有直接關(guān)聯(lián),游戲目標(biāo)也經(jīng)常是兩類顯性的目標(biāo):“率先達(dá)成目標(biāo)”或者“盡量多得分”,或者兩者的混合。
率先達(dá)成目標(biāo):(舉例)
先把對面的生命打到零。
先湊足五個(gè)子。
先賺他一個(gè)億。
量多得分:(舉例)
規(guī)定時(shí)間內(nèi)盡量多打倒對方。
在局?jǐn)?shù)耗盡前多賺錢。
在雙方無處可下之前,盡量多占地盤(圍棋)。
因此第一個(gè)進(jìn)行行動的玩家在絕大多數(shù)時(shí)候也意味著第一個(gè)得到優(yōu)勢,而在上述環(huán)境里,很容易就變成先手必勝(或不敗)的游戲。當(dāng)然世界上也存在后手必勝的游戲,比如“石頭-剪刀-布”變成先后手回合制,比如特定堆數(shù)組合的Nim游戲(輪流從堆中拿走棋子/火柴,直到有一方無子可拿)。
(三堆火柴組成的Nim游戲)
確切地說,我個(gè)人會將回合制游戲分為“行動主導(dǎo)”和“反制主導(dǎo)”,來區(qū)分這兩類游戲。
行動主導(dǎo):
玩家的行動回合本身被視為游戲中珍貴的核心資源。
玩家可以執(zhí)行的行動中絕大多數(shù)都會直接往游戲目標(biāo)靠近,并且很多時(shí)候可以直接量化。(局部最優(yōu)解與全局最優(yōu)解很接近,因此允許“貪心法”簡化決策空間。)
允許Strategy-stealing,也就是先手可以在第一輪進(jìn)行明顯帶有優(yōu)勢的行動,然后復(fù)制后手的必勝策略(如果存在),因此普遍存在先手優(yōu)勢。
反制主導(dǎo):
玩家根據(jù)對手前一行動的策略來進(jìn)行互動和反制,對游戲目標(biāo)有決定性的作用。
相比之下,玩家執(zhí)行的行動未必對勝利都有貢獻(xiàn),有時(shí)反而會幫倒忙。(局部最優(yōu)解與全局最優(yōu)解關(guān)聯(lián)不高)
∩以從先行者的策略中做出針對,或者從先行者身上學(xué)習(xí)失敗經(jīng)驗(yàn),因此許多情況下存在后手優(yōu)勢。
過于強(qiáng)調(diào)反制主導(dǎo)的游戲有個(gè)致命缺陷,就是即時(shí)的反饋不夠直觀,玩家難以在每一步行動中都找到樂趣(或者說,選擇意義的缺失),容易破壞“心流”。所以它們的普遍受眾比較小,因此現(xiàn)在市面上的例子還是行動主導(dǎo)的為主。
要平衡一個(gè)行動主導(dǎo)的回合制游戲中先手優(yōu)勢的影響,可以從數(shù)值、機(jī)制等等各個(gè)角度出發(fā)來尋找可行的方案。下面分析一些值得參考的方向和思路,結(jié)合實(shí)際情況來服用。
思路一:“讓數(shù)字說話”
減少初始資源與選擇空間:
基于卡牌的回合制游戲,許多時(shí)候手牌的數(shù)量意味著選擇的空間和握有的潛在戰(zhàn)斗力總和,本身也是一種資源。因此諸如三國殺,爐石傳說在內(nèi)的卡牌游戲會讓后手在游戲前期的手牌上占有優(yōu)勢,以此來對沖先手的優(yōu)勢。
同樣地,你可以通過調(diào)整初始血量,初始金幣,初始移動點(diǎn)數(shù)等等資源配比來避免先手有著顯著的游戲,甚至還可以在先手的計(jì)分方式和獲勝方式上做出懲罰。
計(jì)分懲罰:
這種方法與減少初始資源有著異曲同工的地方,對應(yīng)的多數(shù)也是量化得分的游戲類型。傳承千年的經(jīng)典游戲——圍棋,在現(xiàn)代就是使用“貼目”制度(具體數(shù)量各地區(qū)略有出入),讓執(zhí)黑先行的選手必須比對手多占一部分地盤才能獲得本局勝利,來保證先后手的勝率在總體上保持平衡。(如果圍棋不貼目,那么黑棋可以通過第一手下天元然后下模仿棋,這樣白棋必須制造征子否則無法破解。)
但這種做法有個(gè)最顯然的問題:你怎么知道具體該懲罰多少分?拍腦門嗎?
除此之外還要注意的是,純粹的量化懲罰與隱式設(shè)計(jì)(Implicit Game Design)理念有一定沖突,刻意制造了設(shè)計(jì)師的存在感,讓玩家感覺把游戲天平完全建立在了設(shè)計(jì)師拿捏的一個(gè)數(shù)值上。這樣的規(guī)則也會讓玩家?guī)е鴫毫﹂_始對局并創(chuàng)造不對稱性,破壞整體美感。更好的做法是讓兩邊玩家都清楚自己的初始優(yōu)勢在哪,是多了先行的機(jī)會,還是多了選擇的空間?
思路二: “行動不是全部”
讓先手需要外部資源投入:
帶有大量養(yǎng)成玩法的回合制對戰(zhàn)游戲中(如Pokemon),許多時(shí)候會引入一個(gè)“速度”概念,來決定誰會獲得先手。這個(gè)速度屬性是一個(gè)特殊的,winner-takes-all的屬性,大多數(shù)情況下同時(shí)也會占用養(yǎng)成的資源,這意味著玩家必須自己做出策略上的選擇,是先手給我?guī)淼膬?yōu)勢重要,還是讓其他硬屬性高一些來得重要?這是一種極具趣味,且經(jīng)過驗(yàn)證可行的玩法,同時(shí)也會根據(jù)資源比重不同引出一條互相克制的反制鏈來,與博弈論中“上校賽局”(Blotto Game)相當(dāng)接近。
(Pokemon中追求速度與否的爭辯從未停止)
但是它也有著局限性!八俣取备拍钍切枰獠抠Y源投入的,也就是說必須和外部的養(yǎng)成之類的玩法結(jié)合,很難有辦法在單局中實(shí)現(xiàn)平衡,同時(shí)也無法在對稱性游戲中實(shí)現(xiàn)。畢竟游戲設(shè)計(jì)上沒有完美的事不是么?
增加反制玩法:
上面提到的反制主導(dǎo)的游戲中,有許多是后手具有顯著優(yōu)勢的。其原因就是這類游戲中存在策略的相互克制,使得后手方可以學(xué)習(xí)先手方的策略,并做出針對性的調(diào)整來取得優(yōu)勢。那如果把行動主導(dǎo)和反制主導(dǎo)的思想結(jié)合起來,讓兩邊都沒法占到便宜呢?
在Dota 2職業(yè)比賽的英雄選擇環(huán)節(jié),就使用了類似的做法。雙方按2-2-1的次序輪流禁用(ban)特定英雄和選擇(pick)特定英雄,如下圖:
(從左往右,綠色表示綠方行動回合,紅色表示紅方行動回合,Ban表示禁用英雄,Pick表示選擇英雄)
當(dāng)然,假設(shè)英雄之間只存在 的強(qiáng)度差異,那么ban-pick順序無論怎么調(diào)整,先選的一方總是有利的。但Dota 2巧妙的英雄設(shè)計(jì)讓玩家在選擇英雄時(shí)不僅要考慮強(qiáng)度差異,還有英雄之間的專長協(xié)作與克制關(guān)系,以及雙方對英雄的熟悉程度不同,都會影響ban-pick時(shí)的選擇。這樣一來,職業(yè)比賽英雄選擇部分就不再是純粹的先手或運(yùn)氣成分主導(dǎo),讓比賽的觀賞性在賽前英雄選擇時(shí)就得到了充分的渲染。
思路三:“讓游戲變得不確定”
隨機(jī)性:
與信息不透明度的思路一樣,在游戲中引入隨機(jī)性可以增加結(jié)果的不可預(yù)測性,從而降低其與玩家初始先后手狀態(tài)的關(guān)聯(lián)。但隨機(jī)性也是一針毒藥,用多了會讓游戲單純變成運(yùn)氣,大幅降低游戲策略帶來的樂趣。要記住的是,隨機(jī)性本身并不一定會改變游戲的對稱性,但它可以沖淡因?qū)ΨQ性帶來的一邊倒的最優(yōu)解選擇,給最優(yōu)解的執(zhí)行帶來一定的障礙。
(一個(gè)標(biāo)準(zhǔn)卡坦島游戲的棋盤)
在風(fēng)靡世界的桌面殖民地建設(shè)游戲《卡坦島》(Settlers of Catan)中,通過投擲兩個(gè)骰子的點(diǎn)數(shù)之和來決定哪些玩家得以獲取資源。同時(shí)初始兩個(gè)基地的放置也是按照 從前到后 再 從后到前 的順序,避免先行玩家對 資源點(diǎn)的壟斷控制。
另一個(gè)提到隨機(jī)性便不得不說的例子就是《爐石傳說》。在爐石中從抽牌到效果發(fā)動無時(shí)無刻不充斥著隨機(jī)結(jié)果的影響, n抽3再3選1的發(fā)現(xiàn)機(jī)制也是隨機(jī)性與決策的結(jié)合,更有甚者如尤格薩隆,一張牌隨機(jī)性的表現(xiàn)在極端情況下便可直接左右比賽的勝負(fù)。
在這樣的游戲中,隨機(jī)性使游戲充滿了變數(shù),使后手玩家相信先手優(yōu)勢并不可怕,也使每局游戲玩家都有期待。但一如之前所言,過分的隨機(jī)性會讓玩家失去自主感,讓游戲的成敗變?yōu)槁犔煊擅慕箲]過程,需要好好把握;另外隨機(jī)性與反制鏈的結(jié)合不當(dāng),也會讓游戲變成石頭剪刀布那樣純粹開局定勝負(fù)的游戲。
挖掘游戲深度:
策梅洛定理假設(shè)雙方都是“完美的玩家”,但在實(shí)際游戲中,先手優(yōu)勢的大小不僅撒于其潛在收益,還得考慮玩家具體能做到多少。這里游戲“深度”一詞指得便是技能上的深度,尤其是指即使最優(yōu)解存在,人類因技能限制也無法達(dá)成完美的情況。
≠個(gè)例子,足球籃球等體育比賽有先手優(yōu)勢嗎?足球也是確定性的,信息透明的游戲,但沒有人能保證自己能完美控制自己的身體(當(dāng)然經(jīng)過訓(xùn)練可以得到提升),球權(quán)的更迭很頻繁。雙方很多時(shí)候較量的就是這種身體控制能力,而先獲得球權(quán)的優(yōu)勢雖然存在,但絕大多數(shù)時(shí)候并不足以扭轉(zhuǎn)比賽的天平---更何況在半場過后會輪換到另一隊(duì)開球。
同樣地,在國際象棋中,先手的白棋也普遍有著2%-5%的勝率優(yōu)勢。但由于決策樹的深度和復(fù)雜度,國際象棋先手必勝與否目前還是處于猜想階段,更別提讓人腦去思考和執(zhí)行了。所以哪怕對先手優(yōu)勢完全沒有實(shí)質(zhì)性的平衡手段,國際象棋的平衡也處于玩家普遍可接受的范圍內(nèi)。
(一個(gè)X方先行的井字棋游戲的完美平局)
反過來說,深度過淺的游戲先手優(yōu)勢會被放大。比如Tic-tac-toe(井字棋)游戲,因?yàn)樯疃忍珳\且無隨機(jī)性,很容易被大多數(shù)玩家找到最優(yōu)解且容易實(shí)現(xiàn)。在這種情況下,先手優(yōu)勢不僅很大,而且很容易找到并實(shí)現(xiàn)不敗策略,因此現(xiàn)在在成年人之間的娛樂對弈活動幾乎完全不會考慮井字棋。
延續(xù)游戲長度:
某些時(shí)候,你已無法直接對游戲規(guī)則進(jìn)行大刀闊斧的改革了,那你怎么進(jìn)一步對先手優(yōu)勢進(jìn)行限制呢?
一個(gè)辦法就是,讓大家輪流坐莊,在一定局?jǐn)?shù)之后再判定總體勝負(fù),如同斯諾克比賽那樣要打十幾局乃至三十幾局來決出勝負(fù)。這樣既可以降低隨機(jī)性對結(jié)果的影響,又可以讓先手優(yōu)勢得到壓縮。然而缺點(diǎn)是會嚴(yán)重放慢游戲節(jié)奏,同時(shí)依舊無法對單局比賽的體驗(yàn)產(chǎn)生影響。
除此之外,還能拉長單局游戲的長度,像文明系列那樣一局能打幾百個(gè)回合,讓游戲中后期沖淡前期先手的影響(至少是心理影響)。但同樣會嚴(yán)重放慢游戲節(jié)奏,對不確定性較低的游戲而言還不一定會起到削弱先手的效果。
信息不透明度:
同樣是可以用紙筆進(jìn)行的回合制游戲,帶有信息不透明度的Battleship的先手優(yōu)勢就完全不如Tic-tac-toe那么夸張(但是依舊存在)。在Battleship中,由于雙方自身的海域布局對對手不可見,玩家需要輪流猜測敵船的擺放位置來進(jìn)行炮擊的選擇。
(一個(gè)10x10的常見Battleship棋盤,用x標(biāo)記炮擊位置)
顯然,如果把Battleship的海域布局改成對雙方完全公開的形式,那么這游戲的先手就會變成必勝——先手能先把對方船轟完。但考慮到實(shí)際上初始階段玩家只有大約1/3的概率命中有效目標(biāo)(事實(shí)上與引入了隨機(jī)性等價(jià)),先手就并不能保證對先行優(yōu)勢的轉(zhuǎn)化,只有少數(shù)極端情況下先手正好比后手快一步擊潰對手才會體現(xiàn)出優(yōu)勢。而這個(gè)可以通過一個(gè)小小的規(guī)則修改來避免,并達(dá)成完美對稱性:
先手擊沉敵人所有船只后,還會允許后手再進(jìn)行一次炮擊;如果后手也因此擊沉了敵人所有的船只,則該局計(jì)為平局。
延伸閱讀:海盜分金與用餐者困境
海盜分金講述的是多人按順序分配財(cái)產(chǎn)的博弈問題:
有五個(gè)理性的海盜,A, B, C, D和E,找到了100個(gè)金幣,需要想辦法分配金幣。
海盜們有嚴(yán)格的等級制度:A比B職位高,B比C高,C比D高,D比E高。
海盜世界的分配原則是:
- 等級 的海盜提出一種分配方案。
- 所有的海盜投票決定是否接受分配,包括提議人。并且在票數(shù)相同的情況下,提議人有決定權(quán)。
- 如果提議通過,那么海盜們按照提議分配金幣。
- 如果沒有通過,那么提議人將被扔出船外,然后由下一個(gè) 職位的海盜提出新的分配方案。
海盜們基于三個(gè)因素來做決定。
- 首先,要能存活下來。
- 其次,自己得到的利益最大化。
- 最后,在所有其他條件相同的情況下,優(yōu)先選擇把別人扔出船外。
∩能很多人都已經(jīng)見過海盜分金的概念了。最優(yōu)策略為[98,0,1,0,1]。推理過程可以在百度百科找到:海盜分金_百度百科
這里提出這個(gè)概念是為了說明,在足夠的空間下,第一個(gè)行動的玩家潛在的優(yōu)勢在多人游戲中可以是相當(dāng)巨大的,尤其是合理利用其他玩家存在的相互競爭關(guān)系時(shí)。但有的時(shí)候,有的游戲規(guī)則并不完全等同于海盜分金這樣的動態(tài)博弈,而是更接近于一個(gè)用餐者困境,也就是囚徒困境的多人版:
有若干人出去吃飯,在點(diǎn)菜之前他們達(dá)成了一致:
- 所有人平攤買單的錢(AA制)。
- 現(xiàn)在每個(gè)人要么點(diǎn)貴的菜肴,要么點(diǎn)便宜的菜肴。
假設(shè)貴的菜肴比便宜的要好(即效用高),但是如果一個(gè)人單獨(dú)進(jìn)食的話,不能保證為貴的菜肴多付的錢一定值得(即性價(jià)比低)。
每個(gè)人都這么推想:眾人將會點(diǎn)便宜的菜肴,而由于點(diǎn)了更貴的菜肴而額外加的錢將被眾人攤分,所以額外加的錢是很少的,而菜肴的味道卻會有較大的改善,因而多花這點(diǎn)錢是劃算的。每個(gè)人都這樣推想,最后的結(jié)果是他們都花錢點(diǎn)了更貴的菜肴,而原本他們認(rèn)為點(diǎn)便宜的菜肴要比點(diǎn)貴的對每個(gè)人都要好些。
在用餐者困境中,假如沒有任何信任和交流的建立,每個(gè)人都會選擇更貴的菜肴,使團(tuán)體總體上得到損失。究其原因,其實(shí)在于決策制定過程的不透明性,假定的是每個(gè)人是同時(shí)或私下做出點(diǎn)餐決定的。如果我們把它與與海盜分金結(jié)合起來看,便可以制定一個(gè)新的規(guī)則,來解決用餐者困境。
有若干人出去吃飯,在點(diǎn)菜之前他們達(dá)成了一致:
- 所有人平攤買單的錢(AA制)。
- 現(xiàn)在每個(gè)人要么點(diǎn)貴的菜肴,要么點(diǎn)便宜的菜肴。
- 每個(gè)人按次序點(diǎn)菜,點(diǎn)完之后公開自己的選擇。
- 所有人可以投票決定是否接受這次選擇,如果不接受則將該點(diǎn)餐人排除在外。
假設(shè)貴的菜肴比便宜的要好(即效用高),但是如果一個(gè)人單獨(dú)進(jìn)食的話,不能保證為貴的菜肴多付的錢一定值得(即性價(jià)比低)。被眾人排除在這次用餐外則是最糟糕的體驗(yàn),而少一個(gè)人一起吃飯也會給團(tuán)體每個(gè)人帶來些許的不快。
上述規(guī)則事實(shí)上并沒有做出太大的變化,只是把靜態(tài)博弈變成了動態(tài)博弈,鼓勵了信息交流,每個(gè)人需要大家的同意才能做出選擇。從決策上看,每個(gè)人選擇便宜菜肴對別人都沒有損失,而選擇貴的菜肴就要冒潛在的被踢出的風(fēng)險(xiǎn),單純地踢出選擇便宜菜肴的人對自己也沒有收益,因此可以達(dá)成的納什均衡則是 的——大家都會選擇便宜的菜肴。
同樣地,規(guī)則設(shè)計(jì)可以極大程度上左右決策。在多人游戲中,把游戲從海盜分金那樣的純競爭關(guān)系的零和博弈改為用餐者困境那樣帶有合作關(guān)系的非零和博弈,并合理掌握信息透明度,可以很大程度上通過合作規(guī)則來平衡局面。在War3、帝國時(shí)代那樣的RTS游戲中進(jìn)行過多人混戰(zhàn)模式的玩家可能還會記得,當(dāng)一家獨(dú)大的時(shí)候,其他玩家便會考慮群起而攻之。在《卡坦島》這樣的回合制策略游戲中也是一樣的道理,在充分自由的交易規(guī)則下,玩家可以通過合作和對抗來嘗試抵消任何已在游戲中存在的優(yōu)勢。
結(jié)語
回合制游戲的先后手平衡有著許多種不同的思路來幫助解決,最重要的還是知道我們的目的是什么:我是要讓游戲展現(xiàn)出完美的對稱性,還是僅僅需要保證玩家不會因先后手優(yōu)勢問題損傷游戲體驗(yàn)?
其實(shí)包括大富翁、飛行棋在內(nèi)的絕大多數(shù)回合制游戲都或多或少具有先手優(yōu)勢,但并沒有帶來破壞性的影響。上面這些思路許多時(shí)候并不一定能完全抹平先手優(yōu)勢影響,也有的在過度使用時(shí)會破壞游戲體驗(yàn),但最重要的是能夠合理結(jié)合運(yùn)用,來達(dá)成你的目的。
投稿郵箱:chuanbeiol@163.com 詳情請?jiān)L問川北在線:http://dstuf.com/