借著全球最大的游戲開發(fā)大會GDC17 的機(jī)會,英偉達(dá)宣布推出 款游戲用顯卡GeForce GTX 1080 Ti。新顯卡采用16納米制程Pascal 架構(gòu),具備3584 個(gè)CUDA 核心以及高達(dá)11GB 的顯存,從紙面參數(shù)上新核彈比上一代游戲/通用計(jì)算多用途顯卡Titan X 性能稍強(qiáng)一些,比自己的前輩產(chǎn)品GTX 1080 也強(qiáng)了35%。
但在新核彈的喧囂之余,PingWest品玩關(guān)注到了英偉達(dá)在游戲開發(fā)方面的更多主張和嘗試。這家稱自己“All about AI” 的計(jì)算技術(shù)公司,正在快速改變游戲和AI 的關(guān)系。
此AI 非彼AI。在過去,游戲AI 可以指所有非玩家角色(NPC),比如劇情中的配角、Boss 和商人等,也可以再進(jìn)一步,泛指所有游戲的非玩家內(nèi)容,比如作戰(zhàn)機(jī)制和商業(yè)系統(tǒng)等等。它是由人設(shè)計(jì)的。
但英偉達(dá)覺得,游戲行業(yè)即將進(jìn)入一個(gè)新的AI 時(shí)代——用AI 來輔助設(shè)計(jì)和開發(fā)游戲,而且質(zhì)量并不遜于人工制作。
“簡單來說,過去的AI 就是規(guī)則和腳本,讓AI 照著你的設(shè)計(jì)行動,再到后來有了決策樹,更先進(jìn)一些!庇ミ_(dá)應(yīng)用深度學(xué)習(xí)研究部(Applied Deep Learning Research) 副總裁布萊恩·卡坦薩羅稱。但他認(rèn)為,隨著深度學(xué)習(xí)技術(shù)突飛猛進(jìn)式發(fā)展,AI 可以幫助開發(fā)者生成音畫素材,甚至劇情、任務(wù)等機(jī)制性的內(nèi)容。
過去兩年,英偉達(dá)已經(jīng)帶來了多項(xiàng)基于機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)的工具,以解決游戲開發(fā)者面臨的棘手難題。舉個(gè)例子,大型游戲的一大特點(diǎn)是畫面精美,但這需要美工畫師和視覺設(shè)計(jì)師巨大的精力去創(chuàng)作材質(zhì)。受制于人員和財(cái)力,中歇發(fā)者往往在視覺質(zhì)量上打了折扣,更多人選擇了矢量化,甚至更粗糙的視覺風(fēng)格。
英偉達(dá)高級開發(fā)技術(shù)經(jīng)理安德魯·艾德斯登展示了一項(xiàng)名叫2Shot 的技術(shù),讓開發(fā)者更輕松地從真實(shí)世界中提取材質(zhì),應(yīng)用到游戲中:只需分別打開和關(guān)閉閃光燈,用手機(jī)拍攝兩張對象材質(zhì)的照片,計(jì)算機(jī)將對它們進(jìn)行自動處理,幾分鐘后即可生成素材文件。
2Shot 極大降低了開發(fā)者優(yōu)化材質(zhì)的技術(shù)門檻,但它仍有很大的提升空間。英偉達(dá)在去年又提出了1Shot 技術(shù),采用更強(qiáng)大的神經(jīng)網(wǎng)絡(luò)進(jìn)行計(jì)算,只需一張照片就能生成素材,時(shí)間也降低到了數(shù)秒的時(shí)間。2Shot 的生成素材質(zhì)量已經(jīng)達(dá)到了工業(yè)級,而1Shot 的質(zhì)量還有待提高,但它們已經(jīng)證明了機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)在游戲開發(fā)方面的應(yīng)用前景。
布萊恩·卡坦薩羅
英偉達(dá)還展示了另外兩種技術(shù),分別名為Texture Multiplier 和Super-Resolution。
Texture Multiplier(材質(zhì)復(fù)制器)類似于視覺特效人員常用的“材質(zhì)增生”(texture mutation) 技術(shù),最大的不同是采用了經(jīng)過了大量訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network) 作為生成器,生成的效果高度接近真實(shí),達(dá)到了肉眼難以分辨的水平。Texture Multiplier 將使得美工人員可以快速制作美觀的大片面積材質(zhì),不再給人一種“你這材質(zhì)復(fù)制粘貼的吧!”的感覺……
而Super-Resolution(超分辨率)則聽起來更為科幻。記不記得《諜影重重5》里的情節(jié):CIA 特工在雅典憲法廣場上尋找伯恩,用模糊的定格畫面,“放大、增強(qiáng)!”(Zoom, enhance),然后就獲得了一張?zhí)貏e清晰的照片,確定了目標(biāo)?
其實(shí)過去根本沒有這種高科技……至少在《諜影重重5》拍攝期間還沒有,直到最近才有類似的出來。前不久Google 的大腦團(tuán)隊(duì)實(shí)現(xiàn)了將8×8 像素分辨率的,極度粗糙和顆粒化頭像,還原成比較清晰的,達(dá)到了32×32 分辨率的頭像,而英偉達(dá)也在做類似的事情。
該公司研究者采用的具體訓(xùn)練方法(注意:和其他機(jī)構(gòu)方法類似,可作參考),是先把大量的高清晰度照片“縮小”(downscale) 到非常低的清晰度,僅保留非常有限的特征,同時(shí)另外把這個(gè)降級過程中損失的特征保存下來。
采用這種方式處理了大量的高清圖片之后,研究者獲得了海量損失掉的特征。他們將這些特征整理合成一個(gè)“特征規(guī)律庫”,就像辭典一樣,意圖在于告訴神經(jīng)網(wǎng)絡(luò):再去“放大” (upscale) 圖片的時(shí)候,按照這個(gè)辭典去操作。當(dāng)然,具體操作起來比這個(gè)口頭敘述的流程復(fù)雜得多,這個(gè)卷積神經(jīng)網(wǎng)絡(luò)模型需要數(shù)天的時(shí)間才能完成訓(xùn)練。
在此前的測試中,Google 大腦團(tuán)隊(duì)的同類技術(shù)能夠成功還原90% 被打馬賽克的人臉,算是一個(gè)十分驚人的成績。而英偉達(dá)則不滿足于低清晰度,希望追求更“感人”的分辨率。艾德斯登告訴PingWest品玩(微信公眾號:wepingwest),該公司已經(jīng)在實(shí)驗(yàn)室中實(shí)現(xiàn)僅花“很快”(數(shù)秒)的時(shí)間將1K 分辨率重組為4K 分辨率的高清照片。
這種技術(shù)能為游戲帶來什么改觀?英偉達(dá)期待它能夠在未來,讓游戲在更小容量的基礎(chǔ)上,顯著提高材質(zhì)的清晰度和視覺效果。舉個(gè)例子:在射擊游戲中,當(dāng)玩家舉起狙擊槍,瞄準(zhǔn)鏡里能顯示出更清晰的遠(yuǎn)處畫面和材質(zhì)。
不光是英偉達(dá),Google 旗下的英國人工智能技術(shù)公司DeepMind,也在考慮用神經(jīng)網(wǎng)絡(luò)在游戲上搞點(diǎn)事情——當(dāng)然如果你有印象的話,過去曾經(jīng)傳出人工智能在《打磚塊》、《星際爭霸》、《毀滅戰(zhàn)士》乃至于圍棋上碾壓人類的消息,大多都是DeepMind 搞出來的……
該公司在去年訓(xùn)練了一個(gè)名叫WaveNet 的人工智能,讓計(jì)算機(jī)生成的語音和人類原聲越來越難以區(qū)分。WaveNet 和過去的串聯(lián)式語音合成、參數(shù)式語音合成不同,將語音的原始數(shù)據(jù)(波性文件)細(xì)分到了以1 毫秒為單位的區(qū)間,在每一個(gè)區(qū)間之間都采用遞歸神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network) 和卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測學(xué)習(xí)。
WaveNet 的結(jié)構(gòu)演示
最后, DeepMind 用Google 自家的TTS 語音轉(zhuǎn)文字(目前世界上得分 的該類技術(shù))數(shù)據(jù)集進(jìn)行測試,比Google TTS 的得分高了10 個(gè)百分點(diǎn)——但將Google TTS 與人類原聲之間的距離縮短了一半還多。
雖然玩游戲的時(shí)候,基本沒人會特別仔細(xì)地聽每一句對白,但不意味著開發(fā)者應(yīng)該在這方便節(jié)省。WaveNet 將會成為游戲開發(fā)者的福音,“想象一下,當(dāng)你需要調(diào)整劇情的時(shí)候,可以用計(jì)算機(jī)生成配音,不必再花錢請配音演員回來重錄,甚至完全不用配音演員!笨ㄌ顾_羅稱。
你可以到WaveNet 的網(wǎng)站上試聽一下效果,跟真人聲音差距真的很小。
好吧,現(xiàn)在AI 有了生成聲音、視覺材質(zhì)等元素的能力,接下來呢?
⊥在上周,游戲開發(fā)公司Nival 宣布了一個(gè)振奮人心的消息:他們給2015 年發(fā)售的在線即時(shí)戰(zhàn)略游戲《閃電戰(zhàn)3》開發(fā)了一個(gè)神經(jīng)網(wǎng)絡(luò)決策AI:Boris。
在一則演示視頻中,Boris 顯示出了“風(fēng)箏”敵方單位的能力(指吸引敵對目標(biāo),帶其到處亂跑以打亂策略的行為);還可以在明顯具有劣勢時(shí)消極應(yīng)戰(zhàn)而非拼死頑抗,以起到保存火力的目的;當(dāng)戰(zhàn)場中有新的敵人加入,Boris 會自動分配部隊(duì)火力到不同的目標(biāo)上,也會根據(jù)敵方火力級別,自動指揮士兵坐上炮臺,而不是傻站在地上,用步槍拼坦克。
更有趣的是,當(dāng)雙方對抗占點(diǎn)時(shí),Boris 會選擇性忽視那些擋路的殘血敵軍,優(yōu)先搶點(diǎn)再等待機(jī)會擊殺——這一特征顯示出了Boris AI 對不同獎(jiǎng)勵(lì)(reward) 級別的理解,能夠優(yōu)先追求與全局獲勝關(guān)系更大的獎(jiǎng)勵(lì)。
Nival 明確表示Boris 沒有使用游戲內(nèi)核的任何地方數(shù)據(jù),只使用對玩家可見的戰(zhàn)場情況,每幾秒鐘進(jìn)行一次決策。Boris 的更多技術(shù)細(xì)節(jié)暫未公開。
在游戲開發(fā)中應(yīng)用AI 技術(shù),還有很大的想象空間。
去年,OpenAI 用《俠盜獵車手5》開發(fā)出了一個(gè)名叫DeepDrive 的“自動駕駛模擬器”。由于游戲內(nèi)部的車輛行駛數(shù)據(jù)應(yīng)有盡有,OpenAI 發(fā)現(xiàn)其實(shí)可以用游戲數(shù)據(jù)來訓(xùn)練自動駕駛系統(tǒng)。雖然后來研究者刪除了與該模擬器有關(guān)的內(nèi)容(這里有一個(gè)Twitter 上的視頻演示,這項(xiàng)技術(shù)所屬的項(xiàng)目官網(wǎng)還在),該事件還是令人印象深刻,它賦予了人們審視AI 和游戲之間關(guān)系的新視角。
像《俠盜獵車手》這樣的開放世界游戲,開發(fā)公司花費(fèi)多年時(shí)間設(shè)計(jì)了大量的任務(wù)關(guān)卡,但最快的玩家不出幾十個(gè)小時(shí)就能玩完全部的內(nèi)容,繼而希望獲得更多的內(nèi)容。然而開發(fā)公司要花更多精力在下一款游戲上,無暇顧及上一代(實(shí)際上開發(fā)公司R 星的做法是用一個(gè)相對較小規(guī)模的團(tuán)隊(duì)維護(hù)游戲,繼續(xù)添加新的在線游戲模式)——未來,AI 會不會獲得生成任務(wù)、關(guān)卡、劇情的能力,以至于可以獨(dú)立完成一個(gè)完整的游戲?
〃坦薩羅認(rèn)為那樣的未來會很棒,但應(yīng)該只存在于設(shè)想階段,“我覺得設(shè)計(jì)關(guān)卡和任務(wù)最難的地方在于,你怎樣能讓新關(guān)卡和任務(wù)足夠有趣,這是目前AI 還不能取代設(shè)計(jì)師的地方。你可以讓AI 生成對白,生成材質(zhì),但將對白、視覺、機(jī)制和劇情進(jìn)行有序、有趣的拼接,它還做不到。我想可能有些幽默只有人懂。但我可以想象AI 未來能夠輔助設(shè)計(jì)師更快推出新的關(guān)卡和任務(wù),那很將令人期待。”
聊到這里,我倒是有點(diǎn)擔(dān)心了。
“你說,AI 設(shè)計(jì)的游戲,會不會把玩家虐成狗?沒準(zhǔn)AI 早就想在模擬環(huán)境里先感受一下,取代和虐殺人類是一種什么樣的感覺吧……?”
投稿郵箱:chuanbeiol@163.com 詳情請?jiān)L問川北在線:http://dstuf.com/