近期拜讀了于洋等人出的《游戲數(shù)據(jù)分析的藝術(shù)》,書中后半部分提到的一些游戲數(shù)據(jù)挖掘方法很有啟發(fā),于是蒙發(fā)了拿公司的頁游產(chǎn)品數(shù)據(jù)進(jìn)行嘗試的想法。
這一次的嘗試是付費(fèi)道具關(guān)聯(lián),我們很期待能找到類似沃爾瑪”尿布與破“的關(guān)系。主要分為兩種關(guān)聯(lián)類型,一種是道具-道具間的關(guān)聯(lián),譬如買了A&B的人有多少幾率會(huì)買C;另二種是細(xì)分群體道具間的關(guān)聯(lián),譬如不同等級(jí)段位的人與同一道具間的關(guān)聯(lián)程度。
使用的工具是SPSS MODELER,采用了關(guān)聯(lián)算法中的Apriori進(jìn)行規(guī)則探索。
軟件算出規(guī)則后,我們主要依據(jù)以下指標(biāo)判斷規(guī)則是否“有趣”:
關(guān)聯(lián)規(guī)則的指標(biāo)
在進(jìn)行建模之前,我們需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,主要考慮:
1)排除長尾:該產(chǎn)品總共有多達(dá)四位數(shù)的付費(fèi)道具,如果對(duì)每個(gè)道具都進(jìn)行關(guān)聯(lián)并沒有必要。實(shí)際上20%的道具貢獻(xiàn)了80%的收入,而長尾部分的購買率非常低,即時(shí)分析出有趣的關(guān)聯(lián),也并不適合做營銷組合(實(shí)際上根本過不了支持度的閾值),因此我們選擇清洗掉長尾;
2)排除運(yùn)營活動(dòng)的影響:有部分購買率很高的道具,可能是由于當(dāng)期運(yùn)營活動(dòng)的影響,這部分的道具顯然應(yīng)該被排除。實(shí)際的做法是對(duì)比各個(gè)道具多個(gè)月的購買率,清洗掉那些波動(dòng)很大的部分;
篩選收入貢獻(xiàn)前80%的道具,對(duì)比多個(gè)月的數(shù)據(jù)
對(duì)經(jīng)過處理的數(shù)據(jù)進(jìn)行關(guān)聯(lián),將得出以下四種類型的規(guī)則,從跑出來的結(jié)果看:
1)高支持度高置信度:這種結(jié)果當(dāng)然是很理想的,但是實(shí)際上這種類型的規(guī)則絕大多數(shù)是常識(shí)性的(譬如付費(fèi)打通倒數(shù)第二關(guān)的人極可能也會(huì)付費(fèi)打通最后一關(guān)),或者是游戲本身的設(shè)計(jì)驅(qū)動(dòng)的(譬如開了VIP的人很有可能買首沖優(yōu)惠禮包)
2)低支持度高置信度/高支持度低置信度:這兩種結(jié)果從數(shù)據(jù)角度來講并不太理想,但是它對(duì)我們來說可能是有趣的。例如我們發(fā)現(xiàn)養(yǎng)成類的某些某個(gè)熱銷單品與某些非必須的養(yǎng)成類商品存在關(guān)聯(lián)。那么我們?cè)谶\(yùn)營活動(dòng)中,就可以設(shè)計(jì)當(dāng)用戶購買完該熱銷單品后,彈出這些關(guān)聯(lián)的商品,進(jìn)行搭配推銷;又比如我們發(fā)現(xiàn)注冊(cè)一個(gè)月內(nèi)的首沖用戶與某些產(chǎn)品存在較強(qiáng)的關(guān)聯(lián),那么我們可以據(jù)此更科學(xué)地設(shè)計(jì)首沖優(yōu)惠禮包。
3)低支持度低置信度:這種類型的規(guī)則我們可能感興趣,但是發(fā)生的概率會(huì)很低,即使運(yùn)用起來做運(yùn)營活動(dòng)所能覆蓋的用戶可能也非常有限。
左上與右下象限的規(guī)則可能是適合落地到運(yùn)營的
實(shí)際規(guī)則分布情況
上述的方法,仍是一個(gè)“采集歷史數(shù)據(jù)-分析建模-指導(dǎo)運(yùn)營”的過程。理想情況下,上述操作中被洗掉的長尾以及那些低支持度低置信度的規(guī)則是不應(yīng)被清洗的,因?yàn)槌绦驊?yīng)當(dāng)能在用戶進(jìn)行游戲時(shí),便自動(dòng)根據(jù)用戶的標(biāo)簽來定義該用戶的類型,從而向他推送符合其特征的營銷內(nèi)容,從而達(dá)到精細(xì)化運(yùn)營的目的。感覺在游戲行業(yè),對(duì)大數(shù)據(jù)的利用遠(yuǎn)不如電商來得成熟有效,隱約覺得游戲的架構(gòu)似乎不適合做這一塊,繼續(xù)探索下去的空間還有多大呢?
近期想為團(tuán)隊(duì)補(bǔ)充一些做游戲數(shù)據(jù)分析的專業(yè)人才,但是一輪招聘下來發(fā)現(xiàn)專職做數(shù)據(jù)分析的人,大多數(shù)只是停留在指標(biāo)體系監(jiān)測(cè)的部分,真正有算法建模經(jīng)驗(yàn)的人不多,BI都談不上,更別提AI。懂大數(shù)據(jù)算法的人,發(fā)展前景是非常廣闊的。
投稿郵箱:chuanbeiol@163.com 詳情請(qǐng)?jiān)L問川北在線:http://dstuf.com/