張世睿



摘要摘要:運營數據通常是用戶對移動應用喜好最直接的體現,運營數據中存在著很多有價值的信息。如果能夠更快地通過運營數據分析和了解用戶、迎合用戶喜好,就能贏得更多的用戶,在競爭中占據有利地位。針對移動應用設計復雜、運營數據分析不直觀的特點,提出一種基于BP人工神經網絡的運營數據分析方法,建立了以移動應用關卡常見數據為輸入,運營數據為輸出的神經網絡模型。實驗表明,該方法能夠有效對移動應用關卡設計和配置所吸引的用戶數量和復玩率進行預測,從而指導移動應用的開發、設計及評價。
關鍵詞關鍵詞:BP神經網絡;運營數據;游戲關卡
DOIDOI:10.11907/rjdk.161379
中圖分類號:TP301文獻標識碼:A文章編號文章編號:16727800(2016)007002103
0引言
隨著移動互聯網的發展和智能設備的普及,移動應用在人們日常生活中變得越來越重要,越來越多的廠商投入到移動應用的開發中來,各種相似功能的應用層出不窮。因此,如何在移動互聯網發展的浪潮下了解用戶需求,開發更加吸引用戶、使用戶滿意的產品,從而在激烈的行業競爭中獲取最多的用戶數量,就成了目前移動應用開發商重點關注的問題。移動應用的運營數據是用戶評價最直觀的反饋,如何從大量且無規律的運營數據中了解用戶的想法就成了當今移動互聯網界研究的重點。本文提出一種基于人工神經網絡的運營數據分析方法,通過對移動運營數據加以分析,預測并指導移動應用設計的方向。實驗結果表明,基于人工神經網絡的移動應用數據分析具有很強的指導作用,結果符合實際,可大大提高產品吸引力。
1移動運營數據分析的一般方法
移動運營數據的分析方法一般分為兩大類,一類是很多中小公司采用的較為簡單的分析方法,即根據應用每日用戶的登錄頻次、滯留時間、特定功能的使用情況等繪制合適的曲線,分析哪一塊功能更容易受用戶的青睞,根據版本更新之后用戶的數量是否增加等制定下一階段的開發和設計任務。這種方法的好處是實現起來較為簡單,不需要很多的知識儲備,數據收集和分析也比較容易。然而這種方法的缺點也是顯而易見的,即對數據的分析更多是基于人的主觀認識,而非理性客觀的評價,容易導致產生帶有偏見的結果,不利于企業的發展。另一類運營數據的分析方法是基于數據挖掘知識,目前研究較多的有針對用VOLOS H, NALLI S, PANNEERSELVAM S,et al.Aerie:flexible filesystem interfaces to storageclass memory .Proceedings of the Ninth European Conference on Computer Systems. ACM, 2014: 14.
P M CHEN, W T NG,S CHANDRA,et al.The rio file cache:surviving operating system crashes[J].In Proc. of the Architectural Support for Programming Languages and Operating Systems,1996.
ANI A WANG,GEOFFREY H KUENNING, PETER REIHER,et al.The conquest file system:better performance through a disk/persistentRAM hybrid design[J].ACM Transactions on Storage,2006(3):309348.
CHEN J, WEI Q, CHEN C,et al.FSMAC: A file system metadata accelerator with nonvolatile memory .Mass Storage Systems and Technologies (MSST), 2013 IEEE 29th Symposium on. IEEE, 2013: 111.
QIU S, REDDY A L.Nvmfs:a hybrid file system for improving random write in nandflash ssd.Mass Storage Systems and Technologies (MSST), 2013 IEEE 29th Symposium,2013: 15.
CHEN F, MESNIER M P, HAHN S. A protected block device for persistent memory.Mass Storage Systems and Technologies (MSST), 2014 30th Symposium on. IEEE, 2014: 112.
責任編輯(責任編輯:陳福時)戶忠誠度方面的分析[1]、用戶流失方面的預測分析[24],以及用戶興趣挖掘[5]和聚類分析[6]等。這些分析和預測方法為移動運營提供了較為理性和可靠的數據,對于應用開發商的計劃訂制和用戶群體分析有很大幫助。
然而,這些方法都只是通過運營數據對用戶某一單方面的行為進行分析和預測,沒有考慮到應用系統設計和運營過程中諸如設計、獎勵、活動等復雜因素。本文提出一種基于BP人工神經網絡的移動運營數據分析方法,具有利用人工神經網絡可逼近任意復雜非線性關系、可學習和自適應的特點,建立起了相應的數學模型。
2人工神經網絡的基本原理
人工神經網絡(Artificial Neural Network)是由大量簡單的處理單元連接組成的一種網絡模型,主要用來模擬人類大腦運行的一些基本邏輯和結構,反映了人腦功能的很多基本特性,但是人工神經網絡并不是人腦真實反映,只是對人腦作出了某種程度的簡化和模擬[7]。圖1展示了一個較為典型的人工神經網絡細胞。
由于人工神經網絡是由大量的神經元根據某種結構組合而成,因此通常按照其組合方式進行分類。較為常見的網絡結構可以分為前饋神經網絡、反饋型神經網絡和自組織網絡三類。前饋網絡也稱前向網絡。該網絡只在訓練過程會有反饋信號,層間沒有向后的反饋信號,因此被稱為前饋網絡。BP神經網絡屬于前饋網絡的一種。反饋型神經網絡是一種從輸出到輸入具有反饋連接的神經網絡,其結構比前饋網絡要復雜得多。
自組織神經網絡是一種無導師學習網絡。它通過自動尋找樣本中的內在規律和本質屬性,自組織、自適應地改變網絡參數與結構。網絡運作過程分為學習和工作兩種狀態。網絡學習主要是指根據學習算法來調整神經元間的聯接權值,使得網絡輸出更符合實際。學習算法分為有導師學習與無導師學習兩類。
有導師學習算法將一組訓練集送入網絡,根據網絡的實際輸出與期望輸出間的差別來調整連接權。有導師學習算法的主要步驟包括:①從樣本集合中取一個樣本(Ai,Bi);②計算網絡的實際輸出O;③求D=Bi-O;④根據D調整權矩陣W;⑤對每個樣本重復上述過程,直到對整個樣本集來說,誤差不超過規定范圍。
BP算法是一種出色的有導師學習算法。由于本文針對移動運營數據進行分析,從而建立起應用設計和運營數據相關的數學模型,因而選擇基于BP算法的有導師人工神經網絡,采用已知的運營數據作為訓練集進行網絡訓練,建立數學模型,并通過該模型來驗證實際項目中的數據情況,以此來驗證該網絡模型的準確程度和可靠性。
3樣本數據與模型構造
3.1樣本數據
本文以國內某手機游戲公司的一款跑酷游戲為例,由于其關卡模式為當前主推模式且數據信息較多,因此選擇該模式下的前40關為研究對象,考察不同關卡布局、設計和獎勵下玩家總體的游玩次數。
本文選取版本3.2的前40關數據作為訓練集構造神經網絡模型。選取版本4.0的前40關的數據作為實驗數據驗證該模型的準確性。
3.2模型構造
神經網絡模型的建立主要需考慮兩方面的問題: 一是確定網絡結構 ; 二是調整學習參數。首先考慮神經網絡結構。網絡結構主要包括網絡的鏈接方式、網絡層數和各網絡層節點的個數,本文采用目前使用最為廣泛的神經網絡。
模型輸入參數選取可以直觀獲得、不需要加工的數值,避免因為人為主觀因素的干擾導致模型無法客觀對應用的設計進行評價從而無法模擬出真實移動運營數據。在關卡設計中,常見的對數據產生影響的直觀因素如下:
(1)關卡序號。越靠前的關卡越容易吸引更多的用戶參與,關卡序號的表示方法從1開始,依次遞增。
因此,根據上述信息,將關卡的序號、類型、獎勵級別、挑戰次數作為網絡模型的數據參數。模型的輸出參數代表所關心的玩家對應用喜好意愿的表達,通常認為以下參數能夠表達玩家對于關卡的喜好:關卡挑戰次數、關卡復玩率、下一關挑戰率。
通過資料可知[8],三層的BP網絡可以逼近任意的映射關系,且與通常使用的一個隱藏層的網絡相比,兩個隱藏層的網絡對提高最終的預測準確率來說并沒有顯著幫助。隱藏層中節點數目選擇較復雜,并沒有統一的規則去指導,因此本文根據設置隱藏層節點個數的不同對數據準確性進行了測試,最終確定隱藏層幾點的個數為20。
本文輸入數據均為正數,因此通過線性歸一化方法將數據歸一化到[0,1]范圍上:f(x)=x-minmax-min(1)由于數據均歸一化到[0,1]區間,因此第一層激活函數選擇S型函數,第二層激活函數選擇線性激活函數,公式如下:f(x)=11+e-x(0 按照上文所述構建網絡模型,訓練函數選擇有動量和自適應lr的梯度下降法進行訓練,訓練參數設置迭代次數為20 000次,訓練目標最小誤差位0.003,訓練速度為0.01。 網絡訓練完成后,將一組測試數據輸入程序中,用來測試該網絡的識別成功率,將上下浮動5%的數據作為正確數據進行處理,進行了四次實驗,得到結果如表3所示。 識別準確率都穩定在80%以上,尤其是復玩率,穩定在87.5%以上。將上述模型數據與常規運營數據分析方法的結果進行對比,從圖2可以看到基于BP神經網絡的方法更加準確客觀,不摻雜分析人員的主觀因素。 4結語 本文提出了一種基于BP神經網絡的移動運營數據分析方法,建立起移動游戲關卡設計因素和運營數據之間的關系。經過仿真實驗證明了該方法有效,相對于傳統的人工分析方法準確率較高且穩定可靠,可以作為一種提高運營數據分析準確率的方法應用于實踐。 參考文獻參考文獻: [1] 劉芳,郭宇春.基于數據挖掘的用戶忠誠度分析[J].計算機技術與發展,2013,23(7):1417. [2]劉光遠,苑森淼,董立巖.數據挖掘方法在用戶流失預測分析中的應用[J].計算機工程與應用,2007,43(9):154156. [3]葉進,林士敏.基于貝葉斯網絡的推理在移動客戶流失分析中的應用[J].計算機應用,2005,25(3):673675. [4]田玲,邱會中,鄭莉華.基于神經網絡的電信客戶流失預測主題建模及實現[J].計算機應用,2007,27(9):22942297. [5]郭巖,白碩,楊志峰,等.網絡日志規模分析和用戶興趣挖掘[J].計算機學報,2005,28(9):14831496. [6]徐涌,陳恩紅,王煦法.基于神經網絡的Web用戶行為聚類分析[J].小型微型計算機系統,2001,22(6):699702. [7]施鴻寶 .神經網絡及其應用[D].西安: 西安交通大學出版社 ,1993. [8]LIPPMANN R P.An introd