中國電信股份有限公司江蘇分公司互聯網與增值業務運營支撐中心 胡仲剛 汪敏娟
基于客戶移動互聯網行為的信息價值挖掘應用
中國電信股份有限公司江蘇分公司互聯網與增值業務運營支撐中心 胡仲剛 汪敏娟
在分析移動互聯網高速發展和用戶需求的基礎上,重點闡述了移動互聯網用戶行為的信息價值挖掘流程和關鍵技術,并對其在個性化內容推薦、精準業務營銷、定向廣告投放和業務能力開放等4個方面應用進行了探討。
移動互聯網;行為分析;信息挖掘
為幫助用戶快速找到自己感興趣的內容,需對用戶移動互聯網訪問行為進行挖掘分析。移動互聯網數據具有數據量大、數據結構復雜、數據內容分散等特點,為了從浩如煙海的數據中提取出有效信息,需借助有效的數據挖掘技術,采取合適的數據挖掘策略。通過從用戶、終端、產品等多個維度進行挖掘分析,確定用戶的興趣偏好并形成客戶畫像。再根據具體的營銷任務,通過針對性的營銷手段,快速將合適的內容推送給合適的用戶,從而實現移動互聯網精細化運營的目標。
1.1 信息價值挖掘流程
基于客戶移動互聯網行為的信息價值挖掘是一項復雜的工程,需采集并整合處理用戶基礎信息、網絡流量信息、用戶訪問內容和用戶終端信息等,對數據進行關聯分析和挖掘,提供具有價值的商業和服務信息,并應用于業務運營。如圖 1 所示,相關流程可劃分為數據采集、分析挖掘和業務應用3個部分。
1.1.1 數據采集
從IT(信息技術)系統獲取用戶基礎信息,通過DPI(深度包檢測)系統從分組域網絡獲取用戶的上網行為數據,從終端信息采集系統獲取用戶終端和業務支持能力信息,通過搜索引擎爬蟲獲取用戶訪問網頁內容。從數據源采集到的數據具有流量大、報文格式復雜等特點,不能直接進行處理,需要先進行清洗和預處理,轉換為標準、精簡、有效的數據。

1.1.2 分析挖掘
從數據采集層獲取有效數據,將用戶的真實身份、網絡流量和訪問網頁內容進行對應,通過相關模型和算法進行有效的數據挖掘。具體可從以下維度進行:
訪問偏好分析:根據用戶訪問的URL(統一資源定位),對基于HTTP(超文本傳輸協議)形式的頁面進行語意分析和內容分類,確定客戶的訪問興趣偏好。
搜索偏好分析:將公共、行業、典型門戶站內等搜索引擎進行分類,構成搜索興趣偏好,通過搜索變量解析,挖掘出搜索的關鍵字。
應用偏好分析:分析安卓和iPhone的下載行為,分析用戶使用各種應用的次數、時長、流量等信息。
專題偏好分析:通過對非文本形式的音樂、視頻、下載、游戲、閱讀和圖片等信息的挖掘,通過對文本形式的房產、汽車等信息的挖掘,確定客戶的專題興趣偏好。
行為特征分析:在客觀行為分析的基礎上,挖掘客戶各種偏好的忠誠度、訪問頻度、上網習慣、流量分布及沉默規律等。
1.1.3 業務應用
實現目標客戶挖掘,對外提供能力輸出,為具體運營和營銷提供決策支持。具體包括:
目標客戶提?。焊鶕蛻舻淖匀粚傩?、終端構成、上網行為、興趣偏好等提取目標客戶。支持營銷主題、客戶特征、客戶規模等多種條件提取方式。
應用接口:構建開放的支撐平臺,提供標準化的API(應用程序接口),幫助第三方系統根據用戶喜好推薦相應的內容。
1.2 關鍵技術
1.2.1 垂直搜索引擎
垂直搜索引擎是信息價值挖掘的重要內核之一。與綜合搜索引擎相比,垂直搜索引擎的信息服務模式有所變化,它更加注重信息的專深性,克服了綜合搜索引擎信息查準率低、有用信息含量低等不足。垂直搜索引擎實現了網頁信息的結構化抽取,是一種搜索質量更準確、相關性更復雜的搜索引擎。其主要技術特點如下:
結構化:專業的結構設置,使信息更加準確和清晰。
個性化:根據專業結構,建立最合理的索引,快速定位內容變更。
專業性:開發針對非傳統文本內容的分析,如文本文件下載、音頻視頻軟件的頭文件信息分析,能夠將非主流媒體的信息進行提取。
功能性:優化對新增行業的快速接入模式。
目前,用戶移動互聯網行為除了文本信息以外,還有大量非文本信息,如聽音樂、看視頻、讀小說、玩游戲等非文本形式,無法通過頁面URL挖掘。垂直搜索引擎能很好地解決以上問題,可以實現對音樂庫、視頻庫、下載庫、游戲庫、小說庫、圖片庫、閱讀庫、房產庫、汽車庫等專題信息的實時維護更新。
1.2.2 人工智能分析
人工智能分析是信息價值挖掘重要內核之二。用戶訪問移動互聯網內容爬取(crawling)后,是通過人工智能分析模型來進行處理的。具體包括:
無效頁面過濾:在一個網站中,存在很多如廣告、導航頁面、功能頁面、提示頁面等沒有實際主題的頁面,需預先進行過濾。一般來說,對具有特定特征的無效頁面系統將自動過濾,對沒有特定特征的頁面采取人工設置過濾的方式進行過濾。
頁面垃圾過濾:在頁面中,除了主題內容以外,還有一些諸如廣告條、頁面美化等非主題信息,這些內容如果也參與到分詞中提取關鍵詞將會造成很大的偏差。因此,需要在分詞前對頁面進行清洗,以保證清洗后的部分只有具體的主題內容。
頁面內容分析:將頁面內容過濾成有效的、可利用的真實數據后,分析出信息的標題、元信息和正文,并進行切詞及剔除虛詞,獲取整篇內容的關鍵詞條,為內容分類提供基礎數據。根據知識庫和專家規則庫及預先設置好的類別,進行內容的分類處理。通過自動學習機的自學功能來發現知識,實現知識庫和專家規則庫的自動優化。
1.2.3 內容聚類分析
內容聚類分析是信息價值挖掘重要內核之三。對經過內容分析的頁面進行聚類分析,把若干相似度高的內容聚類成一組,然后分析各組內容的相同與不同信息。
目前,聚類算法主要有兩種,一是以G-HAC等算法為代表的層次凝聚法,另一種是以K-means算法為代表的平面劃分法。其中,前者是最為常用的聚類方法,他能夠生成層次的嵌套聚類,并且準確度高,但在每兩個聚類合并時,需要全局的比較所有聚類的相似度,確定適當的閥值,計算出最佳效果。
內容聚類在客戶訪問過的內容中,挖掘出相同的內容或類似的內容,形成內容類別,再結合客戶基礎信息、頁面訪問信息等生成客戶畫像。
1.2.4 行為分析模型
行為分析模型是信息價值挖掘重要內核之四。在進行人工智能分析和內容聚類分析時,需通過建立相關的行為分析模型來實現。主要有:
文本挖掘模型:基于訓練語料庫,通過一定的模型訓練算法,構造文本智能分類模型。把構造完成的文本智能分類模型保存到數據庫中,對文本內容進行分詞分析,根據已訓練好的分類模型進行內容分類。
用戶應用偏好模型:根據用戶使用各類應用的情況進行分析,通過應用知識庫識別應用,計算用戶應用興趣偏好模型。
用戶搜索偏好模型:主要根據用戶在主流的搜索網站的搜索情況進行分析。分析用戶搜索主流搜索網站的搜索記錄,對用戶的搜索內容進行分類記錄,計算用戶搜索興趣偏好模型。
用戶瀏覽行為聚類模型:根據選擇的聚類分析指標,利用上面提到的聚類挖掘算法對客戶進行分群。聚類指標可自主選擇,模型輸出包括:每個客戶群的客戶數、百分比、各項指標的分布情況等。
數據關聯分析模型:根據用戶的基礎信息、終端信息和訪問的網頁內容進行關聯分析,找出其中的關聯關系,用于針對性營銷。
移動互聯網用戶行為分析是真實的、客觀的、多維度的分析,其準確度取決于行為分析模型。
目前,基于客戶移動互聯網行為的信息價值挖掘,結合業務發展需要,可以開展個性化內容推薦、精準業務營銷、定向廣告投放和對外能力開放等業務應用。
2.1 個體客戶的個性化內容推薦
針對個體客戶,從用戶、終端、產品等多個維度進行分析,生成客戶畫像。根據多維度的客戶畫像,提供個性化的門戶頁面,針對性地進行內容推薦。同時,通過客戶行為分析反饋客戶特征變化,形成閉環營銷系統。具體流程見圖 2。

如用戶訪問業務門戶時,為其推薦合適的游戲、應用、視頻等。根據用戶的興趣偏好推薦合適的內容,有利于增加用戶黏性,降低流失率。
2.2 群體客戶的精準業務營銷
針對群體客戶,在客戶畫像基礎上,通過建立營銷活動挖掘模型,實現特定業務精確受眾群體的客戶挖掘。在具體業務推廣時,可以按照營銷主題、客戶特征、客戶規模等多種條件提取目標客戶,實施精準營銷,進而達到“提高效率、降低成本、減少投訴、增加效益”的目的。具體流程見圖 3。
精準營銷可以基于多種方式,如營業廳實體渠道、外呼營銷,以及傳統的短信、彩信和WAP(無線應用協議)推送等。對營銷活動效果進行評估,將營銷成功的客戶與挖掘的興趣偏好客戶進行對比,找出存在的問題,為再次營銷提供修正方案。
2.3 媒體客戶的定向廣告投放
定向廣告投放是運營商根據客戶的興趣偏好,向商家的目標客戶群進行廣告推送的行為。它是一種基于用戶行為挖掘分析的精確廣告投放,通過策劃數據挖掘維度鎖定用戶群,由傳媒公司策劃廣告創意,對目標用戶群進行廣告投放,為后向廣告商提供個性化差異化服務。下面以挖掘具有房產、汽車等興趣偏好的客戶進行定向廣告投放為例,如表 1 所示。

結果表明,基于用戶行為的定向廣告投放成功率為普通投放效果的幾百倍,既節約了資源,又達到良好的投放效果。定向廣告投放能精準的將廣告信息投放給最合適的移動用戶群體,對開展移動互聯網后向經營、探索新興商業模式等有重要意義。
2.4 合作伙伴的業務能力開放
開放已經成為移動互聯網時代的潮流。在國外,Facebook平臺上的第三方應用數量已超過24 000個,每天有超過40萬人的開發者圍繞這個平臺做開發應用。在國內,新浪微博、騰訊、百度、盛大、開心網等相繼開放互聯領域的API,力求在網民中為自己塑造開放平臺的形象。構建開放的支撐平臺,提供標準化的API,幫助第三方系統根據用戶喜好推薦相應的內容,可以有效地實現資源整合、信息共享和業務協同。
隨著移動互聯網的迅速發展,流量經營成為運營商創新發展的核心。深化流量經營的一個重要手段是用戶訪問信息的挖掘與分析。通過對移動互聯網中各項數據進行挖掘和分析,能夠對用戶的使用行為、興趣偏好、發展趨勢等進行全面了解,進而開展針對性營銷和提供個性化服務,再通過客戶行為分析反饋客戶特征變化,從而形成良性的閉環營銷體系。如何高效地對用戶移動互聯網行為進行挖掘,充分發揮智能管道的優勢,實現精細化的業務運營,是未來探索的一個重要方向。