張 妮
(華信咨詢設計研究院有限公司,浙江 杭州 310052)
大數據技術就是對海量數據的處理,在分析、匯總以及深度挖掘關聯度的過程中獲取具有價值的信息內容,從而支持對應行業規劃的制定。在大數據技術體系內,要借助數據統計和數據挖掘等手段,憑借建模思想有效提升數據應用的效果。目前,大數據通用分類法主要分為以下幾點。
利用分布式計算平臺,在落實PC Server集群部署工作內容后就能搭建分布式計算框架和存儲結構,從而有效結合不同應用場景落實相應工作,維持綜合運算分析的實效性。其中,云化ETL是較為有效的數據信息管控流程,結合圖1所示的Hadoop流程和ETL規則就能提高數據抽取和轉換的效率。

圖1 Hadoop流程示意圖
Spark是近幾年應用新興的分布式計算平臺體系,能結合內存情況完成計算框架的處理,并且能大大提升應用效能,一般會應用在迭代計算場景中,為其他算法應用降低難度。
在技術應用過程中,從用戶的角度出發建立服務器應用系統,基于PC Server集群部署分析模式,有效建立不同的技術用戶應用場景,利用數據庫中數據關聯度提高節點的訪問效率,充分擴充內存資源。
利用不同的數據處理模式就能搭建更加完整的數據信息管控平臺,為數據應用管理提供良好的支持,保證綜合節點互聯應用效果最優化[1]。
在大數據技術支持下的移動通信數據經營支撐體系要整合具體的信息資源,確保技術應用方案的合理性和規范性,并有效提高分析系統功能的應用水平,實現經濟效益和社會效益的和諧統一。
為了維持數據流量運營分析系統運行的綜合效果,就要結合功能應用要求完成對應層級結構的處理,基于VGOP功能建立擴展應用模塊,將業務監控和運營支撐等功能融合到常規化管理模式中,最大程度上提高系統綜合管理的水平。結構示意圖見圖2。

圖2 結構示意圖
2.1.1 基礎層
基礎層是整個數據流量運營分析系統的底層結構,完成最原始的工作內容,保證各類基礎管理和監控要點都能落實到位,并且主管流量關鍵信息的維護處理。其中,用戶管理和日志管理以最基本的周期記錄為要點,滿足日常信息和數據的錄入要求。
2.1.2 解析層
解析層利用智能處理技術分析用戶行為,從而開展相應的事件響應處理。值得一提的是,智能用戶行為分析功能能建立面向所有用戶安裝應用、終端信息以及內容信息等關聯數據的分析。而對應的智能用戶事件響應處理就是為在全面分析后為客戶提供更加精準的信息推送,保證內容數據和軟件推薦等服務內容都能滿足適配性要求[2]。
2.1.3 分析層
分析層主要是利用深度分析和主題分析兩個基礎分析過程,有效擴展網元自動化監控模塊,保證多系統流量對比監控工作更加有效且完整,最大程度上保證深度分析管理的綜合效果。
2.1.4 運維層
運維層是整個系統的最高層級結構,也是多項重點應用模型的管理層級。其中,運營支撐模塊就是利用場景配置管理以及實時性靜態用戶群匹配處理,并且配合營銷執行方案和結果評估的閉環支撐體系,實現經濟效益的最大化。
主要是建立具有實時性監控的應用體系,能匯集不同的數據源,從而有效完成信息管理,具體信息涉及用戶的上網訪問信息和使用終端行為內容等,尤其是對客戶訂購套餐的實際使用情況等數據進行集中匯總,結合客戶的行為內容挖掘基本屬性和擴展屬性,從而為后續結果固化處理和應營銷活動計劃的開展提供保障[3]。
2.2.1 業務指標監控功能
業務指標監控功能主要是監督客戶的移動數據流量信息,并且對異動情況予以實時性告警處理。一般會實時性分析使用用戶數、流量數據、漫游流量以及套餐內外流量等,將業務類型和套餐類型作為維度,按照小時、日及月為基礎周期節點,全面配置業務具體指標和告警閾值,從而提升分析實效性。
2.2.2 用戶通信圈的實時性監控分析
主要是對用戶近階段好友通新情況進行集中匯總,有效分析業務訂購情況,一般將周期設定為月。在分析輸出結果中,主要涉及主號碼、對端號碼的來話次數、對端號碼的去話次數、對端號碼的短信接收次數、對短號碼短信發送次數、對端號碼經常訪問內容聯動情況、對短號碼的換機情況以及對端號碼的業務訂購情況。
2.2.3 設置搜索關鍵字跟蹤分析
設置搜索關鍵字跟蹤分析主要是對已經設定的渠道進行分析,著重關注用戶搜索的關鍵字,并且依據關鍵字搜索次數進行集中分析和數據排名,指定推送相關信息,一般其生成的周期設定為月[4]。
在互聯網技術不斷發展的時代背景下,智能終端的普及率也在不斷提高,為了全面提升電信運營商的市場競爭力,就要在全面升級服務平臺的同時,針對數據經營支撐體系予以多元管理。針對面臨的被管道化風險,要補償管道價值,利用運營商優勢架構更加合理完善的控制方案[5]。相較于互聯網平臺,電信服務商在獲取用戶行為數據方面具有一定的便利性,因此要借助大數據技術進行數據的深度挖掘,滿足精準產品推薦工作的同時保證能建立基于規則管理要求內的營銷服務內容,確保營銷場景處理的最優化。
首先,結合規則營銷要求準確評估符合具體營銷內容的用戶,并且搭建有效的平臺體系,及時建立無縫銜接體系,維持營銷方案的合理性和規范性。其次,建立實時性匹配的靜態用戶群管理體系,確保能結合不同場景分析方案自動了解用戶的屬性內容,建立動態規劃和靜態用戶執行營銷活動方案。最后,在不同營銷場景分析過程中要具備評估執行優先級的作用,審核者確認優先級內容后,保證活動執行的匹配度滿足綜合管理標準,并且盡量實現統一管理。
例如,結合流量分析平臺獲取的信息數據內容向用戶推薦喜好度較高的App,保證特定營銷推廣的及時性,也為自由App使用效率優化提供保障,為用戶流量管理和營銷執行處理工作的順利落實奠定基礎。其中,用戶使用總時間超過多少后制定營銷方案或者是用戶使用流量超過多少后制定營銷方案是關鍵,要保證場景配置功能的及時性和規范性,就要提升配置的合理性[6]。業務自動配置效果示意如圖3所示。

圖3 業務自動配置效果示意圖
在全面分析對應技術內容和設計要點后,就要結合技術應用要求規范落實具體方案,本文采取的是對開源Spark平臺模式予以深度優化,配合Hadoop生態組件,建立優化整合的體系基礎方案,建立運算評估和存儲功能貼合用戶實際需求的大數據計算平臺[7]。
在集成Spark計算引擎的基礎上,支持R語言完成大數據深度挖掘。并且,配置解析器、優化器以及執行器,利用高級語法等基礎技術內容完成信息的分析。與此同時,整體經營支撐體系會對差異化數據予以針對性處理,保證開發部署和執行效率都能滿足應用要求,且系統資源的合理性權限開發工作符合應用標準。
Manager模塊實現安裝、部署、配置以及監控訪問控制等基礎功能,并且能對異常信息予以告警分析。Sqoop模塊建立關聯數據ETL工具處理模式。Flume模塊完成日志數據信息收集處理,并且篩查日志關鍵字。Spark MLlib配合Spark分布式內存計算框架就能建立數據挖掘結構,并支持R統計語言。Hive模塊支持Inceptor交互式數據倉庫的應用要求。HBase模塊能建立實時性分布式數據庫,支持多維應用系統運行要求。Zookeeper模塊滿足分布式動作服務應用要求,匹配HDFS分布式文件系統。此外還會搭配BI/報表系統、數據庫以及Storm流式計算框架等工具系統,有效建立完整的數據經營支撐體系[8]。
一般而言,在利用經營支撐體系進行數據獲取的過程中,基礎性的數據流主要分為經分倉庫數據、WLAN數據、Gn口數據以及話務網管數據等,結合配置模式和運行指標體系就能建立完整的數據控制機制。與此同時,匹配Spark平臺未完成數據采集和分析,并且按照處理層運行SQL、展示層分析底層數據的方式對數據予以分發和對接。除此之外,利用分布式計算搭建云平臺處理海量數據的同時,還能結合用戶行為分析模式完成精準營銷,最大程度上提高數據處理和分析的時效性。其中,管理層是對元數據予以管理,并且滿足接入平臺管理和調度任務管理要求。處理層則是進行數據抽取、數據轉換以及數據裝載。服務層則利用接入平臺服務和元數據服務等服務模塊最大程度上提升用戶行為信息分析的準確性[9,10]。
在大數據技術體系支持下進行移動通信數據經營支撐結構的管理,要充分關注實時性信息和動態管控工作的要點,滿足綜合經營銷售的要求,實現精準定位,為經濟效益的全面提高奠定堅實基礎。