李亞, 葉敏
(中國移動通信集團設計院有限公司安徽分公司,合肥 230041)
基于大數據的室內網絡綜合分析系統的研究和應用
李亞, 葉敏
(中國移動通信集團設計院有限公司安徽分公司,合肥 230041)
針對當前電信運營商GSM/TD-SCDMA/TD-LTE/WLAN四網業務的管理中缺乏直觀的呈現手段,數據分析的粒度不夠精細化,數據支撐不夠有效等問題提出了一種基于大數據的室內網絡綜合分析的解決方案,通過細化到樓宇的數據采集以及打通相關系統的數據接口,實現一套信息管理工具,可有效提高管理水平和效率。
室內網絡綜合分析;GPS定位糾偏;用戶與樓宇精準匹配算法
隨著安徽城市化進程的不斷加快和電信運營商GSM/TD-SCDMA/TD-LTE/WLAN四網的快速發展,對網絡和用戶需求的精細化分析和管理日益重要,迫切的需要一種直觀的管理手段,精細化定位和分析市場開拓、終端營銷、規劃建設、維護優化的重點目標。
本文提出了基于大數據的室內網絡綜合分析系統的研究和應用,通過本系統的建設,將用戶行為信息精準定位到樓宇并直觀呈現,從而實現精準的規劃優化、市場推廣、終端營銷,并極大的節省了人工成本,為企業的可持續發展提供了重要支撐。
2.1 HTML5
HTML5是用于取代1999年所制定的HTML4.01和XHTML1.0標準的HTML標準版本,現在仍處于發展階段,但大部分瀏覽器已經支持某些HTML5技術。HTML5有兩大特點:首先,強化了Web網頁的表現性能。其次,追加了本地數據庫等Web應用的功能。在很多場合,我們提到HTML5時,實際指的是包括HTML、CSS和JavaScript在內的一套技術組合。它希望能夠減少瀏覽器對于需要插件的豐富性網絡應用服務(RIA,Plug-in-based Rich Internet Application),如Adobe Flash、Microsoft Silverlight的需求,并且提供更多能有效增強網絡應用的標準集。
2.2 MongoDB
MongoDB是一個基于分布式文件存儲的數據庫,由C++語言編寫,旨在為Web應用提供可擴展的高性能數據存儲解決方案。
MongoDB是一個介于關系數據庫和非關系數據庫之間的產品,是非關系數據庫當中功能最豐富、最像關系數據庫的數據庫。它支持的數據結構非常松散,是類似json的bson格式,因此可以存儲比較復雜的數據類型。Mongo最大的特點是支持的查詢語言非常強大,其語法有點類似于面向對象的查詢語言,幾乎可以實現類似關系數據庫單表查詢的絕大部分功能,而且還支持對數據建立索引。
以往的網絡和用戶行為分析僅能定位到小區級別,本系統建設了一套基于大數據的室內網絡綜合分析體系,通過樓宇和用戶匹配算法,形成了定位到樓宇級別的用戶行為指標。本體系分為3層:數據采集層、服務層(數據分析層)、應用展現層,技術架構圖如圖1所示。
3.1 數據采集層
數據采集層通過開發網管和地圖接口,從網管系統和A+Abis系統自動獲取網絡質量和業務數據,并采用自動采集方式從互聯網地圖獲取樓宇信息。
3.1.1 系統接口自動獲取業務數據
與網管系統和A+Abis系統建立系統接口,獲取網絡指標和用戶行為數據。系統建立FTP服務器存儲接口文件,本系統通過FTP協議訪問網管系統并下載接口文件,實現接口文件異步傳輸。
3.1.2 自動采集互聯網地圖的樓宇信息
通過互聯網地圖信息采集模塊自動
采集互聯網地圖的樓宇信息并導入系統。
本模塊通過互聯網地圖的興趣點(POI)的分類檢索接口統一采集樓宇相關信息,并對采集的數據進行過濾篩選,將名稱、經緯度、地址等關鍵信息保留,并與樓宇信息庫進行匹配,確定樓宇的標注狀態。
3.2 服務層(數據分析層)
服務層從地圖的信息采集和糾偏、用戶信息和樓宇信息關聯匹配、規劃優化和市場營銷的建議流程等維度挖掘算法,并為應用層提供支撐。
3.2.1 互聯網地圖經緯度糾偏算法
(1)互聯網地圖安全偏移情況現狀
目前互聯網地圖公司(如:百度地圖、搜狗地圖、谷歌地圖等)均按照國家對地理數據安全的要求對經緯度信息進行處理。未經糾偏處理的互聯網經緯度與GPS經緯度之間的誤差范圍為300~500 m。不經過糾偏處理,就無法與現網的網絡信息、資源信息相匹配,無法對樓宇、用戶、行為準確定位,也就無法指導規劃優化和市場營銷等應用。
(2)糾偏算法
本系統提出一種糾偏算法,實現互聯網經緯度到GPS經緯度的轉換。百度API提供GPS經緯度A到互聯網經緯度B的轉換接口F,但從B到A的逆向轉換沒有提供接口,本糾偏算法提出一種從B到C的逆向轉換算法,經驗證C與A的偏差在10 m以內。本糾偏算法流程如圖2所示。
本糾偏算法中主要采用歐氏距離和聚類算法等核心算法。

圖1 技術架構圖

圖2 地圖糾偏算法流程圖
歐氏距離計算函數如下:

聚類算法計算函數如下:

(3)糾偏效果
通過選取實際的GPS數據,通過算法驗證后,偏差達到10 m以內,平均為4.63 m。
3.2.2 自助監測和更新采集信息
通過互聯網地圖信息采集模塊自動采集互聯網地圖的樓宇信息并導入系統,通過監測互聯網地圖的信息更新,實現樓宇的自動更新和提示功能。
本模塊主要針對互聯網地圖中樓宇的相關信息進行統一采集,通過興趣點(POI)的分類檢索對樓宇信息進行篩選,獲取POI中與符合樓宇屬性的點并定期進行自動采集和匹配,對變化的信息進行更新和提示。
3.2.3 多維度用戶信息關聯匹配算法
實現多維度用戶信息關聯匹配算法,關聯A+Abis系統獲取的用戶級別信息、網管系統獲取的小區信息和樓宇信息,將離散的用戶與樓宇相匹配,實現信息與樓宇的關聯。本系統提出了以下幾個算法實現多維度用戶信息關聯匹配。
(1)精確定位用戶經緯度
根據當前時段室內用戶占用的小區地理位置、方位角及小區占用比例,通過中點求值算法計算用戶經緯度,并結合地理識別因子,最終將用戶位置精確地定位出來,確定用戶經緯度信息。
該算法的主要思想是:根據測量報告中不同小區電平值的強弱和各小區覆蓋、地理位置情況判斷用戶距不同小區的距離,從而定位用戶位置,用戶定位示意圖如圖3所示。該算法在A+Abis平臺中實現,本系統可直接調用用戶經緯度信息。

圖3 用戶定位示意圖
(2)用戶行為信息歸屬樓宇的匹配算法
根據中心點求值算法計算用戶經緯度與樓宇經緯度的歸屬匹配。目前,僅支持與樓宇經緯度點匹配,后續將擴展到結合樓宇的面積,將實現用戶經緯度與樓宇面積邊界的匹配算法。
用戶歸屬樓宇的匹配算法主要思路為:以用戶經緯度基準,判斷與周邊樓宇位置的距離,將該用戶歸屬到距離最近的樓宇。用戶行為歸屬算法示意圖如圖4所示。

圖4 用戶行為歸屬算法示意圖
(3)小區級數據的樓宇均衡算法
根據當前小區歸屬樓宇列表,結合樓宇的面積和用戶數,用戶場景類型等因素,結合影響因子,通過加權均衡算法,計算樓宇的小區級數據。詳細公式如下:
KA=(X1/( X1+X2+…+Xn)×F1+Y1/(Y1+Y2+…+Yn)×F2)×K
其中,X1為樓宇A的面積、F1為面積影響因子、Y1為樓宇A的用戶數、F2為用戶數影響因子、n為樓宇個數,K為每個Cell的業務量,KA為經過加權均衡算法計算的樓宇的業務量。

圖5 應用建議算法示意圖
3.2.4 應用建議算法
基于樓宇的建設情況、業務量、覆蓋率和TD終端占比等信息,提出規劃優化和市場營銷的規劃建設的判斷算法,詳細流程如圖5所示。
3.3 應用展現層
本節列舉兩個應用展現層模塊,作為系統實現舉例。
3.3.1 地圖直觀呈現和修正模塊
所有物業點和樓宇以地圖元素的形式展示,形象直觀,一目了然。支持樓宇信息和物業點信息以及四網信息的管理和呈現,便于直觀比較四網與樓宇信息的位置。
3.3.2 多維度統計分析模塊
提供當月實時分析、歷史數據分析、質量預警、后評估等4個統計分析功能,實現多維度的樓宇級的用戶行為分析和呈現。
本系統投入使用前,全省樓宇原有的測試、維護,通過對數據進行分析輸出各類市場和優化結論,合計約2 500個人天。系統使用后僅花費25個人月,合計750個人天。節省了大量的人工,大幅提升了工作效率,節省了70%的人天。
本文探討了大數據的室內網絡綜合分析系統的研究,系統首先可以自動采集互聯網地圖信息和定期更新,節省人工成本,降低信息出錯率;其次提出了一種互聯網經緯度反向糾偏算法,實現了對地圖信息的自動糾偏和匹配;同時提出用戶與樓宇的精準匹配算法,實現用戶行為信息定位到樓宇;最后可以實時分析指標數據,高效輸出規劃優化和市場營銷建議。該系統應用后大大提升了全省樓宇基礎資料的完備性,并可高效輸出市場營銷和規劃優化數據,同時大幅提升工作效率,具有很高的實用價值。
[1] 張威. GSM網絡優化原理與工程(第2版)[M]. 北京:人民郵電出版社,2010.
[2] 周炯磐. 通信原理[M]. 北京:北京郵電大學出版社,2003.
[3] UMTS30.03 3GPP TR101.112v3.2.0 Selection procedures for the choices of radio transmission technologies of the UMTS[S]. 1998.
[4] Jaana L, Achimi W, Tomas N, Radio Network Planning and Optimisation for UMTS[M]. New York: John Wiley Sons Inc, 2002.
[5] 肖清華. TD-LTE網絡規劃設計與優化[M]. 北京:人民郵電出版社,2013.
Research and application of indoor wireless network analysis system based on big data
LI Ya, YE Min
(China Mobile Group Design Institute Co., Ltd. Anhui Branch, Hefei 230041, China)
The management of GSM/TD-SCDMA/TD-LTE/WLAN network of telecom operation contains some issues as follows: lacking directly presentation, data analyse is not accurate enough, data source is not effective. To solve these problems above, this article provided a solution which can promote the standard and efficiency of management through an online information system which need gather building datas and construct interfaces with other systems.
indoor analyse; GPS rectifi cation; algorithm of U2B
TN915
A
1008-5599(2015)03-0026-05
2015-02-24