曲榮波(中國電信吉林分公司 吉林 長春 130000)
基于復雜網絡的電信大數據處理研究
曲榮波
(中國電信吉林分公司 吉林 長春 130000)
我國經濟和科技的快速發(fā)展,為電信公司的發(fā)展提供了機會,但同時網絡的日益復雜,也對電信大數據處理提出了更高的要求。在復雜網絡發(fā)展過程中,電信大數據如何處理受到了人們的廣泛關注,若是此方面處理工作不到位,那么所產生后果將會十分嚴重。面對這樣的情況,本文對復雜網絡背景下的電信大數據處理進行了深入地分析,并闡述了自己的見解,希望可以為電信大數據處理工作更好地開展提供一點幫助。
復雜網絡;電信大數據;處理研究
互聯(lián)網以及云計算等信息技術的快速發(fā)展以及應用,催生了大數據技術的出現,大數據目前的發(fā)展已經備受矚目,大數據時代的來臨已經成為不可阻擋的趨勢。大數據作為最新的信息技術之一,其應用價值極高,所以電信公司對大數據進行了深化研究,并對大數據進行了進一步的應用,其應用效果較為明顯。但是,在大數據不斷發(fā)展的背景下,電信公司所面臨的數據以及管理等方面的壓力日益增加,在這樣的情況下,電信公司如何對大數據進行有效處理就成為了其當前亟待解決的問題。
2.1 在語音數據分析中應用
在大數據技術的發(fā)展下,其中包含的語音數據部分應用越來越廣泛,此部分在電信運營商中的應用已經十分普遍,電信運營商可以通過對此部分的應用來對其自身所具有的產品進行服務,然后對產品用戶的新需求等進行分析,之后以此為基礎為客戶提供其滿意的產品和服務,這樣的方式使得電信旗下的客戶滿意度日益提高,而且客戶的信息消費也隨之大幅度增加。
2.2 在網絡流量分析中應用
在當前社會發(fā)展過程中,網絡流量的應用已經十分普遍,而且人們對流量的要求逐漸提高,在這樣的情況下,電信運營商若是想要為客戶提供滿意的流量服務,就需要利用大數據來對網絡流量進行系統(tǒng)地分析,從而獲得流量的變化趨勢,然后根據實際情況來對網絡流量資源進行合理的優(yōu)化配置,在此基礎上還需要對網絡日志進行分析,之后對網絡進行整體的優(yōu)化,以此來實現提高網絡質量的目標[1]。
2.3 在企業(yè)經營戰(zhàn)略制定中的應用
當前經濟市場的競爭日益激烈,在殘酷的競爭環(huán)境中,企業(yè)想要站穩(wěn)腳跟,就必須要制定合適的發(fā)展戰(zhàn)略。因此,電信企業(yè)在運營的過程中,利用大數據技術對市場競爭以及企業(yè)自身發(fā)展情況進行了深入地分析,在此分析基礎上,企業(yè)可以制定正確的發(fā)展戰(zhàn)略,并提出合理的企業(yè)管理方法,以此來提高企業(yè)的核心競爭力,為企業(yè)的長遠發(fā)展奠定良好的基礎。
2.4 在企業(yè)業(yè)務創(chuàng)新中的應用
企業(yè)想要長遠的發(fā)展下去,就要堅持走創(chuàng)新道路,企業(yè)在創(chuàng)新的過程中,必須要對客戶的隱私進行有效的保護,若是創(chuàng)新是基于客戶因素侵犯的基礎上那么創(chuàng)新的意義就不復存在,因此,企業(yè)在利用大數據技術進行創(chuàng)新的過程中,需要對客戶隱私進行嚴密的保護,同時進行信息加工,通過提供信息服務的方式來實現創(chuàng)新,從而推動企業(yè)的進一步發(fā)展。
3.1 數據倉庫無法線性擴容
在電信企業(yè)業(yè)務不斷增加的過程中,企業(yè)網絡規(guī)模日漸擴大,這樣就使得大數據處理的難度增加,而傳統(tǒng)數據庫的存在也無法滿足當前數據存儲數量的增加,進而導致數據倉庫無法線性擴容問題出現[2]。
3.2 數據倉庫以及架構更新速度較慢
在大數據應用越來越廣泛的基礎上,電信運營商中的大數據服務日益多樣化,而為了對其進行更好應用,需要對應用內容等進行多方面的深入分析,分析所產生的數據存儲對數據倉庫以及架構提出了新的要求,但因為數據倉庫和架構更新速度較慢,從而使得兩者的應用無法滿足當前信息服務的要求,鑒于這樣的情況,加快數據倉庫以及架構更新是非常有必要的。
基于復雜網絡的電信大數據處理研究可以從以下幾個方面入手,具體內容如下。
4.1 從靜態(tài)數據方面入手進行研究
電信公司中所出現的運營數據并不是一層不變的,在時間漸漸流逝的過程中數據結構也發(fā)生了相應的改變,在這樣的情況下,基于復雜網絡進行電信大數據處理需要從三個方面入手:
第一方面是度和度的分布。所謂的度,就是指和此頁面節(jié)點有關聯(lián)的其它頁面節(jié)點的數目。在對電信大數據進行研究的過程中,本質就是對一個用戶和其它用戶通話的信息數目進行研究,而用戶通話的呼出和呼入可以被稱為出度和入度,所有用戶節(jié)點的平均值就是網絡平均度。而網絡平均度從復雜網絡背景中進行分析后可以發(fā)現其和用戶的重要程度有著密切的聯(lián)系。而出度和入度數據比較大的用戶就是網絡的核心節(jié)點,是其它節(jié)點聯(lián)系的中心。
第二方面是平均路徑。在電信大數據處理中,平均路徑是非常重要的組成部分之一,此部分主要是指網絡中兩個節(jié)點之間最短路徑的邊數。隨便抽取兩個節(jié)點所能得到的最大值就是網絡的直徑,平均路徑長度可以作為參數來對網絡轉發(fā)能力進行有效的衡量,同時最短的平均路徑就是網絡傳輸最快的,和網站查找有著密切的聯(lián)系。
第三方面是聚類系數。此系數主要是對網絡連接的聚集程度進行描述,若是網絡聚集十分密切,那么相應的網絡節(jié)點之間也會聯(lián)系較為密切,通俗一些說就是當一個網絡節(jié)點有很多鄰居的時候,這些鄰居之間也可能是鄰居[3]。
4.2 從動態(tài)數據方面入手進行研究
在對電信大數據進行分析后可以發(fā)現,其自身特點十分地顯著,具體表現為用戶動態(tài)性十分突出,其生命周期這一特征十分鮮明,而其中的時間演化是復雜網絡中必然存在的屬性之一,每一個網絡在應用一段時間之后都會出現演化規(guī)律,但是因為這些數據無法以分或者是秒為單位進行研究,所以為了找出其中掩藏的核心價值,通過是以季度或者是月為單位來進行通話數據研究的。通過對通話數據的研究,可以得到兩方面有價值的信息,一方面是通話聚集效應。在進行分析后可以發(fā)現,在眾多數據中有部分數據的概率是明顯高于其他用戶的,而與這部分用戶相關的數目越多,這部分用戶就越無法脫網,所以電信公司可以以此為基礎來構建流失模型,采取有效的措施來留住這部分客戶。另一方面是發(fā)現客戶個人通話特征。通過對客戶通話數據進行分析后可以發(fā)現,有部分客戶的通話大多是在夜晚進行的,還有部分客戶是在早晨進行的,但通過數據得出這樣的結論之后,電信公司就可以以此為依據來構建新的用戶模型,然后根據用戶的通話習慣來制定相應的通話套餐,通過為用戶提供其需求的通話套餐來留住老客戶,吸引新客戶[4]。
4.3 從社團挖掘方面入手進行研究
所謂的復雜網絡社團,就是指網絡中的頂點可以劃分為多個小組,每個小組內部頂點之間的關系是十分密切的,而小組和小組之間的頂點連接也比較疏遠,所以在對電信大數據進行處理的過程中,需要此方面內容考慮在內。大數據中的社團大小是未知的,而用戶之間的聯(lián)系又會因為時間的流逝而發(fā)生改變,但網絡社團結構的變化卻是比較鮮明的,在這樣的情況下,可以通過對社團挖掘來對大數據進行處理。
綜上所述,在大數據應用日益廣泛的前提下,大數據對電信運營商提出的要求也更高,在這樣的情況下,若是想要充分發(fā)揮大數據的作用,電信運營商就應該對大數據進行有效的處理,規(guī)避其中的弊端,注重其優(yōu)勢的應用,以此來為電信運行商的發(fā)展奠定良好的基礎。
[1]張瑞.電信大數據管理應用技術研究[J].甘肅科技縱橫,2014,43(11):29-30,55.
[2]白寶丹.基于遞歸復雜網絡的房顫預測分析方法研究[D].復旦大學,2012.
[3]王波,柯紅紅,蔣天發(fā)等.基于復雜網絡理論的杭州公交網絡建模與特性分析[J].武漢大學學報(工學版),2011,44(3):404-408.
[4]曹銳.非線性與復雜網絡理論在腦電數據分析中的應用研究[D].太原理工大學,2014.
TP3
A
1009-5624(2016)06-0019-03