999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

LTE小區(qū)的人工智能應(yīng)用與探索

2019-10-18 09:43:57錢(qián)兵曹詩(shī)苑王兵
移動(dòng)通信 2019年8期
關(guān)鍵詞:人工智能

錢(qián)兵 曹詩(shī)苑 王兵

【摘? 要】隨著人工智能技術(shù)在各領(lǐng)域的迅速發(fā)展,無(wú)線網(wǎng)絡(luò)日常運(yùn)維領(lǐng)域也逐漸嘗試借助人工智能技術(shù)提質(zhì)增效降本。主要介紹在該領(lǐng)域性能指標(biāo)異常數(shù)據(jù)診斷、指標(biāo)趨勢(shì)預(yù)測(cè)、LTE小區(qū)擴(kuò)容預(yù)測(cè)三個(gè)方向應(yīng)用人工智能技術(shù)進(jìn)行探索研究的成果。異常診斷使用基于小區(qū)規(guī)模和時(shí)間周期改進(jìn)后的LOF算法,結(jié)果較為理想;LSTM在平均激活用戶數(shù)個(gè)別指標(biāo)上預(yù)測(cè)效果較好;LTE擴(kuò)容小區(qū)預(yù)測(cè)基于改進(jìn)后的LR模型預(yù)測(cè)準(zhǔn)確率可達(dá)99%以上。這些成果將逐漸經(jīng)過(guò)大規(guī)模優(yōu)化測(cè)試并最終落地,對(duì)運(yùn)營(yíng)商無(wú)線網(wǎng)絡(luò)智能化、自動(dòng)化運(yùn)營(yíng)將提供很大技術(shù)支撐。

【關(guān)鍵詞】LTE小區(qū);人工智能;無(wú)線網(wǎng)絡(luò);擴(kuò)容預(yù)測(cè)

doi:10.3969/j.issn.1006-1010.2019.08.006? ? ? 中圖分類號(hào):TN929.5

文獻(xiàn)標(biāo)志碼:A? ? ? 文章編號(hào):1006-1010(2019)08-0031-06

引用格式:錢(qián)兵,曹詩(shī)苑,王兵. LTE小區(qū)的人工智能應(yīng)用與探索[J]. 移動(dòng)通信, 2019,43(8): 31-36.

[Abstract]?With the rapid development of artificial intelligence technology in various fields, it has been gradually applied in daily operation and maintenance of wireless networks to improve quality, increase efficiency and reduce costs. This paper mainly introduces the results of artificial intelligence technology applied in abnormal data diagnosis and trend prediction of performance indicators and the prediction of LTE cell expansions. It is relatively ideal for abnormal diagnosis to adopt the improved LOF algorithm based on cell sizes and time cycles; LSTM performs well in predicting the average number of activated users; based on the improved LR model, the prediction accuracy of LTE cell expansions reaches more than 99%. These results will be commercialized after large-scale optimization and testing, which provides great technical support for operators intelligent and automated operation of wireless networks.

LTE cell; artificial intelligence; wireless network; capacity expansion prediction

1? ?引言

大數(shù)據(jù)給信息產(chǎn)業(yè)帶來(lái)了挑戰(zhàn),也帶來(lái)了機(jī)遇,對(duì)于無(wú)線網(wǎng)絡(luò)優(yōu)化來(lái)說(shuō),抓住了大數(shù)據(jù)的核心特征,加大扶持力度,就可以發(fā)揮其積極作用。運(yùn)營(yíng)商可以根據(jù)需求進(jìn)行內(nèi)部升級(jí)改造,針對(duì)用戶、小區(qū)更好地進(jìn)行運(yùn)營(yíng)和改造,在確保無(wú)線網(wǎng)正常運(yùn)維工作的基礎(chǔ)上,提高運(yùn)維效率,降低運(yùn)維成本。

互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展為人們的衣食住行帶來(lái)了巨大的便利。運(yùn)營(yíng)商在給個(gè)人、國(guó)家、社會(huì)提供上網(wǎng)服務(wù)的同時(shí),每時(shí)每刻都在產(chǎn)生大量的數(shù)據(jù)。其中,有些數(shù)據(jù)是由服務(wù)器或各種其他網(wǎng)絡(luò)設(shè)備產(chǎn)生的,反映了服務(wù)器或網(wǎng)絡(luò)的某些特性,符合一定的變化規(guī)律,挖掘這些數(shù)據(jù)背后的含義對(duì)監(jiān)測(cè)網(wǎng)絡(luò)安全具有一定的幫助。

本文嘗試將人工智能技術(shù)應(yīng)用到LTE小區(qū)日常運(yùn)維工作中,試圖解決當(dāng)前幾個(gè)主要困擾運(yùn)維人員的重點(diǎn)問(wèn)題,包括性能指標(biāo)異常數(shù)據(jù)診斷、性能指標(biāo)數(shù)據(jù)的未來(lái)趨勢(shì)預(yù)測(cè)以及小區(qū)未來(lái)是否需要擴(kuò)容預(yù)測(cè)這3個(gè)問(wèn)題,結(jié)合高效的人工智能算法將對(duì)這幾個(gè)方面的計(jì)算有極大的提高。

2? 基于人工智能算法的無(wú)線智能運(yùn)維

平臺(tái)架構(gòu)

大數(shù)據(jù)的關(guān)鍵技術(shù)包括數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)挖掘,其中數(shù)據(jù)存儲(chǔ)主要是依靠分布式數(shù)據(jù)庫(kù)實(shí)現(xiàn)的,數(shù)據(jù)挖掘是以大數(shù)據(jù)平臺(tái)的搭建實(shí)現(xiàn)的,分布式數(shù)據(jù)挖掘技術(shù)就成為實(shí)現(xiàn)無(wú)線網(wǎng)絡(luò)優(yōu)化的核心技術(shù)之一。

系統(tǒng)架構(gòu)如圖1所示,主要包括數(shù)據(jù)層、計(jì)算架構(gòu)層、分析應(yīng)用層。這一平臺(tái)的主要特點(diǎn)是利用不同節(jié)點(diǎn)上的自動(dòng)部署來(lái)完成數(shù)據(jù)處理,這樣能夠?qū)π聰?shù)據(jù)進(jìn)行實(shí)時(shí)更新,確保數(shù)據(jù)的穩(wěn)定性和延續(xù)性。

(1)數(shù)據(jù)層主要包括數(shù)據(jù)來(lái)源、數(shù)據(jù)采集以及數(shù)據(jù)存儲(chǔ)。數(shù)據(jù)來(lái)源主要包括來(lái)自于Mysql、Oracle等關(guān)系型數(shù)據(jù)庫(kù)中的結(jié)構(gòu)化數(shù)據(jù)以及一些文本等非機(jī)構(gòu)化數(shù)據(jù),數(shù)據(jù)信息在存儲(chǔ)過(guò)程中進(jìn)行了脫敏加密,保證數(shù)據(jù)的安全性。數(shù)據(jù)存儲(chǔ)模塊的算法結(jié)果數(shù)據(jù)主要存儲(chǔ)在HDFS分布式存儲(chǔ)文件系統(tǒng)和Mysql關(guān)系型數(shù)據(jù)庫(kù)中,依托于Hadoop分布式架構(gòu),保證海量數(shù)據(jù)的存儲(chǔ)與計(jì)算。在數(shù)據(jù)采集過(guò)程中,主要是依靠Sqoop、Flume等傳輸工具進(jìn)行數(shù)據(jù)在來(lái)源與存儲(chǔ)模塊之間的轉(zhuǎn)換。

(2)計(jì)算架構(gòu)層主要體現(xiàn)在數(shù)據(jù)計(jì)算架構(gòu)和算法計(jì)算架構(gòu)等模塊。在算法模塊,主要采用Spark平臺(tái)計(jì)算架構(gòu),專為大規(guī)模數(shù)據(jù)處理而設(shè)計(jì)的快速通用的計(jì)算引擎。在算法層面,主要結(jié)合傳統(tǒng)的統(tǒng)計(jì)分析和深度學(xué)習(xí)方法,基于TensorFlow和Keras的計(jì)算架構(gòu),實(shí)現(xiàn)局部異常因子(LOF, Local Outlier Factor)、長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM, Long Short-Term Memory)、差分整合移動(dòng)平均自回歸模型(ARIMA, Autoregressive Integrated Moving Average Model)等模型。

(3)分析應(yīng)用層主要面向用戶,在頁(yè)面上可視化展示算法輸出結(jié)果,向用戶展示具體的功能結(jié)果,主要包括指標(biāo)分布、異常診斷、趨勢(shì)預(yù)測(cè)和擴(kuò)容預(yù)測(cè)這4個(gè)功能頁(yè)面。

3? ?基于LTE小區(qū)智能運(yùn)維平臺(tái)關(guān)鍵技術(shù)

3.1 指標(biāo)異常數(shù)據(jù)診斷

本研究通過(guò)對(duì)比當(dāng)下在異常診斷流行的三西格瑪、四分位差、聚類分析、主成分分析(PCA, Principal Components Analysis)、K-近鄰法(KNN, K-Nearest Neighbors)等多種算法,綜合計(jì)算結(jié)果最終發(fā)現(xiàn):LOF算法與其他多種算法綜合選取異常數(shù)據(jù)的結(jié)果一致性最高,表明該算法診斷結(jié)果最穩(wěn)定,通過(guò)散點(diǎn)圖顯示診斷結(jié)果也最符合業(yè)務(wù)常識(shí)。圖2為多種算法結(jié)果與LOF結(jié)果對(duì)比。

LOF算法的思想是通過(guò)比較每個(gè)點(diǎn)與其鄰域點(diǎn)的距離來(lái)判斷該點(diǎn)是否為異常點(diǎn),距離越遠(yuǎn),越可能被認(rèn)定是異常點(diǎn)。由于LOF算法通過(guò)點(diǎn)的第k鄰域,而不是全局來(lái)計(jì)算,因此得名為“局部”異常因子。而局部離群因子越接近1,則說(shuō)明選取點(diǎn)的鄰域點(diǎn)密度越接近,該點(diǎn)與鄰域可以屬于同一簇;如果這個(gè)比值小于1,說(shuō)明選取點(diǎn)處的密度高于其鄰域點(diǎn)密度,為密集點(diǎn);如果這個(gè)比值大于1,說(shuō)明選取點(diǎn)處的密度小于其鄰域點(diǎn)密度,該點(diǎn)可能是異常點(diǎn)。

在LOF算法的基礎(chǔ)上,綜合考慮了LTE小區(qū)的大小類型和數(shù)據(jù)時(shí)間周期性兩個(gè)重要因素,選取全部數(shù)據(jù)集約為200萬(wàn)條,按全部數(shù)據(jù)集的10%作為小批次處理,進(jìn)行十字交叉驗(yàn)證,來(lái)比較算法的穩(wěn)定性。

應(yīng)用LOF算法診斷10次隨機(jī)診斷的結(jié)果如表1所示:

從表1的結(jié)果可以看出,LOF在異常因子都選取-1.16時(shí),異常率結(jié)果在8.5%附近徘徊,LOF對(duì)異常率結(jié)果的浮動(dòng)性略微大些。但就總體表現(xiàn)而言,LOF對(duì)異常值估計(jì)的穩(wěn)定性表現(xiàn)比較讓人滿意。

結(jié)果顯示:該算法所確定的小區(qū)流量異常值在全部小區(qū)流量值中呈現(xiàn)出離散的狀態(tài)分布,LOF算法并沒(méi)有成片地將數(shù)據(jù)分為正常值和異常值,而是在數(shù)據(jù)集中找到相對(duì)離散于整體數(shù)據(jù)集的點(diǎn),并將該離散于整體的點(diǎn)定義為異常值。

3.2? 關(guān)鍵指標(biāo)的未來(lái)趨勢(shì)預(yù)測(cè)

通過(guò)對(duì)比機(jī)器學(xué)習(xí)中的ARIMA、小波分析以及深度學(xué)習(xí)中的LSTM這3種算法,選取某地區(qū)近2 000個(gè)小區(qū)進(jìn)行對(duì)比實(shí)驗(yàn)。經(jīng)研究發(fā)現(xiàn)LSTM算法準(zhǔn)確率和穩(wěn)定性更好。該算法是長(zhǎng)短期記憶網(wǎng)絡(luò),是一種時(shí)間遞歸神經(jīng)網(wǎng)絡(luò),適合處理和預(yù)測(cè)時(shí)間序列中間隔和延遲相對(duì)較長(zhǎng)的重要事件。LSTM算法是一種特定形式的RNN(Recurrent Neural Network,循環(huán)神經(jīng)網(wǎng)絡(luò)),在RNN的基礎(chǔ)上加了三個(gè)門(mén),分別是輸入門(mén)、輸出門(mén)以及遺忘門(mén)。該模型首先需對(duì)數(shù)據(jù)進(jìn)行處理,按照訓(xùn)練集訓(xùn)練好的參數(shù),在測(cè)試集上測(cè)試,之后按照訓(xùn)練集等長(zhǎng)投入數(shù)據(jù)的后半部分?jǐn)?shù)據(jù)對(duì)之后的數(shù)據(jù)進(jìn)行預(yù)測(cè)。

為了評(píng)價(jià)模型的效果,實(shí)驗(yàn)引入錯(cuò)誤率(error)、精度(accuracy)、正確率(precision)三個(gè)指標(biāo)。上述三個(gè)指標(biāo)的計(jì)算公式如公式(1)~公式(3)所示:

yi是某一指標(biāo)在某個(gè)時(shí)間點(diǎn)對(duì)應(yīng)的真實(shí)值;y'i是模型預(yù)測(cè)的某一指標(biāo)在某個(gè)時(shí)間點(diǎn)的預(yù)測(cè)值;m是錯(cuò)誤率小于0.2的小時(shí)數(shù)量;n是預(yù)測(cè)總小時(shí)數(shù)量。

從原始數(shù)據(jù)中的145 464個(gè)小區(qū)中,根據(jù)小區(qū)場(chǎng)景類型進(jìn)行分層隨機(jī)抽樣,從中選取1 953個(gè)小區(qū)作為實(shí)驗(yàn)的樣本庫(kù),引入小區(qū)上行DRB數(shù)據(jù)調(diào)度時(shí)長(zhǎng)、小區(qū)下行DRB數(shù)據(jù)調(diào)度時(shí)長(zhǎng)、下行PRB平均利用率、PDCCH信道CCE占用率分子和用戶面下行包平均時(shí)延分母這5個(gè)相關(guān)性較高的指標(biāo),分別對(duì)各小區(qū)RRC用戶數(shù)、平均激活用戶數(shù)和用戶下行流量這三個(gè)目標(biāo)指標(biāo)進(jìn)行趨勢(shì)預(yù)測(cè)。然后在時(shí)間序列數(shù)據(jù)基礎(chǔ)上構(gòu)建實(shí)驗(yàn)所需數(shù)據(jù)集。對(duì)實(shí)驗(yàn)所用數(shù)據(jù)集包含的1 953個(gè)小區(qū)按照8:1:1劃分訓(xùn)練集、驗(yàn)證集和測(cè)試集。

實(shí)驗(yàn)中的模型包括三個(gè)LSTM隱藏層,每個(gè)LSTM隱藏層中定義128個(gè)神經(jīng)元,然后對(duì)每個(gè)隱層加入dropout層引入dropout率進(jìn)行優(yōu)化,避免過(guò)擬合,也即是神經(jīng)元隨即斷開(kāi)的比例為0.2。第四層為全連接層輸出維度為168(7×24),激活函數(shù)用tanh表示。Compile方法是設(shè)置模型的訓(xùn)練參數(shù),例如采用“adam”作為優(yōu)化器,損失函數(shù)計(jì)算采用均方誤差(MSE),每次迭代計(jì)算其誤差和準(zhǔn)確率。

模型預(yù)測(cè)方式為利用前30天指標(biāo)數(shù)據(jù)預(yù)測(cè)第31~37天的指標(biāo)數(shù)據(jù)。訓(xùn)練方式主要是選取90%的樣本小區(qū)進(jìn)行訓(xùn)練,訓(xùn)練完成后再取剩余10%的數(shù)據(jù)進(jìn)行測(cè)試。圖3為L(zhǎng)STM神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型架構(gòu)圖。

結(jié)果顯示:LSTM算法對(duì)平均激活用戶數(shù)、空口下行用戶面流量和平均RRC連接用戶數(shù)的預(yù)測(cè)最大精度分別是92%、71%和67.5%。該模型在平均激活用戶數(shù)量表現(xiàn)效果最好,主要是因?yàn)榧せ钣脩舻臄?shù)量無(wú)明顯地區(qū)差異。相較而言,空口下行用戶面流量在不同等級(jí)不同基站的小區(qū)差異明顯,預(yù)測(cè)精度低于平均激活用戶數(shù)指標(biāo)的預(yù)測(cè)精度。此外,原始數(shù)據(jù)中平均RRC連接用戶數(shù)的數(shù)值為0的占多數(shù),相對(duì)平均RRC連接用戶數(shù)的數(shù)據(jù)質(zhì)量低,這或許是預(yù)測(cè)精度低的原因之一。除此之外,實(shí)驗(yàn)?zāi)P蛢H是根據(jù)前三十天的數(shù)據(jù)來(lái)預(yù)測(cè)未來(lái)七天的走勢(shì),歷史天數(shù)不夠長(zhǎng)也可能是模型效果欠佳的原因。隨著數(shù)據(jù)質(zhì)量的提高和時(shí)間跨度的拉長(zhǎng),模型的效果很有可能得到進(jìn)一步提升。利用該模型可以對(duì)樣本數(shù)據(jù)集之外的其他小區(qū)的平均激活用戶數(shù)、空口下行用戶面流量和平均RRC連接用戶數(shù)進(jìn)行預(yù)測(cè)。該模型不僅可以預(yù)知未來(lái)一段周期或時(shí)間內(nèi)流量的走向,還可以與上季度、上月或上周進(jìn)行統(tǒng)計(jì)分析,為采取合適的方法進(jìn)行流量控制、流量監(jiān)測(cè)提供一個(gè)參考,能夠幫助管理員更好地規(guī)劃和管理網(wǎng)絡(luò)。

將LSTM算法嘗試應(yīng)用在運(yùn)營(yíng)商4G無(wú)線網(wǎng)絡(luò)性能指標(biāo)優(yōu)化領(lǐng)域,分別對(duì)平均激活用戶數(shù)、下行用戶面流量以及平均RRC連接用戶數(shù)三個(gè)指標(biāo)進(jìn)行預(yù)測(cè),并以具體省份為例展開(kāi)研究。經(jīng)分析發(fā)現(xiàn),LSTM算法在平均激活用戶數(shù)指標(biāo)預(yù)測(cè)效果較好,因此,本文把平均激活用戶數(shù)預(yù)測(cè)模型在14 016個(gè)小區(qū)進(jìn)行推廣實(shí)驗(yàn)。

3.3? LTE小區(qū)擴(kuò)容預(yù)測(cè)

本研究屬于分類預(yù)測(cè)問(wèn)題,將選用現(xiàn)有經(jīng)典的分類預(yù)測(cè)算法(KNN)、邏輯回歸(LR)、決策樹(shù)(DT)、隨機(jī)森林(RF)和支持向量機(jī)(SVM)。KNN算法的主要原理是根據(jù)K值的選取,根據(jù)距離因素將不同點(diǎn)歸為到K類。故該算法考慮三個(gè)重要要素,分別是K值的選擇、距離度量和分類決策規(guī)則。需要采用交叉驗(yàn)證法來(lái)確定最合適本課題數(shù)據(jù)集的K值。對(duì)于距離的度量,常采用歐式距離法。對(duì)于分類決策規(guī)則一般采用多數(shù)表決法,即訓(xùn)練集里和預(yù)測(cè)的樣本特征最近的K個(gè)樣本,預(yù)測(cè)為K個(gè)樣本中最多類別數(shù)的類別。

邏輯回歸是一個(gè)分類算法,它可以處理二元分類以及多元分類。對(duì)線性回歸的結(jié)果做一個(gè)在函數(shù)g上的轉(zhuǎn)換,可以變化為邏輯回歸。函數(shù)g一般取Sigmoid函數(shù),二元邏輯回歸模型的一般形式為:

hθ(x)=? ? (4)

其中,x為樣本輸入,hθ(x)為模型輸出,可以理解為某一類別的概率大小,θ為模型需求出的參數(shù)。

分類與回歸樹(shù)(CART, Classification and Regression Trees)使用基尼系數(shù)來(lái)代替信息增益比,基尼系數(shù)代表了模型的不純度,基尼系數(shù)越小,則不純度越低,特征越好,這和信息增益是相反的。CART分類樹(shù)算法每次僅僅對(duì)某個(gè)特征的值進(jìn)行二分,而不是多分,這樣CART分類樹(shù)算法建立起來(lái)的是二叉樹(shù),而不是多叉樹(shù)。

隨機(jī)森林(RF)使用了CART決策樹(shù)作為弱學(xué)習(xí)器,在使用決策樹(shù)的基礎(chǔ)上,RF對(duì)決策樹(shù)的建立做了改進(jìn),隨機(jī)選擇節(jié)點(diǎn)上的部分樣本特征,并從這部分特征中選擇一個(gè)最優(yōu)的特征來(lái)做決策樹(shù)的左右子樹(shù)劃分。這樣進(jìn)一步增強(qiáng)了模型的泛化能力。

SVM分類學(xué)習(xí)最基本的想法就是基于訓(xùn)練集D在樣本空間中找到一個(gè)劃分超平面,將不同類別的樣本分開(kāi)。

共選取擴(kuò)容基站中980個(gè)小區(qū),僅保留各小區(qū)擴(kuò)容時(shí)間前的性能數(shù)據(jù),作為擴(kuò)容小區(qū)原始數(shù)據(jù)。在其他未擴(kuò)容基站的小區(qū)中隨機(jī)選取1 575個(gè),并僅保留這些小區(qū)4月份性能指標(biāo)數(shù)據(jù),作為非擴(kuò)容小區(qū)原始數(shù)據(jù)。

選取性能表中共50個(gè)字段,分別為RRC連接建立成功率_分子、RRC連接建立成功率_分母、RRC連接建立成功率、空口上行用戶面流量、空口下行用戶面流量、平均RRC連接用戶數(shù)、平均激活用戶數(shù)、最大RRC連接用戶數(shù)等,分別計(jì)算這50個(gè)字段的平均值、最大值、標(biāo)準(zhǔn)差、25%分位點(diǎn)、50%分位點(diǎn)、75%分位點(diǎn)、大于均值樣本比例、大于75%分位點(diǎn)樣本比例,共生成450維新特征。添加小區(qū)屬性信息,分別為:重要等級(jí)、應(yīng)用類型、覆蓋類型、頻段指示標(biāo)識(shí)。最終,數(shù)據(jù)集共2 555個(gè)樣本,其中擴(kuò)容小區(qū)980個(gè),非擴(kuò)容小區(qū)1 575個(gè),每個(gè)小區(qū)共454維特征變量。

在本次實(shí)驗(yàn)中,還根據(jù)K-Means聚類的原理,對(duì)原始的2 555個(gè)樣本進(jìn)行了抽樣,經(jīng)過(guò)聚類分析后,選取分類準(zhǔn)確的擴(kuò)容小區(qū)樣本110條,非擴(kuò)容小區(qū)樣本1 355條。

在特征工程過(guò)程中,將110個(gè)擴(kuò)容小區(qū)的擴(kuò)容前、擴(kuò)容后各性能指標(biāo)成對(duì)輸入,分別進(jìn)行T檢驗(yàn)和卡方檢驗(yàn),得到各性能指標(biāo)的P值,將P值大于0.3的性能指標(biāo)濾除,被濾除的指標(biāo)分別為最大RRC連接用戶數(shù)、UE上下文異常釋放次數(shù)、UE上下文掉線率、RRC連接重建成功率分母、RRC連接重建比例、系統(tǒng)內(nèi)切換成功率等。在濾掉部分特征后,仍存在較高維度的特征,容易造成維度災(zāi)難,即過(guò)擬合現(xiàn)象,故再一次根據(jù)方差膨脹因子和因子分析的方法對(duì)特征進(jìn)行降維。通過(guò)回歸分析,計(jì)算各特征的方差膨脹因子(VIF, Variance Inflation Factor)。根據(jù)VIF值將特征分為三組分別進(jìn)行因子分析,即VIF>1 000為第一組,100

第一組特征共109維,采用方差極大法對(duì)因子載荷矩陣實(shí)行正交旋轉(zhuǎn)。本課題將因子載荷大于0.5規(guī)定為是否進(jìn)行特征抽取的標(biāo)準(zhǔn)。從總方差解釋表提取6個(gè)主成分,累計(jì)百分比為84.881%;第二組的94維特征中,從總方差解釋表提取9個(gè)主成分,累計(jì)百分比為75.944%;第三組的78維特征中,從總方差解釋表提取15個(gè)主成分,累計(jì)百分比為75.465%。

經(jīng)過(guò)樣本篩選、特征工程、特征降維后,本課題所用數(shù)據(jù)集的樣本數(shù)共1 465條,其中,擴(kuò)容小區(qū)樣本110條,非擴(kuò)容小區(qū)樣本1 355條,98維特征。目標(biāo)變量為是否擴(kuò)容,其中,1表示擴(kuò)容,0表示非擴(kuò)容。本課題分別利用K近鄰、邏輯斯特回歸、決策樹(shù)、隨機(jī)森林、支持向量機(jī)分別對(duì)樣本構(gòu)建分類模型,通過(guò)比較準(zhǔn)確率、混淆矩陣與ROC曲線,選擇最佳分類模型。本課題采用Sklearn機(jī)器學(xué)習(xí)工具包實(shí)現(xiàn)上述5種分類算法,將數(shù)據(jù)集隨機(jī)劃分為訓(xùn)練集與測(cè)試集,訓(xùn)練集與測(cè)試集的比例為5:5。在測(cè)試集預(yù)測(cè)的結(jié)果如表2所示:

表2? ? 5種算法混淆矩陣結(jié)果

KNN LR DT RF SVM

0 1 0 1 0 1 0 1 0 1

678 0 671 7 671 7 678 0 671 7

6 49 0 55 8 47 1 54 1 54

KNN算法中,當(dāng)K=3時(shí),模型預(yù)測(cè)效果達(dá)到最佳,此時(shí)準(zhǔn)確率為0.991 8。LR算法中,當(dāng)優(yōu)化算法為L(zhǎng)oglinear時(shí),模型預(yù)測(cè)效果達(dá)到最佳,此時(shí)準(zhǔn)確率為0.990 5。DT算法中,當(dāng)最大深度為6時(shí),模型預(yù)測(cè)效果達(dá)到最佳,此時(shí)準(zhǔn)確率為0.979 5。RF算法中,當(dāng)弱分類器個(gè)數(shù)為50,單個(gè)弱分類器最大深度為6時(shí),模型預(yù)測(cè)效果達(dá)到最佳,此時(shí)準(zhǔn)確率為0.998 6。SVM算法中,當(dāng)核函數(shù)為rbf,懲罰系數(shù)C=0.6時(shí),模型預(yù)測(cè)效果達(dá)到最佳,此時(shí)準(zhǔn)確率為0.989 0。

利用上述5種分類算法在測(cè)試集得出的ROC曲線如圖4所示,可以看出,LR算法和SVM算法最終的AUC值最大,均為0.99,但LR曲線高于SVM曲線,并且LR模型的測(cè)試集預(yù)測(cè)準(zhǔn)確率高于SVM模型,故選取LR模型作為擴(kuò)容預(yù)測(cè)算法的分類模型。

4? ?結(jié)束語(yǔ)

當(dāng)前數(shù)據(jù)業(yè)務(wù)在移動(dòng)運(yùn)營(yíng)商所提供的服務(wù)中占比越來(lái)越大,移動(dòng)網(wǎng)絡(luò)向混合多層網(wǎng)絡(luò)進(jìn)行轉(zhuǎn)變。這對(duì)運(yùn)營(yíng)商的工作提出了巨大的挑戰(zhàn),因?yàn)檫@一轉(zhuǎn)變意味著要提供更快、更靈活的管理和控制機(jī)制,提升運(yùn)營(yíng)效率,以創(chuàng)新的思維應(yīng)對(duì)日益變化的市場(chǎng)需求。而高效地整合移動(dòng)網(wǎng)絡(luò)的各種數(shù)據(jù)資源,進(jìn)而利用大數(shù)據(jù)技術(shù)進(jìn)行深度關(guān)聯(lián)分析成為應(yīng)對(duì)這一挑戰(zhàn)的關(guān)鍵。

隨著人們對(duì)網(wǎng)絡(luò)服務(wù)質(zhì)量的敏感程度不斷增加,使得無(wú)線網(wǎng)絡(luò)的服務(wù)質(zhì)量更為運(yùn)營(yíng)商所關(guān)注,網(wǎng)絡(luò)質(zhì)量已經(jīng)成為影響運(yùn)營(yíng)商發(fā)展的重要因素,對(duì)經(jīng)營(yíng)的好壞具有重要影響。

運(yùn)營(yíng)商應(yīng)借助于AI和大數(shù)據(jù)等前沿技術(shù),降低人力成本,提高利潤(rùn)率。通過(guò)本文的初步探索與開(kāi)發(fā)驗(yàn)證,可發(fā)現(xiàn)AI技術(shù)在LTE小區(qū)運(yùn)維領(lǐng)域確實(shí)具有實(shí)際的應(yīng)用價(jià)值,進(jìn)一步結(jié)合運(yùn)維人員的業(yè)務(wù)經(jīng)驗(yàn),具有很強(qiáng)的實(shí)際應(yīng)用前景。

相比于大數(shù)據(jù)和人工智能技術(shù)在移動(dòng)互聯(lián)網(wǎng)領(lǐng)域的廣泛使用,大數(shù)據(jù)和人工智能在運(yùn)營(yíng)商的應(yīng)用還處于初期階段,但應(yīng)用領(lǐng)域已經(jīng)逐步拓展。通過(guò)對(duì)網(wǎng)絡(luò)從流量、終端、用戶等多維度進(jìn)行分析,不僅能夠提升網(wǎng)絡(luò)優(yōu)化的效率,降低投入,如果能夠進(jìn)一步挖掘,還能夠?yàn)榫?xì)化營(yíng)銷,改進(jìn)客戶體驗(yàn)提供有力的數(shù)據(jù)支撐。

參考文獻(xiàn):

[1] 張嗣宏,左羅. 基于人工智能的網(wǎng)絡(luò)智能化發(fā)展探討[J]. 中興通訊技術(shù), 2019(2): 57-62.

[2] 鄧雄才. LTE無(wú)線網(wǎng)絡(luò)優(yōu)化思路探討[J]. 現(xiàn)代信息科技, 2019(3): 55-56.

[3] 唐以鵬. 基于城市復(fù)雜環(huán)境的LTE無(wú)線網(wǎng)絡(luò)優(yōu)化方法[J]. 網(wǎng)絡(luò)安全技術(shù)與應(yīng)用, 2019(1): 60-61.

[4] 翟威. TD-LTE的網(wǎng)絡(luò)優(yōu)化研究[D]. 南京: 南京郵電大學(xué), 2018.

[5] 李一喆. AI落地?zé)o線網(wǎng)絡(luò)運(yùn)維四大難題待破解[J]. 通信世界, 2018(29): 40-42.

[6] 張琰,盛敏,李建東. 大數(shù)據(jù)驅(qū)動(dòng)的“人工智能”無(wú)線網(wǎng)絡(luò)[J]. 中興通訊技術(shù), 2018(2): 2-5.

[7] 張家望. 基于S1-U接口信令的LTE性能分析與網(wǎng)絡(luò)優(yōu)化[D]. 北京: 北京郵電大學(xué), 2017.

[8] 李曉輝,古炳松. 基于LTE MR數(shù)據(jù)建模的網(wǎng)優(yōu)應(yīng)用研究[J]. 中國(guó)新通信, 2016(19): 116-117.

[9] 李一喆,肖衛(wèi)東,單麗雅,等. LTE數(shù)據(jù)預(yù)測(cè)方法研究[J]. 郵電設(shè)計(jì)技術(shù), 2016(9): 11-14.

[10] 王磊,王西點(diǎn),程楠. 基于大數(shù)據(jù)技術(shù)的智能化無(wú)線網(wǎng)絡(luò)優(yōu)化體系[J]. 電信科學(xué), 2015(12): 167-171.★

猜你喜歡
人工智能
我校新增“人工智能”本科專業(yè)
用“小AI”解決人工智能的“大”煩惱
汽車零部件(2020年3期)2020-03-27 05:30:20
當(dāng)人工智能遇見(jiàn)再制造
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
AI人工智能解疑答問(wèn)
人工智能與就業(yè)
基于人工智能的電力系統(tǒng)自動(dòng)化控制
人工智能,來(lái)了
數(shù)讀人工智能
小康(2017年16期)2017-06-07 09:00:59
人工智能來(lái)了
主站蜘蛛池模板: 九九久久99精品| 91国语视频| 国产91全国探花系列在线播放 | 99视频在线免费| 国产成人精品18| 欧美国产菊爆免费观看 | 国产亚洲精品无码专| 欧美亚洲中文精品三区| 92午夜福利影院一区二区三区| 国产美女无遮挡免费视频| 日韩欧美国产区| 国产精品私拍在线爆乳| 99这里只有精品在线| 久久无码免费束人妻| 亚洲国产一区在线观看| 色综合天天娱乐综合网| 亚洲精品国产日韩无码AV永久免费网 | 小说 亚洲 无码 精品| www精品久久| 欧美国产精品不卡在线观看| 欧美日韩中文字幕二区三区| 亚洲国产综合精品中文第一| 亚洲中文在线看视频一区| 国产欧美日韩18| 久久一本日韩精品中文字幕屁孩| 国产天天色| 一区二区三区成人| 亚洲首页在线观看| 二级特黄绝大片免费视频大片| 91美女视频在线| 日韩人妻少妇一区二区| 日韩av无码精品专区| 国产成人精品亚洲日本对白优播| 强奷白丝美女在线观看| 美女国产在线| 2024av在线无码中文最新| 亚洲无码精品在线播放| 九月婷婷亚洲综合在线| 啊嗯不日本网站| 爱爱影院18禁免费| 国产人免费人成免费视频| 国产在线拍偷自揄拍精品| 男人的天堂久久精品激情| 日韩黄色在线| 18禁不卡免费网站| 毛片一级在线| 日韩中文字幕免费在线观看| 久久精品国产精品国产一区| 午夜国产大片免费观看| 超级碰免费视频91| 精品欧美一区二区三区久久久| 日韩国产一区二区三区无码| 国产中文一区a级毛片视频| 欧美人人干| 9999在线视频| 亚洲αv毛片| 亚洲精品第五页| 国产超碰一区二区三区| 色悠久久久| 2021亚洲精品不卡a| 亚洲人人视频| 一级毛片免费不卡在线视频| 中文字幕乱码二三区免费| 97亚洲色综久久精品| 91精品国产自产91精品资源| 国产第一色| 国产免费福利网站| 久久精品娱乐亚洲领先| 国产精品深爱在线| 色综合中文综合网| 亚洲午夜片| 久久一色本道亚洲| 中文字幕人成乱码熟女免费| 亚洲Va中文字幕久久一区| 亚洲一级毛片在线观播放| 人妻91无码色偷偷色噜噜噜| 国产特一级毛片| 亚洲首页国产精品丝袜| 国产福利一区在线| 2021无码专区人妻系列日韩| 日本人真淫视频一区二区三区| 伊人色天堂|