999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

聚類算法在高校網(wǎng)絡(luò)用戶行為分析中的應(yīng)用

2016-07-09 14:27:15薛黎明欒維新
現(xiàn)代電子技術(shù) 2016年7期

薛黎明 欒維新

摘 要: 高校網(wǎng)絡(luò)管理部門在運行管理過程中積累了大量用戶上網(wǎng)行為數(shù)據(jù),對用戶上網(wǎng)行為進行整理分析將能掌握用戶上網(wǎng)習慣、規(guī)律,科學(xué)有效地制定上網(wǎng)管理策略。以一具體高校為例,通過對用戶上網(wǎng)數(shù)據(jù)進行預(yù)處理,抽取相應(yīng)字段構(gòu)建分析數(shù)據(jù)集,通過圖表形式對上網(wǎng)登錄時間進行統(tǒng)計展示。以上網(wǎng)時長為指標值,分別使用K-均值聚類與Kohonen神經(jīng)網(wǎng)絡(luò)聚類方法對上網(wǎng)記錄進行聚類分析,得到聚類結(jié)果。結(jié)合用戶信息,以用戶與上網(wǎng)記錄的對應(yīng)準則作為判斷聚類效果的準則,對兩種聚類方式得到的結(jié)果進行比較,選擇合適的結(jié)果。結(jié)合計算結(jié)果對實驗單位的上網(wǎng)情況進行分析,對上網(wǎng)管理策略提出建議。

關(guān)鍵詞: Kohonen神經(jīng)網(wǎng)絡(luò); 高校網(wǎng)絡(luò)管理; 上網(wǎng)行為; 上網(wǎng)管理策略

中圖分類號: TN911?34 文獻標識碼: A 文章編號: 1004?373X(2016)07?0029?04

Abstract: The network management departments in universities have accumulated users′ mass online behavior data in ope?ration management process, which can master users′ online habit and regular pattern by reorganizing and analyzing the users′ online behavior, and formulate the online management strategy scientifically and effectively. A specific college is taken as the example, the users′ online data is preprocessed, and corresponding field is extracted to built the analysis dataset. The online login time is showed in graphic form after statistics. By taking online time as the index value, the clustering analysis for the online record is conducted with K?means clustering and Kohonen neural network clustering methods to obtain the clustering results. In combination with the user information, the results obtained from the two clustering methods are compared by taking corresponding criterion of user and online record as the criterion to judge the clustering effect, and the suitable result is selected. The online condition of the experimental unit is analyzed with the computed results to propose some suggestions for online management strategy.

Keywords: Kohonen neural network; university network management; online behavior; online management strategy

0 引 言

信息技術(shù)的高速發(fā)展,不但對人們的生產(chǎn)生活產(chǎn)生了巨大的影響,同時也給傳統(tǒng)的學(xué)校教育帶來了很大的沖擊[1]。隨著互聯(lián)網(wǎng)應(yīng)用的普及,網(wǎng)絡(luò)用戶數(shù)量快速增加。對國內(nèi)高校而言,互聯(lián)網(wǎng)已成為學(xué)校師生學(xué)習、工作、生活的基本需求,網(wǎng)絡(luò)用戶幾乎覆蓋了學(xué)校100%的人員。高校用戶具有知識性強,使用互聯(lián)網(wǎng)積極性高,信息交互量大等特點,對聯(lián)網(wǎng)速率、網(wǎng)絡(luò)穩(wěn)定性都提出了較高要求。而由于我國高校網(wǎng)絡(luò)用戶連接互聯(lián)網(wǎng)大多通過學(xué)校統(tǒng)一網(wǎng)絡(luò)管理部門出口連接互聯(lián)網(wǎng),對高校而言,互聯(lián)網(wǎng)出口帶寬是有限的,網(wǎng)絡(luò)管理部門在響應(yīng)用戶的上網(wǎng)需求時,有較大壓力。為解決相關(guān)問題,各高校網(wǎng)絡(luò)管理部門也采取了一定措施。一方面,通過技術(shù)手段優(yōu)化學(xué)校網(wǎng)絡(luò)結(jié)構(gòu),升級網(wǎng)絡(luò)設(shè)備,提高網(wǎng)絡(luò)可用性;另一方面,通過出臺相應(yīng)的管理措施利用經(jīng)濟與行政手段對用戶上網(wǎng)行為進行相應(yīng)引導(dǎo),平衡用戶的聯(lián)網(wǎng)需求。

目前國內(nèi)的很多高校在校園網(wǎng)的運營管理上都會使用一些應(yīng)用服務(wù)器,主要用于認證計費、入侵檢測、流量監(jiān)控等方面。在提供服務(wù)的同時,也產(chǎn)生了大量的日志數(shù)據(jù)存儲于后臺數(shù)據(jù)庫中。這些數(shù)據(jù)包含著整個校園網(wǎng)內(nèi)部用戶的使用狀況。如果能對這些數(shù)據(jù)進行科學(xué)有效的分析,并對分析結(jié)果加以合理利用,將會對整個網(wǎng)絡(luò)管理起到很大的推進作用[2],為網(wǎng)絡(luò)管理進行有效支撐,為決策科學(xué)化、管理精細化提供幫助。本文以一具體高校為案例,對用戶上網(wǎng)行為進行分析,找到相應(yīng)規(guī)律,根據(jù)相應(yīng)指標對用戶進行分類,為用戶分組,制定用戶管理決策提供幫助。

1 數(shù)據(jù)抽取與分析

D校在進行用戶鏈接互聯(lián)網(wǎng)管理過程中,用戶通過專用客戶端軟件登錄的方式登錄互聯(lián)網(wǎng),網(wǎng)絡(luò)管理部門對用戶的登錄上線時間、退出下線時間,登錄總時長等都有專門數(shù)據(jù)庫進行記錄。每一次登錄在后臺都會出現(xiàn)一條記錄。由于運行數(shù)據(jù)庫相對龐大,表之間關(guān)系較為復(fù)雜,數(shù)據(jù)結(jié)構(gòu)多樣,為方便分析,從運行的上網(wǎng)數(shù)據(jù)庫中提取與教工用戶上網(wǎng)時間相關(guān)的字段,構(gòu)造上網(wǎng)時間分析表進行分析,如表1所示。

從圖1可以看出,每天大約6點鐘后開始有少量教工登錄互聯(lián)網(wǎng),在早8:00—9:00間達到高峰。在中午下班前11:00—12:00間登錄人次降低。中午休息及下午上班前(12:00—14:00)登錄人次較中午休息前增加,臨近下班登錄人次降低,下班后登錄互聯(lián)網(wǎng)人次相對穩(wěn)定但低于上班期間數(shù)量。

2 上網(wǎng)時長聚類

聚類(Clustering)是數(shù)據(jù)挖掘中一種重要的挖掘方法,它是將物理或抽象對象進行分組并將相似對象歸為一類的過程[3]。

對于數(shù)據(jù)庫中的記錄,上網(wǎng)時長字段(TIME_LONG)是指從登陸網(wǎng)絡(luò)到退出網(wǎng)絡(luò)的時間,上網(wǎng)時長指標有一定規(guī)律性,為掌握用戶上網(wǎng)行為,科學(xué)制定用戶上網(wǎng)管理策略,下面對用戶每次登陸的上網(wǎng)時長進行分析。

K?均值算法是一種基于劃分的聚類算法,它通過不斷的迭代來進行聚類,當算法收斂到一個結(jié)束條件時就終止迭代過程,輸出聚類結(jié)果。由于其算法思想簡便,因此K?均值算法己成為一種最常用的聚類算法之一。

使用K?均值聚類算法對一學(xué)院教工上網(wǎng)時長記錄進行聚類,根據(jù)樣本數(shù)量,設(shè)置聚類個數(shù)為4個,經(jīng)過聚類,四個類的聚類中心分別為:聚類1,中心為3.51;聚類2,中心1.19;聚類3,中心44.25;聚類4,中心72.86。

為每條記錄增加一個字段,表示該條記錄所屬的類別。按上網(wǎng)時長排序的聚類結(jié)果如表2所示。

Kohonen網(wǎng)絡(luò)是自組織競爭型神經(jīng)網(wǎng)絡(luò)的一種,它能夠識別環(huán)境特征并自動聚類[4],該網(wǎng)絡(luò)為無監(jiān)督學(xué)習網(wǎng)絡(luò),能夠識別環(huán)境特征并自動聚類。該方法用迭代算法優(yōu)化目標函數(shù)來獲取對數(shù)據(jù)集的分類。

聚類結(jié)果如表3所示。

3 聚類結(jié)果比較與策略分析

對照原始數(shù)據(jù)發(fā)現(xiàn),一個用戶每天可以頻繁多次登陸退出網(wǎng)絡(luò),在有聯(lián)網(wǎng)需要的時候上網(wǎng),不需要上網(wǎng)的時候及時退出,待有需要的時候再次聯(lián)網(wǎng),在這種情況下,對于同一個用戶,在數(shù)據(jù)庫里一天可以有多條記錄。同樣,也存在這樣的情況,有的用戶每天只登陸網(wǎng)絡(luò)一次,待關(guān)機時自動退出網(wǎng)絡(luò),對于這樣的用戶,一天只有一條登錄記錄。

對于絕大多數(shù)用戶,個人的上網(wǎng)行為是有一定規(guī)律的,而在上述對上網(wǎng)時長進行聚類的過程中并沒有考慮用戶的因素,這就出現(xiàn)了同一用戶的不同上網(wǎng)記錄被劃分到不同類別的情況,如果上網(wǎng)時長相差較大,被分在不同類別是可以理解的,而如果同一個用戶每次上網(wǎng)時長比較接近,且恰巧在聚類邊界點附近,但被劃分在不同類別,那么聚類結(jié)果則不能被很好的理解。

基于這種現(xiàn)象,對上述兩種聚類方法的聚類效果進行評價。

評價偏好假設(shè):相比于類間距、類內(nèi)距離而言,將同一個用戶主體距離較近而類別不同的記錄記為一類更有意義。對不同聚類算法而言,聚類邊界點附近的屬于同一個用戶但被劃分為不同類別的記錄越少越好。邊界點附近的記錄對比結(jié)果如表4所示。

在[K?]均值聚類結(jié)果中,200720x2,199610x0,200420x0,200910x9四個用戶具有在邊界點附近且被劃分為不同類別的記錄,而在Kohonen聚類的邊界點附近卻沒有類似的數(shù)據(jù)。因此,根據(jù)評價偏好,在本例中采用Kohonen聚類方法聚類效果更好,對實際數(shù)據(jù)的解釋效果更好。

策略分析:通過對用戶上網(wǎng)時長進行聚類,分析聚類結(jié)果,約70%的上網(wǎng)記錄為第一類,上網(wǎng)時長集中在1 h之內(nèi),說明對大部分用戶,都能根據(jù)上網(wǎng)需求,調(diào)整上線時間,在沒有上網(wǎng)需求時,主動退出互聯(lián)網(wǎng),這也與大部分用戶選擇的按時上網(wǎng)收費策略是相關(guān)的,說明相應(yīng)的策略能夠影響用戶的上網(wǎng)行為。

第四類上網(wǎng)記錄數(shù)量不多,但上網(wǎng)時長較長超過6 h,對比上網(wǎng)記錄的用戶信息,發(fā)現(xiàn)主要集中在個別用戶,結(jié)合實際工作與走訪調(diào)查,發(fā)現(xiàn)上述用戶普遍存在對上網(wǎng)工具使用不熟悉,不會主動退出網(wǎng)絡(luò),只在關(guān)機時自動退出網(wǎng)絡(luò)的現(xiàn)象。針對這種情況,對此類用戶進行有針對性的上網(wǎng)工具培訓(xùn),同時在上網(wǎng)管理策略中增加規(guī)則,對上網(wǎng)時長超過6 h的記錄,通過消息推送對用戶進行提示,有效引導(dǎo)用戶使用行為。

4 結(jié) 語

本文結(jié)合具體實例,對一特定單位網(wǎng)絡(luò)用戶上網(wǎng)時間數(shù)據(jù)進行分析,根據(jù)將同一個用戶主體距離相近而類別不同的記錄記為一類更有意義的前提假設(shè),對傳統(tǒng)[K?]均值聚類算法進行改進。在具體實例中,結(jié)合記錄中的用戶信息,通過將同一用戶在邊界點附近且屬于不同類別的記錄調(diào)整為一類,對聚類邊界點進行調(diào)整,改進后的聚類結(jié)果對樣本數(shù)據(jù)有更好的解釋效果。

參考文獻

[1] 仇心榮.淺談高校校園網(wǎng)管理[J].硅谷,2009(13):133?134.

[2] 丁青,周留根,朱愛兵,等.基于K?Means聚類算法的校園網(wǎng)用戶行為分析研究[J].微計算機應(yīng)用,2010,31(6):74?80.

[3] 葉良艷.基于改進后的K?Means聚類算法的網(wǎng)吧用戶行為聚類[J].安徽科技學(xué)院學(xué)報,2009,23(4):27?30.

[4] 劉純平.基于Kohonen神經(jīng)網(wǎng)絡(luò)聚類方法在遙感分類中的比較[J].計算機仿真,2006,26(7):1744?1746.

[5] 李翔,顧捷.運用聚類算法預(yù)測地區(qū)電網(wǎng)典型日負荷曲線[J].電力與能源,2013,34(1):47?50.

[6] 馬小惠,陽育德,龔利武.基于Kohonen聚類和SVM組合算法的電網(wǎng)日最大負荷預(yù)測[J].電網(wǎng)與清潔能源,2014,30(2):7?11.

主站蜘蛛池模板: 天堂在线www网亚洲| 久久久久人妻一区精品| 91久久精品国产| 国产成人福利在线| 亚洲区欧美区| www.日韩三级| 露脸真实国语乱在线观看| 日韩无码真实干出血视频| 日韩精品专区免费无码aⅴ| 五月婷婷丁香色| 91久久青青草原精品国产| 777国产精品永久免费观看| 国产视频a| 亚洲色图狠狠干| 亚洲国产成人在线| 精品夜恋影院亚洲欧洲| 国产视频a| 91免费国产高清观看| 亚洲一区第一页| 国产女人18水真多毛片18精品| 亚洲天堂成人在线观看| 国产精品不卡永久免费| www.亚洲一区| 亚洲欧美激情另类| 尤物亚洲最大AV无码网站| 国产凹凸一区在线观看视频| 国产欧美视频综合二区| 国产精品成人一区二区| 国产精品成人久久| 狠狠综合久久| 亚洲第一黄片大全| 国产成人精品视频一区二区电影| 欧美色视频在线| 欧美午夜理伦三级在线观看| 久久精品视频亚洲| 青草国产在线视频| 97国产精品视频自在拍| 日韩精品亚洲精品第一页| 91色爱欧美精品www| 国产精品久线在线观看| 久久大香伊蕉在人线观看热2| 国产成人调教在线视频| 久久频这里精品99香蕉久网址| 久久性视频| 91口爆吞精国产对白第三集| 国产精品综合久久久| 无码人妻免费| 国产xxxxx免费视频| 曰AV在线无码| 亚洲美女操| 97久久超碰极品视觉盛宴| 成人午夜视频网站| 婷婷亚洲视频| 波多野结衣无码中文字幕在线观看一区二区 | 毛片一级在线| 波多野结衣一区二区三区四区视频| 国产精品伦视频观看免费| 免费人成视网站在线不卡| 久久99精品国产麻豆宅宅| 久久国产精品电影| 99手机在线视频| 第一页亚洲| 在线观看的黄网| 国产日韩欧美成人| 国产第二十一页| 日韩精品无码免费一区二区三区 | 日本亚洲欧美在线| 欧美亚洲第一页| 国产精品亚洲片在线va| av一区二区三区高清久久| 高潮毛片无遮挡高清视频播放| 中文字幕有乳无码| 福利视频一区| 露脸国产精品自产在线播| 亚洲欧美日韩动漫| 深夜福利视频一区二区| 中文字幕免费播放| 一本一道波多野结衣一区二区| 亚洲Av激情网五月天| 中文字幕 91| 永久免费精品视频| 欧美日韩中文字幕在线|