鄭松奕
摘要:隨著越來越多的校園用戶使用校園無線網上網,對于用戶相關行為的分析研究就顯得尤為重要。該文基于校園無線網數據設計并實現一個能夠進行用戶行為分析的系統,該系統能夠評估校園無線網的運行狀態并分析用戶的移動軌跡。系統以華南師范大學校園無線網絡數據為例進行測試,并以地圖、表格等在線方式顯示了用戶移動軌跡、用戶設備區分等用戶行為分析結果。
關鍵詞:無線局域網;用戶行為;用戶移動軌跡;行為分析
中圖分類號:TP393 文獻標識碼:A 文章編號:1009-3044(2018)03-0025-03
1 研究背景
校園無線網的快速發展,移動終端、App的大量豐富與普通應用,使得用戶越來越多地使用并依賴于無線網絡,產生了大量的無線數據,這些數據包括校園師生主動產生和各種終端設備自動搜集的數據,如:通過各種即時通信軟件(QQ、微信等)分享自己的想法與興趣、用戶接入使用無線網絡的連接信息、無線位置信息等。隨著這些無線數據的大量產生及數據類型的不斷豐富,如何利用這些數據更好地為廣大師生提供服務,以及為學校管理提供更好的決策依據,是校園無線網未來發展的重點方向。
校園用戶是校園無線網中的行動主體,分析研究無線網絡中的用戶行為數據有助于挖掘校園用戶的行為特點及其行為表現出來的規律。不僅如此,對無線網絡的用戶行為進行分析研究還能為無線網絡管理提供優化調整網絡的科學數據、為用戶提供更有針對性的網絡服務、為教學活動提供技術支持及描述用戶的移動軌跡和社會關系等。為了更好的建設校園無線網和為用戶提供更好的無線網絡服務,對無線網絡用戶行為進行系統化的分析研究十分必要。
2 校園無線網用戶行為分析的應用
2.1 校園WLAN優化
現在的校園無線局域網時常會面臨著如頻率干擾、負載不均衡、用戶無法接入網]、用戶吞吐率較低等問題。面對些問題,可以通過分析校園無線網絡的用戶行為數據,從而優化無線網絡來解決,能夠有效地提高校園無線網絡的信息服務質量。例如,通過對校園無線網絡的用戶行為進行分析研究,可以發現、預測用戶的網絡需求,有助于根據實際情況優化信息服務種類和服務水平。
2.2 學生管理
通過分析研究校園無線網的用戶行為數據可以挖掘出用戶的行為規律與生活習慣等,為學校管理提供更好的支持。
1) 學生失聯預警。通過學生用戶的上網行為規律與上網記錄來判斷學生的在校情況,甄別出非假期期間長時間不在校學生,提供給學校相關部門檢查確認,及時發現學生失聯情況,以更好地保障學生安全。
2) 日常教學活動管理。比如通過分析教學樓不同時間段的無線網絡在線用戶人數變化,結合學校的教學安排,可以統計出上課時間學生出勤人數及有多少學生在課余時間喜歡去教學樓自習,學??梢愿鶕@些數據加強學生考勤管理、或給自修的學生提供一些空余且相對安靜的教室。另外,可以將課表結合終端的位置時間進行課程信息的推送等等。
2.3 用戶移動軌跡分析
在校園環境中,校園用戶一般有較固定的活動地點,比如學生的日常行為包括在教學樓上課、在圖書館自習、在飯堂吃飯、在宿舍休息等,通過分析用戶每次上線下線時與AP(Wireless Access Point 無線訪問接入點)的關聯信息,結合AP的地理位置,可以挖掘出用戶的移動軌跡,也就是用戶到了哪些地方,分別停留了多久,這有利于學校了解校園里教師與學生的行為習慣,可以為高校管理提供了一個便捷、可靠的方式,而且,對師生的工作、學習、生活都有很大的好處。
1) 基于群體用戶移動性規律,發現熱點區域,進而研究校園里不同熱點區域的用戶流動性?;趥€人用戶軌跡數據,可以提取個體用戶行為特征,進行正常行為及可疑行為判別等。
2) 利用用戶移動軌跡區分無線網絡中終端設備的擁有者,從而統計出使用無線網絡的真實用戶?,F在校園里有許多用戶擁有兩個及以上移動終端,使用相同的賬號上網,或者是同一臺移動終端借用他人的賬號接入使用無線網絡,如果僅是利用移動終端的MAC(Medium Access Control媒體訪問控制)地址來標識用戶,則統計出來用戶人數要遠大于真實的用戶人數,不能準確的描述用戶的行為規律,因此需要區分不同移動終端是否屬于同一個用戶所有。同一用戶使用所擁有的不同設備在上網行為、移動性方面具有較高的相似性,甚至是一致的,因此可以通過對比不同移動終端的移動軌跡數據來區分使用同一個賬號上網的不同移動終端是否屬于同一個用戶所有。
總的來說,校園無線網用戶行為分析在反映網絡性能的同時,也可以反映出用戶的某些行為規律、偏好和生活習慣等等,不僅能指導將來的校園無線網建設,提高校園信息服務質量與用戶體驗,也能為學校了解師生及管理提供有力的幫助,具有很好的應用前景和重要的實用意義。
3 系統方案設計
3.1 系統邏輯結構
系統基于B/S架構設計,其系統結構圖如圖1所示,其系統工作流程如下所述:首先是獲取校園無線網絡數據,并通過預處理后,將得到的AC(Wireless Access Point Controller 無線控制器)、AP與其他的用戶數據存放到設計好的數據庫中,然后以WEB方式從數據庫中獲取相應的數據并顯示出來。系統共分為三個主要部分:
第一層為數據采集與預處理部分。采集來自校園無線網絡相關數據,并通過系統進行預處理后,存儲在已設計好的系統數據庫中。采集的數據包括AC、AP等基本信息,同時包括用戶上線、下線等各種日志信息;數據預處理包括去除收集到的存在缺失值或不一到狀態的數據記錄等。
第二層為中間層。負責將采集的原始的數據進行處理,通過統計分析后將得到的網絡性能數據、用戶軌跡數據存入數據庫中。
第三層是管理應用層。實現用戶行為分析結果的顯示,WEB服務根據不同的查詢條件從數據庫中查詢數據,并以圖形化界面顯示查詢結果,方便用戶查看。
3.2 系統功能模塊設計
系統的功能模塊包括WLAN運行狀況顯示、用戶一般性統計、用戶移動軌跡顯示、學生失聯預警及用戶設備區分5個部分。系統的功能模塊框架圖如圖2所示。
1) WALN運行狀況。WALN運行狀況功能模塊包括AC運行狀況顯示模塊與AP顯示模塊。其中AC運行狀況主要顯示了AC當前所管理的AP、AC在線用戶人數隨時間變化情況;AP顯示模塊顯示了各個樓宇AP的分布情況和運行情況。
2) 用戶一般性統計。用戶一般性統計包括用戶終端廠商統計與用戶在線情況顯示模塊。用戶終端廠商統計顯示了用戶所使用設備的品牌及所屬品牌設備的數量;用戶在線情況顯示了各樓宇在線用戶人數隨時間變化的情況。
3) 用戶移動軌跡。用戶移動軌跡用于顯示用戶日常的移動范圍,挖掘用戶的行為規律。
4) 學生失聯預警。學生失聯預警通過分析學生用戶上網記錄對非假期期間長時間不在校的學生用戶進行歸類,并列出預警名單提交給學校的相關管理部門。
5) 用戶設備區分。用戶設備區分指的是同一用戶使用多個終端設備接入無線時,對不同終端設備進行對比識別,區分不同的終端設備是否屬于同一用戶所有。在早期的無線網絡用戶行為研究中單個用戶擁有的接入無線網絡的終端設備數量有限,研究者多以MAC地址來區分不同的用戶,可以統計出比較真實的用戶情況,然而,近幾年來,隨著智能手機、平板電腦等無線移動智能終端的普及,多數校園用戶往往同時擁有多個無線移動設備,這樣使得用戶可以通過多個設備接入與使用無線網絡,如果我們依然釆用終端設備的MAC地址來區分不同的用戶,則用戶行為分析結果可能會出現較大的偏差。因此,區分多個終端設備是否歸屬于同一個用戶就顯得很有意義,不僅能夠統計出真實的用戶,也能更精確的刻畫用戶的移動軌跡。
4 實驗結果與分析
本文采集華南師范大學無線網絡數據進行測試,主要測試了用戶終端廠商統計、用戶移動軌跡、學生失聯預警、用戶設備區分功能。并通過WEB以地圖、表格等在線方式顯示了實驗結果
1) 用戶終端廠商統計。用戶終端廠商統計基于終端的MAC地址進行匹配。每個移動終端都有一個固定的MAC地址,且每一個MAC地址都是全球唯一的。任何正規廠家生產的網卡上都直接標明了MAC地址,所有MAC地址的長度都是48位,通常表示為一組12位的16進制數,如0C-D6-BD-90-C4-97,其中前6位代表網卡的生產廠商(如0C-D6-BD表示了該網卡的制造商是華為),后6位由廠家自己分配,標識了設備本身,因此MAC地址作為獨一無二的物理地址可以用于標識一臺終端設備乃至一個用戶(這里指在不區分同一用戶同時擁有多個終端設備的情況下)。在用戶終端廠商統計模塊的實現中,我們采集了一周的終端設備數據集,并將其MAC地址與IEEE組織提供的廠商列表進行匹配。
本文中用戶終端廠商統計模塊統計了華為、蘋果、小米、三星、酷派、魅族、中興、OPPO等品牌的終端數量,結果如圖3所示。
2) 用戶移動軌跡。用戶移動軌跡利用用戶與AP的連接情況來判斷用戶移動性,描述了用戶一定時間內所移動的范圍,可以更好地了解用戶日?;顒涌臻g與用戶聚集的熱點區域。圖4及圖5顯示了用戶群體的移動軌跡,可以看出,公共教學樓、圖書館、學生宿舍的用戶人數比較多,其次是飯堂及各學院辦公樓。
3) 學生失聯預警。通過收集一個月以來接入使用無線網絡的用戶,共有18344個,然后統計了在數據收集截止日期前3天以來沒有再上線的用戶,結合用戶的上線記錄進行區分是否屬于有失聯情況的用戶,最后的甄別出了23個異常用戶。
4) 用戶設備區分。以某一個用戶“方xx”為例,用戶“方xx”的上網賬號是201603xxxxx。區分前,有103個終端設備使用賬號201603xxxxx上網,部分數據記錄如圖6所示。但仔細觀察發現,除了mac為f40f.241f.5913登錄次數為107,且長期使用外,其他的登錄數據98%以上的終端都只登錄一次,偶爾有登錄2次或3次,但使用的時間短,而且每次在線時間較短,這部分數據有可能是該用戶將上網賬戶借給他人使用而產生的,應該將其去除。通過算法運算后,系統分析推測出只有一個終端設備才是真正屬于用戶“方xx”的,該終端設備的mac為f40f.241f.5913,區分結果如圖7所示。
5 結束語
本文在校園無線網絡數據的基礎上,設計了用戶行為分析系統,該系統能夠對校園無線網絡數據進行統計分析,刻畫用戶的移動軌跡,實現用戶設備區分、學生失聯預警等功能。對于校園無線網絡數據的統計分析可以有效應用于指導或改進無線局域網的建設,而分析研究用戶的移動軌跡則可以應用于個性化服務設計、對用戶進行網絡畫像、尋找用戶熱點區域等多種領域。
參考文獻:
[1] 鄭宇,謝幸.基于用戶軌跡挖掘的智能位置服務[J].中國計算機學會通訊, 2010,6(6):23-30.
[2] 蘇孝強,倪宏,馬永帥.移動環境下基于用戶軌跡的社交親近度研究[J].微計算機信息,2011(5):7-9.
[3] 吳利兵.無線網絡環境下用戶行為的社會性分析[D].上海交通大學,2012.
[4] MAC Address[EB/OL], http://standards-oui.ieee.org/oui/oui.txt. 2016.