譚紅春,楊松濤,闞紅星
(安徽中醫藥大學醫藥信息工程學院,安徽合肥230012)
目前我們廣泛使用的P2P(Peer-to-Peer)技術即對等網絡,打破了以服務器為中心的C/S(Client/Server)傳統模式[1],充分利用了網絡帶寬和廣泛分布的網絡資源,改變了信息的傳輸方式,減輕了服務器的負擔,比傳統的C/S模型有更好的健壯性、穩定性、可擴展性以及更高的性價比[2,3].這使得P2P應用日益廣泛,流量迅速增長.據統計,我國的P2P流量占整個網絡流量的比例大約為40%到70%[4,5].校園網主要用戶為行政人員、教研人員及學生,這些用戶可以通過網絡獲取教學信息、最新研究成果和各類數據庫資源.
我們在一段時間內對校園網中的流量進行了統計,在這期間,總共統計出13種服務類型,位于前3位的服務分別是P2P服務、流媒體服務[6]、傳統服務,其中P2P服務約占52.11%,而其他服務只占到很少比例.這說明P2P流量嚴重吞噬了校園網的帶寬,損害了正常業務的通信,影響了廣大師生的利益.

圖1 服務大類流量分布情況及對應餅圖
P2P流量的有效識別是進行網絡控制的基礎,P2P識別的過程其實就是一個具體的分類過程,下面是分類過程的定義:
定義:給定一個數據集F={x1,x2,…xi}和一組類E={E1,E2,…Ej},分類就要將每個元組xm對應到每一個類中,即確定一個映射f:F→E.其中所有的元組都屬于每一個類En,即 En={xm∣ f(xm)=En,1 < =m < =i且 xm∈F}.
在本文設計的P2P流量檢測方法中,我們預處理數據庫F={x1,x2,…xi},并抽取其中第m條網絡流,形成元組xm.根據類E的不同,映射f:F→E得到的結果也各異,所以本文總結……