999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于網頁瀏覽行為的分析

2012-03-22 02:20:46雪,
上海理工大學學報 2012年4期
關鍵詞:人類用戶研究

米 雪, 張 寧

(上海理工大學管理學院,上海 200093)

探索人類各種行為的統計特性,是探索自然界、認知人類自身的一個重要方面,對于研究經濟、心理和眾多社會學科有著重要的意義.在研究涉及人類行為特性的問題時,一個常常采用的傳統近似是,將人類的行為簡化為可以使用泊松過程描述的穩態隨機過程.這種假設導致的一個結論是人的行為的時間統計特征是比較均勻的,兩個相繼行為之間的時間間隔的偏離其平均值很多的概率很小.但是,Barabási通過對用戶電子郵件和普通郵件的發送與回復行為的時間間隔的實際統計,展示了與此截然不同的特性:人類行為同時具有長時間的靜默與短期的高頻率爆發,相鄰兩個事件的時間間隔分布存在滿足反比冪函數的胖尾特性.這些行為的統計特性不能用傳統的泊松過程進行描述,說明人類的個體行為可能存在復雜的動力學機制[1].

Barabási等的工作開創了人類動力學的新方向.盡管這個方向問世時間很短,但是由于其理論和應用上的雙重價值,很快就吸引了國際上許多知名科學家的關注[2].隨即研究者對這一問題展開了極為廣泛的探索.Vazqueza[3]認為人類的記憶會對自身的行為產生巨大的影響,因此從人類記憶的角度解釋了通信模式中人類動力學的非泊松分布.除此之外,人類行為不僅僅是為了完成某些任務,興趣愛好往往也是驅動人類行為的一個重要因素,如網頁瀏覽[4-8]、電影點播[9]、游戲[10]等人類行為,所以韓筱璞等[11]提出了一個基于可變興趣的人類動力學模型,并通過數值模擬和解析進行了研究,得到了指數為1的冪律分布形式的時間間隔分布.

互聯網為觀察了解和監管人類社會行為的很多方面提供了途徑,特別是那種有著大量頻繁訪問的“老客戶”的網站.如果這些網站屬于公司或者大學的話,其使用模式能夠為人類群體工作習慣提供研究的信息.Dezso等[5]通過研究個體用戶的瀏覽模式和門戶網站上某個網頁訪問量之間的相互作用,發現新聞網頁的訪問量不依賴于其內容,而主要取決于用戶的訪問和瀏覽模式,其訪問量表現出冪律衰退特點.Goncalves等[8]對用戶瀏覽網頁的日志做了一個基礎全面的實證分析,他認為線性優先連接,基于優先權的排隊以及用戶興趣的衰減是理解網頁瀏覽行為的關鍵.張寧[7]用復雜網絡的方法研究特定群體進行萬維網訪問的行為特征,得到了雖然群體用戶訪問萬維網的時間是隨機的,所訪問的網頁各有不同,但大部分人的興趣是一致的,群體興趣網絡的入度分布具有冪律特征,群體興趣圖譜基本穩定,校園群體上網行為具有特定的時間規律性.本文分別從時間間隔和事件間隔兩個層面上研究了某高校的網頁瀏覽日志的規律,群體用戶訪問網頁的時間間隔和事件間隔服從冪律分布,所有單個用戶的活躍性也服從冪律分布,而且不論是群體用戶行為還是單個用戶行為,時間間隔的冪指數大于事件間隔的冪指數.

1 數據來源與統計方法

研究的數據來自國內某高校局域網內師生訪問互聯網的記錄,時間跨度為半個月,從2009年11月26日凌晨0時開始到2009年12月09日凌晨23時59分59秒結束.

對于用戶瀏覽網頁的行為來說,最重要的問題是能否有效地判斷此過程是由人類發出的正常訪問過程.現實中很多因素可以引起頁面的發送請求,除了人類用戶的正常操作過程之外,還有如良性軟件和惡性軟件的自動更新過程,黑客的自動攻擊.大多數的自動更新過程都呈現出具有清晰頻率的規則動態;蓄意攻擊的特點是:它們會產生巨大的訪問量并且這些訪問量會集中在很小的一個時間段內爆發.毫無疑問,這些非正常訪問會在實證分析中影響統計結果的準確性.所以文中將使用統計事件間隔的方法來過濾掉統計研究中的非正常訪問過程,并且對比事件間隔和時間間隔的統計結果,由此對用戶瀏覽網頁的行為進行分析.

統計中定義事件間隔為連續兩次訪問同一網站期間訪問其它網站的次數n,相應的概率分布為P(n).時間間隔t為連續兩次訪問網頁的時間差,相應的概率分布為P(t).統計表明該高校在觀測期內一共訪問的主站數量為82 153個,平均每天的訪問用戶有2 631個,平均每天會發出1 510 381個訪問請求,較大的數據量足以反映真實的統計規律.

2 網頁瀏覽的行為分析

2.1 群體用戶訪問網頁的時間間隔分布和事件間隔分布

這里所說的群體用戶指的是將所有用戶看成一個整體,即在不對用戶的IP進行過濾的情況下,考察所有用戶瀏覽網頁的時間間隔和事件間隔分布.統計結果如圖1所示,該分布在雙對數坐標下呈現出冪函數的特點,冪指數分別為

從時間間隔方面來說,隨著生活節奏的加快,互聯網為人類的生活和學習帶來極大的便利,在日常生活和工作中人們常常需要頻繁地訪問互聯網,所以對于群體用戶來說,大多數的時間間隔都很短,只有晚上休息的時候才會有比較長的時間間隔,這種時間間隔的極度不均勻性造成了冪律分布的形成.從事件間隔方面來說,這里統計得到的事件個數實際上就是群體用戶訪問所有網站的個數.由于各種網站的功能不同,所以人們瀏覽各種網頁的概率也不同.如對自己感興趣的網站,一天可能要瀏覽多次,高頻率的訪問必然使得其間訪問其它網站的次數減少;而有些跟自己生活不相關的網站,可能很久才瀏覽一次.這種事件間隔的不均勻性也造成了冪律分布的形成.

2.2 所有單個用戶的活躍性分布

文獻[9]是眾多關于網絡應用研究中極具代表性的一項研究成果.筆者對某在線電影點播網站的歷史記錄進行了研究,提出了“活躍性a”概念,相應的概率分布為P(a).本文也對活躍性進行了實證研究,活躍性定義為用戶在一天中平均點擊的網頁數,用戶的平均活躍性

圖1 群體用戶訪問網頁的時間間隔分布及事件間隔分布Fig.1 The exponents of time interval and event intervals distributions of web-browsing behaviors based on collective aspects

盡管開始就預測活躍性本身存在著非平凡的分布,但從實證數據中觀察到的冪律關系還是讓人們感到意外.圖2給出了所有單個用戶的活躍性分布,冪指數為s=1.68,這與高校的實際生活中的經驗相符:多數的學生主要以學業為主,只是偶爾上網娛樂一下或者查閱資料;而少數的學生以搞科研為主,生活學習中離不開電腦,所以上網的活躍性必然比較大.

2.3 冪指數與活躍性的關系

為了挖掘活躍性在人類的網頁瀏覽模式中扮演的角色,將所有用戶按照其活躍程度遞增進行排序,然后將這些排序后的用戶分為20組,每個組包含幾乎相同數目的用戶.然后對這20組分別進行時間間隔統計和事件間隔統計,并且研究它們的冪指數和活躍性的關系后發現:所有的20組的時間間隔分布和事件間隔分布都滿足冪函數律,并且兩種統計方法中的冪指數各不相同;時間間隔和事件間隔的冪指數與活躍性都成正相關性.

圖2 所有單個用戶的活躍性分布Fig 2 The exponents of activity distributions of web-browsing behaviors based on all singles aspects

圖3(a)為時間間隔的冪指數與活躍性的關系,對其進行曲線擬合發現該分布服從冪律分布,擬合的冪律分布的函數為y=1.037x0.131,擬合指數R2=0.992;圖3(b)是事件間隔的冪指數與活躍性的關系,對其進行曲線擬合分析發現該擬合結果服從高斯分布,而不是時間間隔層面中的冪律分布,擬合的高斯分布函數為,擬合指數R2=0.992.

圖3 冪指數與活躍性的關系Fig.3 The relation between power-law exponent and activity

2.4 單個用戶冪指數分布

為了顧及到每個用戶瀏覽模式的冪指數的不同,本文研究了不同個體的瀏覽模式并發現單個用戶的時間間隔分布和事件間隔分布均服從冪律分布,其冪指數的個體人數c均服從高斯分布.平均冪指數分別是擬合的高斯分布函數分別為y=

從圖1中,不難發現群體用戶訪問網頁的時間間隔分布的冪指數大于事件間隔分布的冪指數,而在圖4中顯示,單個用戶時間間隔的冪指數分布的平均指數也大于單個用戶事件間隔的冪指數分布的平均指數,并且后者的分布比前者的也要集中.

圖4 單個用戶時間間隔和事件間隔的冪指數分布Fig.4 The time interval distribution is a power law with exponent following a Gaussian distribution,so as the event interval distribution

3 結 論

關于網頁瀏覽的人類行為分析已經有很多專家學者從不同角度進行了分析研究,本文是利用高校訪問互聯網的歷史記錄數據,從時間間隔和事件間隔兩個層面對群體用戶和單個用戶進行了分析.實證表明,群體用戶訪問網頁的時間間隔和事件間隔都服從冪律分布,所有單個用戶的活躍性也是服從冪律分布的,而且不論是群體用戶行為還是單個用戶行為,時間間隔的冪指數大于事件間隔的冪指數;時間間隔的冪指數與活躍性服從冪律分布,而事件間隔的冪指數與活躍性服從高斯分布;單個用戶時間間隔和事件間隔的冪指數都是服從高斯分布的.

互聯網的發展極大的促進了信息的交流和溝通,網頁瀏覽已經成為了人們了解社會動態的一種重要的途徑,因此,通過網頁瀏覽模式對人類行為規律的研究,在資源有限的條件下,通過最為恰當的方式,讓人人都公平地享有信息資源是非常有必要的.

致謝:感謝中國科技大學韓筱璞和上海理工大學樊超參與的有益討論.

[1] 汪秉宏,韓筱璞.人類行為的動力學與統計力學研究[J].物理,2010,39(1):28-37.

[2] 李楠楠,周濤,張寧.人類動力學基本概念與實證分析[J].復雜系統與復雜性科學,2008,5(2):15-24.

[3] Vazquez A.Impact of memory on human dynamics[J].Physica A,2007,373:747.

[4] Racz B,Lukacs A.High density compression of log files[DB/OL].[2009-11-10].http://csd12.computer.org/comp/pro2ceedings/dcc/2004/2082/00/20820557.pdf.

[5] Dezso Z,Almaas E,Lukacs A,et al.Dynamics of information access on the web[J].Physical Review E,2006,73(6):066132.

[6] 趙庚生,張寧.人類行為的動力學模型[M].香港:上海系統科學出版社,2008:47-53.

[7] 張寧.群體興趣網的統計特性研究[J].上海理工大學學報,2008,30(3):243-248.

[8] Goncalves B,Ramasco J J.Human dynamics revealed through Web analytics[J].Physical Review E,2008,78(2):026123.

[9] Zhou T,Kiet H A T,Kim B J,et al.Role of activity in human dynamics[J].Europhysics Letters,2008,82(2):28002.

[10] Henderson T,Nhatti S.Modeling user behavior in networked games[C]//Proc 9th ACM International Conference on Multimedia.New York:ACM Press,2001:212.

[11] Han X P,Zhou T,Wang B H.Modeling human dynamics with adaptive interest[J].New Journal of Physics,2008,10(7):073010.

猜你喜歡
人類用戶研究
FMS與YBT相關性的實證研究
人類能否一覺到未來?
遼代千人邑研究述論
人類第一殺手
好孩子畫報(2020年5期)2020-06-27 14:08:05
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
1100億個人類的清明
EMA伺服控制系統研究
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
主站蜘蛛池模板: 日韩精品亚洲精品第一页| 久久黄色毛片| 亚洲国产亚综合在线区| 国产不卡一级毛片视频| 国产精品分类视频分类一区| 青青草91视频| 亚洲Av综合日韩精品久久久| www.99在线观看| 国产理论精品| 日韩中文字幕亚洲无线码| 国产浮力第一页永久地址| 国产自无码视频在线观看| 亚洲精品男人天堂| 2020国产在线视精品在| 色噜噜狠狠色综合网图区| 波多野结衣在线se| 久久国产热| 国产精品一区二区在线播放| 91精品aⅴ无码中文字字幕蜜桃| 午夜福利免费视频| 凹凸国产分类在线观看| 国产精品偷伦视频免费观看国产| 成人免费黄色小视频| 91网址在线播放| 亚洲高清无码精品| 亚洲无码高清一区| 小说区 亚洲 自拍 另类| 成人日韩视频| 色悠久久久久久久综合网伊人| 中文国产成人精品久久一| 亚洲第一天堂无码专区| 久久网欧美| 91小视频版在线观看www| 国产成人毛片| 国产美女视频黄a视频全免费网站| 色香蕉影院| 国产99精品久久| 日韩人妻少妇一区二区| 一级不卡毛片| 97综合久久| 亚洲精品午夜无码电影网| 99精品久久精品| 在线另类稀缺国产呦| 人妻丰满熟妇αv无码| 91久久国产综合精品| 国产青榴视频| 国产免费黄| 国产无码制服丝袜| 亚洲欧美综合另类图片小说区| 色综合中文字幕| 国产精品原创不卡在线| 极品国产在线| 伊人婷婷色香五月综合缴缴情| 国产丰满成熟女性性满足视频| 性69交片免费看| 一级毛片免费的| 国产亚洲精品在天天在线麻豆| 毛片三级在线观看| www.youjizz.com久久| 波多野结衣爽到高潮漏水大喷| 国产亚洲精品自在久久不卡| 五月婷婷亚洲综合| 久久婷婷六月| 国产精品密蕾丝视频| 国产视频 第一页| 呦女亚洲一区精品| 丁香五月亚洲综合在线| 亚洲中文字幕23页在线| 国产精品亚洲天堂| 中文字幕在线日本| 亚洲午夜综合网| 免费黄色国产视频| 国产一区二区三区日韩精品| 亚洲欧洲日产国码无码av喷潮| 国产91视频观看| 国产成人精品高清不卡在线| 久久综合九色综合97婷婷| 97av视频在线观看| 最新国产网站| 久久精品电影| 夜精品a一区二区三区| 一区二区三区毛片无码|