999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于手機通話網絡的人類交互行為分析

2018-05-09 08:50:07張錫哲申毓佩陳恩紅
計算機與生活 2018年5期
關鍵詞:用戶

李 凱,張錫哲,申毓佩,陳恩紅

1.中國科學技術大學 計算機科學與技術學院,合肥 230022

2.大數據分析與應用安徽省重點實驗室,合肥 230022

3.東北大學 計算機科學與工程學院,沈陽 110819

1 引言

對人類自身行為特性的研究吸引了心理學、社會學、人類學、物理學、計算機等各個學科的共同關注。在現代社會中,人的行為特性與許多實際問題息息相關,如網絡或街區零售業改進倉儲和服務設置,交通部門模擬交通流量的模式或事故發生頻率,以及通信運營商估計移動通信中占線的電話數量并優化資源配置等。

傳統上,在研究這些涉及人類行為特性問題時,常常把人的行為簡化為可以使用泊松過程描述的穩態隨機過程。這種假設的一個推論是人類行為的時間統計特征是較為均勻的,兩個相繼行為之間的時間間隔偏離其平均值很多的概率很小。但是,Barabási在2005年的工作[1]改變了傳統認識,其結果顯示人類行為具有冪率特性:密集的活動出現在很長時間的空白之間。

隨后的一系列研究結果顯示冪率特性在人類的各種行為中廣泛存在,如電子郵件[1]、商業交易[2]、書信往來[3-4]、生活旅行[5]、發送短信[6]、網頁瀏覽[7-8]、在線協作[9]等,甚至多種動物的覓食行為也符合這種規律[10]。

同時,針對移動通信數據的研究也取得了一定的成果。文獻[11]聚焦在個體和群體的手機通信行為模式,手機通信網絡的其他特性也得到了關注,如鏈接強度與網絡結構的關系[12],網絡結構與鏈接的持久性之間的關系[13],手機通信數據觀測到的朋友關系與自我報告結果的差異[14]等。

在移動通信用戶行為模式研究方面,現有工作仍然有限。本文提出了多重時變通信網絡概念,并采用相應方法對更大規模數據集進行分析。

本文的主要貢獻如下:

(1)提出一種能夠表達移動網絡用戶通信結構和時間屬性的圖結構:多重時變通信網絡。

(2)基于多重時變通信網絡,對移動通信數據進行了分析,揭示了其中蘊含的人類行為學特性。其中對群體通話時長、個體行為與聯系人數量關系等內容的分析在其他工作中未見報告。

2 相關工作

移動通信在現代社會生活中具有舉足輕重的地位,相應地,研究手機通信的網絡特性和人類行為特性對認識社會網絡和人類自身都有著重要意義。但是由于數據的高度敏感性,導致數據獲取難度極大,相關工作總體上比較有限。

文獻[12]使用一個包含460萬用戶、覆蓋廣大區域(society-wide)的手機通信網絡,來研究用戶相互作用強度與網絡的局部結構之間的耦合,觀察到了與直覺相反的結果。值得注意的是,其報告的網絡度分布冪率的指數為8.6,異于通常值。

文獻[11]使用一組相鄰基站(不少于160個)的呼叫數據分析個體和群體的行為模式。結果顯示基站呼叫量隨時間而波動,這顯然與作息時間有關;以周為單位的統計結果顯示一般情況下周呼叫的波動較小,而當出現異常事件時則存在明顯的偏差,采用滲流理論描述了這種異常事件導致的偏差。在按照電話使用量對用戶分組的基礎上,考察了不同組別用戶的呼叫間隔,結果顯示間隔分布是無標度的。

本文提出一種多重時變通信網絡結構,基于此在一個比以往工作規模更大的手機通信數據集上,考察個體和群體的行為特性。

3 時變通信網絡

本文主要介紹多重時變通信網絡的概念。

首先在動態時變網絡[15]的基礎上給出多重時變通信網絡的定義。

定義1(動態時變網絡)將開始時刻記作t0,動態網絡G=<G1,G2,…,GT>是在時間上有序的圖集,其中Gt=(Vt,Et)是從t0時刻到t時刻的網絡拓撲圖,Vt和Et分別表示此時間段的圖頂點集和邊集。

本文研究內容不僅包括通常的網絡統計特性,如度分布,而且涉及了通信交互行為更加具體的特性,如通話時長。方便起見,下面擴展動態時變網絡為加權網絡。

定義2(多重時變通信網絡)將開始時刻記作t0,一個多重時變通信網絡MTG=<MTG1,MTG2,…,MTGT>為在時間上有序的圖集,其中MTGt=(MTVt,MTEt,MTWt)表示從t0時刻到t時刻的網絡拓撲圖,MTVt和MTEt分別表示此時段網絡圖的頂點集和邊集,MTWt表示邊權值的集合。

上面定義中的節點(MTV)代表電話號碼,節點與節點之間的連邊(MTE)代表通話記錄,權值(MTW)為通話時長。

多重時變通信網絡(MTG)是一種節點和邊都隨著時間改變而不斷變化的網絡,在網絡所界定的時間段內,某對用戶之間的通話次數即為其所對應節點之間的邊的條數,而邊的權值則是通話的持續時間。需要強調的是,只有當通話開始時刻和通話結束時刻都在網絡所界定的時間段之內時,才會添加這條邊到網絡中,否則這條邊將不會存在。

圖1給出了一個多重時變通信網絡的示例,圖中顯示了從t0時刻到t時刻的網絡狀態,其中t1到t30的時間點都在區間[t0,t]內。顯然,圖中多重時變通信網絡完整地展現了該時間段內各個用戶的通話行為。例如節點4和節點9有兩次通話記錄,第一次通話從時刻t7到t8,第二次通話從時刻t9到t10;同樣可見節點3在此時間段與3個不同聯系人進行了3次通話。

4 手機通信數據集

4.1 數據基本情況

本文的研究基于某通信公司所提供的兩個省級行政區域31天的通信記錄。其中,A省數據包含6千多萬用戶,接近8億條電話記錄;B省數據包含1億多用戶,超過18億條電話記錄。需要指出的是,這里所說的用戶是指電話號碼,而非具體的人。

多重時變通信網絡最重要的特點是能夠保留用戶完整的通信行為,因此在構建網絡之時,需要用戶完整通信行為的數據。數據應至少包含有撥打電話用戶、被打電話用戶、通話開始時間、通話結束時間等信息。

Fig.1 An example of multiple timestamp communication network圖1 多重時變通信網絡示例

4.2 數據預處理

(1)部分記錄的號碼值為空,經過向運營商確認,知其為經過技術偽裝的呼叫,多屬于詐騙電話,此部分數據做刪除處理。

(2)為保證單個用戶通話行為的完整性,需要號碼之間屬于同省同網的通信記錄。同省是指主叫號碼和被叫號碼都屬于同一個省份,同網是指主叫號碼和被叫號碼都是同一個通信公司的網段,例如彼此通話的用戶電話號碼都屬于聯通公司。保證用戶之間為同網的通信是因為數據來自某公司,只取通話雙方都是該公司的記錄,以保證一段時間內用戶通話行為的完整性。

5 通信行為分析

本文將在展示網絡總體屬性的基礎上,從整體和個體兩方面分析多重時變通信網絡的拓撲結構,從而揭示群體和個體的手機通信行為特性。特別的,當對兩省數據的分析呈現相同的結果時,將只報告其中一個。

5.1 網絡總體屬性

本文節點的度定義為與該節點相連的邊的數目,于是網絡節點度的總和除以2即為網絡表征的總的通話次數。

網絡的度分布體現了通話次數的分布,即通話次數與對應的用戶數量之間的關系。圖2給出了B省31天多重時變通信網絡的度分布。

Fig.2 Distribution of network degrees圖2 網絡度分布

由圖2可見,度分布服從冪律分布,冪指數為2.397,介于[2,3]之間,與一般認識大體一致。通話次數特別多的用戶只有為數不多的幾個,絕大多數用戶的通話量并不大。圖3的聯系人分布與度分布大體一致。這一結果表明大多數人的通話量和聯系人多少情況可以通過度分布顯示出來,二者大體呈現正比關系。

Fig.3 Distribution of contact persons圖3 聯系人分布

5.2 整體行為分析

為了挖掘手機通信的總體規律,從而刻畫大多數人的通話行為,下面將對網絡度之和與平均度演化進行分析,觀察通話量、平均通話量隨時間變化的趨勢,以及總體的通話時長與通話時間間隔。

5.2.1 度演化分析

采用A、B兩省數據分別構建的通信網絡,結果表明二者31天的度之和隨時間變化趨勢大體一致,而且此項指標的波動與工作日和節假日沒有明顯關聯。因此,圖4僅呈現B省某3天的網絡度之和演化過程。其中橫坐標為日期序號,次級網格劃分為一天中的24小時,縱坐標為網絡度總和。

Fig.4 Sum of network degrees changes with time圖4 網絡度之和隨時間變化

由圖4可見,上午9:00到下午6:00為通話的高峰區間,期間通話量大,并且早晨通話量上升的速度明顯高于傍晚通話量下降的速度,這一變化規律與正常社會生活中人們一般的作息規律及工作、交往規律相符(因工作性質不同,人們多在早上8點或9點快速進入工作狀態,而下午下班的17點、18點則對應一個個體交流的高峰),白天相對夜間、工作時間相對非工作時間,前者通話量遠高于后者。

對照文獻[11]的結果,發現曲線形狀大體相同,如每天有兩個通信量的高峰,高峰所處時間大體一致,二者之間大約在14點附近有一個相對低值。但區別也很明顯,如0點時候文獻[11]結果的通信量值要高于本文結果,而本文結果每天通話量最低值到來的時間要早于文獻[11]的結果。這表明不同地區人們生活規律既相似又存在差別,文獻[11]數據來源區域人們的夜間活動要強于本文數據來源區域。

考察A、B兩省31天的通話網絡平均度的演化過程,即平均每個人的通話量隨時間變化情況。與圖4的處理方式對應,取B省3天時間的變化情況作為示意,結果如圖5所示。

Fig.5 Average degree of network changes with time圖5 網絡平均度隨時間變化

與圖4的分布情況相反,單個用戶白天的平均通話量相對較少,而晚上的平均通話量則較多。對這種情況,可以通過一個猜想進行解釋:白天的工作時間多為上下級之間的溝通,局部拓撲呈現星型結構,于是每個用戶的平均通話量較少;晚上個人時間多為平等交流,圖中邊的出現近于隨機,整體通話量不如工作時間多,但參與人數更少,于是每個用戶的平均通話量反倒比白天多。

5.2.2 通話時間間隔分析

在B省31天的多重時變通信網絡中,考察通話時間間隔,即每個用戶的每次通話結束時刻與相鄰的下次通話開始時刻時間差,記作TI(單位:min),TI的分布如圖6。

Fig.6 Distribution of the number ofTI圖6 通話時間間隔頻次分布

由圖6可見,此分布近似于冪律分布,下文還會多次出現這種近似于冪率的分布。造成這種表象的原因是多個分布的疊加,眾多個體單獨的活動符合冪率分布,但參數彼此不同,大量此種參數不同的冪率分布相疊加,于是產生此種外在表象。

5.2.3 通話時長分析

在B省31天的多重時變通信網絡中,記通話時長(即邊的權值)為TT(單位:s),圖7展示了TT分布的情況。顯而易見,這仍是一種近似的冪率分布,大量的通話時長位于60~120 s之間,通話時長較短,且通話時長較長的次數相對較少,這與實際生活經驗相一致。

Fig.7 Distribution of the number ofTT圖7 通話時長頻次分布

在對通話量進行分析的過程中,發現雖然工作日和節假日的分布規律大體一致,但通話量在工作時間與休息時間的分布卻存在明顯不同,圖8展示了不同類型時段的通話時長分布情況。

由圖8可見,4種不同類型時間段的通話時長分布均近似服從冪律分布,由此可以確定個人的一般通話情況:在大多數情況下,通話持續時間很短,只有個別時候才會出現持續時間相對較長的通話。然而,4幅圖中的縱坐標差異很大,工作日的通話量明顯高于非工作日的,這顯示在節假日多數人更愿意享受一段相對安靜的時光;與此同時,工作時間的通話量也比非工作時間高出很多,這再次驗證了前文結論。

此外,圖8(c)、(d)顯示,工作時間的通話次數多,但持續時間較長的卻不多,而休息時間的通話次數少,但持續時間較長的相對較多,這也符合人們在日常生活中參與社交活動的慣性規律,即工作時間電話傾向于追求效率,而休息時間電話交流則傾向于表達情感。

總體而言,圖8的結果符合日常生活中關于電話行為的直覺感受。

5.3 個體通話行為分析

著名的“150定律”認為人類智力允許個體擁有的穩定社交關系數為150左右。當然在通信網絡中,一段時間內某人的聯系人并不能夠表明彼此間存在穩定的社交關系,但是此定律可以作為選定研究對象的一個參考。另外根據圖3聯系人分布情況,本文選擇3個具有代表性的個體分別表示社會交往中的3類人:聯系人很少的個體1(10個)、聯系人中等的個體2(150個)和聯系人很多的個體3(372個)。

Fig.8 Distribution of the number ofTTat different time圖8 不同時間的通話時長頻次分布

Fig.9 Average degree of different users changes with time圖9 不同個體用戶平均度隨時間變化情況

5.3.1 個體用戶平均度演化

單個用戶個體的平均度演變過程也就是該用戶的通話量隨著時間的變化情況,如圖9所示,總體看來用戶的聯系人越多其通話量也越多。

5.3.2 個體用戶通話時長

Fig.10 Distribution of the number ofTTabout user1圖10 用戶1通話時長頻次分布

圖10 ~圖12為個體用戶1、2、3的通話時長分布,其中橫坐標為通話時長TT(單位:s),縱坐標為通話時長的頻次。

十分明顯,用戶的聯系人越多相應通話次數也越多,通話時間長度的跨度也越大。由此可以猜測:聯系人很少的用戶不善社交,有限的通話基本是有事說事;聯系人很多的用戶顯示長袖善舞的特性,維護著豐富多樣的社交關系。

Fig.11 Distribution of the number ofTTabout user2圖11 用戶2通話時長頻次分布

Fig.12 Distribution of the number ofTTabout user3圖12 用戶3通話時長頻次分布

Fig.13 Distribution of the number ofTIof different users圖13 不同個體用戶通話時間間隔頻次分布

5.3.3 個體用戶通話時間間隔分布

圖13 為個體用戶1、2、3通話時間間隔的分布,其中橫坐標為通話時間間隔TI(單位:s),縱坐標為通話時間間隔的頻次。聯系人多的用戶因其通話量多,通話間隔就越短,這與日常經驗一致。

6 總結

本文首先提出了多重時變通信網絡模型,在給出多重時變通信網絡概念的基礎上,針對手機通話記錄,分別從整體和個體兩個角度來對多重時變通信網絡的拓撲特征進行分析研究,揭示了多種群體和個體手機通話行為特性。移動通信網絡作為一種社交網絡,本文結果對于社會網絡的結構分析和人類行為動力學研究都具有重要參考價值。

[1]Barabási A L.The origin of bursts and heavy tails in human dynamics[J].Nature,2005,435(7039):207-211.

[2]Vázquez A,Oliveira J G,Dezs? Z,et al.Modeling bursts and heavytails in human dynamics[J].Physical Review E,2006,73(3):036127.

[3]Oliveira J G,Barabási A L.Human dynamics:Darwin and Einstein correspondence patterns[J].Nature,437(7063):1251-1253.

[4]Li Nannan,Zhang Ning,Zhou Tao.Empirical analysis on temporal statistics on human correspondence patterns[J].Complex Systems and Complexity Science,2008,5(3):43-47.

[5]Brockmann D,Hufnagel L,Geisel T.The scaling laws of human travel[J].Nature,2006,439(7075):462-465.

[6]Hong Wei,Han Xiaopu,Zhou Tao,et al.Heavy-tailed statistics in short-message communication[J].Chinese Physics Letters,2009,26(2):028902.

[7]Dezso Z,Almaas E,Lukacs A,et al.Dynamics of information access on the Web[J].Physical Review E,2006,73(6):066132.

[8]Zhao Gengsheng,Zhang Ning,Zhou Tao.Study on scaling behavior in webpage visiting[J].Statistics and Decision,2009(1):18-19.

[9]Zha Yilong,Zhou Tao,Zhou Changsong.Unfolding large-scale online collaborative human dynamics[J].Proceedings of the National Academy of Sciences,2016,113(51):14627-14632.

[10]Barabasi A L.Bursts:the hidden pattern behind everything we do[M].Ma Hui.Beijing:China Renmin University Press,2012.

[11]Candia J,González M C,Wang Pu,et al.Uncovering individual and collective human dynamics from mobile phone records[J].Journal of Physics A:Mathematical and Theoretical,2008,41(22):224015.

[12]Onnela J P,Saram?ki J,Hyv?nen J,et al.Structure and tie strengths in mobile communication networks[J].Proceedings of the National Academy of Sciences,2007,104(18):7332-7336.

[13]Hidalgo C A,Rodriguez-Sickert C.The dynamics of a mobile phone network[J].Physica A:Statistical Mechanics and ItsApplications,2008,387(12):3017-3024.

[14]Eagle N,Pentland A S,Lazer D.Inferring friendship network structure by using mobile phone data[J].Proceedings of the National Academy of Sciences,2009,106(36):15274-15278.

[15]Gao Lin,Yang Jianye,Qin Guimin.Methods for pattern mining in dynamic networks and applications[J].Journal of Software,2013,24(9):2042-2061.

附中文參考文獻:

[4]李楠楠,張寧,周濤.人類通信模式中基于時間統計的實證研究[J].復雜系統與復雜性科學,2008,5(3):43-47.

[8]趙庚升,張寧,周濤.網頁瀏覽中的標度行為研究[J].統計與決策,2009(1):18-19.

[10]BarabasiAL.爆發[M].馬慧,譯.北京:中國人民大學出版社,2012.

[15]高琳,楊建業,覃桂敏.動態網絡模式挖掘方法及其應用[J].軟件學報,2013,24(9):2042-2061.

猜你喜歡
用戶
雅閣國內用戶交付突破300萬輛
車主之友(2022年4期)2022-08-27 00:58:26
您撥打的用戶已戀愛,請稍后再哭
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年5期)2016-11-28 09:55:15
兩新黨建新媒體用戶與全網新媒體用戶之間有何差別
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
挖掘用戶需求尖端科技應用
Camera360:拍出5億用戶
創業家(2015年10期)2015-02-27 07:55:08
100萬用戶
創業家(2015年10期)2015-02-27 07:54:39
主站蜘蛛池模板: 久久久久亚洲Av片无码观看| 国产人人干| 综合人妻久久一区二区精品| 亚洲男人的天堂视频| 国产精品部在线观看| 色爽网免费视频| 无码中文字幕精品推荐| 欧美日韩一区二区在线播放| 亚洲视频免费在线看| 青青青草国产| 亚洲最黄视频| 污视频日本| 丰满少妇αⅴ无码区| аv天堂最新中文在线| 国产v欧美v日韩v综合精品| 国产精品视频观看裸模| 日韩黄色大片免费看| 亚洲国产精品无码久久一线| 91欧美亚洲国产五月天| 欧美自拍另类欧美综合图区| 国产特级毛片aaaaaaa高清| 国产精品极品美女自在线网站| 国产区福利小视频在线观看尤物| 中文字幕在线观看日本| 老司机久久99久久精品播放| 午夜无码一区二区三区在线app| 四虎免费视频网站| 在线免费观看a视频| 日韩AV手机在线观看蜜芽| 亚洲精品视频免费| 在线看国产精品| 啦啦啦网站在线观看a毛片| 中文无码毛片又爽又刺激| 熟女成人国产精品视频| 亚洲精品黄| 成人国产精品视频频| 一级毛片视频免费| 成人a免费α片在线视频网站| 国产夜色视频| a色毛片免费视频| 成人午夜视频网站| 99999久久久久久亚洲| 男人的天堂久久精品激情| 久久国产免费观看| 欧美成人午夜在线全部免费| 色综合热无码热国产| 国产亚洲欧美在线专区| 亚洲一区波多野结衣二区三区| 国产簧片免费在线播放| 午夜不卡视频| 欧美三級片黃色三級片黃色1| 青青久久91| 国模沟沟一区二区三区| a毛片在线免费观看| 久久国产拍爱| 国产SUV精品一区二区6| 国产精品va| 久久黄色一级视频| 成人国产一区二区三区| 国产成人a在线观看视频| 激情无码字幕综合| 91精品伊人久久大香线蕉| 亚洲天堂免费| 亚洲国产成人超福利久久精品| 456亚洲人成高清在线| 乱人伦视频中文字幕在线| 98精品全国免费观看视频| 中国一级特黄大片在线观看| 无码中文字幕加勒比高清| 日韩二区三区无| 狠狠色噜噜狠狠狠狠色综合久| 欧美成人手机在线观看网址| 精品久久久久久久久久久| 国产日韩久久久久无码精品| 久久亚洲综合伊人| 国产91av在线| 国产自视频| 日本爱爱精品一区二区| 欧美成人怡春院在线激情| 国产另类视频| 欧美成人第一页| 亚洲视频在线青青|