999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于序列模式挖掘的社交網絡用戶行為分析

2013-01-01 00:00:00丁振國宋薇李婧
現代情報 2013年3期

〔摘 要〕針對SNS用戶行為存在序列性這個特點,文章提出了一種SNS用戶行為分析模型。模型以SNS群體用戶為研究對象,引入序列模式挖掘的方法實現用戶行為分析,最終獲得用戶的頻繁行為序列模式。文章應用實例對該模型進行了可行性驗證,并對未來研究進行展望。

〔關鍵詞〕社交網絡;社群發現;行為分析;序列模式

隨著在Web2.0技術的迅速發展,社交網絡備受關注,它為廣大用戶提供了一個交流平臺,通過這個社交平臺,用戶可以將現實交際網絡化,找到擁有相同興趣愛好的朋友圈。面對不同行業背景下涌現出的各種社交網絡,掌握用戶的興趣變化和行為趨勢能夠幫助商家制定商業策略,及時更換適合用戶的新產品,增強商業競爭力。對社交網絡用戶行為進行分析可以了解用戶的行為特點和興趣變化。目前關于社交網絡用戶行為的分析研究,主要集中在3個方面:(1)應用馬爾科夫鏈分析預測用戶行為。Sarukkai運用馬爾科夫鏈進行訪問路徑分析和鏈接預測,根據用戶訪問記錄,計算出網頁間的轉移概率,作為分析用戶行為的依據[1]。王實等提出了一種基于隱馬爾科夫模型的興趣遷移模式發現方法,通過分析用戶遷移模式間的關聯規則來發現用戶行為特征和興趣遷移變化[2]。(2)通過研究影響用戶行為變化的因素,分析用戶行為特征。Anagnostopoulos等通過研究社會影響力,找出了社交網絡用戶行為的變化原因,并在此基礎上分析用戶行為變化趨勢[3]。Goyal等人通過研究,解決如何從用戶的歷史記錄里學習影響的概率,并得到分析預測結果[4]。史學敏通過研究時區差異對社交網絡用戶行為的影響,發現社交網絡用戶行為呈現時區特性,以此建立了用戶行為模型[5]。(3)借助統計方法分析用戶行為。從統計學角度,對日志數據項進行簡單的統計分析,得到用戶訪問頻率高的網頁。目前絕大多數商用免費分析工具都屬于此類。由于用戶訪問狀態是動態時變的,采用固定階數的Markov鏈模型并不能準確地對用戶的訪問行為建模;而通過研究影響因素進行用戶行為分析,只考慮了外部環境變化對行為的影響,忽略了社交用戶行為本身所具有的特征,而這種內在特征對分析過程具有重要影響。在上述問題的基礎上,本文提出了采用序列模式挖掘的方法實現社交網絡用戶行為分析。把握社交網絡用戶行為呈現序列特征這一重要特點,應用序列模式挖掘方法提取用戶行為的頻繁序列,分析用戶行為特征。這種方法能夠有效地提取出用戶訪問的序列規則,使得分析結果更加準確,彌補其他分析方法的不足。

1 相關理論研究

1.1 社交網絡社交網絡源于英文SNS(SocialNetworkService),是指人和人之間通過興趣愛好、交易、人際脈絡等關系建立起來的社會網絡結構,它能夠反映真實的社會關系發展,并促進交往活動的形成,使得人們的活動與網站所提供的功能融為一體。社交網絡的構成要素有節點、關系和用戶群。節點是網絡中的個體,也稱社交網絡的參與者;關系是指節點與節點之間的連接,是參與者基于朋友關系或共同興趣建立起來的;用戶群是指在一部分節點為了某些共同目的而組成的群落,是關系的一種部分聚合體。一個社交網絡用戶隸屬于不同的用戶群,這些群落中的成員有些是該用戶在實際生活中的朋友,有些則互不相識,由于具有共同興趣和目的隸屬于同一群體,社交網絡結構如圖1所示。社交網絡使用戶拓展了交際,找到了更多交流對象。

圖1 社交網絡結構示意圖

2013年3月第33卷第3期現?代?情?報Journal of Modern InformationMar.,2013Vol.33 No.32013年3月第33卷第3期基于序列模式挖掘的社交網絡用戶行為分析Mar.,2013Vol.33 No.31.2 基于社交群體的用戶行為社交網絡的核心是“以人為本”,提供各種社交應用滿足用戶需求。目前社交網站提供的應用包括游戲、搜索、交友、郵件、聊天、電子商務等。用戶對諸多社交應用的使用稱之為社交網絡用戶行為,如圖2所示。

圖2 社交網絡用戶行為示意圖 在現實生活中,人們是以群體生活方式聚集在一起,人們之間的行為習慣相互影響、相互作用。虛擬世界中,用戶群是社交網絡的重要組成部分。群體代表了社交網絡中的社會活動,對群體的深入研究可以了解社交網絡中知識信息及其組織結構的發展狀況,也有利于商家準確地找到客戶。將社交網絡信息以群體的形式組織,為信息查詢分析提供了有效和便捷的途徑。所以本文以社交網絡群體為研究背景,通過獲得目標群體中用戶的行為記錄進行分析。

2 社交網絡用戶行為分析模型調查分析表明,用戶對社交網站的使用行為具有序列特征。比如,很多用戶在瀏覽視頻后會進行視頻評論或發表日志記錄心得,使用游戲功能的用戶會應用電子商務功能。用戶的這些行為反映了他們的需求和行為規律,使用戶行為產生明顯的序列特征。所以本文在結合SNS結構特征的基礎上,提出了基于序列模式挖掘[6-7]的社交網絡用戶行為分析模型,如圖3所示。該模型主要分為提取事務集、序列模式挖掘和模式分析3個模塊。其中,提取用戶事務集模塊是該模型的基礎,主要任務是選取與挖掘目標相關的社交網絡用戶行為信息,并對其進行數據預處理,生成供挖掘使用的行為事務集;序列模式挖掘模塊的主要任務是利用序列模式挖掘算法從用戶行為事務集中提煉出頻繁序列;模式分析模塊的任務是根據用戶的行為特點查找到與之匹配的頻繁序列,形成用戶偏好視圖,然后制定出合理的發展策略。

3 提取用戶事務集模塊提取事務集模塊分為兩個階段,數據采集和數據預處理。數據采集的任務是通過響應方式完成原始數據的獲取,而由于原始數據具有不完整和不規則特性,需要通過數據預處理對其進行清洗和處理,以便適用于之后的工作。

3.1 數據采集目前數據采集的主要途徑有兩個:(1)基于服務器日志的數據采集。服務器日志文件是圖3 SNS用戶行為分析模型圖

用來記錄web服務器活動的一種重要工具,主要通過Web服務日志文件中記錄的客戶端HTTP請求的相關信息,實現對用戶訪問行為數據的統計。服務器日志文件提供了詳細的客戶和服務器的交互活動日志。(2)客戶端數據采集方式。這種方法直接從客戶端獲得數據,能夠獲得大量的難以從服務器端獲得的用戶行為數據。可以利用JavaApplet技術、JavaScript技術和網頁跟蹤幀技術實現客戶端數據采集。以學校動漫社交網站為研究背景,選取該社交網站用戶在一個月中的行為數據進行分析,網站注冊人數為15300人,當月參與人數約為2150人。首先通過Web日志獲取用戶行為數據,共采集到6473條記錄。

3.2 數據預處理該階段的主要工作是根據不同的業務和需求,從海量原始數據中抽取所需要的數據,并對不完整的數據做相應的處理,以適應挖掘分析。它包括數據清洗、用戶識別、會話識別、事務識別等幾個步驟[8]。(1)數據清洗主要解決原始數據中出現的冗余信息,錯誤信息以及與分析不相關的用戶行為數據。由于機器故障、人工疏忽等導致記錄缺失和輸入錯誤,對于這些數據要進行刪除。序列模式挖掘的目的是獲得用戶行為的序列模式,對那些沒有顯示請求的文件并不關心,所以需要檢查URL后綴,刪除不相關數據。當用戶請求某一個網頁時,相關的圖片、視頻等信息會自動下載,并記錄在日志中,這些文件對研究的意義不大,所以要將其刪除。如果一個站點的主要內容是圖形信息,那么日志中的圖形文件就可能代表了用戶的顯示請求,所以面對這種情況時就不能刪除圖片文件。除了記錄刪減外,還要對屬性進行刪減。例如,我們關注的信息是:用戶使用了哪些應用功能,在網站及不同網頁的駐留時間長度,所以只需要保留與其相關的日志信息即可,而像用戶年齡、身份、登錄地點等不相關的屬性信息就可以刪除。(2)用戶識別是指識別出訪問網站的每一個用戶。不同的用戶可以在同一時間段內通過一個代理訪問Web服務器,同一個用戶也可能通過不同的機器,或不同的瀏覽器訪問Web服務器;而當不同用戶使用同一臺計算機瀏覽某一站點時也會造成混淆。為此,通常采用以下方法來識別用戶:①以IP地址為區分標識的匿名訪問者。②在用戶允許Cookie的情況下,以CookielD作為用戶表示。③提供注冊功能,通過用戶的注冊ID進行識別。(3)用戶會話[9]指的是用戶對服務器的一次有效訪問。根據用戶訪問的頁面可以獲得其在網站中的瀏覽行為和瀏覽興趣。日志中不同用戶訪問的頁面屬于不同的會話。可以通過設置一個時間跨度值將用戶的訪問記錄分成多個會話,如果用戶訪問頁面的時間差超過了這個值,則認為用戶開始了一個新的會話。會話識別的目的就是將用戶的訪問記錄分為單個的會話。(4)事務識別是在用戶會話對于某些挖掘算法而言粒度太粗的情況下進行,此時需要利用分割算法將它轉化為更小的事務,以適應于特定知識的發現。最常用的事務識別方法是最大向前引用路徑(MaximalForwardReferencePath)方法[10-11]。根據上述流程對采集的Web日志數據進

主站蜘蛛池模板: 国产成人精品一区二区| 57pao国产成视频免费播放| 国产成年女人特黄特色大片免费| 国产成人麻豆精品| 午夜福利无码一区二区| 美女无遮挡被啪啪到高潮免费| 无码人妻热线精品视频| 精品撒尿视频一区二区三区| 日韩精品少妇无码受不了| 久久综合色播五月男人的天堂| 国产精品太粉嫩高中在线观看| 99草精品视频| 久久福利网| 亚洲精品另类| 97国产一区二区精品久久呦| 又污又黄又无遮挡网站| 国产精品国产三级国产专业不| 国产一区在线视频观看| 亚洲人成网站色7777| 久久不卡国产精品无码| 亚洲无码免费黄色网址| 91精品人妻互换| 国产91视频免费观看| 亚洲 欧美 中文 AⅤ在线视频| 九色在线观看视频| 高清欧美性猛交XXXX黑人猛交 | 国产精品久久久久久影院| 中文字幕在线免费看| 欧美一级在线| 无码电影在线观看| 国产91在线免费视频| 亚洲成人www| 色国产视频| 自偷自拍三级全三级视频| 中文字幕人妻无码系列第三区| 欧美曰批视频免费播放免费| 老司机午夜精品网站在线观看| 久久久久国产精品嫩草影院| 女人18毛片一级毛片在线| 国产日韩欧美一区二区三区在线| 91亚洲精品国产自在现线| 幺女国产一级毛片| 亚洲中文字幕23页在线| 色吊丝av中文字幕| 中文字幕在线不卡视频| 白浆视频在线观看| 国产女人在线视频| 91小视频在线观看免费版高清 | 国产在线观看人成激情视频| 超碰免费91| 毛片久久久| 国产免费羞羞视频| 欧美无专区| 久久香蕉国产线| 婷婷色中文网| 中文字幕av无码不卡免费 | 日韩美一区二区| 国产精选自拍| 扒开粉嫩的小缝隙喷白浆视频| 99在线视频精品| 亚洲精品爱草草视频在线| 亚洲国产理论片在线播放| 欧洲日本亚洲中文字幕| 91精品国产91久无码网站| 久久精品这里只有精99品| 91久久国产综合精品女同我| 中文字幕在线欧美| 无码啪啪精品天堂浪潮av| 国产无码精品在线播放| 欧美日韩亚洲国产主播第一区| 成人欧美在线观看| 欧美成人免费一区在线播放| 中文字幕在线观看日本| 久久semm亚洲国产| 波多野结衣一区二区三视频| 另类综合视频| 婷婷六月在线| 在线精品视频成人网| 成人福利一区二区视频在线| 成人福利在线观看| 在线精品视频成人网| 国产h视频在线观看视频|