999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于情感和網絡分析的社交網絡用戶人格預測

2016-03-02 08:47:00楊潔李繼云姜霖霖
智能計算機與應用 2016年1期

楊潔 李繼云 姜霖霖

摘要:人格是對人類之間不同個體特征的高度概括,與人類的行為密切相關。人們在社交網絡中的行為同樣受到人格的影響,了解社交網絡用戶的人格對于推薦系統和個性化廣告都有很大的價值。已有的關于社交網絡用戶人格的研究大多僅使用用戶數據的統計特征,沒有反映用戶數據的內在特征。本文提出一種新的社交網絡用戶人格預測方法,通過綜合考慮用戶的情感及用戶網絡分析特征預測用戶人格類型, 并通過Facebook用戶數據分析實驗驗證了方法對提高人格預測準確率的有效性。

關鍵詞:社交網絡;情感分析;網絡分析;人格預測

中圖分類號:TP305文獻標識碼:A 文章編號:2095-2163(2016)01-

Abstract : Personality can be defined as a set of characteristics which make a person unique. Peoples behavior is closely related to personality. Personality affects individuals behavior in social networking sites as well as in the offline world. Gaining insight in an individuals personality can be very valuable for recommender system and personalized advertising. Most of previous studies on the personality of social network users only focus on the statistical characteristics, which cannot reflect the inner properties of user. This paper proposes a new method to predicting personality based on sentiment analysis and network analysis. The validity of the method to improving the precision of prediction is verified by the experiment on Facebook data.

Keywords :Social Network; Sentiment Analysis; Network Analysis; Personality Predicting

0 引 言

近年來,社交網絡(如Twitter、Facebook、新浪微博等)迅速發展,給人們的日常交流溝通方式帶來了新的變革,這類線上社交模式已經成為了人們日常社交的一部分。社交網絡給人們提供了一個展現自我、發表觀點、聯絡朋友的平臺。社交網絡既是人們在現實世界中的社交關系的延伸,同時也會對人們現實生活的社交產生影響。

在社交網絡中比較有代表性的是Facebook。Facebook始創立于2004年,在2012年注冊用戶已經突破十億大關。同時Facebook也是全球活躍用戶最多的社交網絡。由于在社交網絡中用戶的行為和狀態容易獲取和分析,近年對社交網絡用戶的研究正逐漸增多,其中關于用戶人格方面的研究占據了重要的部分。

人格是人類的不同個體特征的高度概括,即使在同樣的環境中,不同的人也會表現出不同的行為,這源自于每個人不同的人格。人格心理學是心理學的分支之一,主要是通過人們外在的行為來區分人們的內在特質,并研究相互之間的關聯[1]。心理學上通常使用人格特征來定義人們的性格,解釋用戶的行為和偏好[2]。常用的人格模型有MBIT(Myers Briggs Type Indicator)和大五人格模型(Big-Five Model)。

人格與人類的行為息息相關。人格心理學研究已經表明,可以通過人格問卷來預測人們生活中很多方面的行為,比如上班是否準時、工作表現以及音樂偏好等等[3,4]。人格同時也影響著人們的商品選擇及購買習慣。社交網絡是人們日常社交的一部分,人們在社交網絡上的行為狀態與現實世界的行為一樣,都與個人的人格有密切關聯[5]。把人格心理學的研究與社交網絡分析相結合,通過社交網絡用戶的行為狀態等數據對用戶的人格進行分析和預測,對于推薦系統、個性化廣告、用戶心理預警等方面都有著巨大的價值[6]。

目前對社交網絡用戶人格分析預測的研究主要對用戶行為狀態數據進行統計學分析,這種方式忽略了用戶行為的內在特征。本文提出一種新的社交網絡人格預測方法,對Facebook用戶發布的文本狀態進行情感分析,分析用戶的情感狀態及其變化。同時對用戶在Facebook使用過程中建立的用戶網絡進行分析,分析用戶網絡的特征以及用戶在網絡中的狀態及位置。在情感分析和網絡分析的基礎上,分析人格特征和用戶行為的關聯,并實現對用戶人格特征的預測。

1 相關研究

大五人格模型是人格心理學中使用最為廣泛的人格模型之一,具體將人格劃分為五個維度:開放性(Openness to Experience)、嚴謹性(Conscientiousness)、外向性(Extraversion)、宜人性(Agreeableness)和神經質(Neuroticism)。開放性表現為富于想象力和審美能力、對新事物好奇等;嚴謹性表現為自律、有組織性、有計劃等;外向性表現為好交際、愛娛樂、感情豐富等;宜人性表現為樂于助人、富于合作精神和同情心等;神經質表現為焦慮、不安全感、脆弱等。

早期部分研究分析了人格特征和網絡應用之間的關聯。Vazire和Gosling等人使用個人網站的內容對個人的人格進行評估[7]。Gill等人通過郵件對人格進行判定[8]。Rosen等人通過研究社交網絡的用戶發現外向性和嚴謹性和用戶在使用社交網絡過程中感到放松的程度呈正相關[9]。

Ross等人研究了大五人格與社交網絡行為之間的關聯[10]。實驗采用97個用戶的樣本,驗證了外向性和組成員個數密切相關。研究在收集社交網絡用戶數據時采用用戶自我報告的方式。這種方式存在一定的不足之處。首先,自我報告可能由于用戶的主觀影響而存在數據上的不可靠性。其次,這種方法需要人工對用戶的數據進行統計,存在效率低下的問題,不適用于大量樣本的研究。

Gosling等人在Facebook上進行了兩項實驗,對Facebook用戶的行為和人格特征之間的關聯進行分析[11]。第一個實驗采用傳統的用戶自我報告的方式,第二個實驗采用直接觀察用戶數據的方式,去除了用戶主觀性的影響。但是,這種方式仍然通過人工完成,效率較低。同時,實驗中所使用的用戶社交網絡行為特征,比如用戶每周在Facebook上花費的時間、照片數量等,都是基于數據統計,并沒有用戶內在特征的分析。

Golbeck等人開發了一個Facebook社交網絡的應用程序[12]。該應用程序包含兩個功能:邀請Facebook用戶參與大五人格測試、在用戶授權的情況下收集用戶的公開信息(自我介紹、發布的狀態、照片等)。該應用程序實現了實驗數據的自動化采集,提高了實驗效率,同時也去除了用戶主觀性對數據的影響。實驗采用了兩種機器學習算法(M5 Rules和高斯過程)來對用戶的人格進行預測。不足之處在于實驗中所使用的用戶社交網絡行為特征,例如通過LIWC(Linguistic Inquiry and Word Count)工具提取的用戶的語言特征,仍然是基于對用戶使用的文字進行數據統計,沒有進行深入的分析。同時,研究中考慮的用戶網絡密度不能反映出該用戶在社交網絡中的地位和重要程度。

國內關于人格預測方面的研究相比國外起步較晚。新浪微博是中國使用最為廣泛的社交網絡之一。Wang Lingyu等人分析了新浪微博用戶的行為和人格之間的關聯[13]。Bai Shuotian、Yuan Sha等人對新浪微博進行用戶人格分析和預測[14]。實驗采用應用程序的方式實現用戶大五人格測試以及用戶數據的自動化收集。除了用戶基本信息以及用戶使用行為的統計數據外,實驗還收集了用戶安全設置方面的信息,分析其與用戶人格之間的關聯并對微博用戶的人格進行預測。張磊等人對人格分析和預測的相關研究進行了綜述,指出了研究中面臨的挑戰以及未來的前景[15]。

在已有研究的基礎上,本文提出了新的社交網絡用戶人格預測方法,采用自動化收集的用戶數據,并對用戶的行為數據進行深入分析,對Facebook用戶在使用過程中發布的文本狀態進行情感分析,同時對用戶網絡進行分析,獲取用戶行為的內在特征,結合這些特征分析其與用戶人格特征之間的關聯并實現對用戶人格的預測。

2 實驗方法

本文進行社交網絡用戶人格預測方法時采用的數據來自Facebook應用程序自動化收集,在用戶數據方面除去了用戶主觀性的影響,通過大五人格問卷獲得用戶的人格特征。對用戶數據進行情感分析和網絡分析,形成用戶的特征向量。數據流程如圖1所示。

2.1 情感分析

Facebook用戶發布的狀態和Twitter類似,是用戶發布的文字等信息。通常這類信息都與用戶的日常生活及思想有關。Yoram Bachrach 等人在研究中考慮了用戶發布狀態的個數[16]。部分研究結合Facebook用戶的“About Me ”和“blurb”中的文字,結合用戶發布的狀態,把所有的文字視為一個字符串,使用LIWC(Linguistic Inquiry and Word Count)工具提取用戶在文字中使用不同類型文字的統計特征[12;17]。這些研究僅僅考慮了用戶發布狀態和使用的文字中的統計學特征。

用戶發布狀態內容包含的情感狀態和現實中人們的情緒狀態類似,和用戶的人格息息相關。本文將用戶發布的每個狀態視為單獨的一篇文章,對每個狀態進行情感分析。情感分析是對自然語言定量分析的處理過程,提取主觀信息,旨在識別出意見、情感和評估的極性是積極還是消極。本文結合斯坦福自然語言處理組織提出深度學習情感分析模型[18],給每個單詞賦予積極的或消極的情感得分,在分析單詞的情感得分的基礎上,結合語法結構,考慮到單詞組成的含義,最終求出文本的情感總分。

本文將Facebook用戶發布狀態的情感分為五類:非常積極(very positive)、積極(positive)、中立(neutral)、消極(negative)、非常消極(very negative)。在情感分析的基礎上,從每個用戶的狀態中提取22項特征,如表1所示。

2.2 網絡分析

用戶網絡即用戶在使用社交網絡平臺的過程中建立的網絡關系,包含用戶和所有關聯用戶、以及這些用戶之間關聯的網絡[19]。不同人格的用戶建立的網絡有不同的特征,通過網絡分析可以深入反映個人的社交行為方面的特質,幫助評估人格。已有的關于用戶網絡和用戶人格的分析通常僅考慮了網絡大小,并沒有反映出用戶網絡的內在特征。本文對用戶網絡進行更深層次的分析,分析用戶網絡的特征以及用戶在網絡中所占的位置和重要性。

矩陣G表示用戶網絡,每個結點代表一個用戶,矩陣中的元素yij的值表示用戶i和用戶j之間關聯與否。如果用戶i和用戶j之間有關聯(即結點i與結點j之間有邊),則yij的值為1,否則值為0。N表示網絡中所有結點個數。Gjk表示用戶j和用戶k之間的最短路徑條數。Gjk(i)表示用戶j和用戶k之間所有最短路徑中經過用戶i的最短路徑條數。

本文考慮用戶網絡的以下6個特征。

(1)網絡大小(Network size)。網絡中所包括的人數,即結點總數。

(2)網絡密度(Density)。

3 實驗

3.1 實驗準備

本文實驗環境為Intel Core i5-2400 3.10GHz CPU、4G內存、500G硬盤的PC機,操作系統為Windows 7系統。本文采用的數據集包含255個Facebook用戶的數據。包括用戶基本信息、發布的狀態以及狀態的時間戳、用戶網絡信息等。數據來自于Facebook上的myPersonality應用[20]。參與者使用該應用填寫人格問卷并獲得自己人格特征測試結果,同時授權該應用獲取用戶的公開信息及行為數據。在實驗開始前對數據集進行處理,刪除數據集中狀態少于10條的用戶,剩余241個用戶。

3.2 實驗結果

本文使用斯皮爾曼相關系數來評估Facebook用戶人格特征和Facebook行為特征之間的關聯。部分結果如表3所示。“積極-消極”表示積極狀態和消極狀態之間平均間隔狀態個數。OPN表示開放性,CON表示嚴謹性,EXT表示外向性,AGR表示宜人性,NEU表示神經質。

帶有*(p<.05)和**(p<.01)的值表示兩者之間存在著有意義的關聯。如表3所示,積極狀態在所有狀態中所占比例和嚴謹性以及宜人性特征呈有意義的正相關,這表示嚴謹性和宜人性的用戶通常表現出更多的積極情緒。積極-中立和積極-消極都和神經質特征呈有意義的負相關,這表明神經質用戶通常欠缺情緒的穩定性。所有的用戶網絡特征都和外向性特征呈有意義的相關性。網絡大小和外向性特征正相關,表明外向性的用戶通常擁有更多的朋友,同時網絡密度和外向性呈現負相關,這表明外向性的用戶的朋友網絡規模大,但網絡中的用戶彼此大多不認識。嚴謹性特征也呈現相似狀況。

在進行Facebook用戶人格預測之前需要對用戶的人格測試結果數據進行處理。測試問卷的人格特征的得分介于1分至5分之間,是連續性的值,不能直接用于分類。首先需要對數據進行離散化。對于每個人格特征維度,將計算其平均值,然后將用戶的人格特征得分劃為兩類:低于平均值、高于平均值。用戶人格特征數據離散化處理結果如表4所示。

本文使用支持向量機(SVM)機器學習算法對用戶人格進行預測。同時進行另外一組實驗進行對比,參考Golbeck等人的實驗,提取Facebook用戶基本信息和用戶行為數據統計特征,包括用戶發布狀態總數、平均每天發布狀態數、使用LIWC工具提取用戶狀態文字的統計特征、用戶網絡的人數等。兩組實驗的準確率(precision)和召回率(recall)如圖2和圖3所示,其中Exp2采用本文提出的實驗方法,Exp1采用Golbeck的實驗方法。

如圖2和圖3所示,在外向性(EXT)、神經質(NEU)、宜人性(CON)和嚴謹性(CON)這四個人格特征維度上,本文提出的方法取得了更好的準確率和召回率。在開放性(OPN)人格特征方面,另一組實驗取得了更好的準確率。

已有的社交網絡人格預測研究中用戶網絡特征通常僅考慮網絡密度和網絡大小,本文對用戶網絡進行更深入的分析,增加了網絡特征。為驗證增加網絡特征的效果,進行了對比實驗。Exp2采用本文提出的實驗方法,Exp3在用戶網絡特征上僅考慮網絡大小和密度,其他特征與本文方法相同,兩組實驗的準確性和召回率如圖4和圖5所示。

如圖4和圖5所示,增加網絡特征后,在五個人格特征維度上,準確性和召回率均有較大的提高。對用戶網絡進行深入的分析,可以更好地對社交網絡用戶的人格進行預測。

4 結束語

分析并預測社交網絡用戶的人格特征對于推薦系統和個性化廣告具有很大的價值。本文在已有研究的基礎上,提出了新的預測社交網絡用戶人格特征的方法。通過對Facebook用戶發布的狀態進行情感分析以及對用戶在使用Facebook過程中形成的用戶網絡進行深入分析,提取相關特征,使用支持向量機方法進行人格預測,并取得了較好的結果。本文采用的實驗樣本數據量有限,在后續的研究中將收集更多的社交網絡數據,考慮大規模數據處理的情況。

參考文獻:

[1] Matthews G, Deary I J, Whiteman M C. Personality traits[M]. New York:Cambridge University Press, 2003.

[2] ALLPORT G W. The general and the unique in psychological science1[J]. Journal of Personality, 1962, 30(3): 405-422.

[3] ROTHMANN S, COETZER E. The big five personality dimensions and job performance[J]. SA Journal of Industrial Psychology, 2003, 29(1): 68-74.

[4] DOLLINGER S. Research note: Personality and music preference: extraversion and excitement seeking or openness to experience?[J]. Psychology of music, 1993, 21(1): 73-77.

[5] KOSINSKI M, BACHRACH Y, KOHLI P, et al. Manifestations of user personality in website choice and behaviour on online social networks[J]. Machine Learning, 2014, 95(3):357-380.

[6] GAO R, HAO B, BAI S, et al. Improving user profile with personality traits predicted from social media content[C]// Proceedings of the 7th ACM conference on Recommender systems, Hong Kong: ACM, 2013: 355-358.

[7] VAZIRE S, GOSLING S D. e-Perceptions: personality impressions based on personal websites[J]. Journal of personality and social psychology, 2004, 87(1): 123-132.

[8] GILL A, OBERLANDER J. Perception of e-mail personality at zero-acquaintance: Extraversion takes care of itself; neuroticism is a worry[C]// Proceedings of the 25th annual conference of the cognitive science society, Boston: CogSci, 2003: 456-461.

[9] ROSEN P A, KLUEMEPER D H. The impact of the big five personality traits on the acceptance of social networking website[C]// AMCIS 2008 proceedings, [S.l.]: AMCIS, 2008:223-229.

[10] ROSS C, ORR E S, SISIC M, et al. Personality and motivations associated with Facebook use[J]. Computers in Human Behavior, 2009, 25(2): 578-586.

[11] GOSLING S D, AUGUSTINE A A, VAZIRE S, et al. Manifestations of personality in online social networks: Self-reported Facebook-related behaviors and observable profile information[J]. Cyberpsychology, Behavior, and Social Networking, 2011, 14(9): 483-488.

[12] GOLBECK J, ROBLES C, TURNER K. Predicting personality with social media[C]// CHI'11 extended abstracts on human factors in computing systems, Vancouver: ACM, 2011: 253-262.

[13] WANG LingYU, QU Weina, SUN Xianghong. An Analysis of Microblogging Behavior on Sina Weibo: Personality, Network Size and Demographics[M]//P. L. Patrick Rau:Cross-Cultural Design. Methods, Practice, and Case Studies,Berlin Heidelberg: Springer , 2013,8023: 486-492.

[14] BAI Shuotian, YUAN Sha, HAO B,et al. Predicting personality traits of microblog users[J]. Web Intelligence and Agent Systems, 2014, 12(3): 249-265.

[15] 張磊, 陳貞翔, 楊波. 社交網絡用戶的人格分析與預測[J]. 計算機學報, 2014, 37(8):1877-1894.

[16] BACHRACH Y, KOSINSKI M, GRAEPEL T, et al. Personality and Patterns of Facebook Usage[J]. Proceedings of the Acm Web Science Conference, 2012, 12(68):24-32.

[17] QIU L, LIN H, RAMSAY J, et al. You are what you tweet: Personality expression and perception on Twitter[J]. Journal of Research in Personality, 2012, 46(6):710–718.

[18] SOCHER R, PERELYGIN A, WU J Y, et al. Recursive deep models for semantic compositionality over a sentiment treebank[C]// Empirical Methods in Natural Language Processing, Washington: EMNLP, 2013: 1631-1642.

[19] OMALLEY A J, MARSDEN P V. The analysis of social networks[J]. Health Services & Outcomes Research Methodology, 2008, 8(4):222-269.

[20] CELLI F, PIANESI F, STILLWELL D, et al. Workshop on computational personality recognition (shared task)[C]// Proceedings of the Workshop on Computational Personality Recognition, Boston: WCPR, 2013:455-459.

主站蜘蛛池模板: 国产肉感大码AV无码| 老汉色老汉首页a亚洲| 97se亚洲综合在线韩国专区福利| 亚洲无码高清一区| 国产精品露脸视频| 亚洲人成网线在线播放va| 国产无码网站在线观看| 国产高清在线丝袜精品一区| 国产高清不卡视频| 尤物国产在线| 国产精品成人第一区| 嫩草影院在线观看精品视频| 1级黄色毛片| 国产精品亚洲一区二区三区在线观看| 国产成人精品日本亚洲| 亚洲中文无码av永久伊人| 国产精品综合色区在线观看| 无码人妻免费| 欧美精品伊人久久| 国产啪在线91| 伊人蕉久影院| www.亚洲国产| 亚洲美女一级毛片| 久久久四虎成人永久免费网站| 欧美一级在线| 免费av一区二区三区在线| 欧美天堂久久| 国产成人精品一区二区三区| 国产噜噜在线视频观看| 18禁黄无遮挡免费动漫网站| 欧美激情伊人| 亚洲愉拍一区二区精品| 亚洲精品无码专区在线观看| 天堂成人在线| 国产成人乱无码视频| 在线观看无码av免费不卡网站| 欧美精品成人一区二区在线观看| 国产成人综合亚洲欧洲色就色| 理论片一区| 日韩AV手机在线观看蜜芽| 色综合久久综合网| 国产成人精品无码一区二| 午夜综合网| 亚洲精品va| 欧日韩在线不卡视频| 毛片免费观看视频| 欧美 亚洲 日韩 国产| 波多野结衣无码中文字幕在线观看一区二区| 国产亚洲视频免费播放| 狼友视频国产精品首页| 亚洲 欧美 偷自乱 图片| 欧美日韩动态图| 久久久四虎成人永久免费网站| 欧美日本激情| 久久精品中文字幕少妇| 午夜国产在线观看| 国产精品第5页| 91麻豆国产视频| 91网在线| 一本大道在线一本久道| 国产欧美日韩视频怡春院| 亚洲资源在线视频| 亚洲色图欧美| 极品尤物av美乳在线观看| 青青热久免费精品视频6| 成人国产免费| 国产91视频免费| 国产h视频免费观看| 亚洲精品成人片在线播放| 亚洲欧美成人影院| 97视频在线精品国自产拍| 亚洲黄色激情网站| 国产99精品视频| 久久这里只有精品免费| 久久人妻系列无码一区| a级毛片毛片免费观看久潮| 国产系列在线| 国产精品自拍露脸视频| 色噜噜狠狠狠综合曰曰曰| 国产成人凹凸视频在线| 欧美中出一区二区| 4虎影视国产在线观看精品|