胡珉琦
中國互聯網中心(CNNIC)《第36次中國互聯網絡發展狀況統計報告》的最新數據顯示,目前中國網民已經達到6.68億之多。而人們在互聯網上的生活越來越具有數字化特征,這也意味著,人們的思維、情緒、心理也可以被數據量化。事實上,這個虛擬世界已經在科學家的使用下,逐漸成為真實的心理學實驗平臺。不知不覺,你的內心可能已經通過網絡平臺留下的蛛絲馬跡,被心理學家看穿了。
心理學研究的新方法
心理學是一門研究人類心理現象的發生、發展和發展規律的學科,然而,心理現象本身是不可見的。因此,現代心理學研究的基本范式是通過分析人類的外顯行為而窺見人們內心的。
傳統的心理學通常使用問卷、心理測評、抽樣調查和實驗室實驗等方法分析心理數據。“但現有的問卷、心理測評技術是依賴于自我報告的,受到社會贊許性的左右,準確性可能受到影響,而實驗室的控制實驗要設立各種控制參數,這種環境下的行為表現在真實場景中往往是要打折扣的。”中科院心理所研究員朱廷劭告訴記者。
“進入互聯網時代,尤其是移動互聯技術的廣泛應用,除平板電腦、智能手機外,智能手環、智能手表、智能眼鏡、便攜式腦電儀等各類可穿戴設備,幾乎能將人們所有的行為做全時程、生態化的跟蹤和記錄,這也意味著,它們能夠為開展行為心理分析提供最全面、準確的數據記錄。”
朱廷劭主要從事“計算網絡心理學”研究,他認為,人們有可能在測試環境中進行有效的偽裝,卻很難在網絡中長期這么做。“任何網絡上的行為痕跡,都隨時有可能露出馬腳。”
因此,大數據時代為心理學提供了一種新的研究方法:利用現代信息技術實現對行為大數據的采集分析,在此基礎上研究行為和心理的相互作用機制,以建立及時有效的心理干預和行為引導模式,而它對傳統心理學認識帶來的改變也顯而易見。
數據即行為 不難理解,大數據記錄的信息實際上就是普遍化的人類行為,更重要的是,這種數據行為是自覺、自愿發生的,真實性、準確性更高,同時也是可普遍化且可以比較的。
樣本即總體 依照現有技術的計算能力,完全可以達到全樣本數據的搜集、分析。因此,大數據背景下的心理學實際上模糊了樣本和總體的概念,樣本無限放大就成了總體。它可以幫助我們找到人類心理的一些普遍規律。

個體即規律 傳統心理學很難做到對個體心理的預測,這是由于獲取每個個體的歷史數據幾乎是不可能的。但有了大數據,獲取個體長時期的、連續的數據已經不是難事。根據那些歷史數據,可以對每個個體進行獨特性的分析,給出個體特有的規律,從而使個體運用心理學結論成為可能。
情景即實驗 心理學研究最重要的方法是實驗,而現在,我們不再需要實驗室的控制實驗,就可以得到生態化的數據。因為大數據把真實的情境作為實驗,幾乎可以達到與實驗室實驗等同的效力。
大數據時代的心理預測
如今,大數據在心理學領域已經展開了諸多應用研究。針對個體而言,心理學家可以根據社交媒體的數據,基本實現對個體心理特征準確的識別及實時的跟蹤分析,包括人格、心理健康、滿意度、幸福感和決策風格等。
朱廷劭目前主要的研究內容之一,就是利用大數據識別自殺意念,實現對個體自殺風險的檢測,并對這些個體采取及時的干預。
在他看來,大多數自殺行為發生前是有信號的,比如情緒低落,流露出絕望、無助的想法,甚至搜集自殺的相關資料,或把自殺作為寫作的主題等,這些信號都有可能在網絡中有所表達。

事實上,研究人員將自殺死亡用戶組和完全沒有自殺意念的人的微博進行比較,發現前者一般互動較少,更關注自我,更關注死亡、宗教的內容。自殺可能性的差異比較結果也顯示,高自殺可能性的用戶活躍度比較低,在夜間相對更活躍,更關注自己,使用更多否定的表達。
根據已有的研究結果,目前,對單條微博內容是否有自殺意念表達的識別可達90%以上。但他同時表示,由于仍存在不少誤報,這種方法只是用于初篩,提高大規模實施自殺評估的自動化程度,提高效率,“目的是協助傳統的研究方法,而不是代替自殺熱線或自殺救助單位”。
在此基礎上經過拓展,研究人員可以利用大數據進行心理健康狀態的識別。比如其自主研發的一款應用程序“心理地圖”,可以根據注冊用戶的微博數據自動計算出該用戶當前的心理健康水平,實現對心理健康狀態變化的及時檢測。
朱廷劭說,通過分析智能手機用戶的使用行為數據,利用機器學習方法,也可以建立心理健康狀態的預測模型,能夠實現對用戶心理健康狀態的及時監測。這種方法還能擴大至智能手環等可穿戴設備以及體感設備,以實現對個體的無干擾行為記錄和分析,幫助人們更及時、準確地感知個體的心理健康水平。
2013年劍橋大學的Psychometrics Centre在《美國科學院院報》上發表的研究成果表明,基于網絡日志數據的人格特征預測值與基于人格問卷的人格特征測評值之間的相關系數最高可以達到0.43。這也意味著,通過大數據預測人格和主觀幸福感同樣是可行的。
目前,研究人員利用微博大數據,采用不同的特征集合建立人格和主觀幸福感的預測模型。研究結果表明,利用微博使用行為特征和微博內容特征,同時加入年齡、性別、收入和受教育程度等統計信息特征,可以對用戶人格特征和主觀幸福感水平進行有效預測,其相關性達到甚至超過了問卷測量的重測信度。
不僅可以對個體心理特征進行識別分析,大數據還能應用于群體心理的研究,例如識別群體社會態度的變化。通過對生活滿意度、政府滿意度等重要社會心態指標建立計算模型,研究人員利用微博用戶的公開數據可以進行群體社會態度的預測,并進一步通過對爆發群體事件地區的群體社會態度進行分析,獲得群體事件風險預警模型。
在對廣東地區2012年度各地市社會態度進行預測時,研究團隊發現地方經濟滿意度等社會態度指標和地方經濟客觀數據呈顯著相關,這也表明了社會媒體計算獲得的社會心態指標具有很好的可信性。這種對公眾社會心態和群體事件風險的預測與預警,能夠以很低的成本在多個地域的大規模人口上實時動態運行,為把握社會態勢、感知社情民意提供新的渠道。“我們希望能利用大數據實現對群體社會態度臨界狀態的預警,為及時化解可能的群體性事件提供數據支持。”朱廷劭表示。
除此之外,清華大學心理學系教授彭凱平帶領的行為與大數據實驗團隊此前對谷歌圖書近200年來的詞頻統計和大數據分析發現,人類自18世紀初期開始,兩個重要的心理維度出現了滑坡,第一是生活目標、信仰、意義的持續下降,第二是人類所體驗到的積極情緒也發生了滑坡。
于是,研究人員根據中國人的文化和心理特點,結合幸福科學的經典理論,構建了一套可以用以測量幸福程度的中文心理詞庫。這個詞庫中的維度除了積極情緒、意義、投入、關系和成就等傳統維度外,還加入了有關事件的維度。
利用這套建立在中國文化和中國人的心理分析基礎上的詞庫,研究人員掃描了新浪微博2013年全年的數據。
比如通過對各地微博注冊用戶的幸福詞庫掃描而繪制出的“中國幸福地圖”。而用這些城市的幸福數據對其他經濟社會、指標進行預測,也能得出相關的結果。比如,幸福與GDP的關系并非是線性的,這里也存在一個轉折點,在比較貧窮的地區,幸福隨著經濟發展而上升,但是一旦經濟發展到某一程度,幸福將不會得到很快提升。
不違倫理地使用數據

有人的地方就有心理。不可否認,人們對互聯網的依賴程度越強,它就越有可能成為心理學實驗的重要平臺。這一方面為心理學研究拓寬了范圍,提供了巨大便利,但同時,大數據對隱私暴露的負面影響也同樣可能為心理學研究埋下隱患。
早在2012年1月,Facebook 曾對68萬用戶進行了為期一周的“情緒感染”實驗,該實驗被美國《國家科學院院報》的一篇論文公開后引起了軒然大波。
與微博一樣,Facebook用戶的首頁是好友消息推送,但Facebook顯示給每個用戶的更新列表是不全面的,同時,選擇的消息也并非完全是隨機的。
在該實驗中,Facebook對68萬用戶改變了篩選推送的標準,對其中一組用戶盡量移除他們所能讀到的負面消息,而對另一組則給予更多的負面消息。簡而言之,就是放大兩種極端情緒,看用戶受影響的情況。
結果顯示,每天看到積極內容的用戶更有可能發布積極的消息,而那些每天看到消極內容的用戶則更有可能發布消極的消息。
朱廷劭表示,這個實驗之所以受到受眾、媒體的詬病,是因為它暗示了擁有數據的人可能操控用戶的情緒。因此,在大數據時代,合理界定數據使用權的外延和邊界也十分關鍵。
除此之外,大數據所帶來的研究方法的改變也可能令心理學研究者更多地關注數據,從而忽視數據背后鮮活的個體。事實上,大數據的研究方法不可能完全取代傳統的研究方法。
心理學關注的核心始終都是人。