石醬

一個人的臉書時間線或Instagram相冊。就是他或她的心理健康數字晴雨表。它并不是通過表情符號、標簽以及激勵人心的名言警句表現出來的。而是潛藏在一些你本身不知道的較為微妙的信號里,就像醫生的血壓計和心律顯示器一樣,可以對一個人的心理健康提供準確的診斷。
那些喜歡在社交煤體上分享最新貓咪視頻或旅行照片的人,可能會對這個結論十分驚訝。這同時也意味著,社交媒體蘊藏著重要的潛能——比如拯救生命。僅在美國,每13分鐘就有一人自殺,過去50年里專家一直在研究自殺者的動機和行為模式,但都沒有取得實質性的進展。預測精神病發作和抑郁癥發生也面臨著同樣的難題。
現在。科技人員通過機器學習和數據挖掘技術,從社交媒體上的海量碎片數據中提取信息,以上情況正在發生改變——人們已經通過這些方法跟蹤并預測了流感的爆發,現在開始轉向應對心理健康問題。
研究發現,如果一個人患有抑郁癥,他的Instagram就可能推送色彩更藍、更灰、更暗,人臉更少的照片。這些照片收到的費往往很少,但評論很多。他還可能喜歡用“墨井”濾鏡,把彩色照片做成黑白照片,而不是用“瓦倫西亞”濾鏡提高亮度。
即便如此,單憑這些也不足以診斷或預測一個人得了抑郁癥。不過這對構建預判抑郁癥的模型至關重要。該是“機器學習”方法派上用場的時候了。
哈佛大學和佛蒙特大學的研究人員最近利用這些技術分析了Instagram上近44000條帖文,由此得出的楔型可以正確識別70%的抑郁癥患者,而普通醫生只能診斷出42%的患者。同時,模型出現假陽性的比例也較低(不過這個統計數字來自另一批人群,所以這樣的比較可能不公平)。甚至,在心理醫生作出正式滲斷之前,用戶的訂閱內容就已經出現了抑郁信號,這就讓Instagram成為了某種預警系統。
長期以來,心理醫生認為語言和心理健康之間存在聯系,比如精神分裂癥患者說話經常前后脫節和離題,而抑郁癥患者說話會較多使用第一人稱單數。最新的方法是,把某人的推特名字輸入“文字分析”軟件(AnnlyzeWords)——這是一個免費的文本分析工具,它會關注虛詞(代詞、冠詞和介詞)以分析用戶的情緒和思維方式。比如,某個用戶最近在推特上發表了1017個詞語,這些詞都表明他感到生氣和擔憂,在積極情緒方面低于平均值,就可得知實際上他最近對于世界的狀況確實感到悲觀。如果把“@realdonaldtrump”(編者注:美國總統特朗普的推特名)輸入AnalyzeWords。你會發現美國總統特朗普在積極情緒方面得分很高,而擔憂、憤怒和沮喪情緒的得分則可能低于平均值。
除了這種對情緒和社交風格的快速、有時甚至搞笑的測驗,研究人員還在深入探究心理健康方面的問題。
可以反映出抑郁癥的信息包括負面詞匯(“不”、“從不”、“監獄”,“謀殺”)的使用增加和積極詞匯(“快樂”、“沙灘”和“照片”)的使用減少,但這些信息都不具有確定性。美國哈佛大學、斯坦福大學和佛蒙特大學的研究人員更進一步,從約28萬條推文中提取出了許多特征(情緒、語言和語境等),這一次得出的計算橫型在判斷抑郁癥用戶方面得分很高,還正確地預判了九成的創傷后應激障礙。
佛蒙特大學的數學、自然科學和技術科學教授克里斷·丹佛斯說,積極詞匯和負面詞匯的比例是模型內的一個關鍵預測變量。其他的重要預測變量還包括更長的推文字數。丹佛斯強調,研究只評估了一小部分特定的人,所以這項研究目前還只是概念性驗證。但他很樂觀,“這些研究結果和其他類似研究結果表明,人們在網上的行為可以用來為診斷和篩查工具提供信息。”丹佛斯說道。如果加入生理信息(比如來自FitBits和睡眠應用的(信息),這些數據分析工具可以產生更強大的力量。機器學習法對精神分裂生癥的準確預判率平均可達88%,不過這種程度的成功率只有通過人機協作才能達到。
那么,應該如何處理所有這些信息?首先需委本人的授權許可。微軟研究院的一個研究團隊成功預測了哪些懷孕媽媽有可能性情大變。這一切都是基于她們產前和產后早期的推特使用情況。不過研究人員也強調,他們的目標并不是取代傳統的診療和預判方法。但想象一下,如果準媽媽們可以在手機上運行此類預判模型,又會如何?她們可以通過這個應用程序獲得“產后憂郁風險值”以及相關資源信息,還可以在有需要的時候獲得急救幫助。
不過,目前這個領域仍然比較保守,尤其是在隱私方面。如果你的心理健康數據痕跡對所有人可見,該怎么辦?你可能被制藥公司盯上,或者遭到雇主和保險公司的歧視。此外,此類項目有一些并不受制于臨床試驗的嚴格倫理監督,用戶常常在不知情的情況下,數據已被挖掘。正如研究互聯網倫理與隱私的學者邁克爾·齊默曾經解釋過的那樣:“社交媒體上的一些個人信息會以某種方式呈現,但這并不意味著人們可以輕易獲取并公開這些信息。”
因此對于這個美麗新世界,還需要加上一些限制。2013年,谷歌流感趨勢工具大幅高估了流感高峰值,哈佛大學的研究人員指責了大數據的“傲慢”:“它常常含有隱含的假設——大數據可以取代傳統數據收集和分析,而不是成為后者的補充。”
數據挖掘和機器學習法為提早發現心理健康問題提供了可能。目前,從抑郁癥發作到與治療提供者接觸要花6—8年時間。而焦慮癥則需要9—23年時間。接下來,我們有望看到情況得到改善。目前全球有20億用戶經常使用社交媒體——這是這些方法可以推廣的基礎。正如馬克·扎克伯格近期在規劃臉書的人工智能時所寫:“這個世界發生過很多悲劇——比如自殺,其中一些還進行了直播——這些原本是可以避免的。前提是有人意識到這些人發生了什么事,并及早報告。”
心理健康存在于看醫生之前和之后的現實生活中,并且癥狀隨時都在變化中,網站上的帖子、照片和推文都可能泄露使用者的心理健康狀態。同樣的,我們也可以通過網絡促進心理健康的預判、診斷和康復。
社交媒體上。用戶情緒變化的數據可能在不知不覺中按一些商業機構挖掘