文/金 苗(南京大學新聞傳播學院研究員)
在大數據時代讀懂“數據新聞”
文/金 苗(南京大學新聞傳播學院研究員)

“萬物皆數”,早在2000多年前,希臘哲學家、數學家、天文學家畢達哥拉斯就宣稱“數”是萬物本原。此后2000多年,人類從未停止過用數字來量化世界的嘗試,并以此探索、認知和呈現世界,直至發展為今天這個萬物被量化與互聯的大數據時代。新聞是人類呈現、認知、探索世界的重要方式之一,如果就此認為,今天話題的主角——“數據新聞”,理當是大數據時代顯而易見的產物,那就錯了。
1980年,“大數據(Big Data)”這個詞,還只是未來學家托夫勒在《第三次浪潮》中熱情稱頌的遙遠愿景,第一次成為世人直觀可及的概念則要等到2008年學術期刊《自然》那場封面專欄研討。而“數據新聞(Data Journalism)”的誕生卻在上世紀60年代就起步了,記者們先是試圖在新聞報道中如實、準確地解讀數據,又探索著在計算機輔助下通過數據尋找新聞線索、展開新聞分析,而后摸索出在數據可視化中簡潔、直觀、互動地呈現新聞的全新生產方式,并最終在大數據時代成為人們無法繞開,甚至身不由己為之嘆服的全新新聞類型。
舉個例子,鳳凰資訊在魏則西事件中推出的H5《你居住的城市有多少莆田系醫院》,就通過建立莆田系醫院數據庫,讓讀者以查詢的方式從數據庫中親手抓出 “自己身邊的無良醫院”,產生恍然大悟之感和奔走相告的轉發沖動。再比如,《新京報》出品的 《2016年外交部發言人被問最多的是哪些事》,則通過對外交部官網上公布的216場發布會,共計1755個問題信息數據進行篩選分類,提煉有效信息,采用交互式代碼嵌入普通網頁中,宏觀展現了一年中外交部新聞發言人所提及的所有內容要點,該新聞獲2017全球數據新聞獎“公共選擇獎”提名。這些“數據新聞”,基于數據的抓取、挖掘、統計、分析和可視化呈現來進行新聞報道,精準化數據是其核心驅動,可視化交互為其主要呈現,而移動端適配則被視為關鍵問題。
然而,研究表明,包含大量數據的新聞直接影響到受眾的可信度評價,至于數據的獲得方式、挖掘深度和分析邏輯,人們卻并不以為意。可想而知,面對直觀、有趣、酷炫的數據可視化新聞,絕大多數人缺乏足夠的免疫力。可以說,讀懂大數據時代的“數據新聞”是當前必備且時尚的媒介素養。欣賞推崇之余,也要提醒自己去合理質疑:
一是對數據來源打打問號。數據新聞的運行有賴于強大的開放數據,在當前政府各公共部門數據開放有限的情況下,尤其要關注數據來源是否進行了清晰標注;二是保有對數據分析的冷靜。數據新聞的創作有著較高的數據分析專業門檻,即便是邏輯強大和客觀呈現的數據新聞也有其預設框架,專業度不高會帶來主觀性,預設立場明顯則會誤導輿論;三是不滿足于單一的數據新聞,對于同一事實的報道,數據只是多棱鏡的一面,兼看則明從來都是一個新聞讀者保持頭腦清醒的王道。★