方勝
內容提要數據新聞在我國新聞報道總量中依然十分稀少,數據新聞的實踐面臨著基本概念模糊、數據獲取困難、報道領域狹窄、數據挖據不足、相關人才匱乏等問題。本文試圖對這些誤區和局限給予詳盡分析和解決建議,探討數據新聞的發展路徑。
關鍵詞數據新聞計算機輔助報道大數據信息公開
一、概念理解的偏差
“數據新聞”該如何定義?
有學者認為,“所謂‘數據新聞,就是在大數據時代,新聞媒介運用現代的科技手段對龐大、繁雜數據進行識別、發掘和利用,以此來揭示、報道存在的社會關系或社會事件真相?!?/p>
還有學者認為,“大數據”將新聞報道的事實來源從隨機樣本擴大到了全體數據,這就使得數據的采集、挖掘和分析進入到一個新的階段……在這樣的背景下,數據新聞應運而生,并引起了全球傳媒界的極大興趣和積極探索。
誠然,大數據時代的到來讓數據新聞制作更容易、更豐富,但這顯然是混淆了“大數據”跟“數據新聞”的概念,并極大地將“數據新聞”神秘化。其實,數據新聞的定義寬泛得多,甚至淵源也比我們想象的更久遠。
在國外,早在1952年,計算機輔助報道(CAR,computer-assistedreporting)率先被CBS應用于美國總統競選的預測。在20世紀60年代,許多美國調查記者開始科學地分析公共數據庫來獨立地監督權力運行。這些報道方式,都具備和今天數據新聞相似的手段和內容。甚至有學者認為,數據新聞的第一個例子來自于1821年的《衛報》。這篇報道以表格的形式,透露了曼徹斯特各學校的學生數量和每所學校的費用。在中國,記者們以往所作的包含大量數據的報道雖然沒有冠以“數據新聞”的稱謂,但也不能否定它們對數據的分析和利用。
不僅是那些對大數據信息深入加工的報道屬于數據新聞,許多對數據較為簡單的利用乖口呈現也應該歸納于數據新聞的范疇。比如,國內率先開設數據新聞專欄“數讀”版的《南方都市報》,曾經在用電新規執行時,做了《260度電能干嘛——直觀體會居民夏季用電新標準》專題,通過不同家電的用電量,來詮釋260度電的作用有多大。原來,260度電能讓400瓦的洗衣機轉650個小時,若是每次洗半小時,可使用1300次,等等。這顯然不涉及大數據,甚至不包含什么高大上的方法,卻是完全可以讓普通讀者更好地理解新聞的表達方式。
正是因為數據新聞有相當廣闊的范疇,JonathanGray、LilianaBounegru和LucyChambers編撰的《數據新聞手冊》在開篇談及數據新聞的含義時,這樣寫到:“是什么讓數據新聞與其他新聞形式有所不同?它也許就是當你把傳統的‘新聞敏感和講述引人入勝故事的能力,與規模和范圍龐大的數字信息相融合時,產生的新的可能性。”國內的學者如方潔和顏冬在梳理國內外有關數據新聞文獻后,也提出從狹義上看,“數據新聞”的內涵就是“基于數據的抓取、挖掘、統計、分析和可視化呈現的新型新聞報道方式”,而并沒有把大數據作為數據新聞產生的必要條件。
當然,強調歷史的傳承,絕不是否認時代的進步。即使數據新聞不是21世紀的嶄新概念,也必然要以大數據作為基礎,它所面臨的環境和自身的內涵也大大地改變了。例如,計算機輔助報道(CAR)更多地把數據作為內容的補充,而今天的數據新聞更加關注數據本身。大數據時代的到來,自然也為數據新聞提供了更加豐富的素材。
總之,強調數據新聞的更寬泛的概念和范疇,是希望一些中小型的媒體和資源并不豐富的記者,不要在“數據新聞”這樣的概念面前“望而卻步”。同時,我們在重視“大數據”、互聯網的同時,也不要忽略對傳統數據的開發利用。
二、數據獲取的受限
無論過去還是現在,無論是國內還是國外,數據新聞的基礎必然是數據。而獲得有新聞價值同時又真實可靠的數據,對于國內外記者都不是一件輕而易舉的事情。由于發展程度和社會傳統的不同,在這一方面,北美記者要比歐洲記者更容易找到他們所需要的信息,而歐洲記者又要比其他地區的同行更幸運。
當下,各類網站無疑是信息和數據的重要來源,對一些報道而言,甚至可以是主要來源。但是,網絡信息的魚龍混雜,讓甄別和挑選真正可靠和有用的信息十分重要。美國學者RandyReddick和ElliotKing通過網站的后綴,對網站類型的可信度進行了排列,依次是:mil(軍事)→int(國際組織,比如NATO)→gov(政府)→org(菲營利組織等)→edu(教育)→com→net。
在這些網站類型中,最常見的還是gov、org、edu、corn、net。其中,由于掌握資源的不同,政府又無疑是中外記者面對的最重要的數據來源。
政府部門定期公開信息,是各國政府的慣例?!吨腥A人民共和國政府信息公開條例》也自2008年5月1日起施行。其中規定,政府機關應對涉及公民、法人或者其他組織切身利益的,需要社會公眾廣泛知曉或者參與的,反映本行政機關機構設置、職能、辦事程序等情況的或者其他依照法律、法規和國家有關規定應當主動公開的政府信息主動公開。
但是,《中華人民共和國政府信息公開條例》沒有對信息公布的詳細程度作出非常具體的說明。對于媒體記者而言,許多信息可能并非在政府機關主動公開的范疇之內。
數據獲取難直接導致了報道領域的局限。我國媒體現有的數據新聞報道,多集中在經濟領域。的確,經濟類、統計性的新聞報道天生與數據化表達、圖表式呈現有親密關系。即使在數據新聞概念遠未誕生的年代,傳統經濟新聞報道中,數據和圖表仍然是重要的表達手段。但這也反映出,記者們可以獲取的數據多集中在經濟領域當中,政治、社會、文化等領域中還相當缺乏數據來源。
在可以預見的將來,我們的政府機關和其他組織一定會越來越走向開放、透明。信息技術的普及,也一定會讓數據的獲取更加完整和便捷。在達到我們所需要的理想狀態之前,掌握更好的互聯網技巧甚至人脈關系、“狗仔精神”,對數據新聞報道來說都是很重要的。在數據采集方法上,有學者指出,“數據新聞不能單靠‘拿來主義,還是需要記者去實地采訪,發現鮮活的、獨家的原始數據資料,并進一步建立起自己的基礎數據庫?!边@種方法聽起來可能有些笨拙,甚至與互聯網時代有些隔閡。但事實上,在西方先進媒體的數據新聞實踐中,建立良好人脈、多方采集信息、建立自己的數據庫等等,也是被強調的。特別是在我國數據新聞目前的發展階段中,這也都不失為良好的對策。
三、數據挖掘的不足
數據挖掘的不足,一方面受制于數據的可獲得性,一方面也受制于我們對于數據新聞手段的掌握能力。
《南方都市報》“數讀”版編輯鄒瑩從該報數據新聞制作的經驗出發,把數據新聞的發展歸納為三個階段:第一階段是將數據直接進行圖示化轉換,常見于民調、排行榜、調研報告。第二階段則是南都“數讀”的主要做法?!疤觥话l布的圈子,自己通過數據獨立敘事,表達見解。搜尋存在于不同時空的海量數據,并按照各種角度和創意進行深加工,發現數據之間的邏輯關聯和真相。”而第三階段是實時、動態、開放地將數據新聞轉化為數據應用產品。該階段更需跟新媒體嫁接。
正如鄒瑩坦言,第一階段的新聞作品,“雖在呈現上變得美觀,但價值局限于新聞本身,簡單被動,亦有‘換湯不換藥之感?!笨上У氖?,我們目前看到的國內大多數數據新聞或所謂“大數據新聞”,其實都在采取這類淺顯的形式。比如,某地方媒體以“文化大數據”的欄頭開展了該市文化產業方面的專欄報道。雖然名字聽起來很時髦,但內容仍然是傳統統計數字的簡單羅列,甚至連信息圖表也沒有,實在難擔“大數據”這樣的重擔。
其實,在第一階段粗淺的數字呈現上,稍稍有一點努力,就可以有更好的效果。201s年3月12日上午,全國人大聽取兩高工作報告,最高法院院長周強和最高檢察院檢察長營建明分別介紹了2014年反腐工作成果并公布了相關數據。按常規,這些公布的數據可以便捷地制作成信息圖標也就是成為一種簡單樣式的數據新聞。財新網在當天發布的這些數據基礎上,又整理了全國各省級法院、檢察院2014年辦理貪污賄賂案件情況的數據,并明列了省級法院、檢察院審理或公訴的原發改委副主任劉鐵男等讀者關注的重要貪腐人員。這就使其報道較其他媒體更豐富,也給予了讀者更多的有效信息。
第二階段的數據新聞,涉及到解讀、比較和分析等數據挖掘過程,相比第一階段具有質的飛躍,也更加困難。困難之所在,固然有數據獲取的客觀挑戰,但媒體從業者的科學素養特別是數據敏感和處理能力,以及求真、創新的精神可能是更加匱乏的。而第三階段的數據新聞,對數據的互動性、新媒體的發展程度要求更高,距離一般的媒體也更加遙遠。
四、結語
除了以上種種問題,還有些學者擔心數據新聞完全由數據構成,這種模式一旦固化,則將成為新的程序化和模式化的報道。但恐怕這種擔心至少在現階段尚不必要。一方面,新聞報道一定程度的結構固化并非今天的數據新聞特有,而是伴隨著新聞業發展而產生。在某種程度上而言,這也是一種寫作的模式,比如天氣預報的報道方式。另一方面,不同的作者、機構、國度,使得數據新聞的多樣化幾乎是必然的。甚至是未來有一天我們真的由機器人來報道新聞,那么它們背后的不同寫作程序也會帶來不同樣式的新聞作品。
還有些學者擔心數據新聞會侵犯個人的隱私。其實,包括暴露隱私在內的新聞侵權自古有之,這絕不是數據新聞的專利。事實上,由于數據新聞是從高度抽象化的數據而來甚至是從作為全樣本的大數據而來,侵犯公民隱私的幾率可能遠遠低于傳統新聞報道,比如法制新聞、社會新聞等。