文_周建國 徐 潔
作為大數據時代一種獨特的融合報道方式和創新新聞形態,數據新聞以數據為核心驅動力,以可視化為主要呈現方式,依托數據來講故事,改變了傳統新聞生產模式和敘事模式。在媒體深度融合和媒體數字生態圈構建的大背景下,數據新聞可以說是“融合進行曲中的創新樂章”。
今年初,錢江晚報·小時新聞客戶端成立“數據新聞實驗室”,新創欄目“有個數”,對數據新聞的生產與傳播作了一些粗淺嘗試?!坝袀€數”以熱點話題為切入點,基于數據挖掘、篩選,將“資訊+數據”二者智能結合,通過數據的獲取與分析,把新聞背后的故事,通過數字化、可視化、交互化的形式,進行直觀呈現,讓新聞從可讀變成“可視”,從靜態變成動態,實現單向傳播向互動式、服務式、沉浸式、場景式傳播轉變。近一年來,數據新聞實驗室發布20余篇數據新聞產品,點擊閱讀量過百萬。
本文從話題關切、數據驅動、創意呈現三個方面,即數據新聞的內容、手段、形態,淺析小時新聞數據新聞實驗室的探索,以及實踐中的瓶頸與突破。
“數據新聞”,或稱“數據驅動新聞”,是“基于數據的抓取、挖掘、統計、分析和可視化呈現的新型新聞報道方式”,即運用各種技術軟件來抓取、處理、分析和形象化呈現數據,挖掘數據化敘事的新聞價值。數據新聞融合報道的發展方向,正契合媒體融合向縱深發展的大勢,代表著未來新聞業發展的一大方向。國內媒體如人民網、新華網、澎湃新聞等均在數據新聞報道中早有布局。
數據新聞的出發點是“服務公眾利益”。所有數據的處理和呈現,歸根究底,是為了通過數據尋求真相,用數據說話,通過數據分析來挖掘現象背后的意義,讓公眾了解數據變遷的內涵及宏觀數據如何影響每個人。這一點,無論是國際上旨在表彰全球最優秀數據新聞產品的Sigma數據新聞獎,還是國內的中國數據內容大賽,都把它作為一件優秀數據新聞作品的重要評判標準。
“服務公眾利益”這個出發點,同樣是區域性都市類媒體小時新聞做數據新聞的總體路徑指向。在實際操作中,結合錢江晚報·小時新聞聚焦都市大生活的定位,我們賦予“服務公眾利益”以更生活化的解讀:用戶關切。本地化、生活化是小時新聞的定位,同樣是我們跟進數據新聞的標準。從這個角度看,我們的數據新聞實踐,更多是偏服務性的話題新聞,而不是嚴格意義上的調查型數據新聞。
一種是循著熱點事件或話題,找到可操作的角度和數據;一種是從老百姓最關注的領域諸如房子車子教育等話題里尋找小切口。
比如今年歐洲杯時,對丹麥球員埃里克森的急救,被奉為教科書式救援。而杭州是全國最早布局AED的城市之一,也是國內首個AED立法的城市?!栋l生萬一時,杭州救命的AED夠用嗎》快速對接杭州急救中心,對設備在杭州的分布、使用情況、志愿者配備、存在問題等進行梳理,有科普,也有服務性。
對一些本地用戶關注的社會生活類選題,我們嘗試盡量通過數據梳理分析,從中找到一個大家普遍可能感興趣的話題去體現“用戶關注”。比如我們一口氣梳理了杭州截至2020年12月底85次共5000萬人次參與的車牌搖號數據(從2014年5月首次搖號開始),得出了搖車牌背后科學或玄學的結論:你搖了那么多次搖不到,隔壁老王為啥搖了幾次就中了;到底是什么影響了你的運氣;實在搖不到我該出多少錢競拍……兼容趣味性與實用性。

《隔壁老王為什么比我們先搖到車牌》
對用戶有用,即數據新聞的應用,同樣是“服務公眾利益”的一個重要衡量方面。一個出色的數據新聞產品,同時也應該成為用戶工具,能讓用戶在新聞應用中發現自己的故事,或者找到與他們最相關的資訊。首屆Sigma數據新聞獎中,就設有“最佳新聞應用獎”。但在實際操作中,限于數據獲取及技術處理難題,數據新聞產品的應用還很難做到,所以我們嘗試通過線下互動去彌補應用的不足?!陡改浮袄^承”你的手機之后,都在干什么》關注了中老年人的數字鴻溝,我們通過對一定年齡段手機用戶的畫像和應用偏好值,來觀察生活在杭州這座“智慧之城”里的老人們的數字生活。報道發布后,我們又聯合浙江省圖書館發起教老年人使用智能手機的公益活動,通過這種信息+服務的方式,疊加線下活動,體現“陪伴型”媒體的人文關懷和社會責任。
數據新聞是“數據驅動的報道”,開放的數據是數據新聞的核心驅動力和基本要素。可以說,大數據讓我們能以一種前所未有的可量化的維度,去探究事件背后的某種關聯。我們通過把文本、視頻、音頻等資料數據化、結構化、知識化處理,探索有意義的數據聯系,從中挖掘新聞報道,將孤立的“新聞事件”擴展為“情景報道”,從用文字講故事到用數據講故事。它的獨特之處在于,你把數據放一起后,會找到一些規律或異常,可以提供現場采訪看不到的角度。
實踐中最典型的一則數據新聞,是2010年10月23日英國《衛報》刊登的伊拉克戰爭日志。這是一幅借用谷歌地圖提供的免費軟件制作的點圖,39.1萬條數據來自維基解密。它將伊拉克戰爭中所有人員傷亡情況均標注于地圖,地圖上一個紅點就代表一次傷亡事件,點開紅點就是這次傷亡事件的基本新聞要素。沒有多余的文字,點圖上密布的紅點卻顯得格外觸目驚心。在這里,數據就是真相,數據就是新聞。
什么樣的數據資源能夠幫助我們更靠近上述目標?如何在紛繁復雜的數據中挖掘,篩選出有價值、有意義的信息?實際操作中,我們獲取數據的途徑主要有以下幾種:
1.政府及相關組織公開數據:政務網站、政府工作報告、規劃等。目前國家、省級和市級的一些開放數據平臺基本上都能找到每一年的相關數據。
2.高校、智庫、學術刊物、行業協會的發布,或第三方機構發布的數據,但很多都不公開或者需要有償獲取;
3.基于權威媒體公開報道的梳理,包括歷年來本報報道的相關數據梳理與分析;
4.現在很多商業公司、互聯網平臺掌握著大量與公眾生活相關的數據,例如出行、消費等,在評估公益性、權威性、科學性等維度下,我們會主動尋求這方面的資源支持與合作;
5.自主采集,通過編程用計算機語言來爬出想要的互聯網數據,但這一方法具有時間、金錢成本和技術門檻的限制,需要專業技術人員才能實現。
數據新聞的核心是對大數據的處理運用?!缎l報》的伊拉克戰爭日志新聞中,涉及數據量多達39.1萬條。就小時新聞數據實驗室近一年的嘗試來看,在數據獲取上,數據來源單一、分布不均衡,數據開放程度有限等問題是數據新聞生產的主要障礙之一。作為重要數據源的政府部門提供的數據存在一定滯后性,媒體想要進一步掌握更為詳實、個性化的數據較難。而一些機構提供的數據以及受眾參與調查的數據有時不夠客觀全面,運用到報道中會造成數據分析結果的偏差。所以在實踐中,經常是多種渠道、手段組合在一起。
比如《隔壁老王為什么比我們先搖到車牌》,我們梳理了杭州實施小客車搖號以來共85次搖號結果。車管所官網會發布每月小客車牌照的申請審核結果和搖號結果,但是不提供下載,所以需要用爬蟲程序來抓取數據并結構化。
我們也會和一些平臺合作。比如今年的世界睡眠日的稿子——《你的手機正在暴露你的睡眠秘密》,我們就是和“個推”合作,通過手機用戶的位置和應用偏好值來觀察杭州“睡不著”人群。

《你的手機正在暴露你的睡眠秘密》
數據新聞中的數據也不只局限在統計數據,純文本的內容,或是空間數據,在數據新聞產品的制作中也會經常被用到。比如近期我們和復旦大學新聞學院合作的《從2944首宋詩里,找尋桂花樹下同樣的打開方式》,就是對《全宋詩(詞)》收錄的29萬首詩詞進行文本分析,找出桂花詩和賞桂相關的生活場景。
從國內外數據新聞獲獎作品來看,數據開放程度不同,獲得公開數據難易程度不同,也決定了衡量數據指標時側重點的不一樣。相比而言,Sigma數據新聞獎更強調技術如何助力數據開放,為了鼓勵數據開放與共享,首屆Sigma數據新聞獎專設了“數據開放獎”,中國數據內容大賽則更強調技術運用助力既有信息的梳理、描述和視覺呈現。

《從2944首宋詩里,找尋桂花樹下同樣的打開方式》
事實確實如此。由于實際操作中大數據獲取的難度,我們更多時候只能基于“小數據”的梳理分析來達到目的,比如通過統計、抽樣調查、實驗等傳統手段方法獲取樣本數據。
雖然數據新聞并不等同于新聞可視化,但實踐中,大多數據新聞以可視化為主要呈現方式,即把數據放入一定的情境中進行展示,從而體現易讀性、直觀性、交互性和沉浸性。可視化呈現包括可視化數據圖、互動圖表和網絡在線演示等。
在我們的既定印象中,數據往往是枯燥的,是令人畏懼的,身邊大多數文科出身的小伙伴都說“看到一堆數據就頭疼”。即便已經從挖掘到的紛繁數據里,清理出有價值、有意義的數字,它依然是冰冷的。
數據可視化有助于將枯燥的數據信息以及錯綜的關系鏈以形象、生動、簡單的方式呈現,增強用戶交互式、沉浸式閱讀體驗。不論是Sigma數據新聞獎還是中國數據內容大賽,都非常注重可視化的呈現。2020年Sigma數據新聞獎的“最佳數據可視化報道榮譽獎”頒給了一則關于“為什么你的智能手機導致你的‘短信脖子’”的作品。2020年中國數據內容大賽的“最佳移動交互設計”獎則頒給了澎湃新聞《東京奧運會前,我們讓所有奧運冠軍一起PK了一把》。前者在易讀性和直觀性上有很好的體現,后者的可視化效果和沉浸式體驗很吸引用戶。

2020年中國數據內容大賽的“最佳移動交互設計”獎
如何把單調的數據做出想象力?我們在數據可視化上也做了一些嘗試,希望在清楚展現數據的同時,加入設計與美學的體驗,讓枯燥乏味的數字和解釋變得生動起來。
比如加入動態圖。動態圖示相對而言更加生動,能更直接展現變化和縱深感。《跟著小時視頻穿越時光,去看看杭州一路走來的樣子》這個作品,我們讓直方圖隨著時間變化,讀者可以很明顯地看到杭州的行政區劃在72年間的變化,也可以很明顯地看到“擁江發展”的推進。
動畫視頻也是一種有效嘗試。今年7月的鄭州大雨,大家都知道雨很大,但從數字上看,幾百毫米的降雨量沒有感性認識,所以我們換了一個浙江人民都熟悉的量詞來類比——西湖——一個城市,1個小時里倒進103個西湖,讀者就有了直觀的感受。在此基礎上,我們把這個類比做成動態數據圖示,結合現場畫面混剪、配音,生動易懂。
傳播形態的互動化、可視化已經成為數據新聞的發展趨勢。如上提到的圖表、動畫、H5等不同呈現形態的數據可視化產品,其適合的內容和傳播途徑都不一樣,但它們都必須服務于簡明敘事的需要,不能為了數據而數據,為了設計而設計。但實踐中,數據新聞的可視化呈現仍以靜態的圖表和圖形化處理為主,交互程度較低,視覺元素和交互設計的多樣化還不夠,難以有效引發閱讀興趣。
作為一種跨學科、跨領域的融合報道形式,數據新聞以其話題關切、數據驅動、創意呈現,豐富了融合報道的產品形態,催生了媒體融合變革機制的內驅力,有助于推動媒體融合縱深發展,但它同時也對新聞從業者提出了更高的要求。一方面,我們很少能找到現成可遵循的標準和經驗,只能在不斷變化中摸索——數據開放、技術加持,以及流程再造、體制機制的創新。另一方面,數據新聞短期內難以找到市場化應用的路徑,很多時候只能作為一種純新聞產品生產,在市場化的壓力下,尤其需要媒體有潛心做內容的定力和遠見去支撐。
團隊組建上,數據新聞團隊需要技術、設計、采編等不同知識背景人員的結合,向更多元的媒體形態拓展。因此,必須打破傳統新聞生產中的部門限制,再造采編流程,把技術和設計嵌入采編團隊,組建包括設計、技術和傳統采編人員在內的數據新聞團隊,進行融合新聞生產。
5G時代,技術引領。近一年來的實踐表明,基于傳統媒體轉型過來的媒體平臺,由于技術人才、技術積累等“先天不足”,在技術工具的運用、技術支撐數據處理等方面,存在亟待補足的短板,難以做到真正的“數據驅動新聞”,離真正意義上的“數據驅動媒體”更是任重道遠。
在這之前,破題可以先從向外借力尋求合作開始。目前很多高校的新聞學院都開設了“數據挖掘與可視化”的相關課程,具有科技與技術牽引的先天條件,更具有數據分析能力。而媒體為創作者提供平臺的同時,也能幫助他們進行社會轉化。今年以來,小時新聞數據實驗室就和復旦大學、浙江大學兩所高校先后進行了合作,結合高校產研理論優勢和新聞媒體專業優勢進行數據新聞產品合作?!稄?944首宋詩里,找尋桂花樹下同樣的打開方式》就是“有個數”和復旦大學“復數實驗室”的合作產品。
此外,如何加強數據新聞產品傳播的大流量和效應?如何加強數據新聞的市場化應用,通過“數據說話”為垂直領域的經營需求疊加核心競爭力?如何破題社會資本對數據可視化產品的投入與開發?等等,這些都是下一階段必須厘清的問題。