李陽冉
大數據環境下新聞編輯模式探究
李陽冉
隨著數字技術突飛猛進的發展,大數據滲透社會生活的各方面,新聞業態也悄然發生改變,一種新興的新聞生產方式——數據新聞應運而生。基于這種新興的數據新聞運作模式,新聞編輯的工作模式也發生了很大改變,不再只是對稿件進行后期選擇、加工,而是變被動為主動,從海量的數據中提取有價值的信息進行搜集整理、獨立編發新聞、將新聞可視化,為受眾提供科學闡釋。
數據新聞;編輯模式;新聞可視化
[作 者]李陽冉,河南大學新聞與傳播學院碩士研究生。
隨著大數據在新聞編輯出版領域的廣泛運用,新聞生產方式也悄然發生著變化。以美國為例,2014年最令行業內外矚目的標志性事件是上半年幾大專業化數據新聞平臺的相繼建立。從《紐約時報》轉投獨立門戶的Nate Silver在新東家ESPN的支持下建立了FiveThirtyEight.com,專注政治選舉、體育賽事預測;前《華盛頓郵報》編輯在Vox Media旗下成立了vox.com,為公眾提供簡潔明了能看懂的新聞;《紐約時報》新欄目Upshot整合上線,意在滿足時報讀者對嚴肅準確的數據新聞的需求。“互聯網之父”蒂姆·伯納斯·李曾對新聞未來發展方面做出設想:“新聞的未來,是分析數據。”綜觀近年來新聞業發展的現狀,新聞的數據化、可視化越來越受人們關注并作為一種全新的新聞生產模式能夠科學有效地對新聞事件做出預判。
數據新聞(data-journalism),又稱數據驅動新聞(data-driven journalism),指的是對廣泛龐雜的數據進行挖掘、分析、發現數據內在的錯綜復雜的相關關系,以可視化的方式進行新聞報道。它涉及了傳統的新聞報道、數據挖掘、數據分析以及交互可視化等多個領域。由歐洲新聞學中心(European Joumalism Centre)和開放知識基金會(Open Knowledge Foundation)共同編寫《數據新聞學手冊》認為:“數據新聞把傳統的新聞敏感性和有說服力的敘事能力,與海量的數字信息相結合,創造了新的可能。”[1]簡單來說,數據新聞是在對數據集的收集、過濾、整理、分析的基礎上,發掘數據關系,以此發現有價值的新聞主題,并以可視化的方式呈現。
“醫保解密”是美國《華爾街日報》所做的一系列數據驅動的調查報道,內容有關美國信息透明度極低的醫保系統:6000億美金的醫保賬單是如何被花出去的?這一系列報道最終使得美國政府被迫于2014年4月首次公開了自1979年以來一直保密的重要醫保數據,《華爾街日報》還在數據公開后繼續跟進一系列全面調查,分析和披露醫保體系如何濫用納稅人的錢。《華爾街日報》利用這些新公布的數據,勾勒出醫療與貪婪在美國醫保體系中的勾結,美國納稅人每年至少掏出600億美金為偽造的醫保款項買單。“醫療解密”系列并非簡單呈現所獲得的數據,而是由一個調查記者和數據專家所組成的團隊分析和搞懂這些數字背后的聯系,并制作了一系列互動圖和表格,條理清晰,有大量細節呈現。
《華爾街日報》的整套數據由兩部分組成:一部分是政府公開的數據表格,總共包含大概1000萬條記錄;另一部分則是政府公開信息前,由《華爾街日報》向CMS花錢申請的數據,多達幾十億條記錄,其中有過去六年多里大量記賬人每一條賬目的細節。為了確保工作內容的可重復性,數據記者們通常用R寫代碼來進行分析。他們利用了大量分析工具研究這些數據,包括線性回歸、邏輯回歸、主成分分析、K均值算法和多種期望最大化算法。《華爾街日報》的交互圖表團隊在數據被公開當天也同時發布了一個可供搜索的醫保供應商數據庫。隨后的幾周乃至幾個月時間里,團隊不斷在該數據庫上添加新的功能和深度,并最終將這個項目叫作“醫保解密:數字背后”。這個交互現在是“醫保解密”系列報道的封面,它呈現了88萬醫保系統中的醫生和供應商的信息,讓任何人都能很容易查到每一地理位置和專業科室中的最大受益人。
根據《華爾街日報》的新聞運作模式可歸納出數據新聞具有以服務公眾利益為出發點,以公開的數據為基礎,運用專業的軟件程序對數據進行分類處理,對宏觀抽象的數據背后隱藏的新聞信息進行挖掘,以形象互動的可視化方式呈現新聞的特點,而這對于傳統新聞報道是一種全新的顛覆,也為數字化浪潮沖擊下的新聞業帶來了活力。
與傳統新聞報道方式相比,數據新聞的出現不僅改變了新聞生產與傳播的方式,而且對編輯工作產生了深遠影響。
(一)編輯角色發生改變,由被動選擇加工到主動獨立編發新聞
傳統的新聞編輯是以滿足受眾的需要的出發點,以他人的新聞作品為工作對象,按照媒體的編輯原則,對新聞信息進行選擇、加工、評價、傳播,協作組織版面并根據受眾的反饋意見不斷改進新聞工作。但隨著大數據時代的到來,信息陡增且信源廣泛多樣,面對這種態勢,如何對信息進行采集、對數據進行深層次開發,對有價值的新聞信息進行分析整合、對新聞事件做出準確科學的預判,是新聞編輯所要掌握的基本技能。數據新聞的出現使得新聞編輯的角色地位發生改變。“在數據新聞運作模式中,編輯工作可以變被動為主動,編輯在數據搜集和加工的基礎上可以獨立編發新聞,可以為受眾提供基于數據分析的科學洞見和內容闡釋。”[2]
(二)用數據講述新聞事實,將新聞可視化呈現
在傳統的新聞報道中,數據只是作為文本的輔助,為報道文章提供理論支撐。但近些年,隨著互聯網技術的革新,“大數據”的概念越來越受人們關注,運用“大數據”分析社會現象,利用數據信息預測事態發展趨向的受眾意愿也越來越強烈。與此同時,受眾對數據的理解和運用有了更多且更為復雜的要求,這種要求最終帶來了新聞業對海量復雜數據深入挖掘并對數據可視化敘述的大爆發。
數據可視化是指以圖形、圖像、地圖、動畫等更為生動、易為理解的方式來展現數據的大小,詮釋數據之間的關系和發展的趨勢,以期更好地理解、使用數據分析的結果。[3]與傳統的新聞報道不同,數據新聞報道不僅需要新聞編輯具備嫻熟的新聞寫作、多媒體技術運用、數據信息甄別等幾項基本能力,還需要編輯熟練運用數據可視化技術,在邏輯思維的基礎之上通過可視化圖像進一步激發新聞受眾的形象思維和空間想象能力,吸引、幫助受眾洞察數據之間隱藏的關系和規律。因此,大數據時代的新聞編輯只有不斷拓寬知識視野,增加知識儲備,形成立體化、多元化的知識結構,才能準確有效地把握新聞信息,最終贏得數據新聞報道的主動權。
數據新聞通常是一個合作的過程。即使是一個小小的新聞發布,數據可視化也能將新聞變得更加生動有趣。“數據可視化”的概念最早出現在1987年,由布魯斯·麥考梅克、托馬斯·德房蒂和瑪克辛·布朗所編寫的美國國家科學基金會報告《Visualization in Scientific Computing》(意為“科學計算之中的可視化”)中提出,是指將數據庫中每一個數據項作為單個圖元元素表示,大量的數據集構成數據圖像,同時將數據的各個屬性值以多維數據的形式表示,可以從不同的維度觀察數據,從而對數據進行更深入的觀察和分析。[4]但是,這并不就意味著,數據可視化就一定因為要實現其功能用途而令人感到枯燥乏味,或者是為了看上去絢麗多彩而顯得極端復雜。正如涂子沛先生在《大數據》一書中所說:“一幅好的數據圖像不僅能有效地傳達數據背后的知識和思想,而且華美精致,如一只只振動翅膀的彩蝶,刺激視覺神經,調動美學意識,令人過目不忘,留下栩栩如生的印象。”[3]
一部優秀的數據新聞作品,最大的功勞莫過于創作設計了它的視覺藝術家。傳統的新聞報道中,數據展示的只不過是一些數字的羅列或一張簡單的Excel表格。但數據新聞的表現方式是多種多樣的,它擁有專業的數據可視化工具,報表類如JReport、Excel、水晶報表、FineReport等;BI分析工具如Style Intelligence、BO、BIEE、Yonghong Z-Suite等。更為專業的新聞報道與編輯模式,加上不斷創新的設計理念使得受眾易于理解,給予其充分的視覺刺激,更能使受眾深入閱讀,從而將新聞價值最大化凸顯。
數據新聞報道是媒介融合環境下興起的一種跨領域的新聞報道方式,新聞用數據代替文字講述事實,數據新聞的可視化也使得抽象的事實更加直觀形象,這是新聞業面對數字新媒體技術沖擊做出的努力轉型,改變了傳統新聞業的格局,為其注入了新鮮的血液。數據新聞的發展也對新聞采編人員提出了更高的要求,不同于傳統新聞生產,數據新聞生產更加需要編輯具有嫻熟的技術操作能力以對數據進行挖掘、分析,更加注重用戶的需求。數據本身無意義,但如何在數據之間探索新聞價值,明晰隱藏在抽象信息背后的新聞規律與社會發展趨勢,是每一位新聞工作者義不容辭的責任。
(一)提升對數據的搜集、加工與整合能力,用數據創造價值
新聞編輯進行數據新聞報道首先必須以公開的數據為基礎。由于互聯網為人類提供了海量的數據,一方面意味著人類的記錄范圍、測量范圍和分析范圍在不斷擴大,知識的邊界在不斷延伸;另一方面也使得信息接受者的注意力變得匱乏,一不留神就會迷失在浩如煙海的信息海洋中。因此,如何從各個獨立的信息系統中提取、整合有價值的數據,從而實現從數據到信息、從信息到知識、從知識到利潤的轉化以及如何為受眾提供更加精準有效的新聞信息是編輯所面臨的難題。目前,數據搜集的渠道主要分為三種:一是利用搜索引擎,如谷歌使用PageRank技術對網頁進行超文本匹配分析,最終將最為可靠的搜索結果放在首位,其他類似的還有雅虎、百度等;二是通過專業數據庫將有價值的數據信息進行挖掘提取,再進行多維度分析;三是新聞編輯通過網絡論壇及其他數據站點將分散隱匿的數據加工處理,最終將零散的數據整合起來。整合是在篩選和整理基礎上的組合,不是將單個的新聞信息簡單相加或隨意拼湊,而是根據優化原則,將有用信息從龐雜的數據中分析提煉出來,對它們進行“去粗取精、去偽存真、由此及彼、由表及里”的加工和配置,這樣就能夠為用戶提供新的有價值的新聞內容,彰顯和發掘它們各自的內涵,形成“量變效應”,使數據新聞報道總體升值并得以最大化發揮。
(二)充分運用數字技術,將數據團隊納入新聞編輯新格局
一則優秀的數據新聞與其數據團隊挖掘和分析數據的能力密不可分。他們既懂得數據分析,又精通構圖藝術,既擁有敏銳的新聞嗅覺,又獨具審美眼光,他們集故事講述和藝術家的特質于一身,將會成為大數據時代的導航員,同時也是大數據時代新聞生產核心競爭力的關鍵。
由于互聯網使得人與人之間的界限日漸模糊,因此一個優秀的數據新聞團隊應是跨領域的,不同行業、不同學科的人們通過頭腦風暴產生創意,團隊中的相互協作顯得尤為重要。英國《衛報》數據博客編輯西蒙·羅杰斯強調了這一觀點:“新聞編輯部的布局很有講究,如果你越靠近新聞編輯部,就更方便對報道進行交流,成為新聞策劃進程中的一部分;反之則兩者距離越來越遠。”[5]
(三)以用戶需求為導向,合力挖掘數據新聞人性化元素
傳播學領域中的“使用與滿足”理論認為受眾成員是有著特定需求的個人,其媒介接觸活動是基于特定的需求,從而使需求得到滿足。在大數據時代,用數據為用戶創造價值,滿足用戶個性化、多樣化的信息需求是編輯做好數據新聞的根本策略。編輯對數據的選擇實際上代表著一種觀念、一種價值、一種文化,具有選擇性、科學性、時代性。這就要求數據新聞團隊需要站在受眾的角度闡明數據新聞的價值所在,在設計可視化呈現方式時融入更多的人性化元素,幫助受眾通過有效互動快速定位所需信息,最終使數據新聞的價值實現最大化。
(四)把握全媒體、立體化的編輯理念
當前,在媒介融合環境下,信息傳播渠道愈加多元化和復合化,編輯出版活動與移動終端、社交媒體平臺等多個領域聯系更為密切。為了適應這種變化,新聞編輯的思維方式也應從平面走向立體,堅持全媒體開發、立體化運作的全新理念。隨著社交媒體的發展,社交平臺上數據的聲音也變得豐富起來,留下的海量數據與痕跡,顯示出不同事物之間隱秘的聯系。數據新聞與社交媒體的結合,則可以豐富、擴展新聞報道范圍,使新聞獲得更為廣泛的傳播與關注。
[1]郭欽.數據新聞:大數據時代新聞報道新模式[D].武漢:華中師范大學,2014.
[2]張炯.基于數據新聞學的編輯理念與編輯能力的創新研究[J].中國編輯,2015(1).
[3]涂子沛.大數據[M].桂林:廣西師范大學出版社,2014.
[4]陳書悅.數據可視化:一圖勝前言[DB/OL].http://mp.weixin.qq.com/s?__biz.
[5]徐銳.數據新聞:大數據時代新聞生產的核心競爭力[J].編輯之友,2013(12).