晏 輝 艾 悅
(作者單位:江漢大學(xué)人文學(xué)院)
數(shù)據(jù)新聞可視化是依靠視覺傳達(dá)來呈現(xiàn)數(shù)據(jù)中的新聞意義并提高可讀性的一種表達(dá)方式,它通過計(jì)算機(jī)技術(shù)將原本枯燥乏味的數(shù)據(jù)轉(zhuǎn)化成圖表、動(dòng)畫、視頻等易于接受和理解的形式。數(shù)據(jù)新聞可視化已經(jīng)超出了工具范疇,重構(gòu)了新聞實(shí)踐的過程,能夠激發(fā)人們對(duì)新聞閱讀的興趣,并使其對(duì)新聞信息進(jìn)行重新解讀。
計(jì)算機(jī)輔助新聞。它指的是新聞工作者通過計(jì)算機(jī)來收集處理新聞數(shù)據(jù)和信息。在計(jì)算機(jī)技術(shù)得以發(fā)展的20世紀(jì)中葉,國外記者使用計(jì)算機(jī)技術(shù)收集和分析數(shù)據(jù),幫助調(diào)查和提取新聞事實(shí)。著名的案例是1952年美國總統(tǒng)選舉時(shí),哥倫比亞廣播公司通過使用計(jì)算機(jī)技術(shù)來預(yù)測選舉的結(jié)果并最終取得成功。從那時(shí)起,一種“計(jì)算機(jī)新聞”的報(bào)道形式開始流行起來。通過計(jì)算機(jī)技術(shù),新聞工作者能夠更有效地收集和分析數(shù)據(jù),給讀者帶來更有價(jià)值的新聞報(bào)道。
精確新聞。精確新聞的說法首次出現(xiàn)于1973年美國科學(xué)家菲利普·梅耶的專著《精準(zhǔn)新聞:一個(gè)記者關(guān)于社會(huì)科學(xué)方法的介紹》。菲利普·梅耶指出,精準(zhǔn)新聞是一種將社會(huì)科學(xué)研究的方法應(yīng)用于新聞報(bào)道的實(shí)踐過程中,用來提高新聞的可信度和客觀性的報(bào)道方式。精確新聞是為了呼吁記者摒棄過于主觀的報(bào)道形式而產(chǎn)生的。為了滿足人們對(duì)新聞?wù)鎸?shí)性和客觀性的追求,精準(zhǔn)新聞開始使用計(jì)算機(jī)技術(shù)對(duì)大數(shù)據(jù)進(jìn)行挖掘、處理和分析,新聞報(bào)道由此步入數(shù)據(jù)新聞階段[1]。
數(shù)據(jù)新聞。在復(fù)雜龐大的數(shù)據(jù)面前,新聞工作者容易被數(shù)據(jù)的表象所迷惑,難以深究數(shù)據(jù)之間的深層聯(lián)系。復(fù)雜的數(shù)據(jù)帶來了新聞報(bào)道的困境,數(shù)據(jù)新聞對(duì)數(shù)據(jù)的深度挖掘和處理就是為了解決這個(gè)問題而發(fā)展起來的。同時(shí),計(jì)算機(jī)應(yīng)用技術(shù)的發(fā)展為數(shù)據(jù)新聞的可視化提供了更多的表現(xiàn)形式,使數(shù)據(jù)新聞的發(fā)展呈現(xiàn)出嶄新的面貌。
數(shù)據(jù)來源。獲得新聞數(shù)據(jù)的渠道包括主流媒體、影響較大的新媒體、政府部門及其網(wǎng)站、國外媒體及其網(wǎng)站,通過這些具有權(quán)威性的媒體和網(wǎng)站,人們能夠獲取可靠的數(shù)據(jù)。例如,網(wǎng)易《數(shù)讀》的《冬奧中國破九金背后的神秘科技,藏不住了》這篇數(shù)據(jù)新聞報(bào)道的數(shù)據(jù)來源于奧林匹克官網(wǎng)的官方統(tǒng)計(jì)資料。
選題判斷。數(shù)據(jù)新聞的新聞選題與普通新聞報(bào)道的選題有相同之處,都要選取社會(huì)關(guān)注度高且對(duì)公眾生活具有重要意義的事件。如人民網(wǎng)《圖解新聞》的《提振消費(fèi):各地消費(fèi)券政策一覽》,這篇數(shù)據(jù)新聞將消費(fèi)者關(guān)心的各地消費(fèi)券的實(shí)施政策一一盤點(diǎn)出來,便于公眾了解消費(fèi)券的使用情況。此外,數(shù)據(jù)新聞還應(yīng)考慮選題是否具有數(shù)據(jù)敏感性,即能夠從數(shù)據(jù)中發(fā)現(xiàn)規(guī)律和意義。具有數(shù)據(jù)敏感性的選題通過數(shù)據(jù)可視化的方式來呈現(xiàn),會(huì)比常規(guī)文字新聞更直觀易懂或更具感染力。如澎湃新聞《美數(shù)課》的《“90后”“00后”為什么總上熱搜?》在分析了2019年10月至2022年8月提及“90后”“00后”的非突發(fā)新聞?lì)?39條熱搜數(shù)據(jù)后指出,300余條熱搜中感情色彩含褒義的大多集中在“00 后”身上,“畢業(yè)”“職場”“中國”“新兵”“小將”等話題關(guān)鍵詞頻繁出現(xiàn);“90后”的話題關(guān)鍵詞主要包括“童年”“青春”“媽媽”“老師”“回憶”等。大量使用這些年齡標(biāo)簽來提供熱搜詞匯的主力軍媒體,既有倡導(dǎo)正能量的官媒,也有偏重生活化的自媒體。
具有視覺效果的內(nèi)容比純文本的文章能夠吸引受眾參與,如果還能同時(shí)結(jié)合各種見解敘述,會(huì)獲得比文本數(shù)據(jù)更高的傳播效果。例如,網(wǎng)易《數(shù)讀》的《中國人最討厭的零食口味,香菜才排第四》除了通過數(shù)據(jù)探討中國消費(fèi)者零食消費(fèi)的行為和偏好之外,還整理描繪不同年齡段人群的童年零食,以及各地的家鄉(xiāng)特色零食,發(fā)現(xiàn)大多數(shù)人已經(jīng)不再選擇童年最愛的零食,零食幸福指數(shù)較高的省份是河南、湖南和廣東。作品甚至還借用數(shù)據(jù)敘述了零食的最佳食用時(shí)間與零食對(duì)人們工作和學(xué)習(xí)的意義。數(shù)據(jù)新聞在數(shù)據(jù)中提煉新聞點(diǎn),用數(shù)據(jù)佐證觀點(diǎn),讓觀點(diǎn)更有說服力和可讀性[2]。
數(shù)據(jù)新聞還可以通過圖表上不同的色塊區(qū)分、特定時(shí)段線條的變化趨勢來直觀呈現(xiàn)量化數(shù)據(jù)的全貌,幫助人們看清復(fù)雜的問題。如網(wǎng)易《數(shù)讀》的《679萬兒童,在父母看不到的地方自己長大》,該數(shù)據(jù)新聞根據(jù)民政部提供的全國各省留守兒童的規(guī)模、年齡、監(jiān)護(hù)情況、學(xué)習(xí)成績、心理狀況等數(shù)據(jù)來反映目前留守兒童所面臨的問題,人們根據(jù)數(shù)據(jù)的變化認(rèn)識(shí)到現(xiàn)實(shí)存在的弊端,在此基礎(chǔ)上分析問題并提出解決問題的措施。
通過數(shù)據(jù)來完成新聞報(bào)道是數(shù)據(jù)新聞至關(guān)重要的環(huán)節(jié)。新聞從業(yè)者在采集到大量數(shù)據(jù)時(shí),要對(duì)數(shù)據(jù)進(jìn)行抽絲剝繭,為讀者提供數(shù)據(jù)的重點(diǎn)。數(shù)據(jù)提煉一方面可以篩選掉一些無關(guān)緊要的數(shù)據(jù),另一方面可以將數(shù)據(jù)進(jìn)行整合,羅列出有價(jià)值的信息。新聞?dòng)浾呖梢圆檎揖W(wǎng)絡(luò)數(shù)據(jù),也可以從文檔中提取數(shù)據(jù),通過Python、SQL、SPSS等計(jì)算機(jī)軟件進(jìn)行數(shù)據(jù)分析,方便數(shù)據(jù)新聞的制作[3]。
在分析處理數(shù)據(jù)時(shí),應(yīng)注意數(shù)據(jù)之間的關(guān)聯(lián),在關(guān)聯(lián)中尋找新聞線索,深入挖掘數(shù)據(jù)背后的邏輯。比如,公眾號(hào)《數(shù)有范》的《“雙減”之后第一個(gè)寒假:六成家長眼中大多數(shù)孩子確實(shí)輕松了》利用中國青年報(bào)社社會(huì)調(diào)查中心的數(shù)據(jù),整理并講述了2021年寒假中孩子們的主要活動(dòng)方式和中小學(xué)生家長對(duì)減負(fù)的認(rèn)知,通過孩子們“自主在家學(xué)習(xí)”“堅(jiān)持體育鍛煉”“幫忙做家務(wù)”等各類活動(dòng)數(shù)據(jù)看到了國家“雙減”政策實(shí)施的積極效果。
數(shù)據(jù)地圖。數(shù)據(jù)地圖旨在以直觀的方式表示地圖數(shù)據(jù)或地理坐標(biāo),例如,圖釘定位和顏色變化使人們能夠?qū)κ录窬钟懈逦庇^的認(rèn)識(shí)。數(shù)據(jù)地圖極大地提高了人們對(duì)復(fù)雜事件的認(rèn)識(shí)和感知,它可以更好地展示自然災(zāi)害等復(fù)雜問題。例如,澎湃新聞《美數(shù)課》的《5張圖,看長江流域61年來最嚴(yán)重的的氣象干旱》通過動(dòng)態(tài)地圖顯示鄱陽湖2022年提前100天進(jìn)入枯水期,為1951年有記錄以來最早。記者還整理了2022年8月18日8時(shí)全國河流856個(gè)水位站的水位數(shù)據(jù),將之與警示洪水險(xiǎn)情的警戒水位相比,用不同顏色在地圖上標(biāo)注各水位站當(dāng)前的水位差距,直觀顯示了當(dāng)前水位存在較大差距的水位站主要集中在我國中南部地區(qū),幫助讀者感知我國部分地區(qū)出現(xiàn)的“汛期反枯”的罕見現(xiàn)象。
時(shí)間軸。時(shí)間軸旨在將與事件發(fā)展有關(guān)的信息按時(shí)間先后橫向排序,或者將來自不同時(shí)期的同一類型事件縱向排序,以便受眾了解事件的來龍去脈。時(shí)間軸適合同一類事件的先后排列和事物發(fā)展過程的揭示,具有對(duì)內(nèi)容進(jìn)行排序和顯示變化的功能。比如,澎湃新聞《美數(shù)課》的《數(shù)說贛南蘇區(qū)十年巨變》用時(shí)間軸展示了從2012年至2021年十年間贛州、吉安、撫州三市的GDP占全省比重的發(fā)展變化,以及居民可支配收入的增長。
圖解新聞。圖解新聞主要采用視頻、動(dòng)畫、圖片和H5交互的呈現(xiàn)形式,文字較少,多用于時(shí)政新聞。時(shí)政新聞?wù)涡詮?qiáng),內(nèi)容較嚴(yán)肅,受眾接收起來有一定難度,所以適用于圖解新聞。數(shù)據(jù)新聞可視化能通過生動(dòng)活潑的視覺元素,提高閱讀的趣味性,提升嚴(yán)肅新聞的可讀性,讓數(shù)據(jù)新聞得以更廣泛地傳播。例如,人民網(wǎng)《圖解新聞》的《圖解:習(xí)近平出訪意大利、摩納哥、法國全記錄》,用鮮活的圖片展現(xiàn)習(xí)近平總書記到訪巴黎、羅馬、巴勒莫、尼斯、摩納哥五座城市,并加以簡單的文字說明,讓讀者感覺生動(dòng)有趣。
視頻動(dòng)畫。視頻動(dòng)畫是指利用2D或3D動(dòng)畫制作新聞的視頻片段或補(bǔ)充扇形圖、柱狀圖、環(huán)形圖、時(shí)間線等,輔以旁白和音軌,將數(shù)據(jù)傳達(dá)給用戶,使受眾更容易理解信息的內(nèi)容,通過豐富的表達(dá)方式提供信息來引導(dǎo)讀者,并喚起他們的情感共鳴。例如,澎湃新聞《美數(shù)課》的《150秒了解四川甘孜瀘定地震》采用新聞視頻與圖表動(dòng)畫相結(jié)合的形式,將2013年以來的地震數(shù)據(jù)按照經(jīng)緯度分布顯示,說明近年來我國的強(qiáng)震多發(fā)生在西部地區(qū),基本與全球三大地震帶之一的“地中海-喜馬拉雅地震帶”重合。作品講述了四川多發(fā)地震的原因與地震帶來的影響,促使地震救援活動(dòng)受到社會(huì)的廣泛關(guān)注。《這半年,神州十三號(hào)乘組的太空生活記錄》通過H5交互和動(dòng)畫的形式,向社會(huì)公眾真實(shí)展示了2021年10月16日至2022年4月16日神州十三號(hào)宇航員們在太空艙的生活,向國人以及世界展現(xiàn)了中國太空技術(shù)的蓬勃發(fā)展和綜合國力的提升,產(chǎn)生了良好的國際國內(nèi)社會(huì)輿論效果。
初級(jí)可視化工具。簡單的可視化工具適合于沒有視覺設(shè)計(jì)技術(shù)背景的記者,通常是PS、Excel等程序。Excel這一工具的可視化能力有限,但因?yàn)槠湎鄬?duì)較低的技術(shù)門檻而成為理解可視化的實(shí)用工具,Excel較受初學(xué)者的喜愛。PS也是一個(gè)非常流行的軟件,用于信息圖表設(shè)計(jì),也可以修飾圖形和圖表。
中級(jí)可視化工具。中級(jí)可視化工具的可視化功能更加完善,視覺化展示類型也更加豐富,能夠運(yùn)用于更廣泛的范圍中。通常來說,常見的中級(jí)可視化工具主要有以下幾種,Visual.ly是一個(gè)基于網(wǎng)絡(luò)社交媒體的信息圖表工具,能夠提供多種個(gè)性化的服務(wù),可以在社交網(wǎng)絡(luò)嵌入和分享創(chuàng)作者的圖表,或?qū)⑵湎螺d下來為以后的使用做好準(zhǔn)備。Tableau Desktop旨在以可視化的形式表示數(shù)據(jù)之間的關(guān)系,允許數(shù)據(jù)處理與圖表相聯(lián)系,并允許將所有數(shù)據(jù)拖放到一個(gè)數(shù)字平面上來快速創(chuàng)建圖表。Rin action是一個(gè)基于S語言開發(fā)的,擁有g(shù)gplot2繪圖包的數(shù)據(jù)可視化工具,具備視覺效果強(qiáng)烈的可視化挖掘模式并支持交互式的演示,是一個(gè)開放源碼的工具,圖形更強(qiáng)大,可以由用戶自主定制,而不僅僅是默認(rèn)的繪圖功能。
高級(jí)可視化工具。對(duì)于需要完成高質(zhì)量可視化作品的創(chuàng)作者來說,還需要掌握更高級(jí)別的可視化工具,如D3和Python。D3(Data-Driven Documents)是一個(gè)可在網(wǎng)頁上實(shí)現(xiàn)數(shù)據(jù)可視化的工具,D3的明顯優(yōu)勢是可以實(shí)現(xiàn)對(duì)文檔對(duì)象的有效數(shù)據(jù)驅(qū)動(dòng)操作,靈活性較強(qiáng);Python是一款編程工具,它的可視化能力比較突出,可以幫助用戶實(shí)現(xiàn)更多的可視化功能[4]。
簡單數(shù)據(jù)堆砌,缺乏深度思考。隨著可視化實(shí)踐的進(jìn)一步發(fā)展,媒體在具體的新聞報(bào)道中往往追求大而全的數(shù)據(jù),卻忽略了對(duì)數(shù)據(jù)的進(jìn)一步分析和挖掘,沒有充分挖掘出數(shù)據(jù)背后隱藏的信息。例如,澎湃新聞《美數(shù)課》的《投訴數(shù)據(jù)告訴你,“大數(shù)據(jù)殺熟”有哪些套路?》只是從大數(shù)據(jù)殺熟的用戶類型、用戶怎么發(fā)現(xiàn)被殺熟、商家怎么殺熟、大數(shù)據(jù)殺熟能從口袋里多拿走多少錢等幾個(gè)方面的相關(guān)數(shù)據(jù)簡單總結(jié),沒有深入研究,也沒有分析這些數(shù)據(jù)背后的問題和深層含義。
數(shù)據(jù)缺乏時(shí)效。想要提高數(shù)據(jù)信息的時(shí)效性,需要拓寬數(shù)據(jù)獲取的渠道,但是媒體和網(wǎng)站沒能建立獨(dú)立自主的數(shù)據(jù)資源庫,不能保證足夠的數(shù)據(jù)信息。信息內(nèi)容的缺乏意味著數(shù)據(jù)新聞可視化在開發(fā)過程中不能及時(shí)獲得相關(guān)的數(shù)據(jù)。同時(shí),由于在網(wǎng)絡(luò)上搜索數(shù)據(jù)和分析數(shù)據(jù)內(nèi)容的時(shí)間較長,數(shù)據(jù)新聞可視化的發(fā)展受到了新聞時(shí)效性的制約。
其一,利用數(shù)據(jù)挖掘技術(shù)增加新聞深度。數(shù)據(jù)挖掘是分析大量數(shù)據(jù)并找到數(shù)據(jù)之間的邏輯的過程。數(shù)據(jù)本身沒有價(jià)值,有價(jià)值的是分析數(shù)據(jù)后得到的信息。數(shù)據(jù)挖掘要求媒體專業(yè)人士具有計(jì)算機(jī)科學(xué)和統(tǒng)計(jì)學(xué)的基礎(chǔ)知識(shí),并能熟練掌握數(shù)據(jù)采集和數(shù)據(jù)可視化應(yīng)用工具。媒體人在新聞的數(shù)據(jù)挖掘中通常要經(jīng)歷數(shù)據(jù)準(zhǔn)備、規(guī)律尋找和結(jié)論展示三個(gè)步驟。數(shù)據(jù)準(zhǔn)備是將新聞報(bào)道所需的數(shù)據(jù)整合成數(shù)據(jù)集;規(guī)律尋找是用某種方法將數(shù)據(jù)集所含有的規(guī)律找出來;結(jié)論展示是用受眾能理解的方式將尋找到的規(guī)律表達(dá)出來。這些數(shù)據(jù)挖掘的技術(shù)步驟可以通過學(xué)習(xí)培訓(xùn)來掌握,但關(guān)鍵在于提升媒體人的數(shù)據(jù)敏感性。數(shù)據(jù)敏感性的提升不是單純技術(shù)培訓(xùn)能實(shí)現(xiàn)的,它是新聞敏感性與數(shù)據(jù)分析能力的有機(jī)結(jié)合,需要媒體人在新聞實(shí)踐中不斷學(xué)習(xí)和摸索,從而增加新聞深度。
其二,積極建立自采性數(shù)據(jù)庫。媒體機(jī)構(gòu)或平臺(tái)可以創(chuàng)建屬于自己的數(shù)據(jù)庫資源,建立內(nèi)部數(shù)據(jù)生產(chǎn)機(jī)制,消除由于外部數(shù)據(jù)缺失而造成的負(fù)面影響。媒體或數(shù)據(jù)新聞平臺(tái)可以在內(nèi)部用自己的原創(chuàng)內(nèi)容和歷史數(shù)據(jù)充實(shí)自己的數(shù)據(jù)庫,在外部與其他媒體或數(shù)據(jù)新聞平臺(tái)合作,通過購買和分享來擴(kuò)大自己的數(shù)據(jù)庫[5]。此外,新聞媒體或數(shù)據(jù)平臺(tái)還可以利用Python、SQL、SPASS等程序從網(wǎng)絡(luò)中抓取網(wǎng)絡(luò)用戶產(chǎn)生的海量數(shù)據(jù)內(nèi)容,豐富自己的數(shù)據(jù)庫。