□ 文/賀俊浩 林 沛
在今年兩會報道中,媒體在數據挖掘、數據分析以及數據呈現方面進行了一系列探索和創新,取得了良好的傳播效果。本文嘗試對媒體在兩會報道中運用大數據技術做法的類型進行盤點,并嘗試對其運用趨勢和方向進行總結。
“關于兩會,網友們最想知道什么?哪些兩會話題最受網友關注?如何從浩如煙海的數據中讀出中國民眾對改革的期待?”,針對2014年召開的全國兩會,人民網·中國共產黨新聞網聯合百度知道,共同推出系列大數據解析——數讀時代,“據”說兩會。報道主要特點是密切追蹤網民對兩會熱點的關注軌跡,并輔以多種示意圖,信息呈現多元且一目了然。
報道大致分為三部分:分別是每日熱搜,實時呈現網友關切問題;分地區呈現地方網友最關心的熱點話題,展示地域差異;具體問題的解剖和細化,這一部分共有六期內容,分別是全國、改革、民生、政府、反腐和兩高,每一部分內容都有“網友關注度最高的問題”“哪些地方最關心這個問題”等分類,例如在改革這一部分中,共下分四部分內容,分別是“經濟體制、社會體制改革關注度超50%”“網友最關注高考、公務員、公積金改革”“廣東網友最關注改革 專家稱居民心態更實際”“還有19歲至30歲這一年齡段的人更關注改革”,這四塊內容都配上了相應的圖表,顯得可信性更強。
新華社在兩會報道中也廣泛運用了大數據技術,并在對網民關注熱點追蹤呈現的基礎上,拓展報道深度和廣度,主要手段是引入背景介紹和對代表委員的采訪,恰如其分地將社會熱點與兩會議題連接起來。例如一篇名為《大數據揭示網友軍費關切 代表委員解讀軍費增長》的報道中,其主要方式就是“針對大數據方法從社交媒體中提取的關鍵詞,軍隊人大代表、政協委員就中國軍費增長進行解讀。”其中這些關鍵詞是來自2013年7月1日至2014年1月31日期間騰訊、新浪提及“軍費”或“國防費”的51964條微博。
整篇報道按照關鍵詞來進行分類,共有三個部分,分別是:微博關鍵詞一:重要、安全——“不適當增加國防投入,怎能有效維護國家主權、安全和領土完整”;微博關鍵詞二:美國、日本、中國——“中國國防費剛進入協調發展時期,與世界主要大國相比仍低”;微博關鍵詞三:頤和園、北洋水師——“牢記甲午戰爭歷史教訓,切實把每一分錢用到戰斗力建設的刀刃上”。每一部分又包括三小部分,分別是大數據、背景以及代表委員的解讀,在第一部分對重要、安全關鍵詞的分析中,“大數據”部分主要是呈現數字并做簡單介紹,“網友討論‘軍費’或‘國防費’時用到的形容詞里,名列前兩位的“重要”和“安全”兩個詞出現頻率分別為1352和1116,總數占全部微博的4.75%”,然后在背景部分中,引入十八大報告中有關軍費和國防費的文件內容,讓報道權威充分,繼而采訪了相關委員,分別對軍費用在哪和為什么增長進行解釋。
此次兩會,央視擴展大數據的運用范圍,在“兩會直播報道”“兩會解碼”中,引用百度指數數據,并根據每一期主題,在虛擬演播室中讓主持人和屏幕上的數據圖譜互動,摒棄了原本播音員單純播報的方式,看起來更加生動活潑。3月3日“新聞聯播”兩會報道開篇即言“我們首次運用大數據的分析方式,從不同視角看兩會”,對全球關注兩會的情況進行分析報道。隨后場景轉向歐陽夏丹所在的虛擬演播室,在主持人旁邊有個地圖,隨著主持人播報內容的推進,地圖上的數字不停變動,隨后還會更新不同類型圖表,主持人通過生動活潑的語言風格、輕松自如的互動方式,讓受眾通過數字更清晰地看到而不僅僅是聽到豐富的信息內容,從而有更完善的視聽覺體驗。再如3月8日《兩會解碼》中,對全球關注政府工作報告的情況進行了分析,從哪些國家關注到關注的具體內容是什么,再到全球關注者怎樣評價新一屆中國政府的施政綱領,內容層次分明、體系完善,對于全球關注中國等相關問題的呈現也足夠全面,利于觀眾理解。
網絡媒體在今年利用大數據方面,所體現出來的貼近性、客觀性、全面性也值得一提。其中百度知道策劃的“從百度知道看兩會熱點”的系列報道被廣泛轉發,其中不乏主流媒體網站。
策劃報道關注點大多是民生問題,例如“2014中國‘房’事”“2014史上更難就業年”“工資這點事兒”“中國人生育面面觀”“舌尖上的食品安全”等,它利用百度知道豐富的數據,將網友對具體問題的看法意見呈現出來,以此來做深入分析的引子,使報道系統全面。如“中國人生育面面觀”報道就是對“單獨二孩”政策出臺以后,中國人生育觀點的盤點和梳理,整個報道分為三部分,分別是“有些人懷上了不想要——在不想要孩子問題上的糾結,男女各不同”“有些人想要卻懷不上——生育壓力催生代孕等灰色產業”“有些人還想要第二個——最為關注人群為發達地區、30-39歲的人群”,每個問題的分析都是圖表+文字的模式,把網友們對生育問題的觀點進行呈現,從而讓更多人全面了解這個問題在中國的現狀。在此基礎上,百度知道還試圖還原這一人群深層次的動因,如“有些人懷上了不想要”這部分中,報道首先呈現了網友不想要的原因之一:“和男朋友交往6年了,懷孕了,本來應該是件高興的事,可是男朋友卻不要孩子,我讓家里人給他做工作,可是他還是堅決說不要。不知道怎么會是這樣,每天在一起上班,卻不會說話,很難受。我已經拿掉過2次了,現在年齡也合適了,為什么就不要啦!”然后在此基礎上提供原因分析,包括“實在負擔不起”“條件還不成熟”“沒錢就不要小孩”等,然后以直觀的圖表來進行呈現,一目了然。
背景資料
大數據是指無法在一定時間內用常規軟件工具對其內容進行抓取、管理和處理的數據集合,其主要特點是四個“V”:Volume(數據量大),Variety(數據類型多樣),Velocity(處理速度快)、Value(價值密度低)。隨著技術的發展,大數據逐漸廣泛運用于新聞報道。
傳統主流媒體和網絡媒體在對兩會的報道中,主動和數據公司合作,在數據挖掘、分析和呈現方面進行了探索與創新。大數據意味著多樣化的數據來源、巨大的數據量、快速的處理,這對傳統報道的形式和深度都有拓展。通過上面對各種運用類型的盤點梳理,可以看到兩會中利用大數據創新報道有以下若干方向:
其一,媒體間數據的共享力度加大,并重視數據挖掘與整合的合作。舍恩伯格和庫克耶在《大數據時代》一書中,將大數據帶來的思維變革總結為三點:一是總體樣本取代隨機樣本,二是對不精確的容忍度增加,三是相關關系取代因果關系。其中第一條可以看出大數據對樣本數據量的要求是巨大的,并且在先進技術的基礎上提高了總體樣本的分析能力,脫離之前隨機樣本的有限性,而加大對數據量挖掘的擴展。央視與億贊普公司、百度公司合作,新華社與武漢大學互聯網科學研究中心等合作,人民網和百度、360搜索進行合作,百度知道也對自身豐富的數據進行了分析,拓展了網絡媒體報道的深度。可以看出,主流媒體與數據公司、網絡媒體等的聯姻已成趨勢,不僅形成互補促進了資源的利用效率,更加大了對創新可能性的探索。
其二,不僅限于對搜索數據的呈現,還通過采訪解讀增強報道的可信性和權威性。通過對網絡搜索痕跡的挖掘來獲得數據,然后以不同的標準對數據進行分析整合,例如以年齡、地域、性別等,再通過示意圖將結論呈現,這是大數據與新聞報道結合的第一個層次,解決了“網友在看什么”的問題。但一篇完整的新聞報道不僅包括呈現既定的事實,還有通過背景介紹、采訪專家學者等來對事實進行分析與解讀,新華社在《大數據揭示網友軍費關切 代表委員解讀軍費增長》這篇報道中就以此來解答了“網友為什么看”以及“權威專家怎么看”的問題,從而使報道厚重充實,權威可信,另外在“從百度知道看兩會熱點”這一報道中,也引入了編輯對相關現象原因的分析。
未來的新聞媒體將共同博弈,利用大數據進行形式和內容的探索與創新,對于增強報道的全面性和深入性都有裨益。但須知“大數據時代不僅意味著機會與挑戰,也會意味著更多的風險與新的外部制約力量”,所以如何進一步提高大數據運用的有效性,應是未來媒體重點探索的問題。