曾凡斌 李藝
【摘要】大數據時代的迅速到來,引起各界學者的關注和思考,目前學者主要集中在技術層面、思維層面以及倫理層面這三個維度對大數據進行思考。本文結合學者們的思考對數據新聞、數據記者、個性化信息、信息安全、界面傳播、關系傳播等方面進行相關的研究分析,以期發現大數據在新聞傳播領域的研究現狀及應用,以及在未來新聞傳播領域對大數據的更廣泛地運用。
【關鍵詞】大數據 新聞傳播學 數據思維 數據新聞 界面
【中圖分類號】G220 【文獻標識碼】A
一、引言
大數據的到來,得益于信息的開放和云計算。一方面,從依靠口口相傳的信息傳播到古登堡印刷術的發明,傳播突破了范圍限制,開始從精英們的“權力”轉變為普羅大眾的“權利”;另一方面,傳播的摩爾定律、云計算等技術更迭使得信息數量呈指數級增加,數據處理更為便宜,海量的數據積累成為可能,這兩方面原因使得大數據具有了可能性。在數據中居于關鍵性地位的政府數據的公開,使大數據能真正發揮作用,由此,便有了大數據產生的基礎和前提。①
大數據的探究已經開始進入人們的視野并逐漸吸引了學界的注意,近年興起的數據新聞、數據記者、眾包新聞、個性化信息、信息安全等是業界討論得比較多的議題。面對大數據的迅猛浪潮,學者開始思考大數據在新聞傳播界的應用和影響等相關問題。相關研究者分別從不同的角度對大數據進行了分析,提出大數據時代新聞傳播領域面臨的機會和革新;數據新聞使我們的新聞更加接近事實的真相;數據思維給我們提供一種應對大數據潮流的思考方式;利用大數據進行政府輿情的觀測等一系列技術。本文將國內新聞傳播學界對大數據的認識、研究以及未來發展趨勢等為對象進行探索。
二、國內新聞傳播學界對大數據的認識
從2011年開始,大數據開始成為包括新聞傳播學在內的學術界共同討論的熱點話題,新聞傳播學界對大數據的認識和研究的熱度不斷上升。從目前實際情況來看,國內新聞傳播學者對大數據的認識和研究主要集中以下幾個維度。
(一)技術層面
就總體而言,對大數據技術及其相關的研究已經逐漸成熟。大數據技術包括數據采集、數據存取、基礎架構、數據處理、統計分析、數據挖掘、模型預測、結果呈現等幾個方面。李國杰指出,大數據和云計算是新常態下提高生產率的新杠桿,所謂創新驅動發展就是主要依靠信息技術促進生產率的提高。②大數據是一種在新時期下形成的產物,但是我們看待它不僅要有前瞻性,還要有一種歷史的眼光,大數據、云計算等新技術將會與信息時代的標志性技術發明如數字計算機、集成電路、光纖通信和互聯網(萬維網)等一起構成一個超越信息時代的新時代。云計算將紛繁復雜的大數據進行篩選、提純、整合,提取出有價值的數據或是發現本來看似毫無關系的數據之間的聯系,打通多領域、多類型的局部數據進行交叉分析,發現蘊藏的巨大新聞價值,創作出高質量的新聞作品。③中國社會科學院信息化研究中心秘書長姜奇平表示,在大數據之前,由于條件有限,對數據的利用都是抽樣調查,且自身開展的統計調查往往采用隨機樣本,而大數據則采用全樣本進行調查。借助大數據,媒體可以在公開渠道獲取更多全體數據,這使媒體對現實的報道更有可能做到總體真實、本質真實和宏觀真實。④
(二)思維層面
大數據時代,我們要培養預測未來的新思維。大數據的應用增加了我們對未來的確定性,打破了通過估計、大概等傳統預測未來方法的局限性,提高了我們對未來的確定性,增加了社會生活中人們的安全感。全球復雜網絡權威、“無標度網絡”創立者巴拉巴西 ( Albert -Laszlo Barabasi) 在《暴發》一書中提出:“人類行為93%是可預測的”,這是大數據時代背景下預見未來的新思維,闡述了如何從大數據中塑造未來美好世界的正能量。⑤倪寧指出,大數據時代應有三大觀念轉變:第一,在分析處理時使用的是全部數據,不再依賴隨機抽樣;第二,不再一味地追求數據的精確性,而是適應數據的多樣性、豐富性,甚至要容忍錯誤的數據;第三,了解數據之間的相關性,勝于對因果關系的探索,“是什么”比“為什么”重要。⑥操瑞青指出,大數據給我們帶來的是研究思維上的轉變,我們從研究“過去發生了什么、為什么發生”轉向于了解 “正在發生什么,未來將會怎樣”。⑦同時,大數據時代的媒體工作人更要具備一種信息關聯性思維和視覺可視化思維的培養。王君超指出,要善于利用專業人員挖掘的大數據來策劃報道、設計版面,而不再僅僅依靠傳統的問卷調查和街頭截訪式的“精確新聞學”(precision journalism)理念;注重對碎片化信息的整合,在對信息把關過程中強化“把關人”的過濾、降噪功能,同時重視數據的視覺化,力求用更直觀、更生動的形式呈現新聞中的大數據。⑧維克托·邁爾·舍恩伯格(Viktor Mayer-Sch?nberger)在他的演講中談道,“大數據時代的思維方式是:每天早上起來想一下,這么多數據我能用來做什么,這些價值在哪里可以找到,能不能找到一個別人以前沒有做過的事情。你的想法和你的思路是最重要的財產?!雹?/p>
所謂思維過程就是我們大腦內在活動的一種習慣性的思考問題和處理問題的模式,它受到我們所處的時代和環境的影響,并決定從什么樣的態度、方式和方法來看待這個世界。在大數據時代,就要以一種大數據的思維來理解我們所處的社會。在新聞傳播領域,大數據思維主要體現在幾個方面:首先是分析方法的變化,大數據時代基于云計算等技術手段,樣本考察時不是選取部分,而是有關問題的全樣本分析,樣本與數據的處理方式也與傳統方法存有明顯差異;其次是對媒介內容產品的聚合,陳昌鳳等學者指出,大數據思維帶來了新聞內容的創新,是一種融合媒體的形態驅動的新聞報道的創新。例如:時趣互動(北京)科技有限公司是國內領先的社會化管理技術、服務與數據解決方案提供商,并將多年運營社交網絡及在社會化營銷客戶服務的成功經驗融入時趣旗下鼎立品牌——品趣,根據不同行業、企業的需求,為企業提供多樣化的官微設計模板并提供各行業分析報告;聚合新浪微博以及企業官網、客戶關系管理系統(CRM)、企業資源計劃系統(ERP)、官方社區等多個平臺的客戶信息,實現多平臺客戶信息一站式管理;每一次任務均提供全面的微博營銷數據分析,分析每一個達人的推廣效果,通過數據對比可以不斷優化投放方案。
(三)新聞倫理層面
在大數據時代,對新聞倫理的思考顯得尤其重要。郭俊義指出,與傳統新聞一樣,大數據新聞報道同樣面對新聞的真實性、規范性等新聞倫理的問題,甚至在一些大數據新聞報道中,也需要傳統的新聞報道介入以核實信息的準確性。技術的中立與否,取決于使用技術的人,大數據運用也因人的行為而具有了溫度和色彩。所謂倫理問題,歸根結底,其實就是人的道德規范和責任意識問題。
在大數據時代,公眾人物、政府官員的隱私更容易被泄露,網絡新聞監管與公民知情權易發生沖突,虛假新聞、低俗新聞給網絡新聞監管帶來挑戰等一系列的新聞倫理問題成為我們避不開的話題。倫理道德問題一直存在,只是在互聯網時代有了新的表現形式,比如“人肉搜索”等網絡暴力現象。大數據時代產生了特殊的人與人之間的關系,韓亦舜認為,大數據時代要遵循相關的倫理原則,尋找、挖掘數據時,目的先行,文責自負;發布數據或信息時,要慎之又慎,也須知道傳責自負;要區別對待公眾人物與普通人物、公眾行為與私人行為。在他看來,法律永遠不能解決所有問題,倫理道德教育永遠需要,要把倫理道德作為基礎教育的一部分,并包含大數據時代人倫關系的新特點;直面利益沖突各方,運用大數據理念,透析各方面利益關注點,達到新的平衡;正確的輿論引導,建立基于數據道德倫理的新秩序。
三、目前國內新聞傳播學者利用大數據所進行的研究
總的來說,學界對大數據的研究主要是在基礎問題和實際應用兩個方面,具體體現在對以下4個問題的研究。
(一)對大數據時代背景下的數據新聞的探索研究
數據新聞的興起,是大數據對新聞傳播領域影響力的一個有力的佐證,有學者預言,數據新聞將會是未來新聞發展的方向之一。何為數據新聞?郭俊義認為,數據新聞應該包括三個方面:一是借助類似百度指數的各類數據工具去挖掘新聞;二是做數據引證;三是數據可視化。只有具備這三個特點,才可能是真正的數據新聞。簡單來說,數據新聞就是用大數據的思維來生產新聞。最初的數據新聞,也就是大數據在新聞傳播領域的初步應用是詞頻分析新聞,即通過對某個報告進行詞頻分析或對某一報刊媒介進行幾年的詞頻分析,用圖示化的形式展現出來。
在數據新聞報道上,英國《衛報》(The Guardian)是學者們研究的經典案例,喻國明等學者也說到,英國《衛報》運用數據新聞幫助讀者更深入理解在倫敦騷亂中事態的進展和背后的原因??梢哉f,數據新聞是我們在大數據時代遇到的一個極大的機遇和挑戰,“數據記者”并不能取代專業記者,但對專業新聞工作者的要求變得更高,他們不僅要理解統計、設計,而且要有新聞專業的敏銳性。張超、鐘新提出了新聞報道將由數據新聞上升到大數據新聞,所謂的大數據新聞就是基于大數據技術,運用可視化和互動性手段,對社會某一熱點問題進行宏觀和中觀的呈現、解釋或預測的新聞樣式,大數據新聞是深度報道的一種類型。大數據新聞與傳統數據新聞最大的不同在于它運用的是大數據技術,其數據主要是非結構的或半結構的,而不是結構性數據。大數據時代,大數據新聞將成為新聞業“內容為王”的核心競爭力之一。大數據新聞可以通過大數據挖掘與分析,通過關聯分析和因果分析,從關注社會表層現實到發掘社會深層現實,極大地拓展人們對新聞事件或社會現實的認知與把握。
(二)對大數據帶來的信息安全和信息開放的反思
在大數據時代,信息的搜集和整理分析變得更加簡單便捷,個性化的信息定制為用戶提供了從未有過的體驗,與此同時,信息的安全也成了一個值得我們注意的問題。大數據既與個人的信息安全息息相關,也和國家的數據主權與信息保護密不可分。劉曉霞指出,信息主體的安全意識淡薄、立法規范滯后、信息傳播和數據的動態、交互、匿名是導致個人信息泄露的重要原因;數據的公開會使得數據在二次使用過程中威脅隱私安全;大數據在帶來各種便利以及機會的同時,也讓我們時刻暴露在“第三只眼”下面,從我們的購物習慣、網頁瀏覽習慣到我們的社會關系網,我們的信息數據在被各種機構收集的同時,也可能造成隱私被泄露、惡意使用、歧視和威脅。而我國缺乏相關的綜合性隱私保護的專門立法,在大數據時代,這無疑是要亟待解決的。而對國家而言,美國“棱鏡門”事件就充分說明了以大數據為代表的信息技術是一把雙刃劍。陳昌鳳等學者指出,對數據的利用和挖掘是依靠技術來進行的,這是獲取信息權的關鍵,也必然會形成發達國家或地區與發展中國家或地區之間的數據鴻溝,由此帶來的信息數據的不平等使用以及獲取重要情報等容易引起跨國安全威脅的問題。另一方面,對于政府的信息公開,肖衛兵認為,大數據所依賴的基礎就是信息,而政府又是掌握信息資源最多的一個主體。如何通過信息公開將政府手中的信息資源開放出去供從事大數據業務的公司進行開發利用是決定我們國家或者某個省能否把握住大數據時代所賦予的絕好機會的關鍵。美國、英國、澳大利亞等國家已經設立了網站向社會分享政府所擁有的信息資源,我國當然也不能落后。
(三)對大數據時代“關系傳播”的思考
新媒體在本質上是一種“關系傳播”,而不僅僅承擔“信息傳播”的職能,大數據的發展會引發一場“關系革命”。互動界面為媒介組織和受眾搭建了對話的平臺,界面是信息傳播者和信息接受者之間建立和維系關系的接觸面,包括呈現信息的物質載體的硬件和支撐信息系統運行的軟件,從而實現信息的輸入和輸出。界面在促進媒介與受眾的關系上會發揮巨大的作用,不但不會弱化媒體的地位,相反會因為受眾持續與媒體互動而延長與媒體接觸的頻次和強度,從而提高和媒體的黏性。從“關系傳播”延伸出來,姜飛提出大數據對國際傳播具有重大的意義,他指出大數據實現了精確計算和模糊計算兩種計算方式上的革命,“社會控制”在信息時代已經不再是虛擬的,而是通過采集和分析每個主體的個人信息,實現最優化的、不同層面的利益最大化和社會控制。在信息化時代,國家和機構的權力半徑在一定程度上取決于風險預警和信息獲取的半徑,只有在國家信息無障礙傳播和獲取、分析、處理信息的能力提高的情況下,這個國家或地區權力延伸的物理半徑才不會狹小。
(四)對大數據環境下的輿情分析的探索
輿情分析的研究范圍主要是社會輿情和網絡輿情兩個方面。相對于傳統的社會輿情分析,大數據時代的社會輿情分析更集中于對大量網絡數據的搜集、存儲、清洗并結合文本挖掘技術從大量低價值密度的數據中獲取相關的輿情研究信息。雖然大數據目前還處在概念層面,但大數據思維模式和信息處理結構的改變,未來的輿情研究在技術上無法回避大數據,大數據成為輿情研究關鍵技術的支撐和核心概念。劉繼、李磊也指出,大數據時代將給網絡輿情研究帶來重要影響,分別是輿情信息規模超大,存儲模式分布化;輿情信息多源頭、多介質載體,多種數據格式并存;輿情處理速度要求高;輿情統計全樣本化;輿情碎塊信息多,有效輿情挖掘困難等。學者唐濤指出,網絡輿情分為顯性輿情和隱性輿情兩類,對不同的輿情要有不同的分析方法,因此他提出要實現網絡輿情大數據分析方法的創新,對于顯性網絡輿情大數據,主要是基于內容挖掘的主題監測方法;對于隱性網絡輿情大數據,主要是基于網絡日志數據挖掘的分析方法。另外有學者提出了大數據與“云平臺”搭建,學者孫培梁研究了大數據時代政府網絡輿情監測系統的建設需求和目標,提出了政府網絡輿情監測系統“云平臺”思路:通過虛擬化技術,在物理服務器的基礎上搭建若干虛擬機,部署相應應用服務器、數據庫服務器,構建虛擬化存儲體系,在云端存儲所有的數據庫。并提出通過電子政務專網,將政府各部門有機聯系,共建輿情大數據與預警中心的建議。輿情的發展趨勢將從輿情軟件開發到云平臺搭建、從信息傳播到情緒傳導機制、從信息流到社會關系網研究等上升到新媒體與社會運動的研究層面。
四、大數據應用于新聞傳播學研究的展望
在新聞傳播領域也將開始一場大數據革命,怎樣將大數據更好地應用于新聞傳播領域呢?本文認為可從以下方面著手。
(一)提高新聞報道的真實性
新聞報道更加接近事實真相的前提就是要擁有大數據,最好是媒體獨有、獨享的數據,媒體擁有更多的獨特資源,騰挪的空間和余地就越大,這就可以為真正進入大數據時代做好準備;另一方面,媒體要注意大數據時代的媒體人才和技術的培養,重視數據技術的儲備與提升。喻國明指出大數據的真正價值在于它的全,大數據的分析價值在于透過多維度、多層次的數據,以及時態的關聯數據,找到問題的癥結,直抵事實真相。陳力丹教授認為,利用大數據實現的數據新聞,可以展示從宏觀與中觀層面對社會某方面的動向和趨勢的動態把握。海量信息的出現讓人們可以充分地接觸對于某一事件或是人物的“真相”,但同時可能會出現“信息綁架”或是“道德綁架”,這就為大數據時代媒體工作人員提出了新的要求,即在避免信息冗余和無序的同時要注意標題黨的出現和利用信息進行造謠的情況,媒體人要有意見領袖的責任意識。
(二)對可預見的新聞進行提早策劃和及時跟進
全面跟進事件的發展動態,從多種渠道收集海量數據,充分利用各個數據庫,從而實現多元、創新的數據呈現形式,為受眾提供一個全新的新聞盛宴。在這一點上,英國《衛報》的成功經驗可以給我們提供參考和借鑒,在豐富和拓展新聞報道的同時,使新聞獲得更廣泛的傳播。
(三)實現精準化的信息推送服務
利用大數據技術,對海量信息進行搜集,分析媒體受眾群的需求,進行個性化的信息聚合,體現新聞的人文關懷。例如:“今日頭條”應用軟件不僅對網易、新浪、騰訊等各大門戶網站的新聞內容進行聚合,還基于對用戶興趣圖譜的分析為用戶定制和推送個性化內容,在個性化閱讀推薦的道路上已經邁出了關鍵的一步。通過社交數據挖掘加個性化推薦的新聞生產和推送模式,給用戶塑造一種 “更懂我”的使用體驗,同時也使整個新聞生產流程顯得更智能。我們進入到大數據時代后,從內容稀缺轉變為信息過載,信息內容更加豐富。以數據為代表的互聯網技術打破了既有產業之間的界線,把之前界線分明的產業融合在一起,傳媒業也在互聯網技術的推動下,不斷和其他產業融合成新的產業,加快了互聯網生態系統的形成。
隨著研究的逐步深入和成熟,大數據研究已經從引入期的熱潮逐漸回歸理性,人們開始嘗試著對大數據技術進行哲學審視和反思,大數據的研究方興未艾,并且將依舊是學科研究的一個重點,也將會有更多的新觀點和新視點出現,隨著媒介融合的進行,新聞傳播學界將會打造出全新的大數據時代的新媒體和媒體新內容。
注釋
①郭全中 《大數據與傳媒業發展》,《新聞與寫作》,2014年第6期。
②李國杰 《對大數據的再認識》,《大數據》,2015年第1期。
③ 劉怡 謝耕耘 《大數據背景下媒體傳播的轉型與發展》,《當代傳播》,2015年第4期。
④劉春城 《理論與實務:大數據對新聞傳播領域帶來的新轉向》,《新聞經緯》,2014年第6期。
⑤沈浩 黃曉蘭 《大數據助力社會科學研究: 挑戰與創新》,《現代傳播》,2013年第8期。
⑥倪寧 《大數據時代的傳播觀念變革》,《西北大學學報( 哲學社會科學版)》,2014 年 1 月第 44 卷第 1 期。
⑦操瑞青 《傳播效果研究的新思考: 基于大數據時代的探索》,《浙江傳媒學院學報》,2004年10月第21卷第5期。
⑧王君超 《大數據思維下的新聞編輯學》,《中國報業》,2014年第6期。
⑨【英】維克托·邁爾-舍恩伯格 肯尼思·庫克椰著 盛楊燕周濤譯 《大數據時代》,浙江人民出版社,2013年版。
陳昌鳳 烏日吉木斯 《數據新聞與大數據思維的應用》,《新聞學》,2014年第4期。
《大數據時代:新聞業創新求變》,《光明日報》,2015年9月19日。
羅弦 《網絡新聞生產中大數據運用的倫理問題及編輯對策》,《科技與出版》,2015年第1期。
《韓亦舜:大數據時代要建立基于數據道德倫理的新公序良俗》,中國大數據產業觀察網,http://www.cbdio.com/BigData/2015-05/28/content_3171874.htm.
楊雅 《大數據分析與可視化技術:新聞傳播的新范式——“大數據與新聞傳播創新”研討會綜述》,《國際新聞界》,2014年第3期。
張超 鐘新 《新聞業應用大數據: 展望、誤區與對策》,《中州學刊》,2015 年第 6 期。
匡文波 《大數據時代的個人隱私保護》,《中國廣播》,2015年第6期。
肖衛兵 《誰在關注中國的政府信息公開:以百度指數為視角》,《情 報雜志》,2013年第 11 期。
夏火松 甄化春 《大數據環境下輿情分析與決策支持研究文獻綜述》,《情報雜志》2015年第2期。
劉繼 李磊 《大數據時代網絡輿情信息集成機制研究》,《電子政務》,2015年第2期。
唐濤 《基于大數據的網絡輿情分析方法》,《現代情報》,2014年第3期。
李彪 鄭滿寧 《社交媒體時代的網絡輿情——生態變化及輿情研究現狀、趨勢》,《新聞記者》,2014年第1期。
【本文系教育部人文社會科學研究青年基金項目《互聯網使用時間、使用方式對現實政治參與的影響》(項目批準號12YJC860052)部分研究成果】
(本文編輯:肖婧為)