陳敏學
大數據與新媒體傳播
陳敏學
現如今,數據量的大規模增長以及對數據越來越廣泛的應用,都在表示著大數據的時代已經到來。大數據對我們生活的影響是在不斷擴大并且不斷深入的,在生活的方方面面都能體會到大數據的影響。媒體作為信息的收集者與傳播者,無時無刻不在與信息打交道。但是就目前來看,媒體對于大數據的應用遠遠不足,媒體行業仍然在探討如何更好地利用大數據以提升整個行業的水平。大數據的應用是必然的,作為媒體,要不斷創新思維,改變固有觀念,迎接大數據時代的挑戰,發展自我;同時也不應在大數據的信息時代迷失自我,在信息爆炸的時代更應該提升專業化水平,堅守媒體的本質和精神。
大數據;媒體;個性化;互動;社會責任
[作者]陳敏學,復旦大學新聞學院。
近年來,隨著信息技術的不斷發展,數據量呈現爆發式增長,大數據的概念逐漸被越來越多的人所接受,其影響也滲入社會的方方面面。國際數據公司(IDC)預計,到2020年,50%的商業分析都將通過依托于認知計算技術的規范分析進行,并且在分析中,對分析有高價值的數據將翻倍,傳遞給決策者的數據將有60%具有可操作性。同時,IDC《中國大數據技術與服務市場2013—2017年預測與分析》研究報告顯示,中國的大數據技術和服務市場將以年復合增長率38.7%的速度從2013年1億6550萬美元增長至2017年8億5010萬美元。在中國,大數據首先更多地被應用于擁有成熟的IT系統并且積累了足夠多數據的或者以顧客為導向隨時應對市場變化的部門。之后,更多的行業和部門開始對大數據進行理性運用,電信和銀行根據需求進行了基于Hadoop的應用,政府和醫療也已經開始了他們的大數據計劃。
大數據、云計算等前沿技術的蓬勃發展,對于社會發展的意義重大。大數據不斷深入發展的趨勢不能阻擋,雖然“大數據”一詞在很多領域引起非常多的關注,但媒體很少提及大數據對自身的影響。如2014年2月,《紐約時報》發表了一篇名為《大數據時代》(The Age of Big Data)的文章,文中列舉了很多案例說明大數據對社會多個部門產生的影響,卻沒談及在當今形勢下,新聞業乃至整個傳媒業會受到怎樣的影響[1]。毫無疑問,新聞行業不能將自身置于大數據時代之外,若不能很好地適應大數據的發展,不能將傳統新聞報道與大數據相結合,隨時會被整個時代所淘汰。傳統的新聞行業有自身的局限性,如何更好地適應大數據的發展,是需要探討的問題。
(一)大數據概念
在2008年《自然》期刊中,提到了現代科學面臨最艱巨的挑戰之一,就是如何應對正在產生的信息洪流。一千萬億字節就已經是很大的容量,但是事實上的需要遠超于此,這些數據都是“大數據”的資本[2]。在這里,多次提到了“大數據”的概念。“大數據”的概念首先強調了“大”,表示了系統需要管理的數據規模極大,相對于之前的CPU和儲存技術而言,這些規模過大的數據處理需要特別對待。從歷史發展來看,超大規模在提出時表示的是GB級別的數據,海量數據提出時表示的是TB級別的數據,而大數據則是指PB(1015)及以上級別的數據[3]。
Gartner研究公司認為,“大數據是需要利用合理成本的新處理模式進行處理才能使其擁有者具有更強的洞察力和決策力的海量、髙增長率和多樣化的信息資產”。在這里,強調更多的是大數據的“資產性”作用。
(二)大數據基本特征
在此之前,數據的產生與收集一直存在,但是大數據有獨有的特征。隨著互聯網、物聯網和云計算技術的迅猛發展,數據的數量不僅以指數形式遞增,而且數據的結構越來越趨于復雜化。相對于以往普通“數據”,“大數據”具有更深層次的內涵。根據IBM商業價值研究院全球企業咨詢服務部執行報告《分析:大數據在現實世界中的應用》,大數據具有四個主要特征,即數量(volume)、多樣性(variety)、速度(velocity)以及精確性(veracity),簡稱為“4V”。“數量”主要是指數據規模迅速增長,數據量從TB上升至PB級;“多樣性”指向數據的多種形式,結構化與非結構化相結合,從單一的文本形式轉變為多媒體形式;“速度”強調數據的運動,要求分析流數據,數據運動的速度極快,這便要求在不到一秒內做出決策;“精確性”有兩個層面的意義,一是原生數據的內生性和不精確性,二是在數據的管理上,可靠性和可預測性使大數據的分析結果有精確性。
(三)大數據發展現狀
在國外尤其是西方發達國家,大數據的利用已經十分廣泛且成熟。政治和經濟領域中,很多決策基于數據分析而得出。在學術領域,美國麻省理工大學計算機科學與人工智能實驗室建立了大數據科學技術中心。該技術中心主要致力于加速科學與醫藥發明、企業與行業計算,并著重推動在新的數據密集型應用領域的最終用戶體驗的設計創新。在產業領域,國外許多著名企業和組織都將大數據作為主要業務,如IBM、EMC、微軟、戴爾、惠普等國際知名廠商都提出了各自的大數據解決方案或應用[4]。
國內的大數據產業也緊跟世界潮流不斷發展。國內大數據已經應用在金融、電信、政務、醫療、文化等行業,并逐步擴展到其他行業擴展。如金融領域,螞蟻金服大數據應用于螞蟻信用,綜合考慮個人用戶的信用,構筑信用消費生態;交通運輸領域,中國家庭中GPS的廣泛使用;體育領域中專業球隊的比賽也利用大數據進行分析,為球隊制定可靠、有效的戰術、戰略提供有力的數據參考。
不論是國外還是國內,大數據的發展是十分迅速的,不僅是大數據的信息量,更是大數據的應用量,并且大數據的應用范圍一直在不斷擴大。
(一)應用現狀與困境
著名的O'Reilly公司斷言:數據是下一個英特爾,像“英特爾內置”一樣,未來屬于將數據轉換成產品的公司和人們。有效的組織和使用大數據能夠推動社會經濟和科學研究的巨大發展,并帶來前所未有的機遇。歐美等經濟發達國家的一些出版傳媒企業在大數據技術的應用上已走在前列,這些企業充分利用大數據技術挖掘企業的核心價值資源,建立新的商業模式。目前,國外出版傳媒企業有關大數據應用主要集中在產品策劃、產品營銷、智能分析和可視化、數字化教育等方面[5]。
以產品營銷為例,對媒體而言,廣告主是直接的服務對象。而今用戶大量的在線行為數據觸手可及,有針對地投放廣告成為可能,媒體就可以滿足廣告主對精準營銷的需求。如美國衛星電視運營商DirectTV通過部署測試可尋址電視廣告,使其營收中有10%的收入是可尋址廣告帶來。通過可尋址廣告系統,廣告主可以自主選定他們感興趣的家庭類型,同時DirectTV會委托第三方數據提供商在其注冊用戶中尋找符合要求的家庭[6]。根據第三方提供的數據,從各個維度各個層面推斷用戶購買產品的意向,從而為廣告主推薦最為優化的用戶。如此一來,通過對大量信息的收集,優化其產品營銷使廣告主的投放更具有針對性,以一種和用戶進行互動的形式,達到商業利益上的雙贏。
同時,媒體應用可視化技術,對大數據進行分析應用,提升其信息傳播的能力。大數據可視分析是指“在大數據自動分析挖掘方法的同時,利用支持信息可視化的用戶界面以及支持分析過程的人機交互方式與技術,有效融合計算機的計算能力和人的認知能力,以獲得對于大規模復雜數據集的洞察力”[7]。媒體向大眾傳遞信息,可視化的展示尤為重要。通過可視化處理,大數據可以以一種更為生動有趣的形式傳遞到大眾,提升了媒體信息傳遞的水平。
但由于媒體業在大數據的時代缺乏立足的根基,被技術公司遠遠落在后面。根基的先天不足加上發展開始時間晚,屬于媒體業的想象空間并不多,大數據對媒體的價值非常有限。大多數媒體機構在大數據領域并不具備顛覆創新和業務轉型的條件,原因是多層次的。首先最為本質的問題就是媒體業所掌握的數據資源有限,接下來關鍵的問題是,媒體業缺乏處理大數據的能力。媒體業自身生產的數據本身就十分有限,對于有限內容的數字化程度也不夠。以紙媒為例,在新媒體的沖擊下,傳統媒體特別是紙質媒體所受的沖擊首當其沖。國內的《新聞晚報》《上海壹周》等,國外的《紐約太陽報》、紙質版的《獨立報》等也紛紛停刊,甚至有媒體人稱“紙媒已死!”傳統以版面為對象的生產方式,在開展新媒體業務時難以適應,需重新轉化編碼。而在內容數據庫的建設方面,很多媒體甚至處于“零”的狀態[8]。媒體業在大數據環境下該如何生存和發展,這是今天媒體人亟須解決的難題。
除了要解決技術方面存在的困難,媒體作為社會的“守夜人”,應該時刻注意內容至上。誠然,在大數據技術的支撐下,媒體可以根據用戶受眾的需求,推送其感興趣的新聞內容,更具針對性。如“今日頭條”能夠分析出一些用戶在不同的城市有規律的往返與切換,從而識別出潛在的目標受眾,把相應的信息推薦給他們。2016年春運期間,中國鐵路總公司與其下屬的18個鐵路局在“今日頭條”上發布臨客增開信息,單條資訊的閱讀量達到了50萬。但是,如果完全以用戶為依據不加以專業引導,新聞會形成碎片,不利于完整性新聞的傳播,更不利于媒體發揮輿論監督的“守夜人”作用。
(二)媒體在大數據時代的發展展望
首先在數據的獲取方面,大數據應用獲得成功的兩個重要因素一是數據源的代表性;二是價值、良好的供給與需求的合作以及有廣泛影響力的平臺。數據搜集是數據新聞生產流程的第一個環節,也是最重要的一環,直接影響后續階段的可信性和有效性。隨著數據分析和數據挖掘技術的發展,數據新聞分析的數據量級遠超傳統新聞圖表的數據規模[9]。媒體在處理傳統新聞圖表的數據時已捉襟見肘,在選取、管理及處理的過程中均有明顯的滯后性[10],這就需要媒體運用更多的手段來處理新時代下的數據。同時,數據的共享性還需要更進一步的提升,媒體所獲得的數據對于其提升遠遠不足,這就需要全社會共同的努力,將數據資源進一步社會化。
20世紀40年代美國學者提出的“社會責任論”是目前世界四個主導性新聞理論之一,其中一點便是將新聞界提供的信息流、思想流和感情流送達每一位社會成員,這是對新聞完整性的要求,以保證每個公民平等地分享信息。大數據分析下的個性化新聞在一定程度上會造成信息的碎片化,新聞的發布或許會根據數據分析因人而異。但是大數據的發展是不可阻擋的,并且大數據帶來的發展機遇不可忽視,媒體處理好個性化與專業化的問題就顯得尤為關鍵。媒體充當著社會記錄者與信息傳播者的角色,并將自身定位成社會解讀者和分析預測者。深度解讀和去偽存真本是媒體的重要職責。在大數據的環境下,媒體在大數據全面深刻的洞察功能和豐富的挖掘能力作用下,滿足受眾需求的同時,以專業的理論和強大的社會責任感處理整合信息,既不盲目跟風,亦不因噎廢食,媒體的傳播力、公信力和影響力將得到大大的提升。
大數據時代的產生得益于計算機與互聯網等技術的迅猛發展及在各個領域的廣泛應用。大數據對各行各業來說,既是機遇也是挑戰。大數據這一概念從出現到現在,經過近幾年的發展,已經在應用方面不斷深入和發展。數據的量在不斷地擴大,大數據的儲存處理技術也在不斷發展。反過來,從傳統的數據儲存發展到現如今的Hadoop等一系列海量數據儲存技術,讓數據的量得以不斷擴大,大數據的應用也因此更具科學性。作為時代發展的趨勢,如果能很好地應用大數據,無疑會給自身帶來更大的發展。媒體行業也是如此。對于媒體行業來說,大數據仍然較為陌生,如何更好地利用大數據,仍然是值得媒體行業探討的話題。以開放的思想和嚴謹的專業知識迎接大數據時代,是媒體行業在大數據時代的發展方向。
[1]官建文,劉揚,劉振興.大數據時代對于傳媒業意味著什么?[J].新聞戰線,2013(2):18-22.
[2]Big data:Science in the petabyte era[J].2008,455:1-136.
[3]于艷華,宋美娜.大數據[J].中興通訊技術,2013(1):57-60.
[4]李學龍,龔海剛.大數據系統綜述[J].中國科學:信息科學,2015(45):1-44.
[5]吳仁群.大數據在出版傳媒企業中的應用[J].科技與出版,2016(1):24-26.
[6]黃升民,吳殿義.大數據在媒體運營中的應用及思考[J].山西大學學報(哲學社會科學版),2015(2):73-78.
[7]任磊,杜一,馬帥,張小龍,戴國忠.大數據可視分析綜述[J].軟件學報,2014(9):1909-1936.
[8]王武彬.大數據浪潮中的傳媒業——兼談大數據討論的若干誤區[J].新聞記者,2013(6):28-31.
[9]徐銳,萬宏蕾.數據新聞:大數據時代新聞生產的核心競爭力[J].編輯之友,2013(12):71-74.
[10]吳文平,陳沁蓉.以大數據為支點推動轉型[J].新聞戰線,2014(1):53-55.