文|曾凡斌
(作者為暨南大學新聞與傳播學院講師,中國人民大學新聞學院博士研究生,本研究是2012年廣州市哲學社會科學發展“十二五”規劃課題一般項目“互聯網使用時間、使用方式對現實政治參與的影響——基于對廣州市網民的實證分析”,項目號為2012YB31)
隨著博客,微博,社會網絡網站,云計算、物聯網等技術的興起,數據正以前所未有的速度不斷增長,于是出現了“大數據”時代。“大數據”不僅是科研的熱門課題,也是產業界的熱門,更受到其他各界的密切關注。2008年9月自然雜志發表一組文章“Big data:The future of biocuration”,“Big data: Wikiomics”, “Big data: Distilling meaning from data”來探討大數據的出現。科學雜志在2011年2月推出專刊,主要圍繞著科學研究中大數據的問題展開討論。2012年3月,美國奧巴馬政府發布了“大數據發展計劃”,計劃在科學研究、環境、生物醫學等領域利用大數據技術進行突破。“大數據”(Big Data),指信息或數據量的巨大,數據的單位,已經從G和T發展到P、E、Z等為計量單位,其中1TB=1024GB,而1ZB卻等于10億TB。如此龐大的數據將對傳統媒介經營管理方式產生什么影響?傳媒又應如何應對它呢?
傳統的媒介經營管理方式或者是建立在經驗的基礎上,或者是建立在傳統數據基礎上,如抽樣獲得,通過財務軟件獲得,這樣的數據往往是結構化的數據,或者是有關聯的數據,是管理員按照事先設定的程序獲得的。如調查讀者,聽眾,網民可通過嚴格的隨機抽樣獲得,并且通過樣本來推斷總體,而對于傳媒內容的財務數據則可通過財務軟件了解進,銷,存,工資,成本,收入,利潤等多種經營數據,以滿足對數據的分析和決策。
然而,“大數據”通常為非結構化數據,并包含彼此可能無關聯的數據集,例如來自各種獨立數據流(如Twitter、社交網站、傳統CRM、調查結果、人口數據、缺陷數據等)的數據,這不同于通常彼此相關的傳統數據集。于是,“大數據”分析通常會突破傳統數據庫以及分析流程和系統的界限。首先,數據集規模可能過大;其次,數據集彼此無關聯;最后,“大數據”需要極為快速地分析。分析這些“大數據”,傳統的方法和人才就不能適應新的需求了。分析大數據,就要依賴新興技術(如Hadoop Map Reduce)、R統計語言,以及并行多處理、高速聯網、快速I/O存儲(包括基于閃存的新興存儲)等全新的高性能基礎架構解決方案。此外,大數據分析還需要新型技術工作者:數據科學家,甚至是數據藝術家。為此,傳媒就要采用新的技術方法和使用新的人才才能適應“大數據”的要求。
對“大數據”的分析使傳媒經營管理者實時的了解環境內外的最新最全的信息,并從中得出大量深刻見解,改善經營管理的水平和方法。例如,Farmville的制作公司Zynga每天生成超過15 TB的新數據,并通過對玩家行為的持續數據分析結果,測試、調整和優化游戲中的特性,其實現了鼓勵玩家行動起來,以促進玩家針對游戲的種種元素支付真正的錢,并保持玩家對游戲的興趣。于是,雖然在線游戲Farmville是一款非常簡單的游戲,但是由于其背后有著對大數據分析的支持,其也能不斷的飛速發展。當傳媒管理者對數據有較為完善分析能力時,其對事件的把握及預測能力就會增強,通過對大數據分析、預測會使得決策更為精準。
經營管理就是決策,決策需要信息。決策過程實際上就是一個信息輸入、信息輸出及信息反饋的循環過程。應對大數據的挑戰,媒介經營管理需要在新聞生產、受眾調查、效果研究等方面進行創新。
媒介經營管理首先離不開新聞生產,傳統的新聞生產無奈于依靠作者的采訪和編輯的加工,評論等,但現在新聞生產的創新也可利用大數據了,大數據時代數據成為新聞的核心資源之一,數據不僅可以作為新聞報道的內容,數據對于某個事件發生的原因、狀況的揭示會比記者的觀察與調查更準確,更有說服力。例如,英國《衛報》解讀2011年騷亂的事件,除了采用常規的社會科學研究方法,如采訪調查外,還請了曼徹斯特大學的專業人士對250多萬條的與騷亂有關的Twitter信息進行大數據的分析,在此基礎上做成了《暴徒的告白》,這個信息量是非常大的,包括抓取微博的信息,網絡上的信息,如果沒有大數據的分析方法,是不可能實現的。通過大數據生產的新聞往往給用戶提供耳目一新的新聞感官和認識世界的圖景。
其次,媒介經營管理離不開受眾的調查,受眾調查的創新也可利用大數據,與傳統的抽樣調查相比,媒體可以利用大數據更為精確辨識到受眾群構成及其特定階段的具體需求,可以據此階段性地調整新聞生產中各類信息的權重,針對性地提供新聞信息服務、增加客戶粘度。例如,愛點擊iClick自主研發的XMO受眾解決方案(XMOAudienceSolution)可以接觸到最細分的受眾。愛點擊iClick與上百營銷者合作推出上千個在線營銷活動,并在過程中累積了上億的受眾數據,結合第三方數據,強強聯合推出22種精選細分受眾群體。這些受眾群體按行業(例如:旅游、銀行、金融以及教育)、生活方式和興趣(例如:性價比追求者、商務人士、吃貨等等)劃分,以切合廣告主不同的需要。《美國新聞業2011年度報告》報告認為,在媒體市場已成為買方市場之后,用戶決定著哪些內容以哪些方式呈現。媒體業的未來屬于那些“既懂得公眾不斷變化的行為,也能準確投放內容,并將廣告按每個用戶偏好投放的人”。因此,利用大數據來進行受眾調查的創新有利于促進媒介經營管理的精確化。
最后,效果研究的創新可利用大數據,效果研究是傳播學研究的重點,也是媒介經營管理關注的重點。受眾接觸了媒介尤其是廣告信息時候,其認知、情感、態度、行為如何發生變化,傳統的問卷調查采用受眾的自我報告難以獲得精確的信息,控制實驗往往又是在小群體中進行,難以真正的推進到總體。而大數據下的數以億計的高速度、低成本的運算器,計算機,傳感器,網絡平臺使得獲得準確的受眾效果數據成為可能。這方面一個重要的例子是美國的Facebook,由于數以萬計的Facebook用戶的個人信息,個人習慣都在網站中出現,所以Facebook可以通過大數據分析后再將其賣給企業,企業再根據每個人的特點投放最個性化的廣告,于是,當網民使用Facebook時,他(或她)只會看到自己最想看的廣告,從而實現傳播效果的最優化。
總之,只有通過媒介經營管理這幾個方面的創新,才能真正使得媒介的經營管理方式由經驗型向科學型管理轉變。而基于大數據的科學型管理必然是精確、全面、立體而富有預測性的。
在“大數據”的環境下,媒介經營管理怎樣才能實現由經驗型向科學型管理?這就需要進行數據挖掘,從“大數據”中尋找規律,才能為科學型的媒介經營管理奠定基礎。數據挖掘出現于20世紀80年代后期,90年代有了突飛猛進的發展。美國麻省理工學院在2001年1月份的《科技評論》(Technology Review)提出將在未來5年對人類產生重大影響的10大新興技術,其中第3項就是數據挖掘。
數據挖掘(Data Mining)是通過分析每個數據,從大量數據中尋找其規律的技術,主要有數據準備、規律尋找和規律表示3個步驟。數據挖掘的任務有關聯分析、聚類分析、分類分析、異常分析、特異群組分析和演變分析等。數據挖掘是一種決策支持過程,它主要基于人工智能、機器學習、模式識別、統計學、數據庫、可視化技術等,高度自動化地分析企業的數據,做出歸納性的推理,從中挖掘出潛在的模式,幫助決策者調整市場策略,減少風險,做出正確的決策。
數據挖掘已經在企業的經營管理中發揮了很大的作用,而我國的傳媒經營管理也開始利用其為管理服務。例如,作為北京地區有線廣播電視網絡的建設開發、經營、管理和維護的運營商——歌華有線,其正在建設的呼叫中心系統,專門引入商業智能,實現信息數據的深度挖掘,并以報表、圖形的方式對大量的數據信息進行實時的網絡在線分析,為歌華有線的業務經營提供了有力的分析工具。而新華社2008-2015年《工作設想》就有關于數據挖掘的思想,如在關于多媒體數據庫建設目標中明確提出要強化搜索查詢功能,提高搜索查詢速度和準確率的思路。
在網絡媒體的經營管理中,數據挖掘技術更是建立在博客、微博、社交網絡網站這些網民行為的大數據基礎上。例如,騰訊擁有超過7.52億QQ即時通訊活躍賬戶,1億微信用戶、4.25億微博用戶和超過1億的視頻用戶。在積累了個人用戶多方面的海量數據后,2012年騰訊提出了“大數據營銷”的概念。騰訊網總編輯陳菊紅表示“將從這些海量數據中挖掘、分辨出用戶的行為模式、興趣偏好等,打造專屬于每個人的智慧門戶。”騰訊不僅在各大產品線中都設置了數據挖掘團隊,還在和一些第三方數據挖掘公司、營銷公司展開合作洽談,充分挖掘用戶在網上的行為、關系、UGC(用戶產生的內容)等數據,“通過合理的方法找到對企業有幫助的數據,并且將營銷預算合理的分配在為數眾多的數據來源平臺上”,從而提高營銷效率。
“大數據”通常是非結構化數據,通過數據挖掘技術在非結構化的數據中獲取規律性的東西,應該是管理者夢寐以求的,也必然會對管理思維、管理方法、管理手段帶來變革性的革命。傳媒是一個典型加工信息的組織,在加工信息的過程中,必然會接觸到大量的數據,在傳統的經驗管理中,對數據的忽視或者先入為見的猜測,都帶來過深刻的教訓,后來在抽樣技術,統計分析的支持下,雖然可以分析數據的結果,但其往往是結構化的數據,面對新媒體所帶來的非結構化的大數據,需要利用更為復雜的數據挖掘技術才能顯示現內部的規律,使傳播效果達到最優化,而復雜的數據挖掘技術則需要建立更為先進的分析工具和分析人才的基礎上,惟其如此,大數據才能真正的引領一場管理革命。