總裁 施水才
各位新老朋友大家上午好。
非常高興能有這個機會與大家分享有關大數據的一些思考和媒體實踐。可以說,引起媒體業下一步革命的新技術主要包括四項,即大數據(Big Data)、云計算(Cloud Computing)、移動互聯網(Mobile Computing)、社會化計算(Social Computing)。這四項技術幾乎成為各行各業每天都在談論的內容,今天我的主題演講也是圍繞這四項新技術,談三方面的內容:大數據時代已經來臨、媒體業在大數據時代的挑戰和機遇、拓爾思在媒體業的大數據實踐。談談有關大數據的思考。
早在1993年,美國《紐約客》刊登了一則由彼得?施泰納創作的漫畫,這幅漫畫因它的標題——“互聯網上沒有人知道你是一條狗”而變得流行,這是當時對“遠程通訊”的一種理解。但是20年后的2013年,隨著人們對移動互聯網、社交網絡、電子商務的廣泛使用,互聯網不僅僅知道對面是一只狗,還知道這只狗喜歡什么食物、幾點出去遛彎、幾點回窩睡覺。是謂“處處行跡處處痕”,這一切都是基于大數據對用戶的大量行為數據的累計分析。
“人類歷史上最早的一批城市都誕生在河邊,河流為人類提供了食物、水和交通。而我們要做的,就是創造一條數據的河流,來滋養信息經濟的發展。”這句話來自美國的一家開放數據平臺網站,這也是我最喜歡和認同的關于大數據的看法。前兩天,政府公布了2015年我國信息消費將達到2萬億人民幣,信息產業也將成為我國經濟發展的支柱型產業。截止到2011年,全球創建和復制的數據總量為1.8ZB(約1.8萬億GB),每兩年翻一番,到2020年全球將達到35ZB的數據信息量——世界已經不折不扣進入“大數據”時代。
近兩年關于大數據的分析研究也受到了各個領域的追捧。比如,2011年5月,麥肯錫發布《大數據:創新、競爭和生產力的下一個新領域》;2012年1月,達沃斯世界經濟論壇發布《大數據,大影響》報告,宣稱數據已經成為一種新的經濟資產類別,就像貨幣和黃金一樣,是21世紀的石油;2012年10月,IBM也發布大數據報告《分析:大數據在現實世界中的應用》。
2012年3月,奧巴馬政府也提出了有關大數據的國家戰略,發布《大數據研究和發展倡議》,投資2億美元啟動“大數據研究和發展計劃”,目標是增強收集海量數據、分析萃取信息的能力。這事關美國國家安全、科學和研究的步伐,以及引發教育和學習的變革,其重要性堪比當年的信息高速公路。

圖1:互聯網上沒有人知道你是一條狗
大數據概念如此流行的原因到底是什么?有關專家學者分析得出,數據的爆發式增長及其社會化趨勢是大數據產生的本質原因。不論是作為個體人的我們,還是馬路邊的攝像頭,任何事物都將成為數據的一部分。同時,我們還要清楚的認識到,大數據的特征并不是量大就是大數據,而是業界總結出來的“4V”特征,即更大規模的數據(Volume)、更多樣化的數據(Variety)、更實時的數據(Velocity)、價值密度低商業價值高(Value)。另外,大數據的精髓更要明確,我的總結有三:不是隨機樣本,而是全體數據;不是精確性,而是混雜性;不是因果關系,而是相關關系。
對大數據有了一個初步的認識之后,接下來我們還要考慮的問題是,如何應用大數據。可以說,云計算和大數據是一個硬幣的兩面,云計算是大數據的IT基礎,而大數據是云計算的一個殺手級應用。總而言之,大數據應用的落地是通過云計算來實現的。云計算的應運而生,主要是由于現有的信息技術和軟件難以處理大數據的規模和復雜性。對大數據的獲取、存貯、搜索、分享、分析以及可視化等等,都是大數據對現有信息技術提出的挑戰。
此外,大數據時代的三大發展趨勢對媒體的發展有很大的借鑒意義。第一,數據將成為資產,這里的數據既包括媒體的內容數據,也包括媒體的經營數據、用戶數據等各方面的數據。第二,行業的垂直整合。比如,蘋果公司從內容到設備,再到軟件等的一條龍發展模式。第三,泛互聯網化,未來我們的任何行為都有可能和互聯網有關系。媒體行業在未來的發展道路上應該借鑒大數據的這三種發展趨勢。
大數據帶來的變革是多方面、多領域的,不僅對科學技術的發展提出挑戰、給媒體行業變革以參考,還對經濟生態產生了一定的影響。大數據作為一種自然資源,是新經濟競爭力,將形成一種新的經濟生態——反饋經濟。數據本身沒有意義,但是基于大數據的反饋經濟模式將帶來新的一場生產革命:一切將以數據為中心,基于數據進行深度挖掘和分析;以最小的成本創造更快更好的產品;通過實驗性思維和微創新,降低商業風險;反復迭代與用戶緊密聯系,做到更加精益求精。同時,反饋經濟還會帶來量化自我運動,硅谷的先驅者們今年開始了一項活動,就是找到一群自愿者,自愿戴上傳感器及手持移動設備,盡量把每天生活的軌跡(衣食住行)記錄下來,然后從中發現規律,反哺經濟。
大數據帶來的跨界競爭和顛覆性創新非常重要。
挑戰一:傳統媒體影響力日漸式微,漸成老年人專利
調查數據顯示,目前北京地區電視機開機率從三年前的70%下降至今天的30%,傳統廣播電視收聽收視群體逐漸向老年人集中,年輕人不再看電視;截止到2012年底,我國網絡視頻用戶已達到4.5億,在全國網民總數中占比超過70%;2008年《芝加哥論壇報》及《洛杉磯時報》宣布破產,2009年105家美國報紙宣布破產,2009年德國《紐倫堡晚報》《法蘭克福論壇報》《德國金融時報》相繼破產和停刊,2012年《中國新聞出版報》報道稱10月報紙廣告收入環比下降41.7%,同比下降6.6%……以上調查結果顯示,傳統媒體影響力日漸式微,傳統媒體有朝一日真的可能成為老年人的專利。
挑戰二:兩個輿論場正在進行能量轉化
以黨報、電視臺等傳統媒體為主的官方輿論場和以QQ、微博、論壇、社區等互聯網傳播方式為主的民間輿論場,正在進行著能量的轉化。人民網輿情監測中心得出的一組數據顯示:在20世紀80年代,官方媒體掌握著80%的話語權,而在2012年的20個網絡熱點事件中,非官方媒體掌握了75%的話語權。從長遠來看,話語權從官方輿論場部分轉移到民間輿論場的趨勢是不可逆轉的,兩個輿論場正在進行能量的轉化。
挑戰三:報紙在衰落
由圖2我們可以得出美國紙質媒體的廣告收入情況,2002年左右和1990年是報紙廣告收入的高峰峰值,大約為600億美元,而1950年左右的美國報紙的廣告收入約為200億美元,這也是如今2012年的數值。從報紙廣告收入的迅猛下滑,我們也可以看到報紙的衰落速度。見圖2所示。
“往年4月報紙廣告環比應該大幅增長,今年4月環比僅增長7%,導致4月報紙廣告同比下降幅度達到15%,說明報紙廣告下降的趨勢不僅沒有得到改善而且有繼續惡化的趨勢。一年過去了1/3下半年回暖可能微乎其微,已經可以判斷報紙廣告進入一次新的衰退期。”中國廣協報刊分會主任梁勤儉給出這樣的預期。
相較之下,網絡廣告早在15年前就開始繁衍生息,從1998年到2013年,可以說這是網絡廣告騰飛的十五年。2003年,網絡廣告收入就突破十億,2007年,電商行業的爆發式增長使得網絡廣告突破100億,預計到2015年網絡將成為廣告投放的最大媒體。
另外,自媒體粉絲數或影響力挑戰著報紙的發行量。最為全國發行量最大的報紙《參考消息》,它的發行量達到340萬份,而新浪微博擁有粉絲數最多的博主李開復的粉絲數卻高達5000多萬,這是一個讓傳統報紙媒體的小伙伴們驚呆的數字。
那么,傳統媒體之所以衰落的根源在哪?這是我們需要探究的一個重要問題。首先,受眾注意力的流失,受眾的注意力已經向網絡媒體、社交媒體和自媒體轉移,特別是微博和微信的爆發式增長,吸引著越來越多的受眾注意力。次,傳統媒體未能解決好用戶身份和反饋機制。傳統媒體需要以“反饋經濟”的思路來生產內容,細分人群,精準營銷,創新服務。第三,缺少互聯網和大數據思維,傳統媒體創辦自己的電子報和手機版失敗的例子是最為成功的說服。

圖2:報紙在衰落
經過和有關專家學者的探討,我們得出,媒體轉型的關鍵就是轉變思維,也就是要有互聯網思維。所謂的互聯網思維,大體可以概括為五點,即平臺思維、個性化思維、社區化思維、網狀思維和跨界思維。


圖3:網絡廣告騰飛十五年
舉個例子,美國的一個線上視頻網站——Netflix,用大數據捧火《紙牌屋》。在開拍之前,Netflix 是否知道《紙牌屋》會火呢,Netflix 在美國有2700萬訂閱用戶,在全世界則有3300萬,它比誰都清楚大家喜歡看什么樣的電影和電視。每天用戶在 Netflix上產生3000萬多個行為,比如你暫停、回放或者快進時都會產生一個行為,Netflix 的訂閱用戶每天還會給出400萬個評分。《紙牌屋》的成功得益于Netflix海量的用戶數據積累和分析。
綜上所述,我們可以分析出大數據時代媒體業的發展趨勢。大致有三:平臺型公司;細分媒體;平臺向大,細分向小。
同時,大數據也使傳統媒體的作業流程有了全面改造的空間,這也是大數據為傳統媒體帶來的機遇。不論是在稿件的選題上,還是在稿件的撰寫以及對其內容的評估上,都要全面引進大數據的理念和分析方法。選題:傳統媒體作業方式中,選題的來源一般為記者自主策劃,上級領導命題,或來自網絡、電話、線人舉報。而如果借助大數據,可以形成一個選題數據庫,把最新的熱點、重點進行數據化呈現。記者的經驗能力結合數據決策,可以找到最好的選題(普遍存在,領導重視,群眾關心)。撰寫:記者在撰寫文章時,會涉及到一些社會調查,通過街頭隨機訪問、抽樣統計的方式,樣本小,難免以偏概全。而借助于大數據,可以在無提示、無干擾的情況下,采集全網數據。更全面、更客觀、更真實的反映整個社會基本面的狀況和各界的態度以及立場分布。評估:借助于大數據可以實際評估出,傳統媒體的某一篇文章,某一個專題,某一個觀點、某一個記者、評論員在整個網絡世界的影響力。也可以看到競爭媒體的影響力狀況和變化趨勢。這樣,對于內部管理、績效評估、媒體發展都有了可量化的數據和指標。從經驗決策全面轉向數據決策。
拓爾思在媒體業的大數據實踐始終圍繞著三個核心:以數據為核心、以服務為核心、以移動互聯網為核心。
拓爾思服務于媒體業的產品和服務主要包括:
1、全媒體管理系統——媒體單位新一代全媒體應用解決方案。全媒體的核心是以數據為中心,拓爾思全媒體平臺已經在諸如人民日報、中新社等多家媒體和國家級新聞單位落地,同時也在研發基于云平臺的新一代全媒體應用。
2、移動應用產品——擁抱移動互聯網的全方位解決方案。拓爾思在媒體業的最新應用是關于西藏人民廣播電臺的移動互聯網方面的全覆蓋應用,包括資訊、廣播、電視、音樂、視頻、圖庫等。
3、SMAS社交媒體分析云服務——以大數據為核心的媒體分析和內容挖掘服務。包括全媒體信息發現、大數據云服務平臺、全方位服務等。《中國汽車報》以此搭建起了“國家級汽車產業信息數據平臺”——有數(Yousure),其在報紙上刊登的大量數據圖表皆是源于此數據分析平臺。
4、Netsnap網絡新聞轉載云服務——為媒體網站提供精選的網絡新聞,以互聯網服務形式提供的在線待編稿庫,與內容管理系統(CMS,如WCM,方正翔宇等)無縫集成,以達到采、編、發工作流程完美統一。其主要的功能定位是對編輯人員感興趣的網頁進行自動抓取和清洗,轉換成規格化內容填充到內容管理系統的編輯界面,實現一鍵式發布。
5、焦點快報——一款新聞聚合App。用于網絡熱點的快速發現與分享。作為一款免費的社交網絡新聞聚合APP其功能是,基于大數據的采集、分析和聚類,以及每天從數千萬的新聞中聚合分析網絡熱點,及熱點的強度和變化趨勢,并進行實時更新(目前是每小時)。另外還兼有熱點新聞分享(微博、微信等)、歷史熱點搜索、關鍵詞和語音搜索等功能。
拓爾思為媒體服務截止至今已有20年之久。2011年6月拓爾思在創業版上市,以大數據、云計算、移動互聯網和社交網絡技術助力媒體轉型升級。在大數據時代的媒體轉型升級過程中,拓爾思還將繼續與各媒體共同發展。■