文|李京波

一直以來,新聞報道始終是傳統專業媒體的優勢所在。雖然網絡社交媒體出現以后,情況發生了變化,傳統媒體還是能夠通過種種手段保持住自己在報道領域特別是深度報道方面的優勢。但是,大數據技術的出現,就像在傳統媒體的頭頂上高懸了一把重錘,隨時都可能把傳統媒體的專屬領地進一步壓扁。
也許給出這樣的論斷為時尚早,但大數據將在新聞領域引起的震蕩是不容忽視的,因此我們有必要對大數據有所了解。
大數據是在計算機及存儲技術高度發達、互聯網的普及和廣泛應用的前提下產生的概念,它既是資源,也是工具。作為資源,大數據有著普遍認同的四個特征:數據量巨大(Volume)、數據類型繁多(Variety)、價值密度低(Value)和處理速度快(Velocity)。美國加州大學圣地亞哥分校提供的數據顯示:2008年全球數據總量為9.57z,更加令人震憾的是當今世界所有信息中只有不到2%是非數字化的,而數字數據量每三年就可以翻一番。
作為工具,人們利用大數據進行數據分析,趨勢判斷。正是由于數據量大、數據品種繁多的特點,大數據的價值體現比率較低。要從浩如煙海的龐雜數據中獲得富有價值的信息,就要借助于相應技術,對數據歸類整理和聚類分析。
奧運會稱得上是目前世界上規模最大的活動。奧運會期間產生的數據是任何一個單項活動所不能比擬的。因此,我們不妨通過奧運會這個窗口對大數據及媒體發展趨勢做進一步的觀察。
2012年倫敦奧運會的總體數據量可以透過英國電信網的統計得到,包括奧運會“體制內數據”和部分“體制外數據”。據估算,倫敦奧運會期間每秒鐘有60GB的數據量流經英國電信局網絡,倫敦奧運會的現場直播節目超過2000小時。奧運期間,世界上有85億臺個人電腦、智能手機與互聯網相連。
社交媒體方面,奧運會期間,僅推特用戶平均每秒推出13000條信息;8億人每天通過facebook了解奧運會新聞,而facebook每天承載的數據量達到15T(15兆兆字節)。在奧運會上,當博爾特完成了100米沖刺后,推特用戶以每分鐘8萬條信息的數據量推送與此相關的信息。如果這個數字還不夠震撼的話,奧運會開幕式時966萬推特用戶同時發出的信息,相當于2008年北京奧運會期間推特用戶推送信息的總和。
與奧運會相關的信息數據中有一部分是在奧運會場館中產生的,包括主新聞中心、技術中心等管理服務類場館和各比賽場館,我們將這些數據稱為“奧運會數據服務”ODF(即前面提到的“體制內數據”)。ODF服務是國際奧委會為包括21600名注冊媒體在內的奧林匹克大家庭成員提供的專項數據信息服務,內容龐大、繁雜且詳細,其中既包含實時數據、歷史數據,也有運行數據;包括人員、比賽、天氣、媒體、交通等等各項奧運會相關信息。倫敦奧運會期間,近4,000名專業技術人員每天24小時保證著900臺服務器、1,000套網絡和安全設備,以及超過1萬部PC設備的運行。這些設備產生和管理的數據隨時通過奧運會信息系統匯集、存儲,同時提供給以文字攝影媒體和轉播商為主的奧運會注冊用戶。
大約20年前,在國際奧委會新聞委員的協調下,世界上一些著名通訊社和報紙聯合建立起一個名為WNPA的組織(世界新聞通訊社組織),它的主要功能就是研究并實現將奧運會產生的各種數據(ODF的雛形),并將其轉換成媒體能夠接收和解析的格式,供媒體使用。無論過去還是現在,奧運會期間產生的ODF數據都算得上是海量信息。它包含的數據量巨大,各種數據混合在一起傳輸,因此媒體要從中獲取對自己有用的信息,就要從技術上解決制定數據標準、過濾和篩選等問題。
美聯社的下屬公司STATS,有100多年從事體育數據統計和分析的歷史,它的數據統計范圍覆蓋目前世界上300多項體育賽事,詳細到重要賽事的每個場地、每場比賽、每個人的數據。以奧運會籃球項目的技術統計為例:
STATS通過奧運會數據專線連接到ODF數據服務,通過專門設計的應用程序對數據進行過濾、解析、整理、分類,得出有關籃球的數據,按照事先確定的不同用途,經過設計人員的加工和包裝,以不同形式呈現給用戶。經過處理的籃球項目的相關技術統計以及運動員和教練的背景信息、比賽感想等內容,為體育記者撰寫新聞提供了豐富的素材。同時,STATS公司還將這些數據資源向公眾付費開放,這樣就使凡有興趣了解體育賽事詳細信息的受眾很方便地得到相關數據。借助于此項服務,網絡媒體等非傳統專業新聞媒體不用通過專門的采訪,就可以寫出有深度的稿子;體育研究部門拿到這些數據,就可以有針對性地進行研究,提出運動趨勢的預測,為運動員和運動隊提供訓練建議等。
隨著各種數據的增多,各個行業的數據,必然會越來越多地向公眾開放。通過大數據工具,就能解決篩選有用信息的問題,使新聞素材的獲取變得更加容易。它將進一步縮小新興媒體和傳統專業媒體之間獲取深度新聞數據能力上的差距,因此會給傳統媒體帶來更大的競爭壓力。
隨著大數據技術的普遍應用,一些過去由人工完成的新聞采寫工作開始由計算機代替。例如,奧運會獎牌榜的制作和更新:
奧運會數據服務ODF實時提供奧運會每個比賽項目獲獎運動員及所屬國家的信息數據及其背景信息,通過大數據手段將有關數據篩選出來,按照所屬國家和金銀銅牌分類,即可形成一個奧運會多媒體獎牌榜產品的雛形,經過適當編排,就可以在平面媒體上發布。再經過聲光電多媒體手段的設計包裝,就可以在網絡和電視等媒體上向觀眾呈現。如果需要,可以增加和變換分類,使獎牌榜內容更加豐富多彩。奧運獎牌榜的模板設計好以后,剩下的工作就是將實時更新的數據按照分類填入具體區域,全部工作均由計算機自動完成。上述整個過程基本概括了計算機進行體育新聞采寫的原理。
目前,計算機采寫新聞還局限在體育和金融領域。但隨著新聞模板的積累及豐富,計算機采寫新聞的領域將不斷擴大,由此也將給新聞行業帶來新的挑戰和思考。
對媒體界產生重要影響的兩大技術變革,新媒體和大數據接踵而來。新技術的出現和發展是不可避免的,而傳統行業總是受新技術影響和沖擊的最大著力點。傳統行業要立于不敗之地,就要不斷變革,接受新技術,融入新技術。幾年前舉行的世界媒體峰會上,新華社社長李從軍就有如下論述:“新興媒體的產生是時代的進步,是媒體適應當前經濟、科技進步發展的一種變革。新興媒體的出現勢必會對傳統媒體帶來影響。媒體之間要通過融合與合作,才能推動自身往前發展。”至今讀起來仍讓人感覺其力道未減。