□文│閔 超 石佳靚 孫建軍
在新興信息技術的推動下,人類社會各領域、各行業產生的數據量呈現出前所未有的爆炸式增長,由此也激發了各行各業對自身產業變革的歷史機遇的關注。[1]
信息內容一直以來都是新聞出版產業最重要的資源,在大數據環境下,信息內容的表現形態呈現出顯著的變化趨勢。這些新特征包括:①數字化:即信息內容從傳統紙媒向電視、電腦、平板、智能手機、電子閱讀器等新媒介轉移;②碎片化:即信息內容的組織粒度由原先的整體細化到篇目、章節甚至詞句;③語義化:即利用自動識別工具實現語義查詢、自動對比、概念關聯等功能,內容交互性大大提高;④可視化:例如通過數據統計、分析、挖掘等技術發現新聞線索,依靠可視化技術以形象化、藝術化的方式加以呈現;⑤動態化:在傳播過程中利用視頻、音頻和圖片等方式動態呈現,同時通過用戶參與不斷動態優化產生的信息內容;⑥社交化:即用戶消費信息產品時還能享受到經由社交媒體渠道傳遞的社交體驗;⑦個性化:即不同興趣的用戶能夠獲得更加符合自己口味的內容產品,甚至能夠發現自身的興趣增長點。
信息作為新聞出版內容的核心構成,在大數據環境下呈現出嶄新特征,由此生成新型的新聞出版形態,進而催生了一批新聞出版新產品、新服務和新應用。對于大數據環境中出現的新聞出版新業態,我們分別從新產品(涵蓋出版、印刷、發行環節)、新服務和新應用三個角度進行梳理。其中新產品是指那些位于產品研發端的,已經成型、形態清晰而且相對完整的新產品;新服務是指那些位于用戶消費端的,為用戶提供的、相對零散的、全新內容服務或者體驗;新應用則是指新聞出版機構為支撐新產品、新服務,對數據資源進行的有效利用與嘗試。
語義出版。語義出版利用語義技術對文本進行深度描述,滿足用戶基本需求之外的文獻分類、注釋、關聯推薦等深層需求。[2]國內外知名出版機構,如《自然》雜志(Nature)、英國皇家化學會(RSC)[3]、愛思唯爾(Elsevier)、[4]中國知網、萬方數據、人民出版社[5]等已經紛紛推出自己的語義出版模塊。
動態圖書。動態圖書通過用戶參與,產生量身定制、自由訪問、及時更新的個性化內容,如Chen 等人[6]介紹的開放式幾何“動態教科書”和克利樂葵(Coliloquy)公司為亞馬遜金讀(Kindle)電子設備提供的“動態小說”。[7]
按需印刷與按需出版。按需印刷和按需出版重新組合了出版發行的各個環節,是數字環境下的一種全新印刷出版方式。[8]如英格拉姆內容集團將按需印刷與行業發行網絡無縫連接,改善了庫存狀況,降低了運營成本。
數據新聞。數據新聞從精確新聞發展而來,重視用戶參與,用數據代替文字講故事。[9]《衛報》[10]《紐約時報》、英國廣播公司(BBC)、美國有線新聞網(CNN)以及我國門戶網站都開設了相關欄目,為用戶提供輕量化的閱讀體驗。[11]
數字教育產品。數字教育被視為數字出版領域最具盈利前景的產品模式,大數據應用在數字教育領域也將大有可為。電子教材更便于搜索、記錄、復制、粘貼等操作,還可以跟蹤和分析學生的學習行為,便于教師因材施教。
自助出版。自助出版是一種顛覆傳統出版盈利模式的快捷出版形式,[12]更符合Web 2.0 時代“去中介化”和“以用戶為中心”的理念。它不僅可以有效縮短出版周期,而且能夠增加著作權人對出版物的控制和收益。
圖書社交。圖書社交是在圖書制作和營銷過程中加入社交元素,借助社會化媒體滿足用戶的社交需求。其平臺聚集了大量用戶和圖書數據,具備強大的圖書推薦和傳播能力,可以提升社區成員購書的意愿和需求。
個性化推薦和預測。傳統意義上的個性化定制根據用戶閱讀過的內容,推薦與之相關的內容。一種更高層次的推薦服務是,更加關注讀者的閱讀規律,發現并推薦連讀者自己都沒有發覺的感興趣的領域,《紐約時報》是這方面的先行者。[13]
創新的數字內容服務。優質內容經過碎片化、語義化之后,形成優質的數字內容資源,在此基礎上可以創造出豐富的數字內容服務。如亞馬遜的“頁購”服務、金牌用戶免費服務、云圖書館服務和無限制訂閱服務(Kindle Unlimited),等等。
大數據能夠在選題策劃、營銷推廣、用戶研究和定價優化等方面協助新聞出版機構作出科學決策,并已有諸多有益嘗試。
選題策劃。運用大數據技術有助于發現潛在熱門題材,描摹人物形象。除了為人熟知的 《紙牌屋》,讀者數據還能被用來描摹理想主人公的形象,使得人物情節更符合讀者的口味。[14]比如Coliloquy 對浪漫小說中完美男主角“有著純正歐洲口音、30 歲上下、黑頭發、綠眼睛”的勾畫即基于對讀者閱讀狀態的統計。
營銷推廣。利用大數據技術,科學制定圖書營銷方案,追蹤營銷效果。哈珀·柯林斯出版集團基于自有數據庫和圖書銷售平臺,利用大數據技術分析圖書營銷的關鍵影響因素,從而制定科學的圖書營銷戰略。[15]還有一些出版數據挖掘公司專門從事圖書營銷成效的追蹤工作,例如圖書觀察者(Bookseer)、封面蛋糕(Covercake),等等。[15]
用戶研究。利用數據分析預測用戶行為,改進閱讀體驗,提高用戶黏性。巴諾書店在銷售非小說和長篇紀實類文學作品時,分析讀者可能產生倦怠的節點,在其中添加視頻、網頁鏈接等內容,吸引讀者繼續閱讀。[16]《紐約時報》則基于網站900 萬的日均訪客量數據分析可能會取消關注的用戶,從而采取措施增加他們的留存率。[17]
定價優化。利用大數據優化產品定價、廣告定價。例如哈珀·柯林斯出版集團通過整合數字銷售和定價數據集,分析數字銷售影響因素和需求彈性變化,將分析結果綜合運用到市場戰略和定價戰略中;《金融時報》也利用大數據分析,參考多種變量(位置、用戶、目標參數、地區、時刻等),優化廣告定價,取得了良好效果。
大數據技術帶來了全新機遇,借助大數據,新聞出版機構可以提高生產效率、優化營銷模式、拓展產業鏈條、提升內容價值,等等。挑戰與機遇并存。當大數據由理念落地為實踐時,隱藏的問題和困難將逐漸浮現。新聞出版機構應該對大數據可能帶來的挑戰作出清醒的預判和充分的準備。
大數據的本質是更加廣泛、深入的數字化,出版業對大數據的利用應以行業數字化轉型、媒介融合為基礎和支撐。中國傳統出版業還處在數字化轉型的關鍵期,要想在內容、閱讀、營銷、管理等方面實現“數據化”運作,首先應繼續深入推進“數字化”。在出版企業內部沒有建立起統一的數據標準、構建統一的數據共享平臺、完善數字出版組織管理架構的情況下,推進大數據戰略將困難重重。
“富者愈富,窮者愈窮”的馬太效應,在行業數據資源分布上體現得更加明顯。如果沒有相應的基礎設施、專業人員及配套的政策保障,數據采集工作在傳統出版企業中將難以開展,由此在出版企業之間橫亙起一道道“數字鴻溝”;如果只是各部門、各機構各自為戰,采集到的數據也只是分散、蕪雜、互不關聯的數據,從而在企業內部形成一座座“信息孤島”,數據的效用得不到最大程度的發揮。
大數據背景下,信息的戰略價值愈加凸顯,與此同時,也不應忽略由此帶來的數據管理問題。在企業內部,數據真實性、完整性、一致性、關聯性和有效性直接關系到數據質量問題;在網絡環境下,內容的流動性和閱讀的數字化,讓數字版權保護成為一個嚴重的問題;在數據資產化后,極易引發濫用數據與侵犯隱私等法律、政策和倫理問題。
對產業組織而言,大數據問題的本質不是技術創新,也不是數據形態的多樣化,而是實現“數據驅動業務”的相關戰略與戰術。數字化轉型和大數據戰略的實施,將企業的前期投入轉化為數據基礎設施及相關配套資產。如何合理有效地開發利用得來的用戶數據、產品數據、銷售數據等戰略資產,將其轉化為出版生產力,成為出版機構亟待解決的問題。
任何戰略和行動最終都落實到個人,對傳統出版機構來說,大數據問題尤其如此。目前我國出版產業的專業人才大多屬于傳統出版領域,既熟知傳統出版又懂數字出版及其經營模式的復合型人才則相對匱乏。如何培養和吸引這樣的復合型人才,為其分配合適的工作和崗位,最終在企業內形成專業的職能部門,是對出版機構的又一考驗。
國內外新聞出版產業界涌現出的一批新產品、新服務和新應用,對于提升新聞出版機構的運轉效率、產品價值和用戶體驗等起到巨大推進作用。這些新聞出版新業態的出現,得益于相關機構的遠見卓識、對行業變革的深刻預判以及通過一系列行之有效的戰略措施作出的戰略部署。他山之石可以攻玉,下文將總結一些主要的戰略舉措。它們盡管根植于相異的社會環境和文化體系,但是并不妨礙我國新聞出版機構擇善而從,從中汲取經驗,抓住大數據機遇。
對大多數新聞出版機構而言,傳統業務仍是生存的基礎,銷售收入的大部分仍然來自傳統業務;數字業務則是發展的基礎,未來收入的大部分將來自數字業務。傳統出版和數字出版業務協同發展,相互促進,是實現資源優化配置和持續發展的穩健舉措。一方面應該繼續重視傳統業務,細化市場劃分,豐富圖書品類,確保銷售收入;另一方面對優勢內容資源進行多次開發,延展資源價值,不斷拓展數字新業務。
重視數字產品研發,深入推進新聞出版機構的數字化轉型。國外出版傳媒集團的數字化轉型思路概括起來有兩條:一是以自建內容分發渠道、強化內容生產實力為核心的轉型思路,二是以投資、收購業務相關或者特色創新的新媒體企業為核心的轉型思路。蘭登書屋、哈珀·柯林斯、麥格勞·希爾等的數字出版收入占總銷售收入的比重已占到1/4~1/3。[18]
從產品研發到營銷,新型數字業務可以在多個環節、多個維度展開。產品創新的方式和途徑也是多元化的。國外企業的多元化戰略存在兩種模式:水平多元化模式,即“圖書—網絡—手機—電視—電影”一體化的發展模式;同心圓多元化模式,即以出版產業為圓心輻射相關產品和相關領域,避免不熟悉的業務領域。
在營銷方面,用做傳統媒體的思維做營銷是遠遠不夠的,新媒體需要新的營銷思維,國外相關機構在兩條戰線上下功夫。其一,為自己做營銷,在產品促銷、付費模式、用戶定位等方面有所創新,如電子書分頁購買服務、《紐約時報》的“收費墻”服務、亞馬遜的精準圖書推薦等。其二,更進一步為別人做營銷,從提供廣告版面升級為提供營銷解決方案,如美國第一大報業集團甘乃特順勢開展的數字廣告、比價服務等在線營銷業務。
大數據時代,新聞出版機構的本職并非創造新技術,卻可以積極采納和擁抱適合自身的新技術。歷史悠久的《紐約時報》采用亞馬遜云服務和彈性計算服務,通過建立存儲了海量早期文章的數字檔案(稱為“時光機”),不但獲得了大數據量實時傳輸能力,而且極大地節省了信息技術投資開銷。[19]英國皇家化學學會利用非關系型數據庫,以可擴展標記語言(XML)的形式存儲了數百萬份圖片、論文等科學數據社交媒體數據,使其期刊、論文出版數量成倍增長。
對于數字技術的引進問題,國外新聞出版機構的解決方法主要是成立專門的技術部門,或者直接收購或與技術提供商合作。然而,一個更深層次的問題可能是新技術與原有業務的融合。為此,出版企業應當著力推進技術融合,建立全域數據模型,重視數據標準化和規范化工作。對于不斷涌現的新技術,新聞出版機構應該采取的態度既不是漠然處之、不為所動,也不是苦命鉆研、狂熱崇拜,而應該是敞開懷抱、靈活采納,使新技術成為新舊業務相融合的橋梁和支撐。
無論是作者還是讀者,用戶始終是優質內容的創造者和消費者,傳統產業市場份額的流失本質上是用戶的流失。在保留和拓展用戶時,增進用戶的社交體驗和網絡社群歸屬感,效果是顯著的。《紐約時報》一方面建立時報人社區,為讀者提供自由交流、反饋意見與評論的網絡平臺;一方面在面書(Facebook)、推特(Twitter)等社交網站上建立專頁、專題以吸引年輕讀者。亞馬遜則在2013年收購了世界最大的讀書社交網站古德瑞茲(Goodreads),擴張其圖書社區計劃。這種讀者參與的社交化機制,不僅有助于了解讀者的閱讀興趣,而且自動匯集了大量的讀者數據和圖書數據,為信息定制化服務奠定基礎。
傳統新聞出版機構開展數字業務的問題在于,在其成本結構中,非數字業務收入的減少量大于數字業務收入的增加量,開展數字業務的收入往往不能彌補非數字業務的損失。因此,他們首先要做的是提高優質內容的生產效率,從而獲得較高的內容產品溢價,利用數字化的管理手段降低運營成本就是一個行之有效的方法。蘭登書屋不僅對供應鏈效率進行投資,而且投資管理智能系統,使得零售書商的效率可以不斷提高。巴諾書店旗下的諾克(NOOK)自助出版平臺能夠將其上游出版者進行有效整合,為其編輯出版提供便利途徑,并且進一步聯系下游的印刷發行環節,優化產業效率。亞馬遜海量資源的低價戰略,同樣歸功于其利用信息技術和巨額投資降低網站運行成本、人力成本和物流成本的運營成本控制策略。
任何戰略部署最終都落實到個人,不少傳媒集團都設立了關于數據和新媒體運營的高層職位、專職部門或者成立有關信息技術和服務的子公司。《紐約時報》和《華盛頓日報》分別聘請了哥倫比亞大學的數學家和網絡統計專家擔任首席數據官(CDO),組建機器學習團隊,開展數據模型的建立工作。高端數據人才及其團隊為傳媒機構注入了新鮮血液和活力。
傳媒機構一方面需要促進人員的新媒體轉型,使習慣傳統生產方式、管理方式的媒體人轉變觀念和工作方式,適應數字化新媒體的要求;另一方面,應重視大數據人才的招聘和培養,通過引進新型人才,設立專門崗位,形成強大的職能部門,培育起能在大數據時代下開疆拓土的新媒體力量。
注釋:
[1]趙國棟,易歡歡,糜萬軍.大數據時代的歷史機遇:產業變革與數據科學[M].北京:清華大學出版社,2013:35-38
[2]Semantic Enrichment: The Key to Successful Knowledge Extraction from STM Literature[R]. Chennai, 2008
[3]翁彥琴,李苑,彭希珺.英國皇家化學會(RSC)科技期刊語義出版模式的研究[J].中國科技期刊研究,2013(5)
[4]翁彥琴,彭希珺.愛思唯爾(Elsevier)語義出版模式研究[J].中國科技期刊研究,2014(10)
[5]張炯.大數據引領的三種新型出版模式之實踐[J].出版發行研究,2014(7)
[6]Chen X, Li W, Luo J, et al. Open geometry textbook: a case study of knowledge acquisition via collective intelligence[M]. Berlin Heidelberg: Springer, 2012
[7]吳赟.產業重構時代的出版與閱讀——大數據背景下出版業應深度思考的五個關鍵命題[J].出版廣角,2013(23)
[8]歐懿,燕今偉.按需印刷和按需出版及其對圖書行業的影響[J].圖書館理論與實踐,2011(5)
[9]徐銳,萬宏蕾.數據新聞:大數據時代新聞生產的核心競爭力[J].編輯之友,2013(12)
[10]文衛華,李冰.大數據時代的數據新聞報道——以英國《衛報》為例[J].現代傳播:中國傳媒大學學報,2013(5)
[11]魏金梅.大數據時代的用戶新聞生產[J].采寫編,2014(3)
[12]王武,彭巧靈.“出版平民化”的狂歡泡沫——析自助出版在中國普及的可行性和面臨的困境[J].編輯之友,2012(12)
[13]《媒介》編輯部.放眼看海外——國際報刊媒體探索案例匯編[EB/OL].媒介,2013(5)
[14]姚永春.出版企業掘金大數據的兩個層面[J].出版廣角,2014(4)
[15]劉銀娣.數據驅動出版:基于大數據的傳統出版模式變革研究[J].中國出版,2014(15)
[16]陳硯青,徐璐明.小心:你讀書時,“書”也在讀你[EB/OL].中國作家網,http://www.chinawriter.com.cn/wxpl/2012/ 2012-07-10/133900.html, 2012-07-10[2014-11-11]
[17]崔綺雯.從《紐約時報》看傳統媒體擁抱科技變革[EB/OL].ifanr,http://www.ifanr.com/401362, 2014-02-14[2014-11-11]
[18]譚躍.關于出版國際化的主要思考[J].中國出版,2014 (17)
[19]Tewari K. Leveraging Big Data Opportunities for Growth [EB/OL]. Publishers' Forum , http://publishersforum.de/wpcontent/uploads/2013/04/KrishnaTewari_LeveragingBigData.pdf, 2013-04-01[2014-11-11]