劉雅軒
當前,政府對大數據技術的重視與支持力度不斷加大,互聯網與社交媒體的發展也為大數據技術的發展提供了便捷條件,外部環境和技術條件的變化促使出版產業信息化發展進入全新的發展階段。與此同時,出版產業也面臨著全媒體時代到來的挑戰。面對發展中的優勢與不足,如何運用大數據促進出版產業信息化轉型與發展已成為亟待解決的問題。
大數據技術為出版產業的發展創造機遇,為數字化出版、跨媒體出版、綠色出版提供必要支撐。大數據技術對出版業的價值和意義主要表現在以下兩個方面。
數字化出版、跨媒體出版、綠色出版是出版產業未來發展的三大主要方向,它們的實現都必然建立在大數據技術應用的基礎上。
1.1.1 數字化出版離不開大數據技術
一方面,數字化出版不僅是將紙質書轉變為電子書,更涉及出版流程數字化、出版物數字化、信息服務數字化等多個方面。其中,僅出版流程數字化一個方面就包括出版物編排制作所使用的數字編撰平臺、出版物銷售所使用的網絡銷售平臺、收集用戶信息與購買記錄的網絡數據平臺等,這些數字化平臺是數字化出版流程流轉必不可少的基礎條件。同樣,大量的數字化出版物和數字化信息服務也必須依靠基于大數據技術的數字化平臺進行管理和運營。
另一方面,數字化出版過程中將產生大量的出版數據,如編排制作環節的文檔修改記錄、生產時間記錄,銷售環節的銷售記錄、物流記錄,讀者反饋環節的評價文本[1]、出版企業的自有媒體數據(如網站、微博、微信公眾號)等。數據類型也更加復雜多樣,如:關系型結構化數據、網頁等半結構化數據、圖文等非結構化數據。數據的海量化和類型的復雜化,傳統技術難以進行有效和及時處理。要確保數據處理的高時效性與高質量,出版產業必須依靠大數據技術才能實現。
1.1.2 跨媒體出版離不開大數據技術
進入全媒體時代,網絡閱讀終端設備(如手機、平板電腦、電子閱讀器等)的普及極大地豐富了讀者的閱讀途徑,改變著讀者的閱讀習慣。很多讀者傾向于使用手機閱讀文字信息,使用平板電腦閱讀圖片信息和視頻信息[2]。因此,出版企業需要將出版內容進行快速拆分與整合,結合讀者的閱讀習慣,通過不同的閱讀終端推送給讀者。這個過程需要處理大量數據,以及實現文字、圖片、音頻、視頻等不同數據類型之間的數據融合。同時,也自然而然產生讀者的個性化服務問題。出版產業必須借助大數據技術針對不同的閱讀終端進行出版物的差異化開發,并給讀者提供個性化的信息服務。個性化的跨媒體出版是出版產業重要的發展趨勢,也是出版產業大數據應用重要領域。
1.1.3 綠色出版離不開大數據技術
綠色出版是指出版物生產過程與生產工藝的綠色化,例如使用可再生紙張、環保型油墨與噴印技術,主要表現為按需出版,即按照客戶使用需求將出版內容印刷成出版物[3]。按需出版的“需”包括兩個方面:一是對出版物數量的需求,做到一冊可印、即印即銷,有效緩解傳統出版業庫存量大的困境;二是對出版物內容的需求,做到個性化出版與定制化出版,有效解決不確定銷量書籍(如小眾圖書、自費出版圖書等)的出版問題[4]。要實現綠色出版,就必須運用大數據技術對市場進行精確的分析,對出版流程進行精確的控制,給讀者提供精準的定制化服務。因此,綠色出版更離不開大數據技術。
從出版產業發展的角度來看,無論是對市場的科學預測、出版流程的細化,還是時間和成本的節約都離不開大數據技術的支持。
1.2.1 運用大數據技術科學預測市場行情
大數據技術能夠根據目前出版市場的銷售信息與反饋數據進行分析,對用戶的需求做出預測。當前,運用大數據技術預測市場行情的出版策劃主要包括3種。其一,運用大數據對目前圖書市場作品進行前景分析,預測什么書會受到市場歡迎,選擇出版與市場需求相符的書籍;其二,運用大數據技術對目前圖書市場作品的作者、情節、故事背景等內容元素進行分析,預測出受讀者歡迎的內容元素進行創作[5]。例如學術出版社的小說《39條線索》的出版模式;其三,以用戶需求為基礎,以大數據技術為支撐,創造出新的出版模式。例如,磨鐵出版社以用戶出資、投票的方式選出高支持度的內容進行出版。
1.2.2 運用大數據技術細化出版流程
在大數據技術的支持下,出版流程每個流程環節將發生根本性的變化:
1)選題策劃。收集與整理出版企業內部與外部數據,通過大數據分析擇優選擇用戶普遍關注、符合輿論發展趨勢的話題[6]。其中,企業內部數據主要包括歷史銷售記錄、出版物反饋信息以及相關專家的建議等,外部數據主要包括社會流行趨勢、輿論熱點話題等。
2)內容生產。綜合當前出版市場的出版物屬性數據(作者、故事情節、故事背景、角色類型等)與用戶屬性數據(職業、學歷、閱讀時長、閱讀地點等),運用大數據技術進行分析,擇優選擇歡迎度較高的創作元素,促進出版內容的模式化發展。
3)編排制作。基于大數據技術,通過作者、讀者、編輯、專家共同使用的協同編撰平臺,實現四方實時溝通與交流,提升出版內容的完整性[7]。同時,利用大數據平臺對生產過程實時監控,實現自動改正、高效高質的產品印刷,提升出版物外形的完整性。
4)市場銷售。運用大數據技術對相關用戶的人口屬性(年齡、性別、文化程度等)、消費習慣、閱讀習慣、地理位置等進行數據分析,自動生成個性化、智能化的市場銷售方案[8]。并利用電子二維碼、定位與導航等技術實現高效、精準、科學的出版物物流管理。
5)用戶反饋。收集用戶閱讀數據、反饋信息以及微博、抖音、豆瓣、知乎、貼吧等社交平臺上的用戶評價,在此基礎上運用大數據分析對出版物的內容、營銷策略、出版服務等做出調整。
1.2.3 運用大數據技術降低時間與經濟成本
大數據技術在數據與信息的處理上具有便捷、廉價、高效等一系列優點,能夠極大地提升出版效率[9]。一方面,運用大數據技術縮短出版周期。例如,在編排制作環節中,利用大數據分析當前市場海量書籍的內容與設計風格關聯性,能夠在此基礎上建立自動匹配系統,節約大量內容設計時間。另一方面,利用大數據技術篩選出不必要的出版環節,簡化和重組出版流程,如建立云出版平臺,最大限度地降低時間與經濟成本。
總之,數字化出版、跨媒體出版、綠色出版等多種新型出版方式都離不開大數據技術。同時,大數據技術在預測市場行情、細化出版流程、縮減時間與經濟成本等方面都具有顯著的應用價值,對當前出版產業發展意義重大。
當前已經形成了出版產業大數據技術應用的有利環境:政府對大數據技術的政策支持力度持續提升;社交媒體、電子商務的發展為出版業提供海量數據;數據交易市場呈現逐漸繁榮局面。這些有利環境的形成對出版產業發展意義重大。
自2012年起,一大批與大數據技術相關的項目在科技部、工信部等政府部門的支持下順利實施。2014年《政府工作報告》將大數據技術的發展上升到政府經濟工作的重點。2017年工信部編制印發《大數據產業發展規劃(2016—2020年)》,該規劃預計至2020年基本形成“技術先進、應用繁榮、保障有力的大數據產業體系,”為加快建設“數據強國”提供強大產業支撐。除國家外,各地方政府也相繼出臺推動大數據技術發展的方案與計劃[10]。例如,福建省于2016年出臺的《關于印發福建省促進大數據發展實施方案(2016—2020年)》、河北省2018年印發的《河北省大數據產業創新發展三年行動計劃(2018—2020年)》等。可見,不管是國家層面還是地方層面都在不斷提升對大數據技術的支持力度。
目前,社交媒體主要包括六類:網絡論壇(天涯社區、百度貼吧等)、社交網絡平臺(人人網、開心網等)、社群網站(豆瓣、時光網等)、博客(微博、公眾號等)、即時通訊軟件(微信、QQ等)、垂直社交媒體(小恩愛、ZANK)。這些社交媒體時刻都在生產海量數據信息。對于出版業來說,社交媒體可以提供用戶數據,預測潛在用戶,獲得原創性出版資源,同時也是社會化營銷的重要途徑。
截至2018年12月,我國網購用戶數量達到6.10億,其中手機網購用戶占比72.5%,僅當當網2019上半年的圖書銷量就已超過2億冊[11]。電子商務的飛速發展能夠為出版業提供用戶交易記錄(購買時間、購買數量、商品類型、交易金額等),出版企業可以通過交易記錄了解圖書市場靜態信息,針對不同類型用戶的偏好與閱讀習慣制定多元化的營銷方案。
數據共享與數據交易是出版企業獲得外部數據的主要方式,它們的繁榮發展將有利于出版產業的發展。現在,國外數據交易市場已發展成熟,且具有一定規模,例如:微軟公司的Azure Data Marketplace。2014年6月,我國首家數據交易平臺“中關村樹海大數據交易服務平臺”正式上線,為用戶提供標準化數據交易服務。其后,抓手數據交易平臺、國信優易數據交易平臺、路孚特數據交易平臺等紛紛上線,數據交易市場的繁榮為出版產業的信息化發展提供有利的數據環境[12]。數據交易市場的繁榮為出版產業充分利用大數據資源創造了條件。
總之,政策、社會環境、數據交易市場等方面為基于大數據的現代出版產業發展創造了良好的外部發展條件。
在有利的外部環境條件下,出版產業企業應抓住機遇,積極利用大數據技術,加速實現傳統出版產業向基于大數據的現代出版產業轉型升級。為此,本文提出以下3方面策略建議。
首先要有數據重要性和數據共享意識。“數據即資產”是大數據時代的核心理念,出版企業應當注重積累企業內部數據,并關注外部數據,對已獲得數據進行及時儲存、分析與利用。同時,注重出版產業內部之間的數據共享,以有效避免相關數據在開發與利用上的同質化,消除出版產業的數據壁壘,提升企業協同發展能力[13]。
大數據意識還意味著出版思維的變化。傳統的出版思維是產品主導的,一切思維起點都是做好產品。而大數據時代意味著一切從數據出發,實現數據驅動。無論是產品策劃和開發、出版流程、用戶信息服務都需要建立在數據分析的基礎上,而不是既定的某一個具體產品。
大數據時代以中心化、平等化與開放化的特點要求出版企業為用戶提供多元化的產品與服務,實現消費者從“讀者”到“用戶”的轉變。在傳統產業形態中,讀者是信息的被動接受者,處于信息流的最底層;而在大數據產業形態中,用戶則是信息的創造者、提供者,處于信息流的源頭[14]。從被動接受信息到主動創造信息、提供信息,這一轉變要求出版企業以用戶為中心,樹立“用戶至上”的可持續發展理念。
大數據技術為準確分析用戶提供了可能,也為精準服務提供了可能。基于不同用戶需求的差異化提供個性化選題和出版服務已經稱為大數據時代出版產業發展的新方向,出版產業必須積極迎合這種新趨勢。個性化出版服務即包括內容的個性化策劃和個性化生產,也包括針對個人的信息服務。內容的個性化策劃和個性化生產要求充分利用大數據技術挖掘不同用戶的需要,根據用戶需要進行按需內容策劃和生產。同時,要把按需生產的內容精確傳遞給用戶。在這個過程中,需要提供用戶反饋的數據通道,建立從需求到生產再到服務閉環,滿足大數據時代用戶的個性化信息服務需求。在全媒體時代,這一變化不僅僅針對數字出版物,紙面出版物也要實現這一過程,這意味著出版企業內部的一系列出版業務流程的改變。
大數據技術極大地擴大了出版企業數據部門的工作范圍,從對出版物的電子化處理、運營數據的儲存擴大至對出版流程的各個環節提供數據支持,線性的工作流程來時變成非線性的工作流程。這些新變化,就要求出版企業必須加強部門間的交叉協作或部門重構。在部門間的交叉協作方面:在內容策劃環節,利用社會熱點與用戶偏好為編輯部門提供出版建議;在生產環節,利用市場預測數據為生產部門印刷數量的設置提供參考意見;在銷售環節,利用對不同用戶類別與偏好的分類為銷售部門提供銷售思路[15]。因此,出版企業應當積極促進編輯部門、銷售部門與數據部門之間的交叉協作,強化各部門之間的橫向交流與聯系。當交叉協作難以解決問題,又不能充分利用大數據平臺價值時,部門重構也可以是一個選擇。部門重構就是徹底改變部門的傳統功能定位,在大數據技術利用基礎上,每個人以數據驅動開展工作,弱化傳統部門的功能或合并部門,把內部結構功能與滿足市場需要調整到同一方向。例如:美國的《紐約時報》等新聞出版集團以建立數字新聞部的方式將數據技術部門與內容編輯部門合二為一,以此實現大數據新聞出版。
在大數據技術發展背景下,出版產業與大數據需要緊密融合才能實現用戶需求的滿足,但出版產業企業不可能建立龐大的大數據技術隊伍。這就需要出版產業必須以滿足新時代用戶個性化出版服務需求為導向,以出版產業和大數據產業緊密融合為依托,建立全新的出版產業生態。產業生態是全新的產業組織方式,實現相互依存,共生發展,是大數據時代各個產業普遍的發展方向,出版產業也不例外。通過借助生態的力量,彌補自身能力的不足,是出版產業發展的內在需要,也是應對大數據時代市場競爭的必然要求。
3.6.1 強化出版人員的大數據收集能力
在大數據時代,出版從業人員不僅需要熟練使用各類社交媒體,還須具備較高的數據收集能力。出版人員須從兩個方面完成數據收集工作,即企業內部數據收集與企業外部數據收集。其中,企業內部數據收集渠道包括用戶在企業網站的注冊信息、各種出版內容的瀏覽量、企業媒體(微博、公眾號等)的評論等。企業外部數據收集渠道包括本企業出版物在豆瓣、知乎、新浪讀書等網站的評論與反饋等[16]。因此,出版人員須密切關注相關數據信息,主動整合優秀出版資源。例如豆瓣原創作家海棠創作的《我的朋友陳白露小姐》、丁小吉創作的《七天治愈拖延癥》等優秀網絡作品均被出版。
3.6.2 強化出版人員的大數據分析能力
大數據時代的出版企業依然具有傳統出版形態的功能與作用,肩負著內容生產與信息服務的重任[17]。因此,對內容的把控、對文字的編輯、對圖書的策劃以及與作者及用戶的溝通能力依然是大數據時代出版人員的重要技能。除此之外,大數據產業環境對出版人員提出了更高的要求,包括數據收集與分析的能力、數據可視化處理的能力、與數據專員交流的能力以及利用數據分析成果的能力等。因此,高校應當針對這一市場變化,在新聞出版專業開設數據分析與可視化處理課程。出版企業也應當為工作人員提供相關培訓課程,以此培養出既懂數據又懂出版的高水平復合型人才[18]。
3.6.3 強化出版人員的基于大數據的創新能力
大數據時代出版產業發展不僅僅是現有業務的數字化,還意味著大量的模式創新、產品創新和服務創新,需要培養出版人員基于大數據技術的創新能力。而且,與傳統出版業相對長期的穩定發展不同,出版產業與大數據技術的融合,需要適應大數據技術日新月異的新變化。例如:大數據與人工智能技術的融合、大數據與區塊鏈的融合、大數據與5G技術的融合。這些新的融合將帶來出版產業的新變化,如:智能寫稿、智能出版、區塊鏈出版物、虛擬現實內容服務等。這意味著不僅僅需要培養出版人員基于現狀的創新能力,還要培養跟上時代發展的創新能力。
3.6.4 建立大數據時代高水平出版人才的培養機制
無論是現有的出版人員培養,還是對外來人才的引入,都需要一個長效的人才培養機制。通過人才培養機制來提供長期的制度保障,才能保障高水平出版人才自身的不斷發展,從而才能保障出版企業能夠應對大數據時代的挑戰。
綜上所述,大數據技術在出版領域的應用是我國由“出版大國”發展為“出版強國”的必經之路。在出版領域,大數據技術能夠科學預測市場行情、細化出版流程、降低時間與經濟成本,且數字化出版、跨媒體出版以及綠色出版均離不開大數據技術的應用與支持,大數據技術已經成為出版業發展的必然選擇。基于此,出版產業企業應采取轉變產業觀念、轉換用戶觀念、開展個性化出版服務、促進各部門的交叉協作或部門重構、培養高水平出版人才等策略,從而實現大數據技術在出版產業的有效應用,并推動出版產業的信息化發展。