文/吳翠姣 張宇
2012年,美國白宮科技政策辦公室首次發布了有關大數據技術應用的相關計劃《大數據研究和發展計劃》,并專門為此成立了大數據高級指導小組,將大數據戰略真正上升為國家級發展戰略。2014年,我國的《政府工作報告》中也首次提出了“大數據”這一概念,并在2015年的《關于運用大數據加強對市場主體服務和監管的若干意見》中明確了國家實施政府數據資源、構建公共服務大數據工程、優化大數據。我國希望在未來完成的3件事:政府數據資源政策的實施、公共服務大數據工程的建設、大數據優化關鍵技術及相關產品的相關工程建設內容,構建了真正的大數據產業支撐能力體系。4年來,我國紛紛建立了多項大數據工程項目及相關安全保障工程項目,目前,我國已經推出了“互聯網+大數據”行動計劃,希望實施網絡強國戰略,開啟新經濟時代下大數據建設的新篇章。
在信息如洪流的21世紀,大數據技術體系的出現顛覆了時代發展進程,改變了社會發展節奏,圍繞大數據技術所構建的大數據體系希望革新人類未來發展思維,這一點在注重社會交流的新聞出版行業尤其突出。目前的新聞出版行業從業人員必須更新自己的世界價值觀,深入自身所從事的社會活動與工作崗位,獲取利用各方面大數據信息內容,結合生產加工與傳播消費,凸顯大數據技術應用重要價值,在構建大數據體系的背景下不斷創新數據思維,引導社會生產生活。
有一句諺語:“除了上帝,任何人都要相信并應用數據,用數據說話。”這一理念在我國的《促進大數據發展行動綱要》中就提出了這一觀點,即“建立用大數據說話,用數據決策、管理、創新中同樣也提到了相同觀點,要建立圍繞大數據技術的、用大數據說話、決策、創新、管理的一套完整的、功能豐富的全新大數據體系。”這一管理體系的核心自然就是大數據,包括大數據中所傳承的數據思維與數據文化內容。在新聞出版行業中,大數據就是要上升到文化這一高度,這是因為它必須追求一種理性思維本質和科學精神,做到新聞說話實事求是,正確引導社會發展輿論,用數據證明事實,這是新聞出版行業需要遵循的最基本原則。奧地利大數據專家Viktor Mayer-Sch?nberger就在他的《大數據時代》中闡述了具有洞察性質與前衛理念的3種大數據創新思維,它們分別為整體思維、多樣性思維及相關思維。但實際上,對于新聞出版行業而言,可以將這3種思維理解為價值思維、應用思維及共享思維。
大數據對于新聞出版行業發展而言就是一種無形的資產,所以,行業一直遵循數據即財富的基本觀念,大數據的核心就是這一價值思維。在新聞出版社中,他們所擁有的價值思維包括了數據管理、數據交易、數據交易行為以及用戶數據,特別是涵蓋了數據管理、交易、交易行為,以及用戶數據等相關內容,尤其是傳統新聞出版社需要意識到一點,用戶對于他們而言就是一種不可被忽略的隱形財富。早在2014年,Facebook宣布用160億美元收購Whats App時,他們就證明了這一點,用有形資產換取大量的無形資產(用戶)是非常值得的,這也是Facebook的成功之道。
在21世紀,擁有大數據的人就擁有了未來。此話有待商榷,因為大數據能夠幫助行業企業占據制高點,取得主動權,這就說明了數據的價值在于應用,而不在于擁有。新聞出版行業需要大量與社會進行交流溝通,他們需要利用數據驅動自身內部的所有業務流程與產品生產研發過程,所以說,新聞出版行業需要利用數據驅動業務,用業務產生價值,這也是傳統新聞出版社希望發展轉型的原因之一。相比于生產流程,他們更需要數據,因為生產流程只能給予他們固定的定量思維,但是數據卻能為他們提供流動的定性發展思維,例如,在數據決策、印數決策、選題策劃等方面都需要數據作為支撐,通過架構一套完整的大數據平臺體系、深入構建全維度記錄體系、優化存儲于描述數據關系架構商務大數據平臺,建立全維度記錄、存儲與描述數據體系,真正深入到數據關聯、數據挖掘技術應用過程中,對數據實施相關預測與推薦過程,這是為了有效解決存在于傳統新聞出版行業中的缺陷問題,為新聞出版產品與服務內容提供數據化服務條件進行預測與推薦,最后解決傳統新聞出版行業中所存在的種種痛點,最后實現新聞出版產品與服務的數據化。
目前的許多新聞出版社中存在著嚴重的數據孤島現象,造成這一問題的原因是出版社、編輯室、作者三者之間無法實現信息共享,因此,出版社本身可能會陷入到孤島效應危機中。再者就是傳統新聞出版社是缺乏大數據平臺做支撐的,這就導致他們在業務發展過程中無法實現行業協同,無法實現對數據的共享過程。按照上文所談到的“共享即為使用而并非擁有”這一概念來看,行業內部數據流動性并不強,無法與外部數據相互融合,最終成為死數據。新聞出版社需要解決的問題有二:第一就是合理平衡數據的共享關系,優化共享效率;第二則是建立基于利益平衡機制的共享平臺,這是傳統新聞出版社走向未來轉型發展路徑的關鍵。[1]
傳統新聞出版行業是存在諸多發展問題的,它們在某種程度上嚴重影響了產業健康向前發展進程。首先是傳統行業中存在嚴重的產能過剩、供需不匹配等問題,客觀且嚴重地影響了新聞出版行業發展建設所存在的各種問題,導致傳統行業中出現了包括產能過剩、供需無法匹配等現實問題,它們為行業帶來的風險極大,所以目前行業是希望追求綠色發展前景的。從2014年大數據概念出現后看,傳統新聞出版社還未改變自身發展格局,當時全國的新聞出版刊物純銷售額只有780億元,已經不可避免地形成倒掛發展之勢。與此同時,發行市場中所存在的群雄并起、諸侯割據問題也導致全國性發行中的嚴重缺乏,統一開放、競爭有序的全國大市場成為一種奢望,這直接導致我國出版傳媒集團難以做大做強。再一點就是出版發行生態鏈目前處于嚴重的畸形發展態勢,它所運行的寄銷制導致其無條件退貨、賬期較長、回款困難、誠信喪失等問題的出現,圖書單品種核算問題。客觀講,目前的泛行業發展是追求粗放式管理方式的,如果無法從本質上思考并解決相關桎梏問題,就可能會導致大數據技術體系與行業大數據平臺、信用信息平臺發展建設陷入被動。而目前,爭取從產業鏈的上、中、下游實施全方位精確化管理,確保數據驅動選題策劃到位,同時提供印刷決策內容,深度、精準分析用戶行為與營銷行為,同時構建個性化發展機制,為出版社重塑生產、銷售與管理模式創造無限可能性是很有必要的,新聞出版行業企業在發展轉型進程中需要準確把握這一點。[2]
大數據是目前新聞出版行業快速發展的關鍵,它迎合了信息化時代發展建設標準,但就目前來看,新聞出版行業中對大數據及其相關技術的應用也是仁者見仁、智者見智的。就目前出版社中的大數據內容來看,它的分類方法眾多,其中主要結合業務層面進行劃分,新聞出版社的大數據內容主要包括6類:第一是機構數據,例如新聞出版政府機構、行業協會、事業單位、出版社、報社、發行集團等,它還包含了企業的出版收入與營銷利潤;第二是人員數據內容,其中就包括了公務員、編輯記者、專家、新聞出版社以及行業中所有從業人員的基礎數據等;第三是產品數據,它主要包括圖書報刊數據、音像數據、網絡出版物數據等,同時也包含了作者的元數據、印刷數據、版權數據等;第四是政務數據,其中包含了政府的綜合辦公數據、市場監管數據、公共服務過程產生的數據以及人事信息、財務信息數據等;第五是商務數據,其中包括了新聞出版社的信息企業主體市場交易數據、合同數據以及版權數據等;第六是內容數據,其中包含了信息知識數據,這部分數據包含4種類型,其中包括了事實知識、技能知識、原理知識與人力知識,它形成了豐富的大數據庫平臺,被視為新聞出版行業中的特有數據寶藏內容,也成為了知識服務的重要基礎。[3]
3.2.1 數據采集
數據采集是目前新聞出版行業生產發展轉型中的最重要因素,它希望結合數據類型內容中的內容數據、市場數據與用戶數據構建新的數據發展業態,強調大數據技術內容應用的交互性內涵。在整個過程中,它專門圍繞出版行業核心業務內容建設有價值的、有時效性的信息發展體系,將數據采集與出版機構內容創造所獲得的回饋數據融入到實際生產進程中。目前,我國確實存在大量的權威專業新聞出版社,它們擁有豐富的專業內容資源,且在出版業務轉型升級過程中更加追求數據內容的資源化與碎片化發展,強調利用大數據提供豐富資源內容,確保有效實現行業數據銜接調整,解決存在于企業中的某些“數據孤島”效應,尋求行業產業快速發展,強化行業數據發展規范標準,滿足產業發展需求,建立有針對性的大數據服務體系。另一方面,需要滿足新聞出版行業的統一規范化數據采集標準要求,不遺余力地優化大數據采集平臺,強化行數據發展規范標準。就目前來看,基于大數據分析與應用的全數據資源體系構建是有必要的,它能夠在一定程度上提升大數據應用的時效性與準確性。[4]
3.2.2 數據標引
新聞出版社在大數據技術支持下可實現對海量數據的采集,再結合所獲得的數據實施標引工作。在整個過程中需要對大數據體系中的預測功能、預警功能進行分析應用,提升數據創新關鍵作用。就我國整個出版行業發展現狀來看,行業企業還應當更多結合、利用數據標引技術內容實現對知識與行業應用內容的有效標引,建立一套知識標引學科研究體系,這也能為后續發展新聞出版社的知識服務內容奠定良性基礎。[5]
3.2.3 數據計算
新聞出版社的數據計算工作內容包括了云計算與統計學分析,二者可實現兼容并包,同步實施。其中,首先分析云計算內容,它所蘊藏的大數據內容是海量的,且這些海量數據能夠與標引數據內容相互結合,實現對數據云計算處理過程優化,建立基于處理結果的二次數據研究體系。在這里,云計技術與數據計算過程中都會提供豐富且多元化的動態計算內容,實現對技術內容的擴展與虛化,確保虛擬化信息資源內容實現全面調整,真正被納入到網絡鏈接中,真正滿足資源統一化管理與智能化調度過程。客觀講,它所構建的就是一套全新的新聞出版社數據資源池,其池中不斷面向某些有需求的用戶提供不同的資源服務內容。
而在統計學分析方面,則主要結合計算機技術快速發展進程對統計數據進行相應搜集與處理,同時滿足數據分析與存儲發展需求。考慮到一般計算機系統是無法對數據所反映的客觀復雜規律進行有效厘定的,因此,需要在判斷未來發展趨勢過程提出決策方案內容,對數據內容進行二次標引與計算,滿足數據統計學分析條件。在該過程中,還需要對數據的不確定性進行量化分析,基于數據信息規律提取數據內容,找到數據標引與統計計算的最優化方案。[6]
3.2.4 數據建模
在數據建模過程中,需要結合不同應用范圍對學科體系建模與行業應用建模進行分析。在該過程中,學科體系建模主要依賴于當前已有學科體系,它擁有相當成熟的理論知識體系,可根據相關關系構建內在模型,選擇合理化數據建模方案。目前的新聞出版行業中的大數據建模結構相當成熟,可作為行業發展應用建模使用,它的建模范圍涉獵各個行業發展領域,可結合行業職業基礎現狀發展擴大數據建模范圍,這也意味著新聞出版企業業務范圍的擴大。而且數據建模是個性化的,它能夠針對用戶的特定化需求構建相應大數據模型,主要針對數據建模的發展領域。[7]
3.2.5 數據服務
在數據服務方面,它主要結合數據采集、標引、統計、建模等環節展開數據服務體系設計,爭取為所有目標客戶提供豐富多彩的大數據服務內容,充分考量新聞出版行業中的審計發展內容有效轉型與優化。具體來講,就是合理利用大數據技術全方位推動出版行業機構內容從出版到知識服務傳播方面有效轉型,例如:從人工智能向發展機制的轉型,從傳統業務門類面向大數據驅動方向的轉型,全方位提升新聞出版社機構的整體業務運營與發展管理效率。
具體來講,目前的新聞出版社應該追求利用大數據技術優化個性化知識服務內容,從不同渠道整合數據資源,確保數字化整理背景下對知識服務平臺的有效優化,建立圍繞用戶展開服務的檢索與閱讀平臺、熱點分析平臺、數據挖掘分析平臺以及知識關聯服務平臺。與此同時,要構建知識圖譜,為用戶提供數字化、知識化與智能化服務項目。而目前的新聞出版社是追求數字化出版業務發展的,因此,基于大數據的個性化用戶檢索、瀏覽終端行為實施都是可以理解的,它們都能精確掌握當前的用戶實際需求規律,并為用戶未來的知識需求定制個性化方案。[8]
未來大數據模型標準化建設與應用應當成為當前新聞出版行業發展的基礎關鍵。如我國的國標委就已經成立了“全國信標委大數據標準工作組”,負責制定一套完善的國家大數據領域標準體系,為新聞出版結合大數據技術過程采集多方面資源數據內容,實現信息數據有效對接。所以,在未來,新聞出版行業還應該建立基于大數據共享交換機制的信息化業務平臺,加速建設大數據重大工程,為新聞出版社大數據體系的建設與業務創新優化奠定基礎。