【摘要】我國新聞出版領域的數據庫產品雖然起步較晚,但隨著國家政策的積極推進,加上近幾年來信息技術及網絡載體的蓬勃發展,數據庫出版工作步入了快速發展的軌道。但隨著工作的不斷深入,越來越多的問題浮出水面,如何滿足用戶需求,把數據庫出版、運營工作做到實處是促進新聞出版行業數字化進程的重要條件。
【關 ?鍵 ?詞】數據庫;知識體系;知識組織;知識資源;運營版權
【作者單位】溫強,化學工業出版社有限公司。
【中圖分類號】G203 【文獻標識碼】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2019.23.004
一、新聞出版界數據庫的概述及定位
我國早在“十一五”規劃綱要中便明確提出,鼓勵數字內容產業發展,積極發展信息服務業。數字內容產業的提出與文化和信息技術都有聯系,它是基于數字技術應用產生的新興產業概念。數字內容產業涉及移動內容、互聯網服務,已廣泛深入各個領域,其在發展過程中,將各種文化、知識資源與最新的數字技術結合、融匯,建立了新的生產和消費方式,促使新的產業群落形成,培育了新的消費人群,創造出驚人的社會價值和經濟價值。
數據庫出版工作是數字內容產業的重要組成部分。數據庫概念起源于20世紀,最早應用于美國軍方的研制數據工作,后來廣泛應用于各個領域,泛指“按照數據結構來組織、存儲和管理數據的倉庫”,是一個長期存儲在計算機內的、有組織的、共享的、統一管理的數據集合。而本文對數據庫的論述,僅限于新聞出版領域。
專業學術數據庫可以更好地組織知識數據、更方便地維護知識數據、更嚴密地控制知識數據和更有效地利用知識數據。因此,專業學術數據庫的出版工作在新聞出版領域被高度重視和廣泛推廣。近年來,媒體融合成為全球出版傳媒業的共同趨勢,5G時代提前來臨,給以專業數據庫出版為代表的出版單位帶來了空前機遇和新一輪的挑戰。
數據庫可以從存儲和訪問、資源類型等不同角度進行分類。首先,從存儲和訪問的角度劃分,一種是存放于聯機檢索系統中的全文數據庫,另一種是基于云技術的在線數據庫。隨著互聯網的普及和應用,在線數據庫已成為主體,但由于用戶保密、考核等特殊需求,聯機或單機形式的數據庫仍有很大的市場需求。因此,絕大多數的數據庫提供商開發的數據庫都可以兼容和滿足上述兩種不同的存儲和訪問需求。其次,從資源類型角度劃分,可以分為電子書庫、工具書庫/條目庫、電子期刊/報刊庫、圖片庫、視頻庫、音頻庫以及綜合型數據庫等。隨著用戶需求的不斷提升,出版方越發重視一站式服務,因此越來越多的數據庫逐漸發展為集合各種資源的綜合型數據庫。
不同類型的數據庫的技術水平和功能差異較大,但都應具備以下一些基本的功能特征:匯聚海量內容、知識資源深度結構化標引、內容評審與檢測、內容出版企業信任評價及準入機制、內容協同數字編輯和加工過程的跟蹤管理、內容產品的多形態發布、產品的投送和多渠道營銷功能、電子商務功能、智能搜索功能、數據挖掘和數據分析功能、客戶關系管理、數據統計分析、版權保護、內容資產安全管理等。
二、數據庫內容組織與生產的關鍵環節
數據庫的內容組織與生產是一個龐大的系統工程,本文僅針對核心環節進行概要性介紹。
1.產品設計與開發
數據庫產品要取得良好的社會效益和經濟效益,就必須從市場和用戶需求出發,充分滿足市場和用戶需求,這是產品設計的基本要求。近年來,各出版單位的融合出版工作都取得了巨大的進展,培養了一大批復合型出版人才。數據庫的產品設計工作,已從早期的通過文字描述需求發展為通過原型設計軟件全面表達需求。通過幾十頁、甚至過百頁的原型設計,基本上已經可以呈現最終的產品形態,并可以通過原型進一步對用戶進行調研論證、證實用戶需求。對于大量不具備自主開發能力的出版單位來講,這種產品設計和開發模式,極大地降低了開發風險,提高了數據庫產品的社會價值和市場競爭力。
2.知識體系建構
對于傳統編輯來說,知識體系就是一本書的目錄。但對于數字出版而言,知識體系是專業知識科學概括后的分類歸集,更是通過一定規律對知識屬性進行提煉并運用到知識資源標引及分類檢索、智能推送的唯一依據。因此,知識體系的建構對專業學術數據庫而言尤為重要,決定了一個數據庫的科學性和易用性。建構知識體系的基本工作思路是:確定知識組織方式→制訂分類體系→明確各分類屬性→建構敘詞表。一套科學、嚴謹的知識體系,對于用戶精準、便捷地發現知識起到至關重要的作用。
3.知識資源生產
專業出版機構在長期的編輯出版工作中,積累了豐富的專家資源和內容資源,對于出版專業學術數據庫有著得天獨厚的優勢。存量資源的數字化加工和標引是知識資源最基礎的生產方式,但隨著數據庫產品用戶群體的擴大,用戶對增量資源的需求日益凸顯。因此,升級出版模式、改造出版流程,使知識資源先入庫再反向作用于傳統出版,是學術數據庫能取得更大發展的前提。
三、數據庫的主要運營模式
數據庫運營是對數據庫出版后期工作的計劃、組織、實施和控制,是與產品生產和服務創造密切相關的各項管理工作的總稱。通過對數據庫的運營可以實現市場管理、客戶關系管理、渠道管理、內容投送以及用戶個性化需求服務管理。現階段,由于單位性質、人員規模、產品結構等不同情況,各出版單位采用的運營策略也不盡相同,主要包括自主運營、委托運營及合作運營等模式。
第一,自主運營是綜合實力較強的出版單位常采用的一種運營模式。該模式的優點是對運營工作各環節的掌控力比較強,能獲得一手資料,能對工作力度、質量、進度進行全面、直接的管理。但自主運營在人力、物力和技術上的投入都比較大,綜合成本和服務風險也比較高。
第二,委托運營是出版單位面對一些專業性很強的特殊數據庫產品而自身不具備運營條件時常采用的一種運營方式,即把產品委托給專業的第三方來運營。該模式的優點在于可以解放專業編輯,使其精力進一步聚焦在出版業務上,而運營工作交給更專業的公司和人員來完成,效率更高;缺點在于委托運營公司缺少主人翁精神,而且可能同時承接多個項目的運營,在運營深度、連續性等方面會有所欠缺。
第三,合作運營是結合上述兩種運營方式的一種折中解決方案。出版單位和運營公司各委派專人成立專門的運營團隊,甚至合資成立專項運營公司。這種模式既解決了出版單位人員不足的問題,又能對運營團隊進行針對性管理和考核。但該模式只適用于大型的、用戶量大的數據庫產品,中小型數據庫產品很難以這種模式操作。
四、數據庫的發展現狀及存在問題
1.欣欣向榮的行業發展態勢
自“十二五”以來,國家在政策、經費等方面對傳統新聞出版業的轉型升級和融合發展做出了巨大支持。出版單位在各自的優勢出版領域都進行了一系列的探索與實踐,特別是以TO B商業模式為主的專業數據庫,更是取得了顯著的成果,基本可以概括為以下幾個方面。
第一,數據庫品種越來越多。據不完全統計,目前出版行業面向機構客戶提供的電子書、期刊類數據庫有近百種之多,而在5年前,市場還處于兩三個平臺獨大,采購供不應求的狀態。數據庫品種的豐富滿足了越來越多的行業需求,為各行業、各專業領域信息化的整體發展做出重大貢獻。
第二,內容質量和技術水平越來越高。早期數據庫的數據來源基本是已出版內容,僅是呈現形態和傳播方式的變化。隨著大數據、人工智能等新技術的普及應用,以知識服務為核心理念的數據庫逐漸成為主流。此類數據庫的數據都經過深度標引且增量資源越來越多,語義分析、智能推送等技術更是被廣泛應用,這使得數據庫的內容更豐富、檢索更智能、推送更精準、使用更便捷。
第三,產業鏈越來越完整。由于紛繁復雜的市場環境以及用戶個性化需求的日益突出,業內對數據庫產業鏈的要求越來高。一個好的數據庫產品,選題調研、內容生產、技術開發、平臺運營、渠道搭建、維護反饋這一系列工作環節缺一不可。因此出版單位與軟件開發商、運營商及代理商的合作日趨密切,不同類型單位在整個產業鏈里各自發揮重要的作用,這種模式有效彌補了傳統出版單位的不足,更好地把數據庫產品推送到用戶手中,同時更有利于出版單位根據真實需求快速更新迭代產品。
2.數據庫發展面臨的問題
(1)數據庫行業整體發展面臨的問題
第一,盜版問題嚴重,制約行業市場化發展。專業學術數據庫的核心競爭力在于科學、嚴謹、權威的專業內容資源。被稱作“內容提供商”的出版單位,必須嚴格把關版權問題。出版單位既要確保取得原創者的相關授權,又要嚴厲打擊非法盜版者。特別是針對機構用戶的數據庫產品,機構用戶絕不會為同一內容多次買單。而盜版者由于沒有版權成本,售價經常低于正版內容幾倍甚至幾十倍,嚴重擾亂了市場,制約了專業數據庫的發展。因此,各出版單位應高度重視版權問題,采取積極的措施維護合法權益。
第二,行業資源整合需求高、難度大。數據庫品類的增多帶來了新的問題,那就是資源分散,用戶使用不便。首先,不同的數據庫平臺很難實現跨庫檢索,即使實現了跨庫檢索也僅僅是實現鏈接跳轉,無法真正打通各數據庫的知識體系。其次,雖然相關的專業出版單位都有自己的優勢出版方向,但再有優勢的出版單位也無法實現某領域圖書的100%市場占有。再次,資源打通還涉及版權和管理等一系列復雜問題。結合以上因素我們可以看到,行業資源打通整合、提供一站式服務是專業數據庫在未來一段時間需要深入探索和解決的問題。
第三,產業邊界基本消失,競爭激烈。數據庫的出版運營模式與傳統出版的版號/刊號管理模式是完全不同的,任何一家IT技術公司、運營公司都可以做數據庫,網絡上充斥著海量的各種資源。在這樣的大市場環境下,出版單位的競爭對手已不僅是自己熟知的行業同伴,還有更廣泛的競爭主體,所以出版單位在管理、運營等機制和策略上必須與時俱進,否則將成為產業鏈中話語權最弱的一環,甚至被淘汰。
(2)數據庫產業鏈各方的痛點和矛盾
數據庫市場需求旺盛,內容生產已步入正軌,所用技術業已成熟,但有多少專業數據庫的銷售收入能達到所在出版單位主營業務收入的20%以上?問題出在哪里?其中的原因肯定是多種多樣的,但產業鏈各方的利益訴求仍有矛盾肯定是最重要的原因,表現最為突出的是內容提供商、渠道運營商和機構用戶之間的矛盾。
作為內容提供商的出版單位,自身最大的問題是能否把自己最新、最優質的資源放到數據庫中或實現對外授權。目前擔心對外授權會影響傳統出版業績的觀點還是普遍存在的。同時,出版單位最大的痛點是“用戶盜版或使用盜版怎么辦?”“渠道運營商銷售數據不真實怎么辦?”正是因為這兩個問題無法有效解決,所以出版單位越發不敢對數據庫進一步投入和授權。如何通過政府監管和技術升級解決這些問題,將對專業數據庫的發展起到至關重要的作用。
機構用戶考慮的問題其實很簡單,價格、資源量和服務永遠是他們最關心的問題。但市場的實際情況是,某些盜版庫的價格遠低于正版,資源量卻遠高于正版,而且由于資源量大,使用也更加便捷,更容易得到用戶的認可。相反的,采購所謂的正版庫,要想實現盜版庫的功能,需要花費數倍的經費不說,用戶訪問時還要跳轉N個平臺,極不方便。在這種情況下,讓采購者如何抉擇?因此,前文中也提到了行業資源整合這個問題。值得一提的是,隨著近年來國家對財政資金的監管落地,以及采購者的法律意識逐漸加強,這類現象稍有好轉。
運營商以及渠道商(兩者有時是合二為一的)在產業鏈里可能是最艱難的角色。作為私營公司,創造利潤生存下去是他們最基本的訴求。但在正版庫和盜版庫價格相差巨大的情況下,他們在數據庫招投標工作中很難占有優勢。而且面對盜版庫不需要再分配利潤,正版庫還要向內容提供商分成的現實情況,運營商和渠道商更是步履維艱。在這樣的背景下,他們為了取得業績,有時只能突破自身權限開展工作以及在經營模式上投機取巧。而這種情況出版單位或多或少是知曉的,所以越發不想把自己的新資源、優質資源授權給他們,這讓數據庫的運營進入了一個惡性循環。因此,這種現象歸根結底還是要解決盜版問題。
五、數據庫出版工作的幾點建議
1.加大融合力度
融合出版是出版業發展的必然趨勢。出版單位在推進融合發展時必須堅定信念,加深對融合發展的認識與理解。一是要把融合發展當作“一把手”工程進行全局式部署,集中資源力量深入推進。二是要建立融合出版的短期目標和長期規劃,為融合出版制定清晰的路線圖和時間表,有計劃、分步驟地推進融合發展。三是面對新環境、新技術、新領域、新業態,要進一步加強前瞻思維和開拓精神,特別是要加強對云計算、大數據、人工智能、物聯網、虛擬/增強現實等技術的跟蹤研究,以技術應用創新引領內容呈現、產品形態和服務體驗的創新升級。四是借助社群營銷等營銷新模式,全面提升融合出版產品的營銷能力、服務能力和盈利能力,讓融合發展有成果的同時,也能真正實現有影響、有效益。五是借助資本力量,通過融資、上市、尋求文化產業基金扶持等手段,持續增強融合發展動力,釋放融合發展活力。隨著媒體融合的縱深發展,傳統媒體與新興媒體正在從過去的產品融合、渠道融合,逐漸演變為平臺融合、生態融合,邁向合二為一的一體化發展新階段。
2.普及新技術應用
2019年,我國5G實現商用, 5G的運用將極大提升信息的共享效率和傳遞能力,將給經濟發展、社會服務、個人生活帶來巨大的影響,給出版行業帶來顛覆性的變革,尤其給數據庫的選題策劃、生產傳播、消費等各個環節帶來深遠的影響。專業數據庫在迎來空前發展機遇的同時,也面臨重大挑戰,這對出版單位精準把握用戶需求,提供精準化服務和交互式體驗提出了更高要求。因此,出版單位在各種新技術的應用上要進一步加強探索和實踐。
3.凈化、規范市場環境
一方面,需要行業加強行業規范制度和管理手段的進一步優化完善,強化主體責任,建立完善的行業準入、獎懲機制,加強對違法違規行為的打擊力度,健全數據庫版權保護機制;另一方面,出版單位應自覺肩負起社會責任,弘揚社會主義價值觀,注重價值導向引領和內容把關,堅守底線,不觸紅線,共同建構數據庫發展良性生態。
數字出版作為新時代思想文化的重要陣地、文化產業的生力軍,必須充分發揮骨干先鋒作用。數據庫作為其重要的產品形態,一定要進一步提升內容質量、技術水平和服務能力,加強資源整合與版權管理,以便全面推進融合出版向縱深發展。
|參考文獻|
[1]數字編輯專業技術資格考試指導用書編委會. 數字編輯基礎(中級·2018年版)[M]. 北京:北京聯合出版公司,2018.
[2]溫強. 化工領域知識服務動態化智能化[N]. 中國出版傳媒商報,2016-06-21.