趙艷春 王 哲 余 丁
隨著互聯網的飛速發展,大數據時代的到來,包括各種電子書,VR(虛擬現實)技術在書中的應用,不僅改變了人們閱讀方式,而且也不斷影響著人們的生活模式。出版社作為知識傳播的主要承擔者,也要隨之改變,不斷地適應作者、讀者,改變服務作者讀者的方式,更好地發揮“傳播知識 創造未來”的作用。我們傳播什么樣的知識,就有什么樣的科研環境,就會呈現什么樣的學術氛圍。如果我們傳播的都是高水平的、業內公認的科研成果,就會呈現清新正氣的學術氛圍,反之如果我們傳播的知識參差不齊,讀者獲取的信息也會良莠不齊,那么以此為基礎再次產生新的成果的時候,就會魚龍混雜。
就出版界而言,近幾年我國每年出版新書都在26萬種以上,卻存在著“大而不強”的問題。清華大學教授施一公曾多次表示,我國已經在2020年之前論文數量已經超過美國,但是他很擔心,垃圾太多。這不僅折射出科研評價體系的問題,也反映出學術傳播本身有很多亟待改進的地方。全國政協委員、商務印書館總經理于殿利直陳行業發展痛點:“我們這個行業,面臨著‘有高原無高峰’的現象和‘好書不少垃圾更多’的現狀。”[1]可見全面提升出版質量,迫在眉睫。
2017年底我國提出了從出版大國向出版強國的轉變,不僅要提高出版質量,同時會縮小出版規模,而如何打造精品,讓更多原創的科學成果在祖國大地開花結果,也是對科研成果的傳播者提出了更高的挑戰。由于科技出版有其自身的特殊性,他是小眾化的出版,他是科學家成果的結晶,他的讀者也是科學家們自身,因此作者和讀者高度結合,整個產業形成了閉環[2]。這要求我們不僅從選題策劃開始優選創新成果,且在成品之后,更能反饋給讀者一個高質量服務。也就是我們提供給科研工作者全生命周期的服務,讓科研工作走進一個良性的循環過程中。
結合國內外形勢,我國自身特色,如何形成我們自己的知識服務體系,為科學研究服務?面對如此復雜多變的世界,科技出版結合自身的特色,不僅要傳承傳統出版傳播知識的重擔,而且要肩負從專業、生活、科普等多個維度,從文字、音頻、視頻等多個形態,從知識的傳播者、平臺的搭建者到最終全新透明科技生態圈的建立為目標。簡而言之,知識服務的定義是從大量的隱形和顯性資料中,根據人們的需求將知識提煉出來,并有針對用戶的需求解決問題。流程可以概括為:知識內容的聚集—(根據用戶的需求)知識的加工提煉—知識的提供??梢娭R內容的聚集是源頭,知識的加工提煉的是手段。由此可知,內容是核心,服務是根本。這要求我們在內容的呈現上力求精品,做到權威性,科學性;在知識的服務上力求多層次,多樣化,同時做到系統性,深入性。只有這樣我們才能超越傳統紙媒的單一化服務,超越現在互聯網所能提供的簡單大量信息的服務。
盡管出版社積累了大量的信息和資源,但是如何讓這些資源為潛在用戶使用和消費值得進一步研究。圖書出版社有大量的圖書信息,每本書都是一個完整的系統,當我們把書的內容打亂重新組織的時候,相關的知識就會呈現出來,如何呈現出用戶需要的,呈現出知識樹的情況,這就是現在被廣泛提及的知識圖譜。知識圖譜的概念最早由谷歌在2012年提出,旨在描述真實世界中存在的各種實體或概念,如人物、商品、景點、電影等。國內各大學術出版機構利用本體、關聯數據、知識圖譜等語義技術構建更加新穎的科學知識圖譜[3]??茖W知識圖譜是科學領域智慧數據的表現形式,更是新型知識服務的數據基礎,在2017年受到了斯普林格、微軟等知名出版集團和互聯網公司的重視[4]。斯普林格·自然集團的科學知識圖譜SciGraph[5],關聯集成了科學論文內容信息、作者信息、題錄信息、會議信息等,能夠滿足科研工作者對科學知識語義檢索、查詢結果可視化等需求。MAG由微軟公司研發,關聯集成了包括科學論文、作者、機構、會議及相關領域的數據,向科研用戶提供精確的文獻檢索服務[6]。清華大學的Aminer利用數據挖掘、自然語言處理、社會網絡分析與挖掘等技術,構建科學知識圖譜,向科研用戶提供語義信息抽取、話題發現和趨勢分析等在內的眾多功能[7]。構建面向科學領域知識圖譜要全面整合多源、異構的領域知識與出版物內容,實現知識圖譜的豐富與擴展,構建科學交流的完善體系。
而到底呈現什么樣的知識圖譜才是客戶所需要的呢?結合科學社自身的特點,選題立項是科學研究的第一步,也是至關重要的一步,既決定著研究者現在和將來的主攻方向、目標和內容,也在一定程度上規定了科研活動采用的方法和途徑。圍繞選題我們為客戶提供該方向的相關理論探究與應用研究。這其中哪些是前人未曾研究過,而哪些又是前人已經研究過的(在這其中哪些是研究但是未解決的問題,哪些是已經解決的問題)。根據每位研究者的科研狀況,從而給出可能的研究對象,研究范圍,研究內容乃至研究方法。對現有資源進行大數據分析,可以為科研工作者提供如圖1所示的知識服務。

圖1:通過大數據分析提供的科研方向的知識服務
我們還可以從另一個維度進行細化的數據分析研究,深入研究我們所擁有的知識數據,針對不同的客戶,開展多種維度的研究,從中挖掘出新的養分。一本學術成果專著從內容結構上看,應該至少包含三部分:創新的學術價值,成熟知識體系的運用,對未來這一學科領域發展的預測。首先,創新性學術成果主要指思想,理論,觀點,方法,過程上有創新,也就是說通過科研工作者的加工,在原有的基礎上,產生新思想,新理論,新觀點,新方法,新研究的過程[3]。其次,隨著科學技術的不斷發展,社會分工越來越明確,知識領域專業劃分越來越細致,互聯網對各行各業的影響不斷深化,新的問題總是層出不窮,人類創新的腳步不斷邁進。習近平總書記在2016年全國科技創新大會、兩院院士和中國科學技術協會第九次全國代表大會上,提出廣大科技工作者要把論文寫在祖國的大地上指示,也就是不斷推進“知識創新,理論創新,方法創新”。最后,按照總書記的指示,我們進一步梳理專家們的科研成果,把每本書中的創新從三個維度提煉出來。把每本書中涉及這一創新的相關知識體系提煉出來,把每本書創新的相關領域的發展預測提煉出來,最終凝練出供作者需求的全面的小領域展現。如圖2所示。當然這一過程其實需要大量的專業的科學家的人工判斷,并非簡單的數據分析可以做到,是通過對所有知識源的標引,充分將某一學科的知識全面聯系起來,建立領域知識本體,為新一輪的科技創新奠定基礎。呈現給用戶的好似一棵枝繁葉茂的大樹,科研工作者看到這棵樹,仿佛看到自己站在哪里,下一步應該往哪里走樹才能長得更加繁茂。
當能夠給用戶,科研工作者提供這樣的知識服務的時候,我們也就實現了全新透明的科技生態圈的打造。在這個封閉的科技生態圈中,我們引入了開放的概念,不僅完成了所有人對科研成果的展現,也實現了對已有科研成果的檢驗,在互聯網中實現全程可見,均可查詢,實現了知識的互聯互通,共享共用。

圖2:為尋找創新的方向提供服務
知識圖譜的構建,知識服務的提供需要高水平的內容質量,配套的新技術,大量開放數據的獲取,大量的學科專家參與,需要極大的投入和長期的過程,若構建成功,我們也就打造了全新透明的科技生態圈,良性循環已經形成。
知識服務系統的建立不是一日之功,是對現在體系龐大資源的深度挖掘、發現和組織。這不僅需要出版業橫向縱向發掘各類資源,聯合各行業,形成強大智力支撐的內容和資源,而且需要大量新技術的介入包括大數據,人工智能,VR技術等,最終實現大到各行業都有自身的知識圖譜,幫助行業和產業升級改造,小到為每個用戶提供知識圖譜,幫助個人實現職業夢想與規劃。只有這樣才能讓已經擁有的大量的信息、可靠的數字資源發揮更大的作用,才能日益增強出版界文化自信,實現文化強國的重要目標。