劉細文
圖書館“十四五”規劃
中國科學院文獻情報中心“十四五”發展思考——基于數據、信息、知識與情報的規劃框架設計
劉細文
(中國科學院文獻情報中心,北京 100190)
本文系統分析了新時期文獻情報機構面臨的挑戰和發展趨勢,分析新時期文獻信息機構的工作對象、內涵、理論和技術的變化,闡明數字化科研模式變革與需求變化對文獻情報工作的影響和借鑒意義,將數據替代信息作為圖書情報工作流程設計的起點。全面歸納中國科學院文獻情報中心的近期工作進展,包括文獻信息保障能力、數據匯聚和平臺管理能力、科研管理與科技創新服務能力、學術信息評價與交流等方面。“十四五”期間,中國科學院文獻情報中心將面向“戰略決策一線、科技創新一線、區域與產業一線”,以戰略情報服務和學科情報服務為核心,建設國際一流的國家科技知識服務中心。
中國科學院文獻情報中心;“十四五”;發展規劃
發展規劃的制訂,需要考慮已有發展基礎,把握未來發展趨勢,明確下一步發展思路,作出明確的發展道路選擇。筆者從以下方面談談對中國科學院文獻情報中心制訂“十四五”發展戰略的基本思考。
文獻信息機構面臨的變革是多方面的,其影響也是顛覆性的。對于中國科學院文獻情報中心這樣的科研信息服務機構來說,需要從服務需求、工作內涵、圖情理論3個角度認知和響應。
第一,科學研究模式已經發生實質性變化,這樣一些變化已經引起科研范式的革命。科研模式變革是開展文獻情報服務、科技情報服務的大前提,決定了科研信息服務需求的形式和內涵。在這種科研模式變革中,信息技術、智能技術的飛速發展與應用,已經形成數據驅動的科研范式,并且在不斷深化和發展,構成科研活動、知識發現產業化的新手段,數字化的科研模式正在形成。未來的學術研究、知識發現,以及對客觀規律的認知過程,可能正在演變為信息計算或者數據計算的科研模式。《第四科研范式》詳細描述了科學范式從經驗范式、理論范式、計算模擬范式、數據發現(data exploration)范式的演變過程[1]。在數據發現的科研范式中,將科學研究的理論、實驗、模擬等統一,構建一個整體化的科研發現平臺,科研數據通過儀器獲取或者通過模擬的方式形成,然后利用軟件處理數據,同時將信息/知識等存儲在計算機系統中,科學家利用計算平臺分析和解析數據來完成科學研究過程。近年來,數據發現式的科研范式已經成為客觀現實,如化學機器人、蛋白質折疊、AI在材料科學研究中的應用等,都是以信息數據計算的方式進行科學研究。所以,科研信息服務機構首先要把握這個趨勢。
第二,在新學術信息服務范式下圖書館、圖情機構的定位與內涵也在發生一些變化。多年來圖書館界一直在適應環境和需求的變化,不斷創造和豐富服務內涵。例如,在高校圖書館機構中,積極倡導面向決策提供信息服務,組織開展專項性的情報服務工作。國際圖書館機構同樣呈現這樣的發展態勢。在圖書館學研究中,很多專家在倡導圖書情報機構向智庫研究和服務機構轉型,也體現了圖書館服務內涵變化的一個特點。我們可以從這些變化當中仔細去分析、歸結,提煉圖書館機構變化的特點和趨勢。
目前,圖書館信息機構的工作對象在發生變化,體現了圖書館發展的時代特征。圖書館機構的工作對象簡單來說是面向圖書、文獻的,形成了面向文獻的業務流程。信息機構進一步深化,以信息范式實現圖書館的管理與服務,將工作對象從文獻上升到信息。歸納來說,現在圖書館和信息機構所面向的工作場景發生了變化,數據、信息、情報、知識、決策場景都成為工作對象的一些部分。如果按照信息分析這個視角,信息管理呈現為顯性知識表達、隱性知識挖掘、情報表達以及報告形成,最后支撐決策服務。這體現了圖書館和信息服務機構的內涵定位的進一步變化。
除了在數據、信息、情報、知識和決策場景層面的內涵變化之外,圖書館/情報機構的工具方法也在發生演進,信息系統、內容管理、知識管理、情報分析、決策支持的技術工具不斷得到深入應用。從圖書館、信息機構的工具演進技術上來看,可以說信息化或者數據化導致了智能化應用。新一代信息技術的應用帶來了變化,形成眾多的工具、方法、平臺等。同時,新工具與方法的形成,也造就了圖情領域的理論范式的演化。筆者在《圖書情報工作》2021年第1期撰寫了一篇關于情報學范式變革的文章[2],將其歸結為信息論范式、信息管理范式、決策情報范式、信息咨詢范式。這樣的理論范式變化,可以說是信息管理從技術層面走向信息領域的內化過程,最后再走向社會化。所以,圖情領域的理論基礎和理論范圍都是進一步擴大和推廣。
在圖情理論的各個范式下,其理論基礎決定了技術路徑,確定文獻情報工作的服務形式,最后引領的發展趨勢也各不相同。如在情報學的經典Brookes理論和知識方程指引下,形成了檢索系統、知識地圖,最后可以形成智能化的學術信息生態;在決策情報范式下,從決策情報理論出發,可以建立決策信息分析與服務、智庫研究與服務的工作模式,形成智能化決策的信息支撐,進而演化為智能化決策或者數據決策服務的趨勢;在社會化情報服務范式下,以商業信息服務為理論指導,在互聯網、物聯網、智能化網絡支撐下,面向信息化社會的服務場景,發展了商業智能、社會化信息傳播等服務,最后向社會智能大腦、智能信息生態等方面發展。
通過上面簡單概要的分析,得出以下啟示,對規劃圖書情報機構的未來具有借鑒意義。
第一,圖書情報機構應該把數據和數據化建設作為工作的起點,樹立數據思維,構建數據流程,發展數據管理的理論與方法,以數據為支撐,開展文獻信息和情報服務工作。
第二,以數據和信息的數據化為原點,推動圖書館學情報學與數據科學的融合。這里要解釋一下信息數據化的概念,按照一般的認識,學術研究中將數據變成信息,然后形成知識。但在文獻情報工作中,我們搜集了大量信息,由于這些信息沒有進行數據化,難以進行計算處理,也難以形成情報、形成支撐服務的新知識。因此,在文獻情報工作中,信息的數據化應該是我們當前工作的難點,也是重點。
第三,當前文獻情報工作應該是以數據為起點,重構文獻情報工作的價值鏈。在情報學領域,我們經常遵從數據-信息-知識-情報-智慧模型(DIKIW模型)[3],構成一個完整的價值鏈。在信息管理領域,從信息這個中間體切入,使得文獻情報機構的工作在服務鏈條或者信息價值鏈的人為斷裂,在具體文獻情報服務工作中,我們推動從信息端延伸到數據端,推動從信息端往知識、智慧這個方向延伸。如果文獻情報工作內涵向智庫擴展,需要將情報工作延伸到智慧情報(當然情報本身也有智慧、智能的含義)[4]。因此文獻情報工作要以數據為起點重構服務價值鏈。
第四,全面推進文獻情報工作的數據化,包括文獻數字化、學術信息及實體信息數據化,社會信息、行為信息、管理信息、過程信息數據化。通過數據管理、數據融合、知識抽取、情報轉換、決策支撐的理念來建立文獻情報工作流程。
中國科學院文獻情報中心從1949年中國科學院圖書館成立起,不斷向科研信息服務、知識服務方向演化發展[5],現在進入了第三階段,即建設國家科技知識服務中心。國家科技知識服務中心建設,起源于數字圖書館,發展面向科研的學科化服務,演化為科技創新知識服務,工作對象從印本信息資源建設到數字文獻資源建設,發展到目前的科技信息大數據體系建設,形成支撐科技知識服務的數據基礎。
中國科學院文獻情報系統是由院級文獻情報中心和研究所所級的圖書館組成,是一個完整的工作體系。這個工作體系中有法人機構和非法人機構。其中,有3個法人機構,110多家研究所所級圖書館機構,還包括3家大學圖書館。采用全院協同的工作體系和工作模式,主要服務職能包括科技文獻保障、科技創新信息支撐、戰略情報服務、學科情報服務、產業科技情報支撐、學術信息交流、科學文化傳播等。
中國科學院文獻情報中心的服務對象包括中國科學院科研人員和全國科技工作者。在“十三五”期間擬定了3個“一線服務”,面向決策一線、科研一線和區域/產業發展一線。服務的是110多家研究所、3所大學,還有院黨組這樣一些科技決策部門。服務中重點強調三個方面,一是精準化服務,二是情報研究,三是精準化服務通過信息集成平臺作為支撐。
在“十三五”期間,中國科學院文獻情報中心重點進行文獻資源的保障集成能力建設。一方面,形成和建立了安全可控的科技文獻資源保障體系與服務能力。在資源保障體系中,從印本文獻館藏到數字化信息集成,再到開放學術信息的搜集,甚至延伸到新型的數據資源組織。在保障傳統印本文獻儲備量持續增長的同時,形成一流的數字化信息保障能力。在開放信息資源組織以及預印本、機構知識庫建設方面形成規模效應。如建立了OA全文庫,通過對OA論文的搜集、整理、評價,形成大規模的全文庫,搭建預印本平臺,通過預印本平臺搜集發表的學術論文。在中國科學院體系內建設了覆蓋中國科學院所有研究所的機構知識庫,搜集和存儲全院科研人員所產生的所有論文、學術報告等。同時,進一步延伸和發展到社交媒體數據、遙感影像數據等。結合安全保障、安全服務能力的提升,我們也在探索如何與商業數據庫出版商發展移動服務,來支撐這種科研和服務工作。在2020年疫情期間,在出版商的大力支持下,我們開通了移動服務,讓科研人員在移動狀態、在家里都可以完整獲得科技文獻。
另一方面,引領國家數字資源長期保存和論文開放獲取的建設。在國家科技圖書文獻中心(National Science and Technology Library,NSTL)的大力支持下,組織、推動國家數字資源長期保存體系的建設。這個長期保存體系由NSTL的成員館、高校圖書館(北京大學圖書館、清華大學圖書館等),以及軍事科學院圖書館等機構組成,甚至還包括中國圖書進出口公司,都作為數字化文獻信息的長期保存節點。目前正在籌建國家數字文獻長期保存中心。同時,繼續推動我國參與全球開放學術交流治理體系改革的建設,積極推動中國簽署開放獲取協議(OA協議),積極推動高能物理領域學術論文開放(SCOAP3),帶領中國圖書情報機構率先參加國際OA2020計劃,來實現學術論文、學術信息的共享。
“十三五”以來,中國科學院文獻情報中心致力于建立科技文獻情報的信息大數據平臺,并開展數據型文獻情報服務。第一,建成匯聚多源信息的科技文獻和情報的大數據體系,這種多源信息可以把期刊論文、學術報告、學位論文等各類信息進行數據化處理,形成實體和知識關系,支持知識圖譜、情報信息和情報知識的挖掘工作。第二,建立開發智慧型、計算型科技信息的服務平臺,提供科技文獻的移動獲取、精準推送、智能挖掘和關聯推薦等知識服務。同時,開發科技文獻知識人工智能引擎,形成智慧知識服務平臺。通過開發智慧科研平臺、科技大數據知識發現平臺等工作,形成數據采集、數據管理、自動監測、學者畫像、機構畫像和知識推送服務體系。第三,建設中文科技文獻數據庫(Chinese Science Citation Database,CSCD),積極開展學術信息評價服務。在大數據平臺建設方面,CSCD建設是中國科學院的一項長期工作,已經形成數據庫產品,在國際上銷售和提供服務。目前CSCD已服務于200多家國內外高校,同時與國際平臺合作,實現了CSCD平臺服務國際化。在學術評價服務方面,依托文獻信息開展學術論文、期刊質量的評價服務,包括OA論文的評價、論文撤稿的評價等。
第一,建立協同化的學科領域分工模式。在中國科學院體系內形成由院中心、成都中心、武漢中心、蘭州中心、上海中心構成的情報服務體系,包括學科情報工作和產業技術情報服務等。全院文獻情報體系按照領域、專業方向有一定分工,形成領域監測、領域態勢把握和情報分析等工作的方向。這是中國科學院自成立以來一直保留和堅持發展的科技情報服務體系。
第二,面向科技決策需要,組織戰略情報研究與服務。在學科領域與方向發展態勢監測的基礎之上,開展戰略情報掃描和形勢研判,面向深化科技體制改革的科技戰略問題開展研究,支撐情報決策。戰略情報的服務對象十分廣泛,通過專題報告、專業且深入的研究,支撐全院決策,以及支撐國家相關科技決策部門。
第三,對學科領域前沿與國際科技戰略態勢進行了系統的把握。系統整理國際科技領域的戰略趨勢前沿和創新政策發展態勢,為決策部門提供分析報告和分析服務。
第四,重點發展了面向研究所科技創新和成果轉移轉化提供知識服務。其中,最大一項工作是支撐科研人員的科技信息獲取,即科技創新的信息素質培訓和教育。在科技信息素質培訓和教育中形成了龐大的培訓體系,如在中國科學院大學開設了40多門專業領域方向的信息素質培訓課程,均為學分課程,可能是全球最大的信息素質教育培訓體系。同時,結合學院的體系建設,將中國科學院大學的課程推向研究所、推向科研一線,將信息素質培訓延伸到研究所課題組、實驗室。因此,這是一個很龐大的信息素質培訓體系。以深入科技創新場景的培訓為基礎,不斷拓展服務,為全院100多家研究所提供學科情報服務,重點支撐研究所層面的學科戰略規劃、重點實驗室評估以及成果轉移轉化和科技創新等服務工作。此外,還面向各個省科學院,面向區域發展行業提供服務。如依托于全國科學院聯盟,建立了覆蓋19家省科學院的信息與情報服務網絡,依托于中國科學院的12個分院來開展與區域科技創新的合作,向區域和產業發展提供知識化服務。
第五,發展信息計算型知識服務,進一步實現信息深度挖掘與服務精準化。基于多維度數據計算和深度挖掘,形成對人才、高端科學家的立體刻畫和認知,促進潛力科學家的發現以及科研團隊的組織等。基于多源數據的信息計算模型來挖掘關鍵技術清單,如已經出版和組織了3本關于顛覆性技術創新的研究專著,即《顛覆性技術創新——信息技術領域》《顛覆性技術創新——生命科學領域》《顛覆性技術創新——能源領域》。其中第3本專著,基于論文數據、專利數據、社交平臺數據等,形成能源技術領域的熱點方向;然后結合專家的研判,共同形成能源領域顛覆性技術清單。上述情報研究工作,對于指導學科領域發展和領域規劃起到很重要的作用。當然,我們也開展一些關鍵技術清單的研究工作,如采用機器學習和文本挖掘的方式挖掘“卡脖子”技術清單等。
“十三五”期間為探索科技期刊學術論文新出版模式,研究和發布國內首個《中國科學院學術期刊全文XML描述標簽集》標準,目前在10多種期刊當中應用,這個標準是針對期刊學術論文的內容發布標準,希望形成期刊領域的一個全文論文發布的標準。同時,開展中國科技論文發布平臺的建設,探索新型期刊的出版模式,探索了幾種開放出版,建立數據出版工作,對于提高學術交流產生了很好的影響。
基于對發展趨勢的認識和判斷,結合已有的發展基礎,中國科學院文獻情報中心在“十四五”期間確立階段目標:面向“戰略決策一線、科技創新一線、區域與產業一線”,以有效支撐科技創新高質量發展和科學戰略決策為核心,強化中國科學院文獻情報系統建設,建設國際一流的國家科技知識服務中心。在這種目標的體系下,來提升科技創新服務支撐、高端科技信息交流和決策戰略情報支撐能力建設。具體任務包括強化大數據中心建設,形成自主安全、系統集成和關聯融匯的智能化科技知識大數據平臺;針對中國科學院科技創新的需求來深化學科服務的機制建設,建立服務科技創新的學科情報工作體系,來提高對科技自立自強的知識服務保障效率;建設支撐科技決策的情報感知與服務平臺,形成數據、信息、情報、專家一體化的決策知識服務生態;集成數字學術信息評價、新型學術信息交流等能力,來建設中國科學院科研論文和科技信息高端交流平臺。
從規劃思路上講,第一個方面,希望按照“強化核心、創新體制”的發展思路,系統升級數據、技術平臺和情報等能力,強化對科技創新和戰略決策的知識服務支撐。在工作上分成情報、文獻、信息3個層面,按照數據化、平臺化和精準化服務進行展開。這里需要特別強調的是,在數據基礎上形成信息庫、情報數據庫,這是不斷深化信息的數據化加工,將信息粒度進一步細化的過程。在平臺方面更加強調智能化、智慧化,最后是形成精準知識服務。這種精準實際上是一個智能化的信息保障和面向科技創新過程的、嵌入式科技創新過程的知識服務,還有支撐戰略決策感知的一些情報服務工作。
規劃思路的第二個方面,要結合中國科學院文獻情報系統開展一些已有優勢,發揮學科情報服務的優勢和戰略情報服務的優勢,建立學科情報和戰略情報的協同工作機制。在這種協同工作機制之下,可以形成決策信息的簡報、專報或者信息數據化,建立一種集成研討、趨勢分析和態勢感知的服務體系,支撐各類服務的要求。一方面,可以通過信息服務來支撐科技決策的需要,融合戰略情報和學科情報研究,形成決策支撐的新服務機制。另一方面,在整個服務體系當中,整合戰略情報力量,整合戰略科學家、學科專家和數據管理者的能力,來提升情報服務的質量。
中國科學院文獻情報中心的國家科技知識服務體系是圍繞情報體系在數據、中臺、集成智慧服務層面進行展開。基本任務包括建設科技文獻與科技知識大數據中心,建設知識計算平臺與工具體系,形成智能知識服務和智能情報研究架構。
在智慧服務數據建設方面,要建設大數據中心,即全面收集、保存和處理科技信息來支撐科技創新的科技文獻大數據中心。除了需要對信息進行標注,不斷拓展信息的數據加工精度,還要形成學科專業領域的分布式學術信息加工平臺,形成整體的數據-信息-情報工作體系。對于信息和數據,要形成以學術知識圖譜的方式對學術大數據進行管理,研發知識圖譜等智能知識組織工具和平臺,實現數據組織的智能化和流程化。
在智慧中臺,加強數據計算和智能服務支撐能力建設。可以建設新一代知識智能技術工具系統與平臺,來提升服務能力,要充分利用以往的智能挖掘技術,甚至包括社會信息計算的能力,把充分計算信息能力引入文獻服務體系平臺建設當中。
要提供智慧情報服務,需建設智慧科情,即加強嵌入式的智能知識服務和智能情報研究。圍繞科學研究和科研管理與決策的服務需求,提升科技文獻、科技信息的服務水平。同時,把情報學科和學科情報服務嵌入全院科研管理項目和團隊的科研過程當中,來開展數字化、數據化的智能知識服務。通過這樣一種方式,建立嵌入學科主題的知識智能服務機制,提高知識服務的能力,把知識服務工具的應用延伸到數字化科研環境當中,來建設新型服務模式。
[1] HEY T,TANSLEY S,TOLLE K. The Fourth Paradigm:Data-Intensive Scientific Discovery[EB/OL].[2021-03-03]. https://www.doc88.com/p-777870574601.html?r=1.
[2] 劉細文. 情報學范式變革與數據驅動型情報工作發展趨勢[J]. 圖書情報工作,2021,65(1):4-11.
[3] AHSAN S,SHAH A. Data,Information,Knowledge,Wisdom:A Doubly Linked Chain?[C]//IKE. Proceedings of the 2006 International Conference on Information & Knowledge Engineering. Las Vegas:CSREA Press,2006:270-278.
[4] 曾建勛,魏來. 大數據時代的情報學變革[J]. 情報學報,2015,34(1):37-44.
[5] 劉如,吳晨生,劉彥君,等. 中國科技情報工作的傳承與發展[J]. 情報學報,2019,38(1):38-45.
On the 14thFive-Year Plan of National Science Library of Chinese Academy of Sciences: Frameworks Design Based on the Notion of Data-Information-Knowledge-Intelligence
LIU XiWen
( National Science Library of Chinese Academy of Sciences, Beijing 100190, China )
The article analyses systematically the challenges and trends of library and information science institutions in the new ages and objects, connotations, theories, technologies, and explains what are the impacts and references on the LIS services by the digital research model and changes of service need. In the design of future LIS service, we should replace the information with the data as the start point of LIS workflows. Then the article concludes roundly the development of National Science Library of Chinese Academy of Sciences in recent years, such as the support capacities of academic literature and information, capacities of platform management and data mesh-up, service capacities for researches and S&T development, academic communications and information assessment. In the period of 14thFive-Year Plan, National Science Library of Chinese Academy of Sciences would provide services in the “strategical decision line, S&T innovation line, region and industrial innovation line”, develop the strategy intelligence and technical intelligence services, and then establish the center of national S&T knowledge services.
National Science Library of Chinese Academy of Sciences; 14thFive-Year; Development Plan
劉細文,男,1965年生,博士,研究員,中國科學院文獻情報中心主任,研究方向:情報學。
(2021-05-10)
G251
10.3772/j.issn.1673-2286.2021.05.003
劉細文. 中國科學院文獻情報中心“十四五”發展思考——基于數據、信息、知識與情報的規劃框架設計[J]. 數字圖書館論壇,2021(5):12-16.