馬鑫 盧垚 劉洪冰 王新 劉敏娟 王鸑飛
(中國農業科學院農業信息研究所,北京 100081)
隨著科學技術的快速發展,科研成果發布數量倍增,使科技出版行業的發展和變革備受矚目。在數字出版轉型不斷推進的背景下,科學技術和醫學(Science,Technology and Medicine,STM)出版已完成了由傳統紙媒向數字化文獻資源的轉型[1],知識服務已成為STM出版領域新階段的發展共識[2]。國際知名出版商,如愛思唯爾(Elsevier)、施普林格·自然(Springer Nature)等已經實現了從傳統出版商向信息服務提供商的角色轉變。新的出版理念、出版技術和新型出版資源正在顛覆原有的科技出版產業。目前,數字資源已成為出版和利用的主流形式。當前,科技的迅猛發展、復雜的外部環境、日益旺盛的文獻需求、文獻出版業態的巨大變化,以及新冠病毒疫情防控常態化的形勢,都給科技文獻信息保障帶來了新的挑戰。《中共中央關于制定國民經濟和社會發展第十四個五年規劃和二〇三五年遠景目標的建議》指出,科技知識資源已經成為支撐科技自主創新的重要戰略基礎設施和新發展要素[3-4]。國家科技圖書文獻中心(National Science and Technology Library,NSTL)自2000年6月成立至今,已建設成為較為完備的以印本為基礎的數字資源保障體系,成為國內權威的科技文獻資源收藏保存中心和科技文獻信息服務樞紐,為我國經濟社會發展和科技創新發揮了不可替代的支撐作用。因此,了解目前國際STM的科技出版變化,掌握用戶多元化的文獻需求,順應新形勢下科技出版業的發展趨勢,制定相應的文獻資源建設策略,才能確保NSTL在“十四五”期間為國家科技創新提供有力的文獻信息支撐和保障。
近年來,STM協會及相關市場情報權威機構會定期發布報告,針對全球科學和技術出版行業的新趨勢、出版形式和學科市場等進行全面概述,以此探討學術出版面臨的趨勢、問題和挑戰。根據辛巴信息公司(Simba Information)發布的《全球科技出版報告》[5-6]可以了解2016—2020年科技出版市場總體狀況(見圖1):期刊作為市場最大的科技出版類型一直保持穩定增長,到目前為止占科技出版市場銷售額的50.9%;在線內容(包括電子資源數據庫、標準、數據管理平臺、研究分析工具等)2020年較2019年增長5.6%,漲幅最大,首次取代圖書成為位居第二大市場的出版類型;圖書市場明顯萎縮,2020年比2019年降低8.9%,位列第三;摘要和索引(Abstracting and Indexing,A&I)服務的用戶需求穩定,因此市場較為穩定,略有小幅增長,仍位居第四。

圖1 2016—2020年科技出版市場總體狀況
1.2.1 期刊
據辛巴信息公司STM Online Services 2019—2023報告[7]顯示,截至2019年,超過80%的期刊都實現了數字化出版,絕大多數以電子化方式使用[8],而其最新報告[6]顯示,2021年該數據已攀升至90%。通過對2021年國際知名出版社期刊出版情況的調研(見表1),純紙本期刊已幾乎不存在;純電子期刊(E-only)數量約占出版總量的25%;而紙本+電子的出版模式是目前出版的主流模式,約為出版總量的73%。值得注意的是,各出版商都開始關注OA期刊的出版。國際四大知名出版社(Elsevier、Springer、Wiley、Taylor &Francis)OA期刊數量均已過百種。

表1 2021年國際知名出版機構期刊出版情況列表 種
從學科方面來看,近五年新創辦期刊數量排名居前三位的均為在學科分類上較為廣泛的交叉學科領域,分別是工程技術(664種),生命科學與農業(310種),地理、空間與環境科學(223種);其次是化學(129種)、數學(65種)、物理(72種)三門基礎學科。這說明學術期刊的學科交叉性不斷深化,同時基礎學科依然是重要的研究領域。
1.2.2 在線內容
目前出版市場增長最快的類型是在線內容,2018年漲幅達到了6.1%[5],2020年增長5.6%[6]。在線內容主要指電子資源數據庫軟件工具等,但隨著技術與內容結合越來越緊密,衍生出更多類型。從部分知名出版社的新型在線出版類型(見表2)可以看出,在線內容還包括數據管理平臺、研究分析工具等,其特點是產品類型多樣,兼具信息服務的深度與廣度。

表2 部分知名出版社的新型在線出版類型
近年來,隨著OA業務模式對傳統科技期刊訂閱模式的沖擊,國際知名出版商紛紛重新布局,調整戰略,圍繞各種在線內容和服務展開了并購及產品研發,表明企業已明顯從紙媒轉向軟件工具、平臺和數據庫。以Elsevier為代表的國際知名出版機構通過近幾年戰略性的收購和研發,利用先進的技術結合已擁有的大量底層數據,建成了整個學術研究生命周期和聲譽管理的端到端數字化服務平臺。將這些服務于科研價值鏈各個環節的平臺和工具整合在一起,已完成從傳統的科技期刊出版商轉型成為服務于科學研究價值鏈上每個環節的平臺和信息分析服務提供商,為科學研究提供更加精細化和個性化的服務[9]。
1.2.3 圖書
隨著科技期刊電子化閱讀現象的普及,學術圖書也向電子化方式遷移,紙質圖書的出版和使用都在穩步下降,并且經過幾年的快速增長,電子書的增長已經放緩[10]。據美國出版商協會(AAP)統計,2018—2021年美國圖書市場數據顯示印本科技圖書總量在2020年下降了9.4%[6]。受到全球新冠病毒疫情的影響,許多線下學習轉向線上,增加了用戶對電子圖書的需求。雖然學術圖書館仍然是學術內容(包括科學和技術內容)的核心購買者,且預算趨于穩定,但數字化趨勢繼續推動購買決策。盡管在OA運動背景下出現了重視社會效益的圖書開放出版模式,但受出版經費、銷售周期等限制,其發展規模仍受到制約[11]。更多的預算流向了數據庫、電子期刊等在線內容,而不是圖書。但總體來說,電子書支出的增加不足以抵消紙質書支出的減少,是科技圖書出版領域整體下降的因素之一。
1.2.4 摘要和索引服務
A&I服務作為二次文獻的內容來源,使科研人員能夠通過使用一個數據庫或平臺更有效地進行文獻檢索和獲取,有助于科學研究。在數字化環境中,研究產出高速增長帶來的信息超載加重了科技查新與檢索負擔,增加了科研人員查詢文獻的時間。在這一背景下,A&I服務能夠提供經過深度組織加工的二次文獻,提高科研效率,因此對研究人員至關重要,而A&I產品服務的需求預計也將繼續增長。目前,人工智能、深度學習等與科技文獻情報服務的結合不斷深入,如中國科學院文獻情報中心在基于科技文獻知識的人工智能引擎方面已有一系列實踐成果,包括摘要語義識別、關鍵詞識別等,為摘要與索引服務進行了智慧賦能。
越來越多的科研人員希望內容的檢索能夠實現不同數據庫的無縫銜接,而不希望出版商對不同來源的信息設置障礙。例如,IET的Inspec數據庫的所有文獻都含有目錄和摘要,數據以每周大約1.6萬條的速度增加,用戶可以通過科睿唯安(Clarivate)的Web of Science和RELX的Engineering Village訪問該數據庫,以無縫銜接的方式獲取摘要索引服務。
1.2.5 OA出版
DeltaThink的OA市場規模報告[12]表明:開放獲取市場的增長速度繼續超過期刊出版基礎市場;預計2020—2023年OA論文產量的復合年增長率為14%,OA市值的復合年增長率為17.6%。
根據Dimensions的統計數據[13],2011—2020年OA出版增長速率遠大于訂閱期刊,每年約以13%的速率增長,2020年全球發表的OA論文數量首次超過訂閱出版論文數量(OA出版包括金色OA、青銅OA、綠色OA和混合OA),未來已來,OA出版已經成為主流出版模式[14](見圖2)。

圖2 2011—2020年全球出版論文數量與訂閱出版論文數量統計
隨著技術的發展和科研人員更精細化和個性化的信息需求,以數據為基礎構建集成解決方案和決策工具將成為STM出版的重要領域,而數據不僅包括科學家自己擁有和授權的數據,還包括越來越多的由資助者授權開放的數據。開放數據將把出版商提供的價值重新轉向發現和集成,傳統服務也在添加新功能,努力將科研人員更緊密地捆綁在一個平臺上。如Elsevier、Springer Nature、Clarivate等通過增加補充性服務來吸引用戶,像Mendeley和ReadCube這樣的參考管理工具正在成為交互的中心。
隨著科技出版技術的不斷發展,科研評價理念的改變,如果大學以開放獲取引用的數量來判斷他們的科學家和科研人員,而不是以影響因子來衡量在高影響力期刊上發表的論文,那么目前的STM期刊出版商業模式可能會改變,并讓位于完全開放獲取系統。到那時,STM出版的真正商機將是基于人工智能的搜索、數據和動態技術,使在線內容的需求和發展將更加旺盛。
近年來,STM出版界正在發生變化,出版的數字化趨勢愈發顯著[15]。STM出版商協會2018年發布的報告顯示,幾乎所有STM期刊都有數字化版本,絕大多數期刊都以電子方式使用,紙本+電子(P+E)形式是目前STM期刊出版的主流形態,純紙本(P-only)期刊數量正在逐步減少,純電子(E-only)期刊數量正在逐漸增加。
多年來,紙質圖書的銷量在不斷下滑,而電子圖書的銷量在持續增長。但由于電子書的基數較小,難以彌補由紙質書銷量下降帶來的缺口,因此紙質書和電子書的總銷量呈現持續下降趨勢。受期刊數字化的影響,電子圖書的商業模式也朝著電子期刊的方向發展。目前,電子書可按章節甚至段落訪問,商業模式不再局限于一次性收購,而是擴展到年度訪問、短期借閱、按次付費訪問、按章節付費訪問和用戶需求驅動(Patron-Driven Acquisition)的單本采選[16],在如手機或平板電腦上這樣的移動終端單獨銷售。此外,為了應對讀者不斷變化的需求,出版商也在不斷創新,推出定制出版、按需印刷等商業模式。例如:OUP在北美推出的根據課程要求定制出版物服務;CUP推出結合期刊與圖書各自優勢,經嚴格同行評審,并由資深編輯以專題形式編排出版的簡潔而權威的原生數字資源,將數字出版的及時性、靈活性和通用性與最高的學術標準結合起來,為科研人員提供動態參考資源[17]。
2.2.1 打造涵蓋學術研究生命周期的數字化服務平臺
隨著2021年5月Clarivate收購ProQuest公司,包括Elsevier、Springer Nature姊妹公司Digital Science和Clarivate三大出版巨頭都已形成自己的涵蓋整個學術研究生命周期的數字化的服務平臺。即從學術研究的構思、寫作開始到最后研究成果的出版,形成服務閉環,再結合學科評估、成果評價形成強大的智能化服務能力[18]。這些平臺上的產品可獨立存在,也可整合到平臺中成為平臺的一部分,為用戶提供精細化的分析服務[19]。
2.2.2 研發有助于深化用戶關系的文獻管理與替代計量工具
與用戶建立更深層次的關系對于出版商來說至關重要。文獻管理軟件和分析工具可以助其更好地了解用戶,并推廣相關衍生服務和產品,從而帶來巨大的價值和利益。替代指標或替代工具能夠實現對更廣泛的研究生態系統進行計量分析,不僅限于已發表的研究,還將社會媒體、博客和其他形式的研究交流納入其中。例如:Elsevier的Mendeley等文獻管理軟件正在成為出版商與用戶互動的重要工具;Plum Analytics和Altmetrics則提供了一種影響因素替代方案[20-21],幫助用戶即時收集來自社交網絡上多樣化學術成果的關注度,從而更全面、客觀地評價研究成果的影響力,發現高價值的研究成果。這些工具構成連接用戶與出版商的紐帶和橋梁,因而至關重要。
2.2.3 搭建支持數據分析和挖掘的科研數據管理平臺
對易用性和無縫集成的追求一直是在線服務變革的許多驅動因素的核心。目前,各家出版機構紛紛主動參與到科研數據的管理上,都在自主研發搭建科研數據管理平臺,接受和支持多種文件類型,并對這些多源異構數據資源進行整理,使科研人員能夠輕松共享、訪問和管理數據集,以便更好地管理和傳播科研數據,提升科研數據的可發現性和再利用性。IEEE DataPort最高可免費上傳2TB數據;Springer Nature的Figshare為上傳條目分配DOI便于查找和引用;Elsevier的Mendeley Data是基于云端的模塊化平臺,可以將5個模塊整合以發揮獨立功能,也可以和其他科研數據管理解決方案搭配使用,搜索功能可對35個以上知識庫的1 000余萬個數據集進行索引。Springer Nature的基于大數據理念的新型科研信息數據平臺Dimensions,是通過機器學習和文本挖掘等技術對數據進行增強處理,從而統一數據標準,建立跨數據源的關聯關系,為科研人員、機構、出版商以及科研經費資助機構提供信息數據服務和決策支撐工具。
2.2.4 實現信息技術與出版的緊密結合
近年來,STM出版商已從傳統的內容出版轉向提供在線的內容服務、研究工具和解決方案,這就要求出版商更加依賴信息技術,在提升與用戶交互能力的前提下,為其提供動態化、智能化、易用性強和無縫集成的更優服務。傳統出版商已經通過并購、合作等形式迅速提升了人工智能、機器學習、圖像識別、語義標記、搜索引擎優化等方面的技術實力,這些技術被應用在諸多出版流程中,包括投稿、尋找同行評議專家、編輯和出版流程、信息的提取以及推薦閱讀文章等。信息技術的應用在幫助用戶獲得更好的體驗、提高工作效率的同時,讓出版商從科研論文中提取到更多數據、洞察到更多信息,進而助力科研人員加快其研究進展。例如:Elsevier通過收購Parity Computing Inc.獲取其機器學習、自然語言處理和語義技術方面的經驗,為Scopus的分析和決策支持功能奠定基礎[22];Clarivate與UNSILO建立合作伙伴關系,在論文提交和評審系統ScholarOne上試點人工智能技術,以改善同行評審流程并提高審稿效率[23-24]。
目前,全球發表的OA(金色OA、青銅OA、綠色OA和混合OA)論文數量已超過訂閱出版論文數量,OA出版已經成為主流出版模式,增長幅度遠遠高于傳統訂閱出版。2020年以來,新冠病毒疫情的暴發對科研成果的開放性和及時獲取性提出了更高要求,使預印本迅速成為主流研究發布平臺[25]。隨著OA出版模式的日趨成熟,許多預印本平臺開始與一些商業機構合作。PLOS與冷泉港實驗室達成協議,在作者提交投稿之后,經作者同意文章將自動在生物學預印本平臺BioRN和化學預印本平臺ChemRN上發布,以加速成果傳播[26]。隨著預印本資源的激增,平臺開始注重對預印本進行遴選和主題分類,以幫助用戶精準獲得高質量預印本資源;還出現了期刊與預印本平臺合作,將同行評議的工作加入對預印本的評價中[27],并將研究成果預版本的發布正式納入期刊出版全流程[28];隨著科研人員對開放資源的權益認識及接受度逐漸提升,出版商也在不斷探索共享內容的合作方式。2018年,Springer、劍橋大學和德國Thieme出版社與科研社區ResearchGate達成合作協議,在保護作者和出版商權利的前提下,消除科研人員訪問、獲取、共享高質量學術成果的屏障,以提高學術研究工作的可見性和可發現性,共同致力于促進學術協作網絡(Scholarly Collaboration Networks,SCNs)學術研究成果的共享[29-30]。OA資源已成為重要建設內容,制定OA遴選標準,建立OA資源平臺和專題資源庫,提供開放資源集成發現和一站式服務,從OA論文擴展到OA數據,對于預印本資源本身的內容質量和為用戶提供個性化、精細化的服務提升,以及基于開放資源的數據挖掘和再利用等,使科研生態和學術傳播途徑更加多樣[31-32]。
當前,STM出版與數字技術的融合日益緊密,呈現出版類型多樣化、服務供給創新化等趨勢。面向科技創新和科技體制改革的科技文獻保障需求,與西方國家對我國科技信息封鎖日益加劇的現狀之間存在巨大矛盾,作為國家級的科技信息保障和服務機構,NSTL應把握“十四五”期間的科技信息服務發展機遇,不斷完善科技信息資源保障和服務體系,采取以印本文獻資源為保障、OA等新型資源為主體的文獻資源建設戰略。
隨著STM出版趨勢向數字化方向推進,在館藏文獻數字化的大趨勢下,學術圖書館的經費預算將更多從傳統印本文獻資源向電子期刊、電子圖書和在線服務等數字資源傾斜。在圖書館經費增長幅度遠遠落后于資源價格上漲的今天,各圖書館都面臨印本學術期刊的取舍問題。隨著數字環境日趨完善,各館也逐漸將“重用輕藏”的理念落到實處。近年來,國外已有圖書館開始將印本期刊館藏全部數字化,供更多用戶利用;在國內,多數高校圖書館不斷縮減印本期刊的費用,同時增加電子期刊的采購經費。在館藏文獻數字化的大趨勢下,數字期刊的比重將會越來越大[33]。
由于提供數字資源的數據庫商與出版社之間版權協議存在不穩定性,所以數字資源保存和使用也存在一定的不確定性。因此數字資源某種程度的脆弱性,決定了紙質資源和電子資源的長期建設,這是圖書館的社會責任。作為國家級的科技文獻信息資源保障機構,NSTL肩負著國家資源戰略保障任務,持續鞏固印本文獻的戰略儲備和基礎保障作用是國家科技信息資源建設的基礎性和戰略性任務,也是數字信息環境下國家科技文獻保障系統完整性和戰略安全的最可靠屏障。
在STM出版領域,數字時代已經全面到來,數字資源已成為學術交流中最重要的資源。STM并購活動表明,出版商已明顯從紙媒轉向軟件工具、平臺和數據庫。NSTL“十四五”發展規劃指出:媒體融合時代,在語義出版、數據出版等背景下,文獻資源范疇正在發生變化,它包括越來越多的新媒體、科學數據、可視化圖譜等新型資源,因此需要強化對富媒體學術、事實型數據、術語型組織、軟件型工具等資源建設保障,形成立體化資源保障體系[34-35]。當前,以用戶需求為導向的文獻資源建設工作,在面向復雜多變的科學研究過程與科技創新環節,用戶對信息獲取的便捷性、時效性、完整性、準確性提出了更高、更精細化、更細粒度的知識服務需求,在支持用戶提問的基礎上,幫助用戶研判問題、分析數據、挖掘關系、揭示關聯、輔助決策[4]。在全面推進面向學術研究的基礎上,需要開拓面向產業創新的資源建設,加強市場報告、產業分析、統計手冊等資源采集,形成學術信息資源與產業信息資源相融合,適應知識增長和創新需求變化的一體化創新資源體系。此外,在開發利用上,可以在數字平臺中融入科技文獻內容語義描述模型,推動細粒度的知識發現、共享與利用,滿足立體化數字資源保障體系的建設要求[36]。
近年來,國際知名出版商的并購活動圍繞各種新型資源展開,這些工具和平臺將作者和客戶與出版商的內容緊密地聯系在一起,更好地了解用戶,并溫和地引導他們轉向其他服務,增加用戶黏性。新技術、新商業模式將不斷涌現,推動產品創新,更多的工具被開發出來,讓機構和科研人員能夠存儲數據并分享研究成果。這些工具不僅用來分析研究本身的成果和影響力,也用來分析評價科研人員和相關機構。以科研管理平臺、數據分析為代表的新型資源是出版機構的發力點,通過精準分析,用于提供高質量科研成果,吸引更多用戶使用相關產品和服務,增加出版機構與用戶黏性,進而再通過獲得大量數據提供更精準的分析服務。因此,加強新型資源的采集,如專利分析、軟件工具、科研數據、情報分析、代碼等,有利于滿足科研人員更精細、更深入的科研需求。
目前,OA出版已經成為主流出版模式,增長幅度遠遠大于傳統訂閱出版。我國已經長期積極參與推動開放獲取實踐,不斷優化和完善科技文獻資源發現系統,加快推進開放獲取符合我國建設創新型國家的需求和實施創新驅動發展戰略的核心利益。由于科技文獻的獲取和共享對提升知識傳播利用效益和開放國家創新能力具有重大意義,NSTL主動發揮科技文獻資源國家平臺作用,聯合多家成員單位先后開展了多類型的開放獲取工作。NSTL通過對開放資源的遴選、采集、加工、組織與揭示,將不同平臺、不同文獻類型的資源集成整合,構建了OA集成整合系統;建設了以提供預印本文獻資源服務為主要目的的實時學術交流系統——中國預印本服務系統;中國科學院文獻情報中心、中國農業科學院、中國醫學科學院都建立了具有專業領域特色的機構知識庫[37]。圖書館在開放存取中扮演著信息搜集、使用、管理和建設角色,同時承擔著維護和存儲責任。系統完整地搜集網絡OA學術資源不僅包括主流學科、新興學科、培育學科等的外文期刊、圖書資源,還應該包括由政府機構網站得到的開放數據、預印本資源以及地方志、字詞典、實用工具軟件等。從資源遴選、組織加工到資源服務,不斷完善OA資源采集內容和平臺建設,為用戶提供OA資源服務,真正發揮圖書館作為社會信息資源共享中心的作用[38]。未來,NSTL應在鞏固已有OA資源及平臺建設成果的基礎上,積極順應數字出版環境與STM出版趨勢,以用戶需求為落腳點,在資源整合、服務創新等方面加大建設力度,如實現不同數據庫資源的互操作,以及通過摘要索引服務促進資源利用。
本文對STM出版態勢與現狀進行調研,結果表明:期刊、圖書、在線內容和摘要和索引服務是STM出版的主要類型;傳統資源呈現紙電結合的發展態勢,新型資源則更強調內容與信息技術的融合,且開放獲取逐漸成為主流出版模式。在當前背景下,互聯網、數字化技術的出現給傳統圖書館帶來了革命性的發展契機,館藏信息資源結構正在發生變化,文獻信息資源建設的重點已經從以往主要以紙質文獻為主逐漸轉向紙質資源與數字資源同步建設的發展軌道,呈現出由傳統文獻資源向數字知識服務轉移的新態勢。因此,作為國家級科技文獻保障平臺的NSTL應從文獻資源立體化、新型化和開放獲取等方面著手,努力發揮其在網絡化時代科技文獻資源戰略保障中的作用,把握當前國際科技文獻信息出版動態,探索符合NSTL面向“十四五”發展規劃對文獻資源建設的發展之路,提高科技信息資源的建設和服務能力。