地震圖書館查收查引自動化系統建設介紹與展望＊

2023-11-22 08:40:26張晉輝馬秀丹

地震科學進展 2023年11期

張晉輝馬秀丹

1) 中國地震臺網中心，北京 100045

2) 中國地震局發展研究中心，北京 100036

0 引言

查收查引又叫收引查證、文獻查證、代查代檢等，是圖書館、情報機構或信息服務機構提供的一項日常服務項目。通過對用戶發表或指定的論文或著作在SCI（Science Citation Index）、EI（The Engineering Index）、CSCD（中國科學引文數據庫）和CNKI（中國知網）等國內外著名檢索工具中的收錄及引用情況進行檢索并出具檢索報告，為用戶項目申請、獎勵申報、職稱評聘等工作提供客觀、準確的依據[1]。

隨著大學和科研機構職稱評審、基金申請、學位申請、工作量核定、獎學金評定、科研獎勵等科學評價定量化，用戶根據人事、科研或教務等部門關于科研成果評定的相關規定，要準備論文收錄或引用的檢索證明材料時，查收查引服務通過文獻檢索出具論文收錄或引用的檢索證明材料，查收查引系統為圖書館和信息服務機構開展查收查引服務提供在線申請和受理的解決方案。

地震系統圖書館有沒有自己的查收查引服務？目前地震圖書館查收查引服務開展的情況如何？存在哪些問題？查收查引服務有沒有實現自動化？系統如何開發和建設的？有什么優勢？如何提供服務的？等等這些問題都是本文重點關注和闡述的。筆者作為中國地震局圖書館科技查新工作負責人親身經歷了地震系統查收查引服務的發展歷程及查收查引自動化系統的開發和建設過程，希望通過對該工作的介紹，幫助廣大用戶深入了解地震系統查收查引工作的開展情況和自動化系統的建設情況，并以此推動地震圖書館科技查新工作的開展。

1 地震圖書館查收查引服務開展情況及存在的問題

1.1 地震圖書館查收查引服務開展情況

中國地震局圖書館于1998 年建立，是由中國地震臺網中心（原地震信息中心）主辦，中國地震局系統各單位協辦的專業圖書館。查收查引服務是中國地震局圖書館最早開展的服務項目之一，自1999 年經中國地震局科技發展司批復建設地震系統唯一的科技查新室以來，幾代地震圖書館人不斷摸索、開展服務，至今已有20 余年的歷史。中國地震局科技查新站是中國地震局批準建立的地震系統唯一一個地震科技查新咨詢機構，依托豐富的地學館藏資源及電子文獻資源，為中國地震局系統內外用戶提供地學及相關專業的科技查新和查收查引服務，為地震監測預報、震害防御、應急救援等領域的地震科研人員及相關管理部門提供重要的信息支撐[2]。

中國地震局圖書館原有查收查引申請方式主要為到館申請、郵件申請，查收查引工作大部分環節都由手工完成，即科技查新員通過接收查新檢索申請單，根據用戶需求，手工查詢數據庫，獲取文獻的收錄和引用情況，復制到檢索報告中，再經過手工編輯、排版，最后產出檢索報告，這一過程大約需要5～7 個工作日。隨著查收查引工作的開展，原有查收查引服務存在問題日益突顯。

1.2 地震圖書館查收查引服務存在的問題

1.2.1 用戶查收查引知識缺乏

由于缺乏科技查新和查收查引相關必備知識，很多用戶普遍對查收查引的概念認識不夠，對服務內容和服務流程了解不夠，認為查收查引服務只是一項立等可取的服務。查收查引申請單出現各種各樣的低層次錯誤，例如有的訂單缺少待檢索論文清單，有的訂單沒有勾選待檢索的數據庫，有的訂單沒有正確勾選數據庫檢索時段，有的訂單甚至提供錯誤的檢索人姓名信息等，這些問題需要工作人員花費時間來修改和完善已提交訂單。

1.2.2 自動化程度低，查收查引效率低

查收查引流程一般包括服務受理、數據庫查詢、數據下載、開具并核對證明、收費并開具發票等，都需要館員人工處理，尤其在項目申請、成果鑒定、獎勵申報、職稱崗位評聘等工作重疊時，工作量非常大。查收查引繳費需要與財務部門反復溝通，需要用戶來圖書館繳費，或者銀行匯款，或者內部轉賬（本單位職工），存在耗時、支付困難、服務流程繁瑣等問題。查新員人工修改報告模板，計算收錄和引用記錄費用、開發票稅費等容易出錯。

1.2.3 處理流程不透明、工作量統計困難

圖書館原有查收查引服務與用戶之間沒有建立統一的服務平臺，缺乏協同辦公，導致查新員和用戶無法及時了解服務進度，無法快速查詢工作的歷史記錄；檢索申請文檔以紙質形式存檔，難以查詢歷史委托單的情況，年末人工統計工作量，只能根據保留下來的紙質申請單，人工計算工作量。

1.2.4 重復勞動非常大

由于缺乏經驗傳承機制，前期工作不能得到有效積累和重復利用，導致新申請訂單都要從零開始、重新檢索，從而造成了大量的重復勞動以及時間和人力的浪費。

若干年來，科技查新室一直飽受上述問題的長期困擾，隨著計算機技術和信息技術的發展，原有的工作模式已不適應信息時代用戶獲取信息和科技查新工作的需要。為適應時代發展，提高工作效率和工作質量，迫切要求建設自動化的查收查引系統。因此，地震圖書館于2018 年勇于創新、大膽嘗試、積極探索，結合地震行業實際情況，將人工智能、大數據等現代信息技術有機融合到傳統科技查新和查收查引工作中，自建自動化查收查引系統，努力提升查收查引服務的自動化、標準化程度和工作效率，提升圖書館的信息化水平和深度知識服務水平[3]。

2 地震圖書館查收查引系統建設

查收查引自動化系統自2018 年建設完成并投入使用，經過幾年的不斷迭代完善，實現了前臺申請和后臺受理，并通過系統、郵件和微信號提醒進度。由于相關的評價工作經常有處理高峰，需要將查收查引服務用系統管理起來，優化服務流程，并實現對收錄和引用的文獻進行自動處理，以及報告的自動形成。

2.1 系統架構

地震圖書館查收查引系統的總體架構如圖1。地震圖書館查收查引系統由數據預處理、收錄檢索、引用檢索和報告生成4 個功能模塊組成。為了提升系統的精準性、便捷性、實用性和高效性，系統專門設置數據預處理功能和算法，增加了檢索數據源、人機交互模塊及自引排除等功能模塊[4]。同時，開發適用于SCI、CDCD、EI 和CNKI 等國內外主流引文數據庫的接口程序，實現以文獻標題（收錄）或作者&刊物（引用）中關鍵詞自動提取收錄或引文數據。

圖1 地震圖書館查收查引系統架構Fig.1 The cited reference retrieve service system framework of earthquake library

2.2 系統軟硬件、系統配置和服務界面

查收查引自動化系統搭建的服務器為Windows Server 2012 及以上，4 核CPU，16 G 以上內存、200 G以上硬盤。系統基于Apache+PHP+MySQL 的服務器架構，使用邏輯、數據、界面顯示分離的MVC 方法組織代碼，采用模塊化的開發設計模式，保證了系統的二次開發和可擴展性。查收查引報告兼容Office 各版本的Word 軟件[5]。

系統界面（圖2）采用左右布局，左側為導航欄，分為科技查新、查收查引等服務，以及與這些服務相關的人力資源、系統功能、個人設置等模塊；右側為導航欄中各模塊對應的工作界面，默認頁面為各常用模塊的最新數據統計情況、代辦事宜，以及進入各模塊的快捷鏈接。在打開多個模塊的工作界面后，可以通過工作界面上方的選項卡對已經打開的模塊的不同子頁面進行切換。

圖2 地震圖書館查收查引系統后臺服務界面Fig.2 Background service interface of cited reference retrieve service system in earthquake library

2.3 系統主要功能

系統針對傳統查收查引服務存在的問題，實現如下10 項功能：

（1）實現在線申請和進度查詢：用戶前臺在線填寫《查收查引申請單》，通過系統查詢和郵件提醒功能得知查收查引的進度；

（2）實現對前臺用戶申請的后臺處理功能：工作人員在后臺受理查收查引，修改查收查引報告的相關信息，包括用戶的基本信息和每種類型索引的信息，工作人員可查看與自己相關的任務信息；

（3）具有統合檢索入口的功能：系統可快速切換至各個數據庫進行檢索；

（4）具有文獻處理功能：系統能夠對SCI、EI 等數據庫的純文本題錄數據進行自動處理，進行格式簡化、查重、排重、快速獲得入藏號、期刊統計等操作；

（5）具有格式簡化功能：系統對中科院期刊分區導出的Excel 進行簡化打??；

（6）具有相關文檔和單據的打印功能：工作人員在線打印查收查引的相關單據，自動導出Word 版的查收查引報告；

（7）具有費用計算功能：系統根據表單填寫的相關屬性自動計算查收查引費用；

（8）提供統計功能：系統可以導出歷史查收查引數據，也可實時統計工作人員的工作量，根據查收查引的目的、類型等維度進行統計；

（9）用戶可對工作人員的服務進行評價，填寫意見反饋表單，促進服務質量的不斷提升；

（10）記錄系統后臺與前臺的日志：采集用戶對前臺的訪問和使用日志，包括訪問頁面、檢索、登錄等，及時發現惡意訪問的IP 地址并禁用，采集系統管理員對系統的使用日志，包括系統登錄和相關模塊的增刪查改等。

3 系統建設總結

地震圖書館查收查引自動化系統解決了制約原有查收查引服務開展的若干瓶頸，改進了查收查引工作模式，提升了工作效率和報告質量。查收查引自動化系統投入運行后，圖書館查收查引量大幅提高，2018—2020 年查收查引量為263 份，較系統投入運行前年均數量增加155%。自動化系統具有以下顯著優勢：

（1）平臺建設的科學化和標準化提高了報告數據的可靠性和定制化，提升了用戶體驗。系統對查收查引報告中的清單、收錄、引用、指標等數據均進行了標準化細分管理，數據可以通過自動檢索數據庫的標準接口獲得，也可以通過導入國際通用的文獻題錄數據格式獲得，符合科技查新站的全國業務標準和數據庫商的國際通用標準。根據教育部科技查新工作指導，平臺對查收查引報告的產生制定出網頁和Word 版本的統一模板，從頂層設計適應各科技查新的業務標準和需求，同時也根據地震圖書館的個性化需求進行了定制開發，比如報告水印、模板風格和新增個別字段的顯示需求等。

（2）收錄引用的檢索范圍、檢索效率和數據完整性提高了報告生成的時效性和準確性，提高了工作效率。系統既對接Web of Science 引用的標準接口檢索（檢索SCI 引用數據在10 s 以內），又提供非標準引用檢索（通過標題或作者、期刊、年份模擬瀏覽器操作進行引用檢索），可通過標準接口快速高效獲得引用數據，也可通過非標準接口查全引用數據。平臺實現對查收查引所需的Web of Science、Scopus、EI、CSCD、CSSCI、CNKI 等若干主流數據庫都能進行自動檢索，國內其他供應商只做到了部分數據庫[6]。此外，系統還能根據文獻所發表期刊和年份高效關聯JCR 影響因子、JCR 期刊分區、中科院期刊分區、CNKI 影響因子數據，在一定程度上反映文獻品質，突出數據完整性和定期更新速度。

（3）論文清單、收錄數據、引用數據的智能匹配提高了查收查引工作的自動化程度，避免了重復勞動。系統對論文清單、收錄數據和引用數據的獲得進行邏輯設計與智能算法匹配。支持用戶在線提交查收查引的論文清單，通過人工智能算法自動解析用戶提交的論文清單的若干種格式，同時也支持用戶直接提交數據庫的標準格式或Excel 模板，讓用戶將論文清單的查詢需求格式化地反饋給查新人員；在獲取收錄數據時，系統可以根據用戶的作者姓名和地址自動查詢出可能屬于作者的潛在收錄數據，再通過論文清單中的標題通過人工智能算法匹配出用戶所需的論文；在獲取引用數據時，系統通過自引判斷標準（施引文獻作者包含被引論文全部作者、委托人自己、第一作者、通訊作者或作者團隊），可以根據作者簡稱和全稱的匹配機制自動區分論文的被引頻次、他引頻次、自引頻次。在收錄和引用數據都獲得之后，系統可以將收錄和被引文獻與作者的論文清單進行匹配，準確地給出作者提供的論文清單中被收錄和引用的論文，以及未被收錄或引用的論文。

4 下一步工作展望

地震圖書館經過前期建設和近幾年的不斷完善，雖然已經初具雛形，并以此為基礎為地震系統內外用戶提供了多年的信息檢索服務，累計出具查收查引報告460 余份，但仍然存在著若干需要進一步改進的地方，例如查收查引申請單填寫有些繁瑣，有些數據如期刊引證報告、北大核心刊源等更新時間較慢等，需要在日后實踐過程中加以改進。為建設功能完備的地震行業自己的科技查新和查收查收系統，我們還需要在以下幾個方向努力：

（1）加強與用戶之間的互動。用戶是信息系統的服務需求方和最終使用方。建設一個易用性強、體驗友好的信息系統，必須要加強與用戶的溝通和聯系，通過設計調查問卷、抽樣訪談、用戶培訓等方式充分掌握用戶的使用體驗和改進建議，加強系統的迭代升級和優化完善，將是一項持之以恒、久久為功的工作。

（2）加強與其他信息系統尤其是單位業務管理系統之間的融合。數據管理和信息服務效能的提升依賴充分的數據共享和數據融合。除了圖書館和情報機構，單位人事、科研等管理部門對單位員工科技成果產出都具有比較強的信息獲取和跟蹤需求。圖書館查收查引系統需要與單位自身人事、科研等信息管理系統進行無縫銜接，實現數據共享，最大限度提升單位內部信息化程度和業務管理水平。

（3）對接圖書館微信公眾號和小程序。充分利用大數據和融媒體技術手段，開發服務接口，與微信等社交軟件整合[7]，可以通過微信公眾號和企業號來對系統中的服務進行申請、受理和查詢，在微信平臺上提供移動端便捷式查新服務。