機構知識庫(Institutional Repository,IR)又稱機構庫、機構倉儲、機構典藏庫,指以學術機構為主體建立、搜集及存儲該機構內成員創造的包括學術論文、會議報告、多媒體資源等各類知識資源,并提供公開檢索及利用的數字知識庫[1]。在2002年首次提出機構知識庫概念的學術出版與學術資源聯盟(Scholarly Publishing and Academic Resources Coalition,SPARC)高級顧問Raym Crow認為,機構知識庫是學術機構為捕獲并保存本機構的智力成果而建立的數字資源倉庫[2];Clifford A.Lynch則認為,一個學術機構的機構知識庫是機構為科研教學人員所提供的一系列服務,服務的目的是管理和發布由本機構及其成員所創造的數字資源[3]。不管從資源角度還是從服務角度來說,機構知識庫都是一個機構重要的知識管理工具。當前機構知識庫大多局限于成果保存和展示等方面,與科研管理系統的銜接和協作方面幾乎是空白的。結合醫院科研管理的電子化、系統化需求,機構知識庫可積極融入科研管理的各個階段,通過拓展數據庫功能,為研究人員提供科研輔助,為科研管理人員提供數據支撐,為醫院管理者提供決策參考,使其成為醫院科研管理的重要工具[4]。
廣東省中醫院(下文簡稱“我院”)作為全國最大的中醫院之一,有著中醫系統內數量最多的重點???學科,以及一大批名中醫、專家、學者,每年有大量論文、基金、專著、專利等,但是醫院這些寶貴的知識財富尚未得到很好的傳播、推廣和應用;同時我院每年也在積極申報各級別重點專科、重點實驗室、診療中心等,為廣州中醫藥大學“雙一流”建設添磚加瓦。因此,需要對自己和競爭對手的科研實力有所掌握和比較。此外,我院科研管理任務繁重,包括職稱的申報審批,項目的審批和檢查、驗收,論文、專著、專利、獎項的收集和獎勵,每年還要根據自定的評估指標體系對各個科室、團隊進行科研績效評估,這些工作需要耗費大量人力和物力。為了方便獲取、保存、管理、利用本機構的智力成果,為本機構科研人員的績效評估及學術交流提供重要參考來源,以科研管理為導向構建廣東省中醫院機構知識庫極為必要。
1.2.1 保存和管理數據的數字倉儲
機構知識庫可以長期保存院內文章、專著、專利、標準等各項成果,保存名醫經驗、手術視頻、實驗報告和學者上傳的個人數據,如筆記、課件、實驗數據、科研進展報告、病例報告等。數據庫支持多媒體數據格式,成果可以是文檔、超鏈接、圖片、視頻等形式。
1.2.2 科研管理和績效評估的工具
機構知識庫包含了項目管理、人員管理、成果管理、獎勵管理等科研管理的功能,可提升科研管理與評價的效率。如院內學者申報職稱、申請項目時及各種需要獎勵成果的列表可以直接從機構知識庫獲取其成果列表,省去多次提交和審核的繁瑣。另外我院每年都要對各科室、團隊進行科研績效評估,不同類型和級別的成果按我院自行制定的評分體系有不同的分值和權重。利用機構知識庫節省了提交、審核成果的麻煩,讓績效評估工作變得簡單快捷,還能減少遺漏、錯誤和糾紛。實踐證明,通過機構知識庫進行科研服務可節省工作量,而且能降低錯誤率[5]。
1.2.3 展示、交流和學習的平臺
機構知識庫打破了“信息孤島”,能讓大家了解院內各學科研究的發展水平、趨勢、重點、熱點、合作作者和機構,為自己的學習、研究、合作對象的選取提供一定的參考,大大促進了院內人員的學術交流及人才隊伍的建設和學術水平的提高。
1.2.4 學科建設和“雙一流”建設的依據
為振興中醫藥發展、推動中醫藥現代化和信息化,我國加強了對中醫藥院校及其附屬醫院的建設和投入,建立了臨床研究基地,將中醫藥學科納入國家“雙一流”建設,設立重點學科和重點??芠6]。機構知識庫在保證學科團隊和學者的科研成果得到有效管理和利用的同時,也能準確地定性、定量評估本機構的學術水平,以及與其他競爭對手進行比較,為學科建設、管理決策提供參考。
我院機構知識庫的建設遵循以科研管理為導向,層級結構清晰、功能完備、可擴展等原則[7]。在充分進行管理和技術需求評估的前提下,以開發系統接口方式,將機構知識庫與科研管理信息系統進行整合,將原有機構知識庫及科研管理系統下的不同功能模塊定義為服務;通過網絡對松散耦合的粗粒度功能服務模塊進行整合、使用;通過將科研管理系統嵌入機構知識庫,實現圍繞項目工作流、信息內容驅動的機構知識庫管理、科室分析、學科建設、知識圖譜、機構學者、個人知識中心等管理功能。
系統架構主要包括數據采集層、數據處理層、數據倉儲層、功能應用層、界面展示層(圖1)。

圖1 醫院機構知識庫系統架構
2.1.1 數據采集層
數據標準以《GB/T 25100-2010 信息與文獻、都柏林核心元數據元素集》等為基礎,參考科技部、國家圖書館等機構發布的相關元數據規范;數據采集方式主要包括數據庫公司抓取、管理員錄入和作者主動繳存。
2.1.2 數據處理層
依托數據庫公司的資源,對文獻進行回溯與更新,以“自動+人工輔助”的方式對文獻進行規范化的數據加工和處理。對元數據的收集、清洗、整合與增補包括文獻回溯與更新、數據篩選與剔重、不同數據庫來源的元數據的匹配、字段的增補與二次開發(對文獻評價的輔助信息進行增補以及對文獻內容進行人工標引),輔助信息及人工標引包含全文鏈接、中科院大小分區、JCR分區、影響因子及區間分段、成果評分賦值字段等。系統支持管理員自定義元數據的描述,即字段的標引。
2.1.3 數據存儲層
數據倉儲主要保存文獻數據(主要提供檢索、統計等服務)、用戶數據(主要保存用戶和驗證權限等)和日志數據(主要保存系統運行日志、用戶糾錯記錄等)3種數據。
2.1.4 功能應用層
功能應用層主要用于界面展示層和數據倉儲層的數據組織和使用,主要包括機構成果模塊、科室分析模塊、學科建設模塊、知識圖譜模塊、機構學者模塊、個人中心模塊6個功能模塊。
2.1.4.1 機構成果模塊
機構成果模塊展示機構內所有員工的各種成果,包括論文、專著、專利、成果、精品課程、新藥、標準(下分標準、指南、診療方案)、科研項目、科研獎項等。建立以題名、作者、關鍵詞、期刊為檢索字段的快速檢索框,并實現以成果類型、時間、作者(下分第一作者、通訊作者、全部作者)、語種、期刊名稱、文獻類型、合作作者、合作機構、國家及地區、重要成果(下分熱點論文、高被引論文)、學科、中科院分區、JCR分區、影響因子分段、收錄情況(SCIE、MEDLINE、CA、SSCI、EI、ESCI、A&HCI、ISR、CPCI(含原ISTP和原ISSHP)、CSCD、北大核心、ESSCI、中國科技核心期刊目錄自然科學卷和社會科學卷)等為檢索字段的二次檢索。每項成果后顯示按我院科研績效評估體系給予的分值。檢索結果可通過點擊字段名按時間、被引頻次、下載數自動排序,可選中并以題錄形式導出,導出字段可以自由勾選。
2.1.4.2 科室分析模塊
廣東省中醫院有5個院區和3個分門診,包括幾百個大小科室、研究團隊。機構知識庫根據我院實際情況提供按院區、大科、小科(包括所有團隊)分類的導航,為所有科室建立主頁。首頁顯示科室團隊簡介、人員(名字鏈接到個人主頁),并由負責人進行信息維護;以數字顯示科室發文(按收錄情況)、專著、新藥、專利、成果、標準、獲得獎勵和基金情況等,點擊數字會顯示具體成果列表;在各項成果題名后增加顯示科研評估分值的字段。在統計頁面提供人員職稱統計圖,各個類型成果的產出趨勢圖,成果類型、收錄情況、研究主題和文獻類型的分布統計圖,發表期刊top10、被引頻次top10、研究人員產出top10的統計圖,關鍵詞、主題詞云圖,合作機構、合作作者網狀圖等;能夠選擇不同年份進行統計,并且圖可以下載。此外還提供院區、大科、小科(包括所有團隊)的對比分析,可對多個同級或者不同級的科室成果進行多角度的對比分析。所有科室名稱后設置匯總分值計算按鈕和對比按鈕,可一鍵計算科研績效分值以及勾選科室后加入對比。
2.1.4.3 學科建設模塊
學科建設模塊提供了所有學科的導航,為所有學科建立的學科主頁能顯示學科簡介、人員(名字鏈接到學者個人主頁),由學科負責人進行信息維護。學科建設模塊以數字顯示學科發文(按收錄情況)、專著、新藥、專利、標準、科研獎項、科研項目、精品課程等,點擊數字將顯示具體成果列表,在統計頁面提供類似上述科室分析模塊的常用功能?!半p一流”高校建設的核心是學科建設,機構知識庫除了展示學科技術、人才、成果等外,還可與對標機構進行競爭情報分析,實現學科動態預警[8]。
2.1.4.4 知識圖譜模塊
知識圖譜模塊對機構知識庫中的資源進行多維度統計,提供詳盡、直觀的統計結果,醫院成果類型分布、語種分布、收錄情況分布、研究主題分布、文獻類型分布的統計圖,各類型成果產出的趨勢圖,機構學科規范化的學術影響力趨勢圖,論文期刊分布top20、被引頻次top20、下屬機構產出top20、學科產出top10、研究人員產出top20統計圖,關鍵詞云圖,主題詞云圖,合作機構網狀圖,合作作者網狀圖,詞頻共現關系圖譜。機構的知識圖譜能夠選擇不同年份進行統計,且圖可以下載;能夠可視化地說明本機構誰在做什么、有無特色、是否重復、與誰合作等。利用本機構圖譜與全領域知識圖譜、競爭對手知識圖譜等的比較分析,可以找到自己的競爭優勢和劣勢、研究空白,發現潛在的競爭對手和合作機會,還可利用知識圖譜進行科研布局規劃和提出學科建設策略[9]。
2.1.4.5 機構學者模塊
機構學者模塊提供以姓名、工號、ORCID為檢索字段的快速檢索框。左側縱向以科室為分類的導航欄,右側橫向以姓氏首字母為檢索字段的導航欄。因我院一名學者可以隸屬于多個科室/團隊,以及存在同名、更換科室的情況,這些字段信息需要對接人事系統并及時更新。為所有學者建立學者主頁,包括在職的學者以及退休的專家,顯示學者簡介、研究方向、所屬科室或團隊、H指數,學者可自行修改個人信息、提交和認領成果。以數字顯示學者各類成果,點擊數字將顯示具體成果列表,在各項成果題名后增加顯示科研評估分值的字段。所有學者名字后設置匯總分值的計算按鈕和對比按鈕,可一鍵計算科研績效分值以及勾選學者后加入對比。在統計頁面還提供類似其他模塊的常用統計分析功能。
2.1.4.6 個人中心模塊
個人中心模塊可以修改并保存個人基本信息,上傳、認領、撤回個人成果,支持各類型格式的數字資源;提供存儲空間,支持個人上傳并存儲學術論文、科研進展報告、技術報告、碩博士論文、實驗數據等其他灰色文獻,以及未發表的數據,如臨床醫生自己的個人數據、手術視頻、特殊病歷分析等,可以自行設置不同開放權限。個人中心模塊設置有打印報告模板,個人用戶可在個人中心模塊中進行文獻的收錄證明、個人論文產出報告、職稱申報報告、部門產出報告、醫院年度產出報告等的打印。醫院學者群體,每年都要向不同職能部門提交各種數據,是重復勞動且與科研關系不大。機構知識庫可以簡化這一工作,實現“一次提交,數據通用”的功能。此外,為了減輕學者錄入數據的工作量,對機構知識庫進行數據爬取,學者僅需認領少量不確定的疑似數據及自行上傳無法收集到的數據,由管理員進行審核[10]。
2.1.5 界面展示層
界面展示層包括機構庫界面、個人界面和科研管理界面以網頁的形式對數據進行展示。數據庫系統具備可定制化的UI,系統的友好性和功能性強,可根據用戶需求進行調整修改。
2.2.1 用戶權限管理
由管理員對系統進行平臺信息維護、用戶權限認證和管理。最高管理員擁有對用戶與所有資源的增刪改權限,并且可根據組策略為不同用戶分配不同的權限。如為圖書館管理員分配成果代認領權限,為科研處管理者分配審核各種提交的報告、評估統計科研績效的權限等。
2.2.2 數據資源管理
系統的每一個子數據庫都具備獨立的存儲、發布、管理功能。如圖書館管理人員通過定義標引和錄入編目,即可對子庫內具體成果進行字段增補、檢索查找;科研處管理人員通過錄入課題信息,即可對課題人員、經費、設備、成果等進行管理。
2.2.3 數據遷移與安全
數據庫支持對數據的合并、拆分、批量導入、導出等操作,提供標準OAI數據接口和其他數據交換的接口,支持與醫院OA平臺、人事管理平臺進行數據對接與交換。數據庫能實現自動備份或手動備份功能,可以定期進行數據對比檢測,及時發現和處理數據錯誤,保證數據安全。
機構知識庫在國內高?;蚩蒲袡C構中應用較普遍,在國內醫院中還沒有被廣泛應用,尚處于起步階段。我院機構知識庫的構建無論從內容建設、用戶體驗還是從知識產權方面來說,都還有很大的改進和完善的空間,在機構知識庫中嵌入的科研管理系統也需要進一步完善。
在國際上,機構知識庫發展的一個重要趨勢便是拓展支撐科研管理方面的服務功能,包括知識管理、知識審計、科研評價、科研項目管理、科研規劃等,機構知識庫已經成為整個科研管理系統的有機組成部分[11]。我們在構建以科研管理為導向的機構知識庫時,既要學習國內外已有經驗,也要結合自身情況和需求進行改革創新。建設功能完善的、有特色的、與時俱進的機構知識庫,是一項長期而艱巨的任務,還有待深入研究。