摘 要:本文以高校為例介紹了機構庫的產生背景,論述了機構庫強調集中存取、突出過程管理、促進資源共享、提高機構關注度的特點,闡述了機構庫構建中建設隊伍的專業化、資源采集的廣泛性、資源建設的標準化、數據應用的拓展性等要求,架構了面向機構庫的技術+數據+服務的一站式信息發布與整合系統。
關鍵詞:數字化環境;高校圖書館;機構知識庫;信息發布;信息整合
隨著互聯網和數字化環境的快速發展,高校圖書館通過購買專業數據庫、自建特色數據庫等方式已建立起由紙質資源和數字資源組成的較為完善的文獻信息體系。這些數據資源一般都是成果性信息的集合,是展示結果或成果的資源,對研究過程中產生的階段性成果并未予以收集、保存和利用。階段性資源能夠系統、全面地揭示教學和科研的來龍去脈,完整再現學術過程,是教學科研方法學習、知識產權保護、研究脈絡分析的重要資源。
1機構庫的產生背景
數字化環境快速發展的今天,互聯網己經成為高校科研、教學人員進行信息交換的主要途徑之一。傳統出版模式的學術交流體系己經不能完全滿足科研教學人員及時獲取最新最前沿信息的需求。隨著開放獲取活動的發展,開放獲取理念逐漸被人們所認同,越來越多的教學科研人員愿意將他們的科研教學成果投向開放獲取平臺[1],如電子期刊、個人主頁、微博、個人圖書館等。同時,存儲技術的發展也使得越來越多的科研人員接
納自我存取服務,自愿將他們的論文以及在科研過程中產生的階段性成果和數據資源保存在個人或專業存儲空間上[2]。所謂機構知識庫又稱機構庫、機構倉儲、機構典藏庫等,是收集、存放由某個或多個學術機構(例如大學、研究所、圖書館、博物館等)專家、教授、學生自主發布的,可供機構內外用戶共享的學術文獻的數據庫[3]。其概念的核心在于建立一種數字資源自由存取機制,獲取、保存和傳播高校及其研究機構的數字知識資產。機構庫的概念強調兩個方面,一是資源存放主體主要是本機構成員,二是資源類型是本機構產出的數字化方式呈現的學術研究成果。
目前國內高校圖書館都在征集學校師生或校友的印刷型著作及學術成果并將其進行數字化處理后予以保存,但在教學和科研過程中產生的階段性知識成果和資源并未得到足夠的重視,高校圖書館有責任和義務積極創建本校的機構知識庫并將這些過程性知識成果和資源充實到機構知識庫中以形成本校圖書館的特色化館藏學術資源。
2機構庫的特點
圖書館作為知識和信息存儲與利用的樞紐,利用自己的專業優勢和技術特長來構建機構知識庫對于長期保存科研成果、科研過程數字資源、教學成果、教學過程數字資源、促進資源的共享等具有積極的意義。
2.1強調集中存取。
機構知識庫可以長期保存和管理科研教學成果及其過程性數字資源。隨著科研、教學工作的不斷開展,研究者產生的各類成果及階段性數字資源越來越多。通常這些信息基本都保存在個人使用的電腦中,由于電腦的存儲容量有限,且軟件硬件損壞等原因,大量過程性、碎片化的數字資源會隨著時間或軟硬件的更替而遺忘或丟失。另外,這種個體保管的方式一定程度上也制約了信息的傳播和交流。因此,有必要為這些數字信息資源提供一個長期保存和傳播的安全場所,以克服個人或單個部門分散保存的弊端和風險。而且利用存儲技術把分散的學術信息資源集中起來并通過相應的技術手段把不同格式的數據加工整理、集中存儲、統一管理,為以后用戶方便快捷地利用奠定基礎。
2.2突出過程管理。
建立機構知識庫,可以完整地保存本機構成員的科研過程,如實反映學術活動的進展和階段性成果。在機構知識庫中可以保存包括工作中的開題報告、經驗總結、非正式的成果與進展、思想交流、工作中需求或產生的數據、工作日志、實驗數據、統計報表、演算公式、研究心得等過程性數字信息資源,同時借助先進的管理技術和傳播手段將科研工作的不同方面而不僅僅只是最終成果展示給用戶,從而使他們能最大限度地從已完成或正在進行的科研或教學項目中獲益,借鑒和學習他人的研究方法和技巧,減少研究內容沖突,避免重復勞動,為知識產權歸屬提供原始材料。
2.3促進資源共享。
教師可以利用機構知識庫的教學、科研數字資源來提高自己的教學質量,完善自己的教學方法。學生則可以利用機構庫中的教師課件來進行自主學習,利用相關的科研數據來指導自己的實驗。科研、教學人員的知識成果可以得到迅速、廣泛地傳播,減少了印刷出版而導致的時間滯后。另一方可以通過網絡的免費獲取,大大提高知識成果的可見度和被引率,最大限度地推動科研、教學知識成果的傳播交流與共享[4],建立開放的、可自由獲取的學術環境,共同促進社會的文明和進步。
2.4提高機構關注度。
機構知識庫不僅可以系統、完整地保存本單位的科研、教學資源,同時也可以通過機構知識庫的形式集中展示本單位的科研教學實力,吸引其他行業、系統機構的專業人員訪問,展示學校風貌,傳播學校文化,推介學校形象,提高學校的關注度和影響力,擴大行業知名度,為學校的宣傳起到良好的廣告效應。
3機構庫的構建要求
3.1建設隊伍的專業化
構建機構知識庫,需要建立一支高水準的建設管理團隊并設置相關的專業人員,主要包括用戶服務和系統技術兩類專業人員。用戶服務人員主要負責與用戶的溝通和專業支持,最好由學科館員組成。學科館員具有圖書館業務知識和專業技能,還具有與其所負責的相關學科的專業背景,能夠很好的同提供資源的院系、研究所進行溝通,并能夠利用其圖書專業知識對收集來的數字資源進行加工處理后將其充實到機構知識庫中。技術人員主要負責機構庫平臺的日常維護與二次開發工作,最好是具有計算機專業背景的數據庫運行維護或軟件開發人員。同時,還要確立機構知識管理的運作機制和管理準則,使之成為資源共建共享的規范化、制度化的長效機制。
3.2資源采集的廣泛性
機構庫的信息資源采集是構建機構知識庫的基本問題。目前雖然很多高校建立了機構知識庫,但是資源很少,這主要是由于學校的科研人員、教師對機構知識庫認識不夠、對機構知識庫重視不足,不同學科領域學術交流傳統不同以及機構知識庫本身存在問題等諸多原因引起的[5]。科研教學人員在完成科研項目、教學項目的過程中會產生大量的過程性數字信息資源,這些數字信息資源包括實驗的資料數據、參考資料、科技報告、文件、教學課件、數據庫、聲像資料、動畫、圖片、公式、演算過程、實驗數據等,這些都是高校和科研機構的重要學術資源,因此需要鼓勵教師和研究人員提交相關內容。這就要求圖書館人員首先應持續不斷地宣傳、推廣機構庫建設的意義,其次要與學校的各院系、研究所建立良好的合作關系,了解教師、科研人員論著出版、成果發表、科研進展等情況并努力充實到機構知識庫中。
3.3資源建設的標準化
機構知識庫的一個重要意義是促進知識的交流與傳播,因此標準化是構建機構知識庫的重大技術保障。如果各高校機構知識庫信息資源的錄入、收藏、發布、利用的標準不盡相同,就會造成不同機構知識庫之間的信息異構以至于無法共享,導致出現“信息孤島”現象,這就有悖我們機構庫建設的初衷。因此,機構知識庫的標準化是決定機構知識庫互操作機制、資源共享的重要技術基礎。撇開機構庫建設的數據標準化來探討機構庫建設注定是要走入死胡同,沒有前途的。
3.4數據應用的拓展性
隨著數字化環境的高速發展,大數據技術的應用也越來越廣泛,因此在機構知識庫的基礎上為其增加大數據分析功能也是目前的發展趨勢。通過基于機構知識庫的大數據分析功能,學校的科研人員可以分析出目前自己學校的科研集中于哪些領域,成果如何,從而確定自己的研究課題和方向,也可以根據機構知識庫找到自己科研合作的對象。對于教師而言,可以通過機構庫的大數據分析系統了解、借鑒和學習學校通行的教學方式方法、教學改革的方向、教研的熱點、優秀的課件等以提高自己的教學水平。
4 面向機構庫的一站式信息發布與整合系統
4.1 機構庫的結構模型
機構知識庫一般采用目前流行的B/S結構,其基本結構如圖所示。機構庫結構分為3個互相聯系又彼此相對獨立的端口,即客戶端、運算端和資源端。客戶端是是系統的起點和終點,是用戶和管理員的終端瀏覽器。用戶和管理員可以通過自己的瀏覽器來訪問和使用機構數據庫系統。其中用戶可以訪問教學專題模塊,科研專題模塊,數據分析專題模塊以及數據錄入模塊,管理員除了用戶可以訪問的模塊外還可以訪問系統管理模塊。運算端是系統的技術運行支撐,它位于圖書館機房的邏輯服務器,以各個專題模塊中上傳的信息資源為基礎,通過數據整理和分析,把零散、混亂的信息資源條理化、規范化,將整合后的數據以科研專題,教學專題,數據分析專題的形式展示給用戶,并提供數據錄入功能以及系統管理功能。用戶可以根據自己的需要在科研專題,教學專題中查找自己所需的資源,也可以通過數據分析的功能來對自己感興趣的數據進行統計分析和匹配,還可以通過數據錄入模塊發布信息,而管理員則可以通過系統管理模塊管理機構數據庫中的內容,為用戶提供完善的信息體驗。資源端是系統的后臺數據庫,它位于圖書館機房的數據服務器,由數據訪問接口組件與中心數據庫構成,用于存放客戶端通過數據錄入模塊錄入的機構庫數據。當然資源端和運算端也可以部署在同一服務器上,當資源端和客戶端的發布數量與訪問數量很大時,機構庫的工作效率會比將數據資源層和邏輯運算層分別部署在不同服務器上低很多[6]。
4.2面向機構庫的一站式信息發布與整合系統
從上面的分析不難看出,機構知識庫是集“技術+數據+服務”為一身的一站式信息管理系統,其中運算端是技術層,資源端是數據層,客戶端是服務層,機構庫將三個層級融合在一起,通過IR門戶,將內容建設、知識服務、業務管理、系統維護等串聯起來,實現一站式的信息發布與整合,其主要功能和平臺優勢如下[7]。
(1)主要功能。該系統具有內容獲取、數據管理、應用服務、信息反饋多種功能,其中IR門戶通過知識庫導航、全庫檢索、學者風采、院系建設、重要成果、我的空間等入口,實現系統的門戶體驗。內容建設通過元數據推送、全文推送、單篇添加、批量導入、從數據庫添加等方式,不斷豐富和完善知識庫內容,實現信息發布的自主、直觀、批量。知識服務通過熱點與趨勢、學術指數揭示、引證關系分析、合作關系分析、成果分布分析、相似成果推薦等,實現知識挖掘與分析的深層次服務,使單一、零散、不同來源的信息得以序化、整合。業務管理模塊對知識庫的建設情況、成果統計、成果認領、數據審核、數據管理、學者管理等進行優化和指導,系統通過客戶帳號管理、數據推送設置、數據審核設置、開放策略設置、數據安全備份、基礎信息管理等功能實現系統的穩定、安全、高效。
(2)平臺優勢。一站式的信息發布與整合系統具有數據和功能的雙重優勢。第一,數據優勢。該平臺數據合法規范,新增數據都是機構學者本人推送,是知識版權的直接擁有者,具有獨家數據優勢。而且數據推送都按照系統提供的統一格式,元數據著錄項目比較完善,便于實現文獻的標準化著錄、標引和專業性檢索詞匹配。系統還支持適時更新和歷史數據回溯,有利于數據的不斷豐富和完善。第二,功能優勢。一站式信息發布與整合系統支持按需配置不同類型用戶的功能權限和操作,保證系統的安全性;支持推送成果自動審核設置,支持開放策略的靈活性,系統管理員和作者都可以設置題錄和全文的開放權限;提供多維度統計表,為科研考核與評估提供客觀的數據支撐;深度解釋機構成果的隱性情報信息,還可以與科研、教學、學工等系統對接,實現集成化的多重交叉印證和參考。
數字化環境的高速發展為機構知識庫建設提供了較好的互聯網環境,一站式信息發布與整合系統無疑成為機構知識庫建設的絕好平臺,進而為機構的學習、科研、創新、展示等提供良好的數字化窗口。
參考文獻
[1]李國俊等.基于元數據的高校機構知識庫建設研究[J].大學圖書館學報,2012():55-60
[2]劉華.國外機構知識庫的長期保存研究及其啟示[J].情報資料工作,2007(3):49-52
[3]郎慶華.機構知識庫自存儲資源的獲取策略研究[J].情報雜志,2009,28(7):166-169,184.
[4]黃凱文,劉芳.網絡科學信息資源“公開獲取運動”的模式與方法[J].大學圖書館學報,2005,(2):38-41
[5]毛曉燕.大數據環境下圖書館信息服務走向分析[J].圖書館工作與研究.2014,(3):72-75.
[6]高勇.啤酒與尿布:神奇的購物籃分析[M].北京:清華大學出版社,2008.
[7]中國知網數字圖書館[DB/OL]/http://elib.cnki.net/2015-12-15
作者簡介
吳曉穎(1973——),女,湖北襄陽人,湖北文理學院圖書館館員,主要研究方向為信息采集與分析,發文7篇。