劉玉博,吳曉彤,汪玉新
(山東農業大學圖書館,山東 泰安 271018)
機構知識庫是一個機構(如學校、研究所、公司等)將機構成員在學習、工作過程中產生的各種學術成果進行整合而成的數字資源集合[1],旨在為機構內人員提供一個統一的知識存儲平臺,促進機構內外學者、研究人員的交流,擴大知識的共享范圍,提升機構的知名度,體現機構的科學研究、教學、社會影響力等方面的綜合實力。無論機構知識庫的外在形式如何,其本質都是通過建立一種新型管理和服務機制,幫助學術機構實現學術成果的自主管理和交流傳播[2]。高校機構知識庫是數字時代展示高校學術研究成果的基礎平臺,也是高校為師生提供用于管理和發布數字資源的信息平臺。
據OpenDOAR網站統計,截至2021年10月,全球共有機構知識庫5 746個,其中中國大陸被收錄的機構知識庫62個[3]。這些機構知識庫大致可分為兩大系統:以中國科學院為首的科研院所系統和以教育部中國高等教育文獻保障系統(CALIS)牽頭的高校系統。目前,中科院的機構知識庫已經收集了96個研究所的數據,中國高校機構知識庫聯盟(CHAIR)有51所高校圖書館參與。這兩大系統的機構知識庫建設項目,對于中國機構知識庫的建設起到了很好的引領示范作用。
2018年3月,國務院辦公廳印發《科學數據管理辦法》,指出高等院校是科學數據管理的責任主體,主要職責中就包括建立科學數據管理系統,公布科學數據開放目錄并及時更新,積極開展科學數據共享服務。2021年3月,教育部印發《高等學校數字校園建設規范(試行)》,對高校機構知識庫建設提出了指導性意見,指出機構知識庫應與學校科研管理信息系統對接,搜集、整理、揭示、關聯與共享科研產出。國家相關政策的出臺,為高校機構知識庫建設和發展提出了新要求,也是新發展機遇。
為了滿足高校機構知識庫的需求,數據庫商和軟件開發商嗅到了商機,適機推出了許多機構知識庫產品,可以實現數據的自動推送和標引,減少建設投入和時間成本。目前,全球和中國的機構知識庫建設正處在一個快速增長的爆發期,越來越多高校認識到機構知識庫的重要性,加快了投入力度和建設速度。
雖然高校建設機構知識庫的熱情高漲,很多學校也緊跟潮流紛紛上馬項目建設,但實際建成上線運行的卻寥寥無幾,真正做到開放共享的更是鳳毛麟角。高校機構知識庫建設的主導部門一般都是圖書館,少數也有網絡信息中心牽頭的[4]。高校圖書館希冀通過機構知識庫的建設擴展服務模式、提升服務質量,卻往往因為資金、人力、技術等原因陷入困境,或建設進度慢遲遲無法上線,或重建設輕應用,利用效果不佳,或數據更新不及時逐漸停擺,沒有實現可持續發展,將學校科研數據共享的“形象工程”慢慢變成圖書館“自娛自樂”之物[5]。
高校機構知識庫不是圖書館簡單的自建數據庫,涉及數據少則幾萬條,多則幾十萬條,成果類型包括期刊論文、學位論文、會議論文、圖書著作、報紙、專利、標準、科研項目、科技成果等,需要對接人事處、科技處、發展規劃處、教務處和研究生處等校內職能部門獲取數據,如果沒有取得學校領導的支持和完善的頂層設計,是不可能建成的。
隨著軟件、網絡、存儲等信息技術的迅速發展以及用戶需求的不斷提高和改變,圖書館自己搭建平臺和手動更新數據已經無法駕馭,選擇商業化平臺成為絕大多數高校的唯一選擇。但高校機構知識庫建設涉及學校幾十年甚至上百年的歷史成果、幾千人的成果歸屬,如果沒有充分的心理準備和人力儲備,幻想一蹴而就是注定要失敗的。在商言商的商業化平臺公司在宣傳上往往夸大產品效果而縮小建設難度,如果僅憑一兩個技術人員就匆匆上馬,即便建成也只是個空架子,可持續發展無從談起。
高校一般都有幾十甚至上百年的歷史,往往還涉及更名、拆分、合并等復雜情況。二級機構的歷史變遷,曾經包含的系、專業、研究所、重點實驗室、研究中心等附屬機構也是筆糊涂賬。教職工也處于入職、辭職、調崗、退休等動態變化中。
目前的機構知識庫收集的數據類型超過十幾種,雖然商業化平臺宣稱可以自動更新80%~90%的數據,但實踐中只有論文、專利、標準等可以實現,而科研項目、科技成果只能自動收集省部級以上的公開數據,圖書著作等不署名單位的類型只有依靠學者自己提交,準確性就很難把控。
有的學校前期已經建設了人事系統、科研系統、知識產權系統和學者庫等。機構知識庫從已有的系統中獲取科研項目、獲獎成果、專利等相關信息,數據來源渠道多、良莠不齊,難免重復、出錯,包括成果歸屬、人名等錯誤,因此其元數據的準確性和全面性無法保障。
數據的滯后性也是令人頭疼的問題,學者發表在國際期刊上的論文,從接收到線上發表,到正式發表,再到被收錄,最后到收割推送,至少需要幾個月的時間。歷史上的成果署名沒有指導性規范,有很強的隨意性;不同國際期刊署名五花八門,有的姓在前有的名在前,有的名字是全拼有的是縮寫,有的全拼加空格連詞符有的合并,甚至還有重名、重音。署名為學校的成果數據推送后,如何準確匹配和歸屬到二級機構和學者上,也有很大的困難。
大量更新滯后和無法自動收割的成果數據需要學者手動提交。這部分數據如果不審核,元數據的準確性和精細度就無法保證;如果需要審核就需要大量的人員參與,過程太復雜又會影響學者提交數據的積極性。總之,數據如果達不到“一張表工程”要求,后續數據利用就會非常困難,可持續發展必定大打折扣。
機構知識庫的生命周期大致分為準備、建設和運維3個階段,如果把準備、建設階段比喻為挖坑、種樹,那么運行維護階段的悉心照料才能使機構知識庫落地生根、開枝散葉、開花結果,這一階段是可持續發展的集中體現。
學者在使用機構知識庫過程中肯定希望自己填充數據的辛苦付出要有豐厚的回報,能夠輔助完成各個部門要求的各式數據匯總,從耗時耗力的重復性勞動中解放出來,這就要求圖書館或者商業化平臺公司能進行功能定制,滿足學者個性化需求。
學者在使用過程中遇到困難,圖書館能否提供足夠的人員進行輔助、培訓和指導?學校其他部門產生的科研數據也需要定期導入,圖書館是否有充足的技術人員進行維護?機構知識庫的運維對于圖書館來說絕不是僅僅增加一個自建數據庫這么簡單,而是一種服務理念和運行機制的變革。
2018年,山東農業大學圖書館啟動機構知識庫建設計劃,密集走訪調研兄弟高校建設情況,積極參加學術會議學習經驗,邀請多家商業化平臺進行功能演示。2019年,經過建設小組的多次討論,向學校提交了申請建設機構知識庫的請示、調研報告和建設方案,并于年底完成采購。2021年,山東農業大學機構知識庫經過近兩年的建設,上線運行并交付使用。在整個機構知識庫的準備、建設和運維各個階段,均以可持續發展作為基本考量,充分吸收兄弟高校的經驗,努力打造機構科研數據匯集、保存、展示和利用的“一張表工程”。
在準備階段,圖書館就深知面對機構知識庫這樣一個浩大的工程,必須在校內爭取最大限度的支持。在圖書情報委員會年度會議上,向分管校領導和各部門、各學院的委員們匯報展示了3個學院的試點版本,讓全校上下在對機構知識庫不熟悉、不了解的情況下,通過匯報演示有了直觀認識。會上委員們提出的建議意見,也成為后來建設過程中的重要指導和考量。
緊接著通過校長辦公室下發了建設方案,成立學校機構知識庫建設領導小組(由分管校領導任組長),明確了參建各方的職責分工,制定了建設時間進度。要求圖書館、參與建設部門和各學院要密切協作配合、扎實有力推進,做好相關系統對接、逐步消除數據壁壘,主動開展基于機構知識庫的各類型、深層次服務,不斷提高學校機構知識庫的認知度與關注度,使其逐步成為學校知識基礎設施的重要組成,成為支持數字科研和數字教育的重要工具,成為學校管理科研成果、傳播學術知識、支持創新的重要機制。
在建設過程中,從人事處、科技處、教務處和研究生處等部門獲取了眾多元數據,成為搭建機構知識庫的基礎框架,這些數據包括歷史上學校年鑒中統計的各類科研數據。維護過程中,當下產生的匯總數據也會定期進行導入,最大限度地減少學者手動提交,保證元數據的準確性和規范性。
任何機構在啟動機構知識庫建設初期都是缺乏經驗的,在這種情況下貿然覆蓋全校進行數據匯聚風險是很大的,會拖慢進度或者犧牲準確。山東農業大學建設團隊在實踐中,首先選取了文理工3個代表性學院進行試點,摸索組織機構、人事信息、數據匯聚、歸屬匹配等建設經驗的同時也鍛煉了隊伍。
試點的另一個優勢是快速形成功能預覽版,直觀地將打造成型的平臺呈現在部門學院領導和專家學者面前,通過言之有物的功能演示去爭取支持、收集反饋,有利于打磨系統細節,有效地推動了建設進程。
在機構知識庫的建設過程中,圖書館容易陷入一種自建庫的思維方式,即通過自主建設和自主管理打造產品,提供服務。實際上學者既是機構知識庫數據的使用者,同時也是數據的提供者,而圖書館更多的角色是數據平臺的維護者。學院和部門認為這個平臺能解決實際問題,對他們越有幫助用得越多,學者也更有提交數據的積極性,共建共享是可持續發展的必由之路。
基于這種思路,山東農業大學機構知識庫增加了一個機構層級“系”,即“校—院—系”三級管理體系。系在學院的管理中是個非常重要的單位,很多數據統計和填報工作都是系主任來完成的。系主任作為一個管理員角色,可以隨時調取本系內所有學者的成果數據。另外,學院在遇到跨系的數據填報任務時,可靈活組合相關學者搭建臨時的“系”層級,方便數據匯總和導出。在運行初期,還對機構知識庫不同層級的角色設置了不同的權限,后期隨著大家對機構知識庫逐漸熟悉,再慢慢放開限制。
學科館員制度是圖書館創新信息服務模式的重要手段,也是圖書館服務學校人才培養和教學科研的重要舉措。經過幾年的試點,山東農業大學圖書館于2020年全面實施了學科館員定點服務學院制度,選拔16名具有碩士、博士學歷的館員對口擔任19個教學學院的學科館員開展學科服務,組建了農業與生命科學、理學與工程科學和人文社會科學3個學部服務組,建立起有效的信息需求與服務保障渠道,幫助學科和讀者高效利用圖書館的資源和服務。
機構知識庫建設意義重大、工程繁雜、涉及面廣,圖書館作為承擔主體責任的牽頭單位,必須配備充足的人力資源。學科館員是圖書館聯系學院的紐帶和橋梁,因而與機構知識庫是天然契合的,兩者都屬于信息服務范疇,所以學科館員團隊全程參與了學校機構知識庫整個建設過程。
機構知識庫建設離不開學院的鼎力支持,在前期學科服務工作已經取得對口學院信任和認可的基礎上,機構知識庫啟動伊始學科館員就到學院走訪調研,聽取學院對科研數據平臺的需求,宣講機構知識庫的功能,收集學院組織機構信息和機構人員信息,搭建起機構知識庫的基礎框架。成果初步歸屬后,學科館員進行了大量的核對,匯總了詳盡細致的意見,多次與平臺服務商進行對接反饋。為了減少學者的填報工作量,學科館員又對照學院教師主頁,補充主要專家的個人簡介、學科方向、獲獎情況等信息,還通過專業檢索補充圖書著作等不易歸屬的數據。學科館員還負責對口學院的使用培訓和答疑解惑,學院管理員審核后的學者自提交數據也要進行元數據規范再審核,大大提高了數據的精細度和精確度。
學科館員通過參與機構知識庫建設,了解對口服務學院的專家學者、學術產出和學科發展等基本信息,為更好地開展學科服務掌握了第一手資料,是深入開展工作的有力抓手。學科館員依托自身的學科知識和服務優勢,加強機構知識庫的內容構建、利用和推廣,建立圖書館、學院和學校職能部門之間的聯動機制,從而使機構知識庫真正做到可持續和健康發展。
使用起來順手、需求得到滿足,學院才能積極地參與機構知識庫建設。通過大量走訪調研,與學院領導和專家學者進行深入交流,發現他們的需求并在機構知識庫進行深度定制。
一是增加課程數據。教學與科研是評價學者不可或缺的兩個方面,只有科研數據是無法科學反映學者工作成績的。通過與教務處和研究生處對接,每學期結束都導入學者的本科生和研究生課程。后期還計劃與人事處對接,導入學者的實際結算課時量。二是增加成果類型。比如作為農業院校,有許多的動植物新品種成果,圖書館為農學院和動科學院添加了審定和認定品種兩個成果類型,還為信息學院添加了軟件著作權等。三是增加學生成果。學院在進行專業認定的時候,經常需要填報學生參與項目或者獲獎成果,在指導教師的名下進行登記,實現學生成果的管理和統計。
后期維護是比前期建設更能體現可持續發展理念的階段。面對不斷增長的需求,機構知識庫的運維一定要有一支人員穩定、技術全面、責任心強的隊伍。圖書館由館長直接負責對學校的溝通,一名副館長和辦公室主任主抓協調,兩名計算機科學和網絡安全碩士作為技術中堅,16人的學科館員團隊對口協助學院,全館有近四分之一的館員為機構知識庫保駕護航,才能久久為功、善作善成。