[摘要]基于廣西機構自建學術數據庫及其它類型文獻信息資源的建設與共享情況,借鑒國內外開放存取活動的經驗,從共享平臺的選擇、資源整合與檢索技術、組織管理方式、制度體系、服務模式等方面探索適合廣西的機構自建學術數據庫開放共享的模式。
[關鍵詞]機構知識庫;學術數據庫;自建數據庫;共建共享;資源共享;機構
[中圖分類號]G250.74[文獻標識碼]A [文章編號]
隨著網絡技術的發展以及在信息社會化的趨勢下,信息資源的開放共享已經不僅僅限于公共文化與商業性學術資源的范疇,正在觸及和逐步深入到各個機構的自有自建的信息資源。自建學術數據庫收錄內容的獨特性,使其頗受科學技術領域內人士的青睞。本文從對比國內外自建學術數據庫出發,基于廣西的實際情況,研究探索適合廣西的機構自建學術數據庫共建共享模式。
1 國內外自建學術數據庫開放共享現狀
機構自建學術數據庫,是指學校、研究所、醫院、政府機關及其他企事業單位針對本機構的性質自行搜集整理相關學術信息資源而建立的可在一定范圍內共享的數據庫。它既能在一定程度上滿足機構內人員或機構服務受眾在工作、生活及學習上的信息需求(有些甚至能支持領導決策),又可彰顯本機構的信息特色,因此也可稱為特色數據庫。它可以是專家成果庫、產品庫、文獻知識庫,也可以是其他內容或類型的信息集成庫。自存檔、學科知識庫、機構知識庫都屬于自建學術數據庫的范疇。
1.1 國外情況
在Elsevier數據庫及百鏈學術外文搜索中檢索發現,國外在研究“自建學術數據庫”或“特色數據庫”的文獻非常少,而研究“自存檔”“學科知識庫”及“機構知識庫”的文獻比較多,機構知識庫是在學科知識庫及自存檔基礎上發展而來的。因此本文所討論國外的自建學術數據庫,主要指的是機構知識庫。
機構知識庫是于上世紀末伴隨著開放存取運動的發展而興起的一種新的學術交流與資源共享模式,一般是大學或研究機構依托網絡對本機構或多個機構成員所產生的電子學術資源進行收集、存儲、發布、長期保存,并免費提供給機構內外的網絡用戶共享。美、英、德、日等發達國家的機構知識庫起步早,資源數量多、種類多,大都得到國家層面的政策支持及經費資助,發展較為完善,并且趨向于多個機構聯合聯盟,影響力大,用戶范圍廣。如:2013年2月,美國白宮科技政策辦公室發布政策指令,要求所有研發資助達到1億美元的聯邦機構在6個月后提出并實施開放存繳政策,讓聯邦政府資助科研項目所產生的論文在發表后12個月實行開放獲取;美國20多位國會議員提出“聯邦資助科研成果公共獲取法案”(Federal Research Public Access Act),要求以法律形式固化規定所有公共科研資助超過1億美元的聯邦機構都要實行公共獲取政策[1]。英國政府則于2012 年 9 月撥出 1 000 萬英鎊支持 30 所研究型大學支付開放出版費用。
1.2 國內情況
國內研究自建學術數據庫的文獻也基本集中在大學及研究機構的特色數據庫和機構知識庫上。我國在開放存取建設上比西方國家起步要晚,進展也較緩慢,但可喜的是,目前已經開始取得一定成效并試圖融入到國際大潮之中。
中國科學院從2009年開始正式在全院各個研究所建設機構知識庫,目前已有76個研究所建成機構知識庫,并制定了強制性的存儲政策。同時,廈門大學、北京大學、清華大學、上海交通大學、北京理工大學和重慶大學也在積極進行機構知識庫的建設和服務工作。2010年,中國科學院與德國馬普學會在北京共同主辦了第八次開放獲取柏林國際會議,并與德國、英國、瑞典、美國等科研教育機構共同發起成立“開放知識庫聯盟”,通過全球合作推進開放存取知識庫發展[2]。
然而,目前的開放存取運動,似乎僅限于在高校與科研機構中得到認同和利用,國內絕大部分企業、社會機構和公眾對科技及學術信息的獲取仍然受到很大的限制,獲知能力與獲取條件也極度不平衡。
1.3 廣西機構自建學術數據庫開放共享情況
本課題組于2013年3-11月在廣西選取調查了111家機構(含高校、科學研究機構、企業、公共圖書館)的200多個自建學術數據庫,大約可分為公共文化類型數據庫、學術研究型數據庫、決策輔助型數據庫3種類型。其中,有61%的機構僅局限于本單位IP地址內訪問和使用自建數據庫,另有18%的機構允許協議單位人員通過密碼登錄使用數據庫。只有21%的機構(主要是公共圖書館和部分高校圖書館的公共文化類型自建數據庫)對用戶無限制,實行全開放使用。從總體上看,廣西的自建學術數據庫開放共享的程度非常低,使數據庫本身的價值得不到充分的發揮與體現。
要把各個不同機構的不同類型的自建學術數據庫進行整合共享,面臨著諸多困難:1)技術上的問題。第一是數據庫建設技術的不統一。各個機構所用的建庫平臺和系統不一樣,在抽查的35個樣本機構中,采用的建庫系統多達13種;第二是數據庫文件格式及元數據標準的不統一;第三是訪問權限的限制。很多機構的數據庫都限制為機構內局域網訪問。2)需要一個組織管理機構進行共建共享的統籌規劃管理,并制定相關的共建共享政策與規范。3)缺乏專項建設資金,可持續發展不容樂觀。
2 機構自建學術數據庫開放共享中的關鍵問題研究
在全國甚至全球的信息資源共建共享的大趨勢之下,廣西的文獻信息資源共建共享平臺也在逐步完善中,但獨具特色的機構自建學術數據庫在共建共享中被忽略了。鑒于自建學術數據庫收錄內容的獨特價值性,應該重視它們的利用情況,將其納入廣西信息資源建設與共享的規劃中。
2.1選擇合適的共享平臺
自建學術數據庫的共享,需要依托一定的計算機網絡服務平臺才可實現。目前整個廣西范圍內使用的信息資源共享平臺有不少,影響較大的主要有:高校系統的CALIS數字圖書館系統平臺(http://www.gx.calis.edu.cn:8090/)、情報系統的廣西科技文獻共享與服務平臺(http://www.gxstd.com/)、醫學系統的廣西醫學文獻信息服務站(http://data.gxmi.net/)、自治區“人文強桂”建設工程成果————廣西人文社科文獻資源共享平臺(http://www.rwqg.gxnu.edu.cn/portal/index.jsp)、公共文化系統的廣西文化共享工程信息資源共享平臺(http://gxwh.gxlib.org.cn/oai/)以及商業化的以百鏈云為基礎的廣西區域數字圖書館共享平臺。另外還有一些基于云計算的公有云服務平臺,如谷歌云、阿里云、新浪云、百度云等。
自建學術數據庫的共享,是單獨使用一個服務平臺,還是與其他文獻信息資源共用一個平臺?在上述眾多平臺中,選擇哪一個最合適?我們可以先了解各平臺的特點:CALIS是整合了高校各圖書館文獻資源并面向高校用戶的數字圖書館,具有檢索、申請傳遞、運送、結算、咨詢等功能,但在使用前必須先整體導入用戶信息,以保證用戶身份的合法性,各館還須有專人負責所有事務的處理;廣西科技文獻共享與服務平臺整合部分科研系統、公共文化系統、高校系統的資源,集檢索、申請、發送、咨詢等功能,既面向集體用戶(固定IP用戶),也面向個體用戶(動態IP用戶),用戶在使用前須免費注冊并充值賬戶,但充值卡需到當地科技局申領獲得,平臺未提供其他充值途徑;廣西醫學文獻信息服務站是專業文獻平臺,功能單一,僅有檢索與下載(需付費)功能;廣西人文社科文獻資源共享平臺整合了部分高校和公共文化系統的資源,但平臺功能還未完善,檢索、咨詢、傳遞等功能經常無法正常使用;廣西文化共享工程信息資源共享平臺中學術性、研究性的文獻資源少,僅提供檢索與瀏覽功能;廣西區域數字圖書館共享平臺整合了全國范圍內高校、公共圖書館、研究所等機構的各學科各種類型的中外學術資源,提供一站式檢索,用戶在檢索后可直接下載或通過郵箱申請文獻傳遞并在24小時內獲取,但須由各機構自己購買平臺(每年支付費用)并在IP范圍內使用。
如果使用公有云服務平臺,機構則不需要訂購軟硬件,只要借助云平臺,即可調試應用和服務。以新浪云(Sina App Engine,SAE)為例,SAE與新浪賬號緊密聯系,經過認證后即可使用。它借助Web Service Pool,支持MySQL數據庫,提供以PHP和HTTP技術的同步計算為基礎的計算中心,使許多不懂底層開發的使用者把SAE當作虛擬主機免費空間來使用,而且能夠非常方便地在SAE上進行Web開發,包括創建Web應用、定制Web應用、部署Web應用、開發Web應用、切換線上版本和刪除應用等操作,不必擔心故障宕機、服務擴容[3]。另外,SAE的開發成本和運行維護成本較低,因為新浪云提供定額免費的存儲空間和流量,即便超出了使用額度,也只需要即買即用、按需付費,投入成本不會過多。在云服務平臺上,每位用戶均可提供和分享信息資源與服務,甚至可以在線編輯、評論,促進用戶與機構之間、機構與機構之間、用戶與用戶之間、用戶與資源之間的互動,真正達到共建共享的目標。
因此,從用戶使用、資金成本、功能性能、技術成熟程度、平臺維護等多方面綜合考慮,建議借用廣西科技文獻共享與服務平臺,或者是選用公有云服務平臺。當然,無論選擇哪一個平臺,必須對平臺的各項功能進行重新設計或改進。
2.2一站式的資源整合與檢索技術
面對多個數據庫的海量信息,用戶往往希望一次輸入即可完成對所有數據庫的檢索,不同格式、不同類型的符合檢索條件的相關數字資源能夠一次呈現、無縫鏈接、順暢獲取?,F在,眾多的機構自建學術數據庫分布在不同的地理位置,分別有各自的信息組織方式、處理方式和檢索系統,為用戶提供不同的查詢方式和服務種類。如何整合如此眾多的自建學術數據庫,屏蔽各個數據庫的差異,實現用戶快速便捷地訪問資源、發現資源及獲取資源的愿望?
一站式的數字信息資源整合與檢索技術能夠解決這個問題。實際上,一站式檢索已成為信息資源共享研究和實現的重要熱點之一,并在國內外得到廣泛應用,如清華同方、萬方、百鏈云、CALIS系統等都支持一站式檢索,西安交通大學、華中科技大學還自行開發了異構資源統一檢索平臺[4]。
一站式資源整合與檢索中的關鍵技術主要有:1)J2EE技術(多層次分布式應用模型),一般采用客戶端、應用服務器、數據庫服務器三層結構,業務邏輯處理集中在應用服務器層,當業務邏輯有所改變時可以改動應用服務器層,對其他兩層則改動較少,以提高系統的安全性;2)DOM(文檔對象模型)技術,DOM是以層次結構組織的節點或信息片斷的集合,也是一種與瀏覽器、平臺、語言無關的接口,使得開發者可以訪問頁面其他的標準組件并做其他開發任務;3)Ajax技術,即異步JavaScript和XML,它是幾種技術的強有力組合,包括XHTML和CSS標準化呈現、XML和XSLT進行數據交換與處理、DOM實現動態顯示和交互、XMLHttPRequest對象進行異步數據讀取、用JavaScript綁定和處理所有數據;4)Struts+Hibernate框架技術,是基于模型(Model)-視圖(View)-控制器(Controller)模式的應用架構的開源框架;5)Web Service技術,其最大特點是跨平臺的通用性,通過使用統一的標準,能夠統一封裝數據、消息、行為等,在無需考慮具體應用環境下讓不同系統實現跨平臺,彼此兼容,進行無縫通信和數據共享;6)SOA技術,即面向服務的體系結構,它將應用程序的不同功能單元(稱為服務)通過這些服務之間定義良好的接口和契約聯系起來;7)Lucene全文檢索技術,它可以方便地嵌入到各種應用中實現針對應用的全文索引/檢索功能[5]。
2.3采用聯盟委員會的組織管理方式
自建學術數據庫的共建共享是一項長期的系統性、協作性的互惠互利的大工程,必須有組織上的保障,尤其是在廣西范圍內跨地域、跨行業、跨部門的機構之間的合作共享。這種基于地域基礎的共建共享,可以借鑒國外開放獲取機構的經驗,采用自治區內聯盟的合作模式,由自治區級政府部門或科技文化部門牽頭,召集廣西范圍內的相關機構,在自建信息資源共建共享的目標指引下根據一定的組織協議,共同組建一個聯盟委員會。各機構在聯盟共同發展、合作、進步的宗旨引導下,為避免重復性建設,節約原本就緊張的人力、物力和財力,提高廣西各類自產自建信息資源的數量和水準,應以統籌規劃、統一標準、聯合共建、資源共享為方針,充分發揮自身的自建信息資源的價值,共同構建自建學術數據庫共享平臺,為廣西的全面發展提供充足的信息資源。
2.4 構筑保障共建共享的制度體系
機構自建學術數據庫的共建共享需要以規范化的數據格式為標準,并以政策、制度方面的保障作為支撐,尤其是要盡可能爭取得到國家層面(或者是省區級政府層面)的政策支持和經費資助。制度保障體系包括技術標準規范、行為規范條例、利益平衡機制、經費保障機制、監督激勵機制等多方面。技術標準規范能夠控制和保證信息資源的數據質量標準、共建共享的技術標準(如檢索技術、傳遞軟件、支付與結算軟件等)及評價系統的一致性;行為規范條例可以明確聯盟成員必須履行的責任和義務;利益平衡機制確保成員機構的合法權益并有效調節成員機構之間錯綜復雜的利益關系;經費保障機制能夠確保共建共享的可持續健康發展(可向政府申請撥付信息資源建設專項經費并爭取形成長效性的支持);監督激勵機制可以促使成員機構自覺履行各自的義務,約束制止不良行為的發生,激發參與共建的積極性,確保共享資源的數量與質量,使共建共享順利進行。
2.5采取用戶自助與文獻傳遞相結合的服務模式
課題組在調查中了解到,用戶在查找與獲取信息時偏好自給自足,不喜歡受到他人的干預。因此,自建學術數據庫共享平臺所采取的服務模式,應以滿足用戶自助獲取信息文獻的需求為主要目標。各個機構的自建學術數據庫整合在共享平臺中,實現集中存儲、統一發現、一站式檢索、遠程共享。用戶在終端通過統一認證、統一授權、統一計費與結算,可以自行隨時隨地下載、瀏覽和使用這些資源。一些因知識產權問題而不能直接下載的信息,則可通過成員機構中的參考咨詢員在平臺中為用戶檢索、下載,或者用戶通過E-mail申請文獻傳遞的方式來實現共享。
此外,隨著新技術對信息資源建設的不斷滲入,共建共享平臺可以探索拓展新的服務形式。比如,用戶可使用手機移動分享自建學術數據庫共享平臺的信息資源,使信息服務無處不在,提高平臺信息服務的能力與效率;平臺上開設虛擬社區,方便用戶進行全方位的交流與互助,也利于收集用戶的反饋意見,促進平臺的改進與完善。
2.6參與開放存取活動
機構自建學術數據庫特別是機構知識庫的共享,是否可加入到開放存取的運動大潮中去?在國內外開放存取運動的影響下,廣西機構自建學術數據庫加入開放存取是必然的趨勢,可以分步驟逐步實現。首先是開放政府及其下屬部門的公共政策類、文化類及其他類型的自建學術數據庫;第二步是開放高校和科研機構的知識庫,這些知識庫的內容大部分是由國家和政府公共資金資助的科研項目成果;第三步開放企業及其他機構的不涉及知識產權和企業機密的自建學術數據庫。
機構自建學術數據庫參與開放存取活動,能夠確保廣西廣大公眾獲得這些源于本土的知識來學習和創造的權利,真正實現社會知識權的公平保障和公共成果的公平利用,提高國家自主知識資產的社會共享能力,更好地把知識效益回饋于社會。
3 結語
廣西的文獻信息資源共享事業已經小有成就,有了不少的平臺。但是,這些平臺之間的聯系較少,也存在一定的問題。希望自建學術數據庫的共享,能促進解決這些問題。最便捷的方式是,自建學術數據庫能與其他類型資源如圖書、期刊、報紙、網絡資源及學位論文等其他特種信息整合在一個平臺中共享,并且能夠融合咨詢服務、文獻傳遞、Google等學術搜索引擎、相關鏈接服務、個性化服務、意見反饋等服務功能,使平臺成為一個信息發現和獲取的服務平臺,為用戶提供一步到位的信息檢索與服務,為科教興桂發揮其應有的作用。
[參考文獻]
[1]張曉林.實現開放獲取,支撐科技創新:有關國家和機構支持科技期刊開放出版的政策與措施[J].中國科學院院刊,2013(3):378-385.
[2]李武,梁小建,楊琳.近五年來開放獲取運動的國際進展分析[J].科技與出版,2013(8):71-75.
[3]龔洪敏.基于云計算機環境的優質資源共享平臺的研究[D].西安:陜西師范大學,2013.
[4]解金蘭,王雅娟.基于新門戶建設的信息資源一站式檢索服務研究:以我國重點高校圖書館為例[J].情報理論與實踐,2013(8):62-65.
[5]王慶恒.基于一站式數字圖書館資源整合和服務集成系統的研究與實現[D].北京:北京郵電大學,2010.
[收稿日期]2014-04-01
[作者簡介]廖球(1971-),女,碩士,副研究館員,廣西科技大學圖書館。
[說明]本文系2013年CALIS廣西文獻信息服務中心預研項目“廣西機構自建數據庫建設及其共享模式研究”(項目編號:CALISGX201306)和2013年度廣西現代遠程教育研究中心公開研究課題“廣西高校圖書信息資源遠程共享研究”(批準號:2013ZXZD05)研究成果之一。