□陳 琳
機構知識庫(Institutional Repository,簡稱IR)是在開放獲取環境下產生的一種以學術機構為軸心的數字資源集合[1]。它集中了一個大學或研究機構創造的所有智力成果,包括了期刊論文、論文預印本、技術報告、科研進展報告、碩博士論文、圖書或其章節、科研數據庫、會議錄、教學資料或課件、計算機軟件和其他灰色文獻等等[2],并通過網絡平臺達到全文檢索和利用的目的。
自2002年11月麻省理工學院圖書館和惠普實驗室共同開發的DSpace軟件正式面世以來,機構知識庫在世界范圍內發展迅速,并朝著全球知識共享的目標邁進。截至2009年11月18日,被開放存取知識庫名錄(The Direct of Open Access Repositories,簡稱DOAR)收錄的知識庫已超過1500個[3],其中超過80%的機構知識庫將所有資源向網絡用戶開放。
從國內外機構知識庫建設的實踐來看,技術已不再是關鍵問題,相關的政策和相應的支撐機制乃是機構知識庫得以持續、健康發展的根本。本文擬結合相關案例,探討機構知識庫建設的相關機制,以期對我國機構知識庫建設有所裨益。
構建機構知識庫涉及權益交錯、經費長期投入等諸多問題,需要從戰略的高度來認識它。對于一個機構來說,實現對機構知識資產的管理只是機構庫建設發展的基本目標,建立長期的知識管理、傳播和服務利用機制,支持和服務于機構知識創新過程和目標的實現,乃是機構知識庫長期的責任和建設的意義所在。因此,應將機構知識庫建設提升到保存知識資產、發展知識能力、構建知識環境的戰略任務的高度,并將其納入機構的整體建設、管理和發展戰略之中,以機構知識庫白皮書或管理應用指南等方式明確確認[4]。
機構知識庫的發展若能獲得政府或高層次組織的支持,可以使機構庫的發展更有效率且發揮最大效益。以臺灣地區為例,其機構知識庫的建設就得益于當局的戰略決策。在2005年,臺灣“教育部”委托臺灣大學圖書館制訂“建置《臺灣學術研究資源中心》運作架構、機制與執行策略計劃”。該計劃經“教育部”評估后,認為建置“臺灣機構典藏(Taiw an A cademic Institutional Repository,簡稱 TAIR)”為當局刻不容緩之重要工作。于是在政府的牽頭下,2006年6月開始,臺灣大學圖書館開始執行《建置機構學術成果典藏計劃》,并以其為機構典藏的營運范例,開發機構典藏軟件和完備的相關行政工作流程文件與標準規范,作為全臺灣各高等院校建置機構庫的參考[5]。政府的戰略決策極大地促進了臺灣地區機構知識庫的發展,且分散建置、集中呈現的發展模式不僅保持了各自的主體性,發揮出機構自身的研究特色與研究能力,又在使用上集中統一呈現臺灣的學術研究成果,方便利用。TAIR計劃已經吸引了 94所高等院校的參與,總記錄條目達到439918筆[6]。
機構庫建設涉及圖書館、各學院系所、科研處、教務處、網絡中心等諸多部門,需要一個很好的合作團隊。從國內外機構知識庫創建的主體來看,大多數機構知識庫都是由圖書館負責建立的,圖書館在機構知識庫創建的各個階段都充當著宣傳、規劃及協調管理的角色。
圖書館應主動宣傳機構知識庫的意義與作用,號召更多的科研人員響應、加入機構知識庫的建設,促進知識資源的共建共享。可以利用學科館員與各院系之間建立的經常性聯系,把握各種機會及途徑加以宣傳,使研究人員對機構知識庫取得認同并積極提交知識內容;在系統的選擇和維護管理上,圖書館要與網絡中心合作,討論編寫資料庫的框架規劃及系統功能需求書、實施和維護機構知識庫的成本、經費、硬件等諸多細節問題;圖書館還應該和教務處、科技處等部門密切配合,掌握著教師各類課題項目申請、完成狀況以及研究成果的信息。
機構知識庫政策是機構基于擴大對研究資源存取能力及改革學術傳播體系的需要,對研究成果進行收集、保存、維護以及提供使用所制定的原則和標準規范[7]。政策的制定是一件復雜且需要持續進行的工作,它決定了機構庫建設的質量、發展方向和可持續發展。每個機構的獨特性使得知識庫政策也是個性化的,是為每個機構量身定做、滿足每個機構需求的。通常情況下,政策框架應涵蓋內容存繳政策和知識產權保護政策。
2.3.1 內容存繳政策
機構庫中收錄哪些文獻類型,圖書、期刊論文、會議論文、學位論文、研究報告、手稿等各類型資料的收集原則、提交方式,是否收錄多媒體資料等都應在存繳政策中加以規定 。若在內容的存繳上缺乏相關政策,基于無任何約束力的作者的自愿和自覺方式進行,不僅內容的提交率和科研人員認同率不高,建設的效率和效果往往不佳,進而會影響到知識庫的推廣和應用。
一般來說,機構庫知識的內容以學術性及研究性作品為主,一般需要存檔的是論文預印本、已發表論文、技術報告、科研進展報告、碩博士論文、圖書或其章節、科研數據庫、會議錄、教學資料或課件、計算機軟件、其他灰色文獻等,而行政記錄、與機構的歷史和活動有關的一些資料等則可以存儲在機構的檔案館[8]。
各個機構的內容存繳政策不一。比如,香港科技大學機構典藏政策確定其收集范圍為全校教職員工、博士生和研究助理的許可研究成果,包括期刊論文、數據集、圖書章節、會議論文、學位論文、研究和技術報告、專利、預印本、會議講演稿和工作論文等,不包括通俗讀物和報紙文章;香港理工大學包玉剛圖書館的機構知識庫的收藏范圍包括全校研究人員、攻讀學位學生的許可研究成果,除期刊論文、技術報告、工作論文、會議論文、演示稿、預印本、圖書、圖書章節、專利、學位論文以外,還包括圖、素描圖、視頻和數據集等。
在機構庫建設發展的初期,為了吸引科研人員向知識庫提交內容,在決策層和管理層的支持下,制定出強制性自存繳政策,是內容存繳政策的重中之重,將為內容采集和持續建設提供強有力的政策保障[9]。比如,丹麥要求大學將其科學出版物都提交到“國家科研數據庫”中,英國Well Trust基金會要求凡是自2006年10月1日起接受基金會資助的研究者,必須將資助的研究成果存儲在PubMed Central或 UK PubMed Central中[10]。從美國、英國等已經建成的機構庫的內容來看,機構知識庫中博士論文、博士研究的原始數據文件以及碩士論文的收藏量都比較大,正是得益于大學對這些內容強制提交的要求。我國的大多數高校也要求學生在畢業離校時必須提交學位論文電子版加以保存,這些強制性的存繳政策實踐證明是一種快速收集資源的好方法。
2.3.2 知識產權保護政策
機構知識庫收集機構成員投稿于商業性或非營利機構出版的文獻,進行典藏時,除需取得作者授權外,還必須獲得出版社同意,故要實現全文開放存取,首先面臨的是著作權問題。從香港和臺灣地區高校機構知識庫的內容看,全文的比例總體還不高。
已發表的學術論文涉及自我典藏權利(self-archiving right)、全文索引權利(full-text indexing right)和全文取用權利(access right)。學術論文發表后,雖然作者將文章的多數權利出讓給了出版社,但作者和作者所在單位仍擁有自我典藏的權利,可對文章做全文索引;如果文章的權利已由作者讓渡給出版社,則出版社擁有論文的取用權利,機構知識庫可以主動鏈接到擁有該篇文章取用權利的出版社資料庫網頁上,讓使用者付費購買,下載全文[11]。
據調查,愈來愈多的期刊或出版社認可作者以開放存取的方式做自我典藏,其中期刊允許自我典藏的比例從2003年的55%、2004年的83%提高到最近的94.88%;出版社允許自我典藏的比例也從2003年的42%、2004年的58%提高到最近的62.9%[12,13]。盡管如此,目前仍有5.12%的期刊和37.1%的出版社不允許自我典藏。因此,為了妥善保護機構和作者的合法利益,應建立明確的知識產權保護政策,出臺鼓勵出版商在著作權方面允許作者擁有更多權利的政策。
在版權制度的合法框架下,“開放內容許可證”(open content licenses)應運而生,這種新方法簡而言之就是作者為自己的作品選擇一種許可證一起發布,這些許可證本身都是開放式協議,即它只明文禁止使用者不能做的事,除此以外,可以隨意使用這些作品。美國C reative Commons基金會,在2002年12月16日提出的創作共享許可證(Creative Comm ons licenses,簡稱CC)就是這樣一種許可證。
CC許可保留作者的著作權,同時在滿足一定許可條件的情況下,允許第三方因為研究與學習目的而復制、散發、公開展示或表演作品、將作品完全一致地轉化成另一種格式。第三方在超出“一定許可條件”下使用作品,仍需專門申請著作權人的許可。雖然使用者免費擁有了這些權利,但是必須遵守一些許可證設置的前提條件,諸如沒有得到許可,不得實施許可證中禁止的行為;所有的復制件上,都必須保留原始的版權說明和許可證的鏈接;不得更改許可證的內容;不得用技術手段限制其他人合法使用作品[14]。創作共享版權許可(CC許可)在保障機構成員著作權權益的同時促進了知識的廣泛傳播,故應積極推行它。
在開放存取和知識產權保護政策上,不少國家的做法值得借鑒。在美國,美國國會通過了“公共獲取科學法案”(FRPAA)的立法提案,支持對公共資金資助的科學研究成果的開放存取;美國國家衛生研究院(NIH)的開放存取政策要求研究人員在論文公開發表6個月后,將論文提交給N IH的PubMed-Central,然后免費提供公眾使用。美國國家自然科學基金會的開放存取政策提倡“期待并鼓勵研究成果的發表,共享數據和各種在工作中形成的材料。研究人員擁有其作品的知識產權,并容許他們擁有版權或專利。”[15]在荷蘭的“科學奶酪”項目中,關于平衡作者和出版商的版權問題就有很好的規定:一方面,出版商對涉及文獻商業行為的版權具有唯一許可權;另一方面,作者擁有涉及文獻學術用途的許可權。無論是預印本,還是已出版發行的文獻,都要保證作者最后出版的版本在6個月后存檔于知識庫[16]。從個體層面看,一些大學的特殊政策也頗具特色,如美國馬里蘭大學“允許教授提交到校工作前完成的著作,但須加注,并由已有現成設備的單位,負責提供數字化掃描服務”;荷蘭開放大學鼓勵在文獻引用時,引注鏈接到原出版社;美國楊百翰大學與英國牛津大學“因后來正式出版而刪除的預印本,會在資料保存永久記錄中標注,并鏈接至新的書目資料”等[17]。
機構知識庫要持久、健康地運作,還應建立支持機構成員方便進行存繳和傳播的管理服務機制。
向知識庫系統中提交資源通常需要按照規定的程序,了解和操作這些程序往往需要花費一定的精力和時間,繁瑣的提交過程會使研究人員不愿意來做這些事情。所以,提交程序的設計應簡便、易操作。在機構知識庫建設的初期,還可以采取集中式的資源收集方式,即建立協助提交機制,由圖書館指定專人幫助研究人員完成資料的提交,包括資料的整理、格式的轉換、提交程序的完成等。這樣不僅可以減輕研究人員的負擔,還可以由圖書館統一管理機構知識庫,對作者提交到機構知識庫的作品是否符合該機構服務對象的需求,是否屬于所要存檔的文獻類型,是否有版權許可,是否符合一定的格式,作品的元數據是否符合一定標準等內容進行審核,保證機構知識庫建設的質量。
機構知識庫應具有基本服務功能和擴展服務功能。基本服務功能是基于元數據加工和內容提交、內容組織、信息瀏覽、檢索等數字化學術信息的收集、集中管理、長期保存和提供使用的一般性功能;擴展服務功能則是基于訂閱、推薦、評注、標記、關聯瀏覽與檢索等一些滿足個性化服務需求的衍生功能。不同的機構知識庫可以根據其建設和服務目標定位的不同,提供和支持不同的服務功能組合。對于提交到知識庫的研究成果,應盡量賦予其更多的擴展服務功能,如可以自動維護個人著作目錄、能夠自動將成果散播到全國的機構知識庫系統中,將機構知識庫的內容提供給google等搜索引擎,以增加能見度等[18]。
機構知識庫的優勢已經越來越得到學術界的認可,以自我典藏方式存放在機構知識庫中的論文,用戶容易獲得,故被引用的機會較大。調查表明,Astrophysica l Journa l上72%可免費獲取的論文(主要存放在A rXiv中),其篇均被引用次數為剩余28%的論文的2倍[19]。所以,為了讓研究人員切實感受到機構知識庫帶來的利益,可以提供利用率、被引率的推送服務,可以將研究人員所提交的科研成果的瀏覽量、下載量、被引率等信息,及時通過電子郵件或其他途徑傳遞給他們。像日本北海道大學等大學定期把文獻的下載數量通知給文獻提供者,讓著者了解自己提供的文獻在什么時候、多大程度上被利用,同時將讀者對論文的評價、感想等反饋到著者,促進著者與讀者之間的學術交流,活躍學術氛圍[20]。
研究人員向機構知識庫提交研究成果的意愿,關系到機構知識庫的成敗和可持續發展。由于人們對機構知識庫的認識程度不高,缺乏主動提交的意愿,加之提交到機構知識庫中的未發表的論著,目前在學術認可和科研待遇上尚未得到應有的支持,更沒有被納入職稱評審可報送材料體系中,致使資源提交率仍然徘徊在較低的水平,為此,制定一些與學術評價相結合的激勵機制十分必要。如可以通過爭取組織內部甚至國家政策的支持,制定出與學術評價機制相結合的激勵政策,將機構知識庫中的資源納入科研考核評價體系和職稱評價體系。國外的一些做法值得我們借鑒:例如,比利時采取的一項激勵措施,是為作者提供建立和維護個人出版物目錄的服務;在荷蘭,則為作者所存入的成果提供一個到皇家圖書館E-Depot的鏈接,在“科學奶酪”項目中建立的國家級的機構知識庫,里面盡可能多地收錄了數百位國家學術帶頭人公開發表的成果,為機構知識庫帶來了聲望和地位,從而激勵作者提交他們的作品[21];美國加州大學機構知識庫網站建立的欄目“下載最多的記錄”(Top dow n loads);加拿大多倫多大學機構知識庫網站上發布的“瀏覽量列表”(Item s viewed)[22]等,可以讓作者了解自己成果的社會反響,切實感受到機構知識庫為其帶來的直接利益,這些舉措無疑對研究人員有激勵作用。
采用開源軟件已成為機構知識庫應用平臺建設的主流,應通過對 DSpace、EPrints、Fedora等開源軟件的功能特點及適用范圍的比較分析,選擇適合本機構建設目標的軟件系統并進行必要的定制和擴展開發。以臺灣地區為例,臺灣高校機構知識庫統一采用DSpace,并由臺灣大學對其進行二次開發,完成了對DSpace的漢化和定制,向全臺灣院校提供全套的技術支持,包括系統軟件的下載、補丁程序、安裝手冊(W indow s版和 Linux版)、定制化手冊(文字與圖片的修改)、備份說明等,使得軟件界面可在英文、正體中文(即繁體中文)和簡體中文之間切換,用戶使用起來十分方便[23]。與此同時,技術平臺不僅應建立開放的元數據收割接口,還應建立與開放資源集成揭示系統(例如OpenDOAR)的開放統計與檢索接口,與學術出版、教育信息、科研數據、科學普及等系統的開放輸入輸出接口,與文獻信息服務系統的開放服務接口。
1 徐速.機構知識庫.圖書館理論與實踐,2008(1):39-41
2 趙繼海.機構知識庫:數字圖書館發展的新領域.中國圖書館學報,2006(2):33-50
3 Abou t OpenDOAR[2009-11-18].h ttp://www.opendoar.org/about.htm l
4 張曉林.機構知識庫的政策、功能和支撐機制分析.圖書情報工作,2009(1):23-19
5 關于 NTUR.[2009-11-18].h ttp://ntu r.lib.n tu.edu.tw/about/index.jsp.
6 臺灣學術機構典藏.[2009-11-18].http://tair.org.tw/
7 王學勤.機構知識庫建設相關政策研究.中國圖書館學報,2007(3):44-47
8 洪梅,馬建霞.機構知識庫建設機制初探.情報雜志,2007(8):37-39
9 陳淑珍,韓珂,祝忠明.我國大學機構知識庫建設的模式選擇與實施策略.圖書館雜志,2009(8):52-77
10 賴輝榮.破解機構知識庫建設中資源收集難題之策略.國家圖書館學刊,2009(3):59-61
11 項潔,洪筱盈.臺灣機構典藏發展芻議.教育資料與圖書館館學(臺灣),2005(12):173-189[2009-11-18].http://joem ls.dils.tku.edu.tw/fulltext/43/43-2/173-190.pdf
12 Stevan Harnad,Tim B rody.Com paring the Impact of Open Access(OA)vs.Non-OA A rtic les in the Same Journals.D-Lib Magazine,2004,10(6).[2009-4-11].h ttp://www.dlib.org/dlib/june04/harnad/06harnad.htm l.
13 Jou rnal Policies-Summary Statistics So Far.[2009-04-11].h ttp://romeo.ep rin ts.org/stats.php.
14 阮一峰.談談創作公用許可證.[2009-11-18].http://www.kuqin.com/law/20080425/7658.htm l
15 何林.美國機構知識庫發展現狀對我國發展機構知識庫的啟示.圖書館論壇,2008(3):101-148
16 同8
17 同7
18 同11
19 David C.Prosser.The Next Information Revolu tion:H ow Open Access w ill Transform Scholarly Communications.[2009-11-18].http://ep rints.rclis.org/archive/00003917/02/IYLIM_chapter.pdf
20 朱蓮花,劉春燕.日本機構知識庫的構建現狀研究.情報理論與實踐,2009(8):125-128
21 同8
22 宛玲,蘇娜,厲志紅.大學機構知識庫組織管理問題研究.圖書情報工作,2008(4):97-99
23 機構典藏計劃網站.[2009-11-18].http://ir.org.tw/