文/朱安柱方紅侯勝超陳燕青
華中科技大學
透視高校圖書館開源應用
文/朱安柱1方紅2侯勝超1陳燕青1
采用經過二次開發的開源軟件,既可掌握核心技術,又與應用需求貼切,后期維護成本低,對于提高圖書館的研發創新能力,降低相關費用,加強資源建設以及館際之間的合作具有很大的優勢,因此,越來越引起高校圖書館的重視。
華中科技大學在2009年花費近半年的時間,對開源軟件在國內部分高校數字圖書館中應用的情況進行了抽樣調查,以期了解現狀,找出問題,提出建議。
我們以清華大學、北京大學等國內24所高校圖書館為調查對象,由于其中一所高校圖書館填寫不規范,因此,共得到23份有效問卷。
問卷由四部分內容組成:圖書館的基本情況;關于開源軟件應用的一般情況,主要是關于開源軟件的應用領域和編寫語言以及獲取渠道等;對開源軟件應用的具體領域進行調查;關于構件開發應用情況的調查。為了能更全面地了解高校數字圖書館開源軟件的應用情況,在問卷的備選項中,我們設計3個以上的答案。
在24所高校中,985或211重點院校共17所,占總數的70.8%,普通院校有7所,占29.2%。重點院校在建設資金和技術力量上普遍具有優勢,是我國數字圖書館建設的重要力量;而普通院校情況往往可反映出高校圖書館對開源軟件的一般接納程度和發展現狀。因此,調查以重點院校為主要對象,以普通院校作為輔助參照,力圖全面了解開源軟件在數字圖書館建設中的應用情況。開源軟件使用情況見表1。
不同的高校數字圖書館使用開源軟件的情況是不同的,這與圖書館的規模、技術能力、提供的服務、對開源軟件的需求等密切相關。
人力財力投資空間有待加大
目前國內高校圖書館的技術研發人員數目大多數在5~10個之間,只有個別高校圖書館技術研發人員數目在10~20個之間,還有極少數高校圖書館的技術研發人員少于5個。
高校圖書館技術研發人員數目普遍較少,并且重點高校明顯要比普通高校多。這是因為重點高校與普通高校相比,擁有更多的文獻資源和優秀人才,因此重點高校圖書館也應該擁有更多的技術研發人員,才能開發出滿足高校圖書館需求的系統。
高校圖書館都在大力建設自己的數字圖書館。隨著互聯網的普及,高校圖書館日益認識到單純依靠傳統的紙質資料難以滿足用戶的需求,此時數字信息資源的豐富與多樣化能夠在一定程度上彌補紙質資源的不足,高校圖書館在這種形勢下逐步認識到數字信息資源的強大作用,每年都投入一定的資金用于數字化建設。

表1高校數字圖書館開源軟件的使用情況
開源軟件的應用統計
在我們的調查問卷中,由于只有17所高校數字圖書館使用開源軟件,因此我們的統計結果只涉及到這17所高校數字圖書館,并且主要針對開源軟件的應用領域和編寫語言這兩個方面。
1. 應用領域集中于三方面
不同高校圖書館對于開源軟件需求的不同,加上技術研發人員所熟悉的應用領域的差異性,使得開源軟件在不同高校圖書館應用的領域會有差異,我們這次調查統計結果見圖1。

圖1 開源軟件在高校圖書館的應用領域
由圖1可見,這些高校大多數都應用操作系統、數據庫、Web服務、開發工具以及應用軟件,但是主要應用領域還是集中在操作系統、數據庫和Web服務這三個方面。
我們從如下方面對17所高校數字圖書館開源軟件具體應用領域的調查結果進行統計:操作系統、Web服務器、數據庫、存儲系統、集成門戶應用、統一檢索、系統架構技術、內容管理系統(CMS)、單點登錄系統、聯機公共目錄查詢系統(OPAC)、虛擬參考咨詢、個性化門戶、RSS聚合軟件、Wiki服務、博客系統和網絡書簽等。在此為了維護調查對象的權利,用英文字母代表這17所高校,詳情見表2和表3。


根據表2和表3并結合我們的調查可知,應用最廣泛的領域的是Linux操作系統、Apache網絡服務器、MySQL數據庫,同時DSpace存儲系統、Z39.50統一檢索、Strut系統架構也得到較為廣泛的應用,其他應用領域則只有少數重點高校在使用。
隨著海量數據的增加以及互聯網的普及,數字資源的管理靠傳統的人工管理和文件系統管理障礙重重,此時數據庫管理系統以其能保證數據的完整性、安全性,以及在多用戶同時使用數據庫時進行并發控制,發生故障時對系統進行修復等優點得到了廣泛的應用。
2. 多種編寫語言供選擇
高校圖書館使用的開源軟件的差異性,不同的開源軟件進行二次開發時所需開發語言環境的不同,以及技術研發人員對不同編寫語言掌握的熟練程度的不同,使得他們對開源軟件進行二次開發時所使用的編寫語言會有差異。在這里由于有一所高校沒有填寫該項,因此統計結果只涉及16所使用開源軟件的高校圖書館,具體統計結果見圖2。可見,編寫語言以主流語言Java應用最廣,同時JSP、PHP 、ASP也得到了較多的使用。這是由數字圖書館對Web應用的需求決定的,數字圖書館信息資源的分布式特性決定了它在軟件或工具應用上必然追求更多更好的Web服務。而JSP、PHP、 ASP作為Web服務而興起的開發語言,其在Web應用上的天然優勢也勢必影響著數字圖書館開源軟件在編程語言上的選擇。
構件開發用于三個領域
所謂構件,即規范化或標準化了的類對象或類對象組,能獨立運行,并能提供某種功能,它是通用的,可以支持不同的應用程序,可以像硬件領域中的硬構件一樣,直接插入到不同的環境或不同的平臺上運行。構件開發以其復用性強,結構層次清晰,模塊接口規范,易于功能封裝與擴充,提高了軟件開發質量,增強了軟件的可移植性、可靠性和可維護性等優點在軟件開發中得到廣泛的應用。本部分的調查結果主要是針對構件開發的使用領域,見圖3。
圖3表明,在構件開發過程中,應用構件開發較多的領域為:Web服務、中間件和應用軟件。
目前,許多高校圖書館已經在使用或者嘗試使用構件技術,并且主要的應用領域也是目前應用較多的主流領域,如Web服務、中間件和應用軟件等。構件的編寫語言和開源軟件使用的編寫語言類似,并且獲取方式和開源軟件差異不大,即都是從Internet或者一些非營利性組織中獲取,僅個別高校圖書館有自己開發的構件以及自己的構件庫。在構件開發方面,國內高校數字圖書館還有待進一步研究,充分利用構件開發的優點,開發易于組裝、通用、可靠的構件,不斷深化對構件技術的掌握。
由于開源軟件具有免費下載、質量好、技術先進、應用廣泛、使用安全等特點,現已被許多行業認識和接受。尤其是經過二次開發的開源軟件,既可掌握核心技術,又與應用需求貼切,后期維護成本低,對于提高圖書館的研發創新能力,降低相關費用,加強資源建設以及館際之間的合作具有很大的優勢,因此,越來越引起高校圖書館的重視。

圖2 不同編寫語言的比例

圖3 構件開發的應用領域
開源軟件的獲取途徑主要是Internet(部分高校還從IT企業或非營利性組織中獲取,僅有個別高校有自己獨立開發的開源軟件),這很大程度上是由于缺乏技術支持。因此這些高校基本上都愿意為這些服務(幫助查找文檔、技術支持、文檔和培訓)提供一定的預算。在網絡安全措施上,也以防火墻、殺毒軟件、入侵檢測以及訪問策略為主,其中防火墻技術是應用最多的。
目前,開源的LAMP在一起組成了一個強大的Web應用程序平臺,并在高校圖書館中應用廣泛,尤其是很多高校圖書館的網站就是建立在它的基礎上的。知識倉儲,數字對象長期保存的數字圖書館專用軟件在國內主要采用目前比較流行的開源軟件DSpace和Fedora。根據我們的調查,在集成門戶應用上,國內只有極少數的重點高校圖書館使用了這個服務。而且對于圖書館集成系統ILS,在我們調查的這些高校中都沒有應用,這說明目前在國內ILS使用的還是以商業軟件為主,開源軟件在圖書館中使用得較少。
由于數字資源建設的不同步以及采用技術的不同,各種數字資源都有各自的數據結構、組織方式、查詢方式以及顯示界面,為了滿足不同用戶的需求以及減少檢索時間,很多高校圖書館采用了統一檢索系統,且以Z39.50和Lucene為主。系統架構技術,也只是部分重點院校在使用,且以Strut、Hibernate和Spring 為主,這很大程度上取決于高校圖書館的技術水平。
在數字圖書館門戶網站建設中只有一些重點高校使用了CMS,且以Drupal、Joomla、Plone為主,其中Plone是一個專業的內容管理系統,適合用作搭建對外網站、內部網系統、文檔發布、協同群件系統等。單點登錄指只需認證一次,用戶就可以訪問所有具有訪問權限的服務,它的使用可以減輕用戶登錄系統的時間開銷、使用頻繁等負擔,目前只有個別重點高校在使用。OPAC、虛擬參考咨詢、個性化門戶也只是在部分重點高校圖書館中應用,并且個性化服務中主要以MyLibrary的應用居多。隨著Web2.0技術在數字圖書館中越來越廣泛的應用, RSS聚合、Wiki服務、博客系統和網絡書簽等也開始在部分高校圖書館中應用。
需求是導向
開源軟件的發展必須是先有明確的目的,再探尋可用的技術,而不是先找技術,再決定做什么。在需求不明確的情況下,很容易造成開源軟件選擇的盲目性,給圖書館帶來不必要的損失。只有需求明確,才能知道自己要選擇哪一種開源軟件進行二次開發,以適合本館的需求,使用哪一種開發工具,使得開發效率更高,需求更明確。
領導重視是關鍵
沒有領導的重視,是不可能開展好這項工作的。任何一個項目都需要相關領導的重視,沒有領導的重視,工作過程中會遇到很多障礙,如資金不到位、開發人員工作積極性不高等。從本質上說,開源軟件的二次開發還是軟件開發,這是圖書館過去不曾關注和不太熟悉的。主管領導對開源應用和開發的支持,為軟件開發人員提供良好的工作氛圍至關重要。因此,領導重視和支持是開源軟件應用過程中的關鍵要素。
隊伍建設是基礎
技術隊伍的建設是應用開源的基礎。開源軟件大多只是提供一個基礎的技術平臺,本地化后如果直接將開源軟件引入而不進行二次開發,在短期內可能會給圖書館帶來效益,但是這種做法并不能形成圖書館開源軟件發展的核心競爭力,同時也很難滿足不同圖書館的需求。因此,不論是直接引入,還是根據圖書館自己的需求進行二次開發的開源軟件都要求具備一定水平的技術隊伍對其進行管理和維護。
加大投入是保證
開源軟件也需要投入,包括人力資源,經費的投入。由于開源軟件的權利人放棄了獲得報酬權,使圖書館可以免費或以極低的價格獲得軟件。但是和商業軟件相比,因其沒有專門的軟件公司提供后續服務,從而對圖書館的管理能力和技術支持提出了更高的要求。這使得在后續的軟件管理、培訓和維護等方面需要有專業的技術人員、專門的經費預算來保證。
根據調查統計結果,可以發現當前很多高校數字圖書館都在使用開源軟件,這在很大程度上與使用開源軟件的優點有關。同時我們使用的開源軟件大多數都是通過Internet或者從一些非營利組織中購買獲取的國外開源軟件,并在此基礎上進行漢化或者二次開發,幾乎沒有自己獨立開發的開源軟件,這是因為缺乏技術人才,所以在這方面我們還要加倍努力。
此外高校數字圖書館在使用開源軟件后的深刻感受就是節約成本,提高效率,提高了標準化程度,增加了靈活性以及在平臺上有多種選擇等。而那些沒有應用開源軟件或者在使用中存在的問題一般為質量不可靠、與其他軟件不兼容、知識產權問題、沒有技術支持、缺乏開發人員等。
在數字圖書館建設中,重點高校無論是在資金,還是技術上明顯比普通具有優勢。為了能夠使開源軟件在國內高校以及其他機構的圖書館中普及,我們應該采取建立開源軟件的合作開發與應用機制,重視開源軟件的評估以及宣傳和培訓等措施,讓開源軟件真正為我所用。
(作者單位:1為華中科技大學醫藥衛生管理學院,2為華中科技大學圖書館)