□姚曉霞
教育部高等學校圖書情報工作指導委員會(以下簡稱“教育部高校圖工委”)從1999年開始收集高校圖書館統計數據;2004年開始利用高校圖書館事實數據庫系統(以下簡稱“事實數據庫)收集圖書館的基礎設施、資源、服務等情況;2006年開始對系統收集的數據進行統計分析并發布高校圖書館發展報告。事實數據庫比較完整地記錄了高校圖書館事業近十年來的的發展情況,有助于了解高校圖書館的發展歷程、成就與不足。
2010年12月3日,教育部高校圖工委秘書處召集專家,結合以往統計中出現的問題和高校圖書館發展的實際情況,對事實數據庫的統計項目作出修訂,調整層次結構,增刪某些項目,明確項目定義,細化填報細則,并針對高職高專、普通高校、入選“985計劃”和“211工程”的高校的圖書館,分別推出精簡版、基本版、擴展版[1]。新的統計項目于2010年底發給各省、自治區、直轄市高校圖工委秘書處和全體圖工委委員征求意見,并根據匯總意見再次作了修訂。
隨著統計項目的調整和變化,原有的事實數據庫在功能和性能上都已經不能滿足高校圖書館統計工作的實際需要。為此,教育部高校圖工委委托中國高等教育文獻保障系統(CALIS)開發新版系統,以推進和提升高校圖書館的統計工作。CALIS從2011年初開始新版系統的設計和開發工作,歷時5個月完成開發。新版事實數據庫系統于2011年5月3日正式上線運行,網址是http://www.tgw.cn:18080/。新系統在易用性、個性化方面有較大改進,擴大了各省圖工委秘書處的管理權限,如可以自行增刪本省高校圖書館用戶,自行添加符合本省需要的統計項目等等。為保持系統的延續性,圖書館代碼等信息未作改變。新版系統能自動識別高校圖書館的身份,并給出推薦填報的相應統計項目。圖書館既可以參照系統填寫相應版本的統計報表,也可以就高填報其他版本,但不能就低填報別的版本。
新版事實數據庫的指標體系秉承CALIS云服務的理念,采用軟件即服務(SaaS)的共享服務模式設計。根據使用系統的三類用戶類型(教育部高校圖工委、省高校圖工委和圖書館用戶),將該系統設計成三級架構方式:教育部高校圖工委擁有最高權限,可以制定并修改全國范圍內高校圖書館適用的統計指標,并可以把指標同步到省高校圖工委和圖書館用戶層面。省高校圖工委的權限次之,可以制定并修改本省的統計指標并同步到本省所轄圖書館和用戶層面。圖書館用戶在利用教育部高校圖工委和本省高校圖工委的統計指標開展統計工作的同時,可以針對本館的情況,利用該系統制定自己的統計指標。三個層面的統計指標各成體系,相對獨立,同時相互呼應。成員館在填寫統計指標時,既可以照顧到教育部高校圖工委、省高校圖工委和成員館三個層面,也避免了成員館指標的重復建設和統計,形成一個自上而下、靈活的指標體系。
圖1給出了事實數據庫的基本設計思路。從圖中可以看出,數據庫分為三類用戶,其中成員館用戶又根據身份(包括高職高專、普通高校、入選“985計劃”和“211工程”的高校)的不同,填寫的統計報表有精簡版、基本版和擴展版三個版本。所以事實數據庫對權限的要求比較高,各項功能要做到既對用戶透明,又能有序控制。
考慮到成員館每年產生大量基礎數據和統計數據,并在一定時期集中上報,事實數據庫在設計時具備在線大數據量查詢和統計功能,以保證業務查詢和統計效率,保障和滿足全國大吞吐量數據的需求。
針對數據填報過程中不可避免的問題,系統提供自動計算、糾錯及輸入校驗功能。輸入校驗保證用戶輸入的正確性,同時對非法和破壞性的輸入有很強的容錯能力。當用戶進行正常的數據輸入時,系統對數據要做有效性檢查和完整性檢驗,保證其正確性;對于用戶錯誤的輸入,不但拒絕接受,而且給出明確的錯誤提示,供操作者改正;如果用戶輸入非法的和對系統具有破壞性的數據,系統能夠加以識別,并做出相應的處理,避免造成系統的死機和癱瘓。
事實數據庫保存的是高校圖書館每年的基本信息和業務統計數據,對數據的安全級別要求非常高。為此,系統設置了三級安全控制,即:網絡安全級、處理安全級和用戶安全級。系統對用戶的驗證采用網絡登錄、數據庫登錄、應用系統使用三種驗證方式。為保證采集和處理數據的安全,系統采用了重要原始數據網絡加密傳輸、數據庫加密傳輸或應用系統數據加密相結合的技術。

圖1 事實數據庫設計思路
事實數據庫的主要功能有通知通告發布、用戶管理、信息管理、統計分析和系統設置等。由于該系統是根據用戶的不同身份來劃分權限的,為了清楚地描述系統的功能,表1按圖書館用戶、省高校圖工委、教育部高校圖工委三種角色對系統功能進行說明。

表1 事實數據庫系統功能
對于圖書館用戶來說,最重要的是數據填報工作??紤]到高職高專、普通高校、入選“985計劃”和“211工程”高校圖書館的統計指標不同,系統在登錄時就對學校的情況進行判斷,對各類學校進行個性化設置,提供不同的入口,使界面簡潔明晰,提高了填報質量的可控性。考慮到統計項目非常多,在一個頁面顯示和填寫數據容易出錯,系統將統計項目拆分成若干小項,用戶可隨時填報隨時保存,所有信息填寫完畢并確認無誤后,才最終提交。
對省高校圖工委用戶來說,最重要的是本省用戶的管理和個性化填報項。比如管理本省圖書館用戶信息的添加、刪除,審核本省圖書館的用戶信息,其中涉及到并館、改名等多項操作。
對教育部高校圖工委來說,最重要的是統計匯總和數據分析,生成全國范圍的各類報表/排行榜,開展跨年度數據比較和館際數據分析等,同時需要維護數據字典等系統數據。
以上三類用戶都可以利用指標體系管理的功能來構架權限范圍內的統計指標。教育部高校圖工委可以創建和修訂全國高校圖書館普適的統計指標;省高校圖工委首先要采用教育部高校圖工委公布的統計指標,在此基礎上可以創建和修訂本省高校圖書館個性化的統計指標;成員館首先需要采用以上用戶創建和修訂的統計指標,然后添加本館個性化的統計指標。這樣就需要保證三類用戶的統計指標分別下達到用戶相應的權限范圍內。
從2011年投入使用到2012年底,新系統的圖書館用戶數達到1828個,省高校圖工委用戶數為34個。目前該數據庫已包含了高校圖書館2010年和2011年的統計數據,正在收集2012年的統計數據。教育部高校圖工委已經利用新版系統搜集的統計數據,對2010年和2011年的圖書館發展情況進行了分析,發布了高校圖書館工作人員總數、館舍總面積、在建館舍設計建筑面積、文獻資源購置費、紙質資源購置費、電子資源購置費、存儲總容量、主干網帶寬等多項排行榜。此外還發布了2010年和2011年高校圖書館發展報告,引起高校圖書館界廣泛的關注和重視。
教育部高校圖工委成立了專門的文獻資源工作小組,利用新版事實數據庫,對“211工程”院校圖書館的資源發展情況進行了深入研究和分析,發布了資源發展狀況區域對比報告。
教育部高校圖工委還可以根據需要,利用數據庫搜集到的統計數據開展館際數據的比較,生成各類對比分析圖表。例如,圖2給出了幾所學校讀者總數、年度經費、文獻資源累積量、書刊外借量和電子資源下載量的對比分析結果。這些圖表和數據都是系統自動生成的,圖書館可以利用此功能開展和目標院校的資源、服務、館舍等各項統計數據的對比分析,為本館下一步的發展方向提供一定的借鑒和依據。
目前利用事實數據庫填報2010和2011統計數據的高校圖書館只有近600所,不到圖書館用戶數的1/3;另外省高校圖工委對創建本省統計指標的功能也沒有充分利用。鑒于此,圖書館對事實數據庫的利用還有很大的空間,其應用還需要加大推廣和宣傳力度。

圖2 六家圖書館部分統計數據的對比分析結果
對于事實數據庫的應用前景,主要有以下三點考慮:
第一,收集和保存圖書館資源、服務、基礎設施等方面的定性和定量數據,記錄圖書館的建設和服務現狀,記載圖書館的歷史信息。教育部高校圖工委和省高校圖工委可以利用該數據庫發布各類統計數據的排行榜,撰寫全國和省內高校圖書館的年度報告。這是新版事實數據庫已經實現的系統應用。
第二,為圖書館的高效管理提供依據。2010年國際圖聯發布了《圖書館統計宣言》[2],該宣言指出“圖書館統計對于圖書館的高效管理是必要的,對于不同類型的利益相關者促進圖書館服務尤為重要”。事實數據庫可以擔當這樣的重任,將統計數據呈獻給政策制定機構、圖書館出資機構、已有的和潛在的圖書館用戶,展現圖書館的社會價值,為圖書館的未來發展提供思路。
第三,用戶和同行之間的對比和分析。對此《圖書館統計宣言》也有明確的要求:“國家級以及由此產生的國際級圖書館統計的質量,既取決于每一個圖書館正確、及時地遞交統計數據,又取決于精心地編輯以糾正錯誤和誤解。為了使統計結果能夠在地區間或國家之間進行比較,必須對統計項目采用相同的定義和方法?!笔聦崝祿鞂⒃谖覈咝D書館對統計項目采用相同的定義和方法方面起到決定性的作用,為全國及世界范圍內各種類型的圖書館之間的比較分析、合作交流提供依據和參考。
1 高校事實數據庫系統.[2013-05-01].http://www.tgw.cn:18080
2 國際圖聯“圖書館統計宣言”.[2013-07-31].http://www.ifla.org/files/assets/statistics-and-evaluation/publications/library-statistics-manifesto-zh.pdf