張惠君,張西亞
(西安交通大學,710049)
關于“教育部高校圖書館事實數據庫”統計難點的探討
張惠君,張西亞
(西安交通大學,710049)
對“教育部高校圖書館事實數據庫”有關統計工作的難點進行歸納,分析了問題發生的原因,認為嚴謹的指標體系、詳盡的填報說明是做好圖書館統計工作的保障,并提出改進和做好這一統計工作的建議。
高校圖書館;圖書館統計工作;事實數據庫
統計工作是圖書館管理工作的重要組成部分,它的基本任務是要真實、準確地提供可靠的圖書館統計資料,為各級主管部門制定政策和計劃、宏觀調控高校圖書館工作提供依據,也為圖書館改進工作、提升服務提供可靠的反饋信息。[1]
科學、實用的統計指標體系是統計工作的藍本,而教育部高等學校圖書情報工作指導委員會(以下簡稱“教育部圖工委”)則是我國高校圖書館統計標準的制定者和推行者。目前我國高校圖書館使用的,正是全國高校圖工委于2005年面向全國普通高校圖書館推出的高校圖書館事實數據統計軟件,即《教育部高校圖書館事實數據庫系統》(以下簡稱“事實數據庫”)。
從1985年的《高等院校圖書館調查表》,到1991年的《普通高校圖書館統計表》,再到2005年版的《教育部高校圖書館事實數據庫系統》,20年間,我國高校圖書館的統計工作幾經變遷。在內容方面,指標體系經過多次修訂,不斷完善;在填報方式方面,從成員館提交紙質報表,到目前的網上填報;在統計數據匯總手段上,從過去的各省圖工委手工匯總,向全國高校圖工委提交紙質匯總表,到提交匯總文件軟盤,直到今天實現系統自動匯總。
自從事實數據庫建立后,教育部圖工委沒有再像紙質報表時代那樣,正式發布一個統計指標體系,但事實數據庫中的所有統計項已構成了當前我國高校圖書館的統計指標體系,只不過這個指標體系隱身于一個數據庫系統中,它是事實上的統計標準。在事實數據庫中,還對許多統計項進行了注釋和說明,注釋文字組成了事實數據庫的填報細則。
在日常工作中,各省高校圖工委總會收到來自成員館的咨詢,他們在使用現行的指標體系進行統計時,存在著諸多疑問和困難。在此,我們對其中的典型問題做一分析,希望通過探討,使事實數據庫更加完善,更加實用,以利于統計數據更加精準。
在事實數據庫中,A3是關于工作人員的統計項,包括人數、年齡帶、學歷、職稱等,其中,關于學歷的統計指標設置如下:
A3 工作人員
…
A3.3學歷
A3.3.1 博士
A3.3.2 碩士
A3.3.3 第二學士學位
A3.3.4 本科
A3.3.5 大專
A3.3.6 大專以下上述指標要求按學歷統計出各類人員的數量,乍一看,沒有問題。對于頭腦清醒、認真負責、較真兒的統計人員來說,A3.3.1、A3.3.2這里是有“疙瘩”的。
我們都知道,近些年高校圖書館有大量的員工在職接受研究生教育,他們中的大部分人接受的是非學歷教育,畢業后只有學位,沒有研究生學歷,這樣,矛盾和困惑就來了:統計博士、碩士人數時,把他們算進去吧,與上位指標“學歷”(A3.3)相矛盾,因為他們沒有相應的學歷;不算他們,他們確實是博士,是碩士,是反映圖書館人員素質的重要指標。年年統計,了解學位與學歷區別的人歲歲糾結于此,問題出在哪里呢?
在實際運行中,相信很多圖書館都會遇到這樣的情況:當年經費不夠,就先欠著商家的,下一年再付;或者正好相反,當年經費比較寬裕,就把下一年的某些費用預付了。這種當年資源購置支出與實際購入資源不相符的現象,造成了文獻資源購置費(B1.1)統計標準不一致,那么,究竟該按每年實際支出計算呢,還是以當年購置的資源為準,當年的資源花了多少錢就按多少統計?
在事實數據庫中,H是關于資源利用情況的統計項,其中有關館際互借的統計指標設置如下:
H資源利用情況
…
H2館際互借借入量
H3館際互借借出量
…
館際互借是館與館之間的服務活動,有借入就有借出,入與出是相互關聯,數量相當,因此,理論上,每年各省高校圖書館區域內的館際互借借入量(H2)總和與借出量(H3)總和應該相等,考慮到某些館還從省外圖書館(如國家圖書館)借入圖書,那么,匯總數據中,正常情況應該是借入總量略大于借出總量。但是,事實數據庫中的統計結果并非如此。以陜西省為例,2008年借入總量為3600冊,而借出總量為5352冊,理論與實際偏差相當大,為什么呢?
當年購置數據庫(D3)是事實數據庫中統計結果比較“亂”的統計項,我們不妨再看一組陜西高校圖書館2008年的數據。

當年購置數據庫(個)圖書館A 21302510 10717268 58圖書館B 3691162 727173 125圖書館C 3687192 1569820 22文獻資源購置及相關費用(元)購電子資源(元)
從上述數據我們不難發現,圖書館B當年購置數據庫個數明顯偏高,不但比與之經費相當的圖書館C高,還遠遠高于資源購置費5倍于它的圖書館A。為此,我們查閱了圖書館B2005-2008年統計數據中的D3項,發現其每年購置數據庫都在120個左右。針對這一現象我們推測,是否圖書館B在統計D3時采用了與眾不同的統計標準?經過與該館統計人員溝通,得到了證實。
在《中華人民共和國高等教育法》第二章中,有關學歷和學位的相關內容如下:
第十五條 高等教育包括學歷教育和非學歷教育。
第十六條 高等學歷教育分為專科教育、本科教育和研究生教育。
第二十二條 國家實行學位制度。學位分為學士、碩士和博士。
目前,高校圖書館在職攻讀碩士、博士學位的人比較多,通常情況下,在職申請學位屬于非學歷教育,申請人在獲得學位后,只表明其在學術上已達到碩士(或博士)學位的學術水平,具有碩士(或博士)學位畢業研究生的同等學力(學習能力的“力”),不涉及學歷,即申請人的學歷并沒有改變,也不能獲得碩士(或博士)研究生畢業證書。[4]
但是,事實數據庫的指標設置卻將學位等同于學歷,把二者的下位概念混列在一起,從而將碩士、博士當作學歷的下位概念,致使這部分指標在邏輯上“擰巴”,這就是“明白人”填報時困惑的原因所在。鑒于此,建議對A3項進行修訂,把學歷統計和學位統計分別列出,盡可能使圖書館統計指標體系科學、嚴謹。
按照上述第十六條、第二十二條的規定,在我國,學歷分為專科、本科和研究生;學位分為學士、碩士和博士。因此,建議將A3的相關統計指標修訂
為:
A3 工作人員
…
A3.3學歷
A3.3.1 研究生
A3.3.2 本科
A3.3.3 大專
A3.3.4 大專以下
A3.4學位
A3.4.1 博士
A3.4.2 碩士
A3.4.3 第二學士學位
A3.4.4 學士
…
A2項關于館長學歷的統計指標設置,也存在這個問題,建議一并修訂。
在圖書館日常運轉中,經費支出與資源購買不同步的現象時有發生,通常有兩種情況:一是當年經費充裕,提前預付下一年的費用;二是經費緊張,欠商家的費用下一年再付。
針對這種經費與資源不同步的現象,在高校圖書館實際統計時,通常采取兩種方法。第一種,是以資源購買情況為準,當年買了多少資源,就按資源應付費用統計;第二種,是以經費支出為準,當年實際支付多少,就按多少統計。
上述兩種方法,各有各的道理,都有存在的理由,因此,建議教育部圖工委明確規定一種統一的方法,以保證統計數據的可比性和持續一致性。我們認為,第一種方法能更準確地反映圖書館資源建設的現狀,因而,應當作為被規定的統計方法,其計算公式為:
文獻資源購置費=當年實付+上年預付+當年欠費-當年預付-往年累計欠費
這個公式涵蓋了購置資源時有可能發生的所有付費方式,實際情況要簡單些。
在1.3中,我們關注的是區域內館際互借流通量的現象。關于借入總量與借出總量理論與實際不相符的問題,是由于統計該指標的技術手段落后而造成的。
就目前我國高校圖書館區域館際互借服務而言,除少數幾個省市采用計算機系統管理外,大部分地區還停留在手工管理的層面。手工管理方式下的區域館際互借服務具有這樣幾個特點:(1)采用紙質證件作為館際間的通用借書證;(2)手工記錄通用借書證的借出/歸還;(3)手工記錄館與館之間的互借服務。上述特點決定了館際互借借入/借出量的統計很難精準。
對一個圖書館來說,外校讀者來借了什么書,是可以精確記錄下來的,可是,本校讀者向其它學校借了什么書,借了幾冊書,不容易統計,除非在每次讀者歸還通用借書證時,都詳細詢問,這個笨辦法顯然不具有可持續性和可操作性。因此,在區域館際互借服務沒有實現自動化管理的地區,各館可以準確地統計借出量,但借入量的統計存在困難。
一般情況下,很多圖書館都默認,通用借書證流通一次算作借入一冊書,很明顯,這與實際情況是有出入的,因為很多讀者使用一次通用借書證,可能會借幾冊書,這就是為什么區域內館際互借借入總量總是小于借出總量的原因。
上述問題的出現,當然是館際互借服務管理水平不高造成的,要解決這個問題,根本的辦法是實現館際互借服務的自動化管理,以便精確地記錄每一筆互借信息,包括文獻借入館/借出館信息、被借文獻信息、讀者信息等,讓統計工作真正成為圖書館管理工作反饋機制的一部分。
還有網上訪問量(H6)的統計,也是由于技術手段的原因,從而導致統計數據缺少可比性。對于網上訪問量,有的圖書館采用最傳統的方法,即統計首頁點擊量;有的圖書館使用網上免費軟件;也有技術力量較強的圖書館,自行開發流量統計軟件。當然,不排除個別圖書館“捏”一個體面的數據。鑒于此,建議教育部圖工委推薦一個統一的網站訪問流量統計軟件。Google Analytics是個不錯的選擇,它是一款免費的網站流量統計工具。[5]或者提供一個安裝網站訪問統計軟件的服務器,供全國高校圖書館使用,這是最理想的解決辦法。
2005年,教育部圖工委在對事實數據庫進行改版時,刪除了對桌椅板凳等家當的統計,細化了數字資源的統計。由于數字資源統計比傳統資源統計要復雜些,為此,教育部圖工委與CALIS管理中心于2004年專門制定了《高等學校圖書館數字資源計量指南(2004年)》(以下簡稱“計量指南”)以及與之配套使用的《高等學校圖書館數字資源計量指南中文數據庫參照表》(以下簡稱“中文數據庫參照表”)、《高等學校圖書館數字資源計量指南外文數據庫參照表》,并于2007年對《計量指南》進行了修訂。[6]
對數字資源的統計涉及到數據庫個數、電子期刊種數、冊數、折算冊數等多個統計指標,即便有相關的統計指南,實際操作時還是需要仔細琢磨。加之統計工作一年一次,每次重拾時總得花大把的時間回憶,難免讓人對此“頭大”,甚至恐懼。事實上,如果方法得當,功夫下到,關于數字資源統計的大部分項目,沒有想象中那么難。
根據《計量指南(2007)》,可以將數字資源分為八個類,不同類型的數據庫采用不同的計量方法,詳細信息見下表:

類型 需要統計的指標 統計要點中文電子圖書 數據庫個數、電子圖書種數、電子圖書冊數 包庫購買每種計一冊;選購每種計二冊中文電子期刊 數據庫個數、電子期刊種數、電子期刊份數、電子期刊折算冊數 折算時,一種一個年份換算為一冊中文二次文獻數據庫 數據庫個數中文其它數據庫 數據庫個數外文電子圖書 數據庫個數、電子圖書種數、電子圖書冊數 包庫購買每種計一冊;選購每種計二冊外文電子期刊 數據庫個數、電子期刊種數、電子期刊份數、電子期刊折算冊數 折算時,一種一個年份換算為二冊外文二次文獻數據庫 數據庫個數外文其它數據庫 數據庫個數
上述資源類型中,電子圖書的統計相對容易些,無論是包庫還是選購,種數基本上是清楚的。關于電子期刊的統計,由于涉及到累積量,需要換算冊數,就顯得比較復雜了。其中,電子期刊種數、年份的信息是統計的關鍵,它主要來自三個方面:訂購通知或合同上提供的數據;供應商的數據庫介紹;檢索平臺的實際數據。
目前,國內普通高校、民辦普通高校以及獨立學院共2244所,這些院校的圖書館是事實數據庫的使用對象。如此眾多的使用者,要保證在使用時對統計項目的理解完全一致,是不現實的,數據庫個數統計就是一個典型的例子。
統計數據庫個數時,有的圖書館嚴格按照《中文數據庫參照表》執行(如1.4中的圖書館B),有的卻沒有;有的只統計當年新增的數據庫,有的則包括了新增和續訂的部分;有的只統計了電子書、電子刊之外的數據庫,有的則統計了所有數據庫。方法如此不統一,結果五花八門是可想而知的,它反映了一個重要問題,即與事實數據庫填報工作相關的支撐文件存在不足和薄弱之處。
我們認為,對統計指標的注釋和說明,與指標體系同等重要,值得我們花費筆墨加以討論。
對于一個統計指標體系而言,統計指標的概念表達一定要簡潔、明了,如果沒有充分的使用說明,很容易造成統計數據的偏差,因此,應盡量對統計指標逐項解釋,甚至通過舉例的方法加以說明,必要時還可制定專門的說明性文件。總之,與事實數據庫填報相關的支撐文字和文件,是做好圖書館統計工作不可缺失的重要組成部分。
從近幾年我們與成員館的互動中,以及從對成員館統計報表的審查積累中,發現下列問題在事實數據庫的填報工作中比較突出。
(1)填報細則和《計量指南(2007)》有相互矛盾之處。在事實數據庫的填報細則中,對“D3當年購置數據庫”是這樣說明的:“指除電子書、刊以外的數據庫”。按字面理解,D3只統計二次文獻數據庫和其它數據庫,不包括電子圖書、電子期刊。但是,在《計量指南(2007)》中,關于電子圖書和電子期刊的計量是這樣規定的:“電子圖書以數據庫個數和電子圖書冊數為計量單位”;“電子期刊以數據庫個數、電子期刊種數和份數為計量單位”。按照這個規定,電子圖書和電子期刊既要統計數據庫個數,也要統計相應的冊數、種數和份數。規則上的不一致是顯而易見的,這種不一致讓頭腦清醒的統計人員很困惑,不知該以哪個為準;對于稀里糊涂的人來說,可能遵照的是數據庫里的填報細則,也可能采用的是《計量指南(2007)》中的規定。這種情況必然造成統計方法的不統一,致使統計結果大相徑庭。
(2)《計量指南(2004)》中,關于數字資源的計量有這樣一句話:“數據庫個數以供應商分割的最小銷售單元為計量單位”,2007年修訂時仍被保留。這段文字存在兩個問題,一是晦澀難懂,不易把握;二是不嚴謹,存在漏洞。以SCI為例,它可以分年購買,難道我們在統計D3時,要把SCI每年的資源都算作一個數據庫嗎?這樣統計顯然沒有意義。我們認為,這句話在《計量指南》中顯得多余,可以刪除。
(3)對數字資源平臺的劃分有待商榷。在《中文數據庫參照表》中,將萬方數據劃分為118個子庫,想必是遵照上面所說的“以供應商分割的最小銷售單元為計量單位”來劃分的,即便這句話本身不存在漏洞,照此分割數據庫也是值得商榷的。以萬方數字資源為例,這118個子庫,很多都是同一種資源類型,只不過學科不同而已,在統計時僅僅因為賣家的價格體系是按學科標價,就據此劃分數據庫個數,并不是科學、合理的方法。我們認為,像萬方數據以及類似的數字資源平臺,可以按照通俗的方法劃分為期刊、學位論文、會議論文、標準等,既容易理解,又便于操作。
事實數據庫的統計項設計應充分考慮各種可能性,以適應各種極端現象。例如,在事實數據庫中,辦公費(B1.3)設置為“不能小于100”,這個設定不夠客觀。我們知道,現在民辦高校越來越多,很多民辦高校圖書館的辦公費并不劃撥到圖書館,而是由學校掌握,對圖書館而言,統計時該項應該填“0”,但是,事實數據庫中必須填“100”才可通過系統審核。這就讓人難做了,據實填“0”吧,系統不允許;填“100”吧,顯然又與事實不符。
現實中,還有更加極端的例子,有的民辦高校,一年中沒有給圖書館下撥一分錢運行費,如此一來,年度經費情況(B)下屬的大大小小的和經費有關的統計項,統統為0。像這種情況,系統根本不支持據實填報。
針對那些落差比較大的統計項,事實數據庫應該允許個別統計項添加腳注,例如辦公費,多則幾十萬,少則為0,那么,辦公費為0的圖書館就應該加上腳注予以說明。這個屬系統功能方面的問題,也期待在今后加以完善。
不是每位統計人員都像統計指標體系的設計者那樣,對每一個指標項的內涵和外延都心如明鏡,因此,詳細的支撐文件和文字是必須的。
日常工作中,經常有成員館提出這樣的問題:我們的設備維護費全部由學校負擔,我可以填“0”嗎?回答是肯定的。但是對統計人員來說,填報“0”是需要掂量的,需要有權威部門的認可,心里才踏實。如果在設備維護費(B1.2)的原有填報細則“水電費、物業費、保潔費、維修費等在內”后增加一句:“如果上述費用全部由學校支付,則可填0”,那么B1.2的統計就十分明確了。
還有一個常被問到的問題是:我們中途換了館長,一年中有2個館長,該填哪個館長呢?對于這個問題,應該在事實數據庫中增加說明文字:“以年終在任館長為準”,短短幾個字,使統計人員不再有疑問。
還有些統計項,是需要舉例說明的。例如,在《計量指南(2004)》中,對于電子書的界定,明確了“包括學位論文及其它類似書的出版物”,但是在《計量指南(2007)》中,卻簡化為“包括與書類似的出版物”,這一改動使得電子書的統計出現變數。一旦圖書館統計人員更換了,或者有人忘記了以前是怎么統計的,就有可能將學位論文遺漏,這樣,既造成館與館之間的數據不具有可比性,也會使本館的統計數據沒有了繼承性。在這個問題上,我們認為,《計量指南》應該將所有能想到的“與書類似的出版物”都列舉出來,并且要窮舉,這樣,才可使《計量指南》真正起到指南的作用。
由于沒有說明,或者注釋不夠通俗,而使統計結果跑偏的現象還有很多。例如,在歷年對各館統計報表的審查中,我們時常發現個別圖書館將外借書刊(H1)填報“0”,與之溝通,答曰:我們館的書沒有借給外校讀者。如果將H1的注釋由原來簡單的“紙本”改為“本館紙質書刊流通量”,相信就不會出現錯誤的統計結果了。又如,個人電腦(L5),有的圖書館只填報幾臺,不免讓人存疑,經了解后得知,是錯將個人電腦理解為“歸個人使用的電腦”了,如果將L5原有注釋“年末在用的所有個人電腦數”改為“年末在用的所有PC機以及筆記本電腦”,或許可以使該統計項更容易理解。
總之,任何一個統計指標體系,都離不開對統計指標進行說明的文字和文件,在制定說明性文件時,既要保持語言的準確性和學術性,還要力爭使之易讀,易懂。
教育部事實數據庫是我國高校圖書館統計工作的規范和標準,要使其在今后的工作中發揮更大的作用,必須做到以下三點:一是指標系統的科學化,填報說明的詳盡化;二要根據圖書館事業的發展,及時更新指標體系以及相關說明;此外,對統計人員的培訓,也是做好統計工作的重要環節。
[1]姜曉等.高等學校圖書館統計[M].成都:成都科技大學出版社,1995.17.
[2]教育部高校圖書館事實數據庫[DB/OL].http://162.105.140.111/calis/default.asp.
[3]中華人民共和國高等教育法[EB/OL].http://www.moe.edu.cn/publicfiles/business/htmlfiles/moe/moe_619/200407/1311.html.
[4]為何在職研究生考試無學歷證書只有學位證?[EB/OL].http://www.onjobedu.com/html/hdwd/kaoshi/50768.html.
[5]Google Analytics[EB/OL].http://www.google.cn/analytics/.
[6]教育部高等學校圖書情報工作指導委員會,高等教育文獻保障系統(CALIS)管理中心.高等學校圖書館數字資源計量指南(2007年)[EB/OL].http://162.05.140.111/tugon-gwei/info/index.asp?strCode=specification_63.
[7]高教資源.中國高等學校教師網[EB/OL].http://www.ccf.edu.cn/zhiyuan/.
[8]顧 健.美國教育統計中心的大學圖書館統計[J].大學圖書館學報,2008,(2):15-21.
Inquiry into statistical knots for constructing The Fact Database of the Ministry of Education in university libraries
ZHANG Hui-jun,ZHANG Xi-ya
(Xi’an Jiaotong University,Xi’an 710049,China)
This article sums up the statistical knots for constructing The Fact Database of the Ministry of Education,makes an analysis of the causes of the problems.The authors of this article hold that rigorous indexing system and detailed directions for filling in the form are the guarantee to better statistical work,and propose some suggestions to improve and perfect the statistical work.
university libraries;library statistics;fact database
G250.74
B
1006-1525(2011)01-0049-05
2010-10-21
張惠君,女,副研究館員。
(編輯:朱愛瑜)