董 越,顏 蘊,王鸑飛△,葛欣旭,呂 燕(.中國農業科學院農業信息研究所;.中國農業博物館;.寧夏圖書館)
?
“用戶友好”環境下COUNTER圖書使用統計標準的失靈與警示
董越1,顏蘊1,王鸑飛1△,葛欣旭2,呂燕3
(1.中國農業科學院農業信息研究所;2.中國農業博物館;3.寧夏圖書館)
摘要:資源供應商為了迎合用戶,竭力提升服務水平,創造“用戶友好”的信息使用環境。然而,新環境卻導致以COUNTER標準為例的一些現行規范或標準失靈。筆者通過深入解析最新COUNTER圖書使用統計特征,一方面揭示“用戶友好”的運營環境如何影響該標準,另一方面說明圖書館在當前供需關系轉變過程中所處的弱勢地位,強調圖書館積極投身改革與創新的必要性。
關鍵詞:COUNTER;使用統計;閱讀習慣;用戶友好;電子圖書;采后評估
圖書館資源建設具有科學系統的評估流程,其中,了解和分析資源的利用情況,是館員評價圖書館館藏和服務質量的重要依據。隨著多年的電子資源館藏積淀與實踐經驗積累,如今電子資源建設工作重點,已由最初的資源引入上升為有效利用。借助使用統計數據,客觀地分析資源建設效益、了解用戶需求狀態、發現圖書館服務短板,從而輔助圖書館制定或調整運營決策,更好地促進圖書館館藏建設和鞏固信息服務的核心地位。[1]同時,使用統計對資源擁有機構意義重要,資源供應方與代理商通過分析數據,直接摸底自己出版或代理的電子資源的終端用戶使用情況,及時調整以便保持市場占有度。隨著電子資源種類與資源運營商的增加,為了實現統計結果的縱向與橫向比較,需要采用標準一致、方法可靠的標準來規范電子資源的使用統計。[2]
有關使用統計的研究早在2002年已經開始,[3]經過不斷地探索與檢驗,COUNTER標準的實施規范最受青睞。COUNTER作為國際水平通行的電子資源使用統計標準,保障每個資源供應機構提供在線產品與服務的同時,能夠誠信的、連續的、可比較的將資源使用情況記錄并生成對應報告。2013年底頒布實施的最新版《COUNTER電子資源實施規范》(第四版)整體而言又做了諸多改進:它融合了期刊、數據庫、圖書、會議錄以及多媒體等電子資源類型,綜合了《COUNTER期刊與數據庫的實施規范》(第三版)與《COUNTER圖書與參考文獻實施規范》(第一版)的內容特點;[4]引入了新的術語、記錄對象及測量指標,新增了用戶(Customer)、機構標識符(Institutional Identifier)、圖書數字對象標識符(Book DOI)和所有權標識符(Proprietary Identifier)等多項資源與機構標識符。[5]然而,細究電子圖書與參考文獻部分的統計規范,可以發現其結構與內容調整甚微。
當前,信息供需正處于一個以用戶信息需求為核心、“用戶體驗”服務模式為導向、資源供應商直接參與服務的新興信息服務環境。以中國農業科學院專業圖書館的服務情況為例,用戶的需求分散廣泛、時效性強、專業度高,出版商的服務直達終端、模式創新多樣、資源高度壟斷,導致圖書館作為信息服務中介機構,傳統主體業務或已落伍,或被侵蝕,嚴峻的環境迫使圖書館在服務中加大力度。由于服務的評估與分析主要借助分析工具,一旦失去,則嚴重制約分析工作的執行,使圖書館的生存狀況雪上加霜。實際操作過程中發現,COUNTER標準作為圖書館資源建設評估的主要工具,雖然被不斷更新完善,但其中的圖書使用統計標準在當前環境中失靈,應予以警覺。
《COUNTER電子資源實施規范》(第四版)(以下簡稱COUNTER R4),COUNTER R4整合了以往“期刊與數據庫”和“圖書與參考文獻”的獨立版本,將期刊、數據庫、圖書、參考文獻、多媒體五大類資源的統計標準匯總于統一的實施規范,在名稱上以“電子資源”概括。生成統計數據方面,劃分為期刊使用報告(Journal Report)、數據庫使用報告(Database Report)、平臺使用報告(Platform Report)、圖書使用報告(Book Report)、多媒體使用報告(Multimedia Report)和題名使用報告(Title Report)六大種類;每個大類之下再根據用戶不同需求,提供以小標號區分具有內容側重的子報告。
“圖書使用報告”適用于在線圖書及參考文獻類型資源的使用情況統計,在COUNTER R4中,包含五個子報告。已有研究將新規范與之前版本進行比對,并且介紹了新版的特性(見表1)。[5]但是,由于“圖書使用報告”主體構架和內容依然沿用了《COUNTER圖書與參考工具實施規范》(第一版),所以總體而言新版統計數據所展示內容沒有顯著變化。
1.1圖書使用報告1(BR1)
BR1格式與統計內容用于描述“每月、每個題名成功獲取的題名數目”;另對記錄目標補充說明“僅針對全書內容以唯一文檔方式提供,其他情況必須統計于BR2”。
該報告輸出表格分為兩大部分,第一部分以摘要式介紹五項內容:報告類型、用戶、機構識別碼、報告覆蓋期間(年月日-年月日時間制式)、以及相同時間制式的報告生成日期。第二部分為明細,首先分七列分別記錄書名、出版商、所在平臺、圖書DOI、所有權標識符、ISBN編碼與ISSN編碼,隨后幾列記錄每本圖書在報告數據期間的總下載量與月度下載量。

表1 COUNTER R4圖書及參考資料使用報告類型及內容描述
BR1最后還附有七項說明:第1-4項分別對用戶、機構標識符、圖書數字對象標識符、所有權標識符的使用情況予以說明;第5項約定了統計總量(Total for all titles)的顯示位置;第6項說明“0使用”標題不包含在本報告內;第7項指向性說明“有關規則指導參考期刊使用報告JR1”。
1.2圖書使用報告2(BR2)
BR2格式與內容用于描述“每月、每個題名成功獲取的章節數目”;并對“章節”附有注釋“章節類型(書目章節、百科內容主體等)使用于本報告的情況,必須在報告中予以標示。超過一種章節類型的情況,簡單列舉報告中主要的章節類型”。
該報告輸出表格的第二部分與BR1的記錄字段相同,僅在第一部分增加了一項介紹對象。因為是統計“章節”獲取情況,所以在BR1的基礎上,增加了對于章節種類的描述。
BR2同樣附有七項說明,內容與BR1相同。
1.3圖書使用報告3(BR3)
BR3格式與統計內容用于描述“每月、每個題名、每種類型被拒絕請求量”。
除報告類型外,該報告的第一部分記錄項目和內容與BR1一致。第二部分差異較大,首先與BR1一樣分七列記錄圖書信息,隨后就每本圖書獲取內容失敗的情況,提供期間累計量和月度統計數據。根據獲取失敗的原因,又分成“并發用戶受限”和“非授權資源”兩種情況。所以,同一題名的圖書會出現兩行,相對獨立地記錄兩種情況的請求被拒數據。
BR3附有七項說明。第2~7項說明與之前報告內容相同。因為此報告統計拒訪數據,所以在第1項明確說明“BR3僅針對題名級別,統計請求被拒絕的數據;平臺級別的統計將記錄于BR4中”。
1.4圖書使用報告4(BR4)
BR4格式與統計內容用于描述“每月、每個平臺、每種類型被拒絕請求量”。
BR4有5項說明,分別是用戶、機構標識符、所有權標識符、統計總量顯示位置的補充說明,以及“規則參考JR1”的指向性說明。
1.5圖書使用報告5(BR5)
BR5格式與統計內容用于描述“每月、每個題名的全部檢索量”
該報告仍然可以參考BR3,項目內容與統計方式幾乎一致。區別僅在于第二部分的數據明細中,統計數據不是“并發用戶受限”和“非授權資源”的拒絕量,而是反映“常規搜索”和“聯邦式或自動化搜索”的檢索量。
BR5有8項說明,第1項說明“本報告僅用于統計基于題名級別的檢索數據,基于平臺級別的檢索由平臺使用報告(Platform Report 1, PR1)統計”;第2~6項分別說明用戶、機構標識符、圖書數字對象標識符、所有權標識符以及統計總量顯示位置;第7項將聯邦檢索和自動搜索引擎產生的數據,與常規檢索產生數據加以區分;第8項是“規則參考JR1”的指向性說明。
1.6小結
通過解析圖書使用報告,可以將COUNTER R4用于統計“圖書類”資源的子項報告歸納為“使用”、“拒訪”、“檢索”三類。每個子項報告附有對報告中字段內容的補充說明,雖然直觀上細化了用戶和資源信息顆粒度,但是整體而言缺乏提升統計數據解讀性的作用。
“使用類”報告是資源采后評估的重要參考依據。BR1、BR2分別以“題名”與“章節”的使用量作為區分,從實際操作層面分析,是以每個單一電子文檔的使用情況作為數據統計基礎。BR1附有說明“僅當全書內容包含于單一文檔的使用情況記錄在BR1中,其他情況記錄于BR2”,由此可知,若一本圖書以章節或其他方式將全書內容拆分為多個相對獨立的電子文檔,則該圖書的使用數據將被統計于BR2中,且拆分后每個文檔的使用均會被記錄。所以BR2以“章節”為基礎的統計方法,所得數據看似精細實則粗獷,其不確定性直接影響對整本書使用情況的評估。
“拒訪類”與“檢索類”報告多用于采前分析評估工作。其中拒訪報告BR3、BR4分別在“題名”和“平臺”層面統計,報告中又以“并發用戶受限(Access denied:concurrent/simultaneous user licence limit exceeded)”和“非授權資源(Accessdenied:contentitem notlicenced)”作為區分。由于未與“使用類”的統計規則對應,其統計方法的合理性有待考證。檢索報告BR5中包含常規檢索和聯邦檢索兩部分數據,實際使用價值也難以定論。因為資源采前評估不是本研究重點,所以有關拒訪和檢索的數據暫不深入分析。
這張不同尋常的地圖是由薩普手繪的,數據由希森收集。(薩普作為一名女性,當時不允許她登上研究輪船。)地圖顯示,一條龐大的水下山脈呈南北向延伸,像一道巨大的接縫位于海洋的中部,這條山脈被稱為大西洋中脊。薩普發現,這條山脈的中間有一道又深又闊的裂縫,裂縫的兩邊都是高高的山峰。她把這個作為證據來說明海洋地殼是運動的。她是正確的,這一點也支持了魏格納被邊緣化的大陸漂移理論。然而,薩普的同事希森贊成地球膨脹論,遺憾地將她的理論當作是“女孩講的空話”。
通過前文解析可知,《COUNTER R4》“圖書使用報告”基本沿用舊例,其統計內容、格式與術語定義和期刊統計規范高度同一。[6]雖然報告中記錄的內容引入多種資源與機構用戶標識符等粒度細化的數據項,或有助于提升資源匹配與機構分析的精確度和可比性。然而,實際操作過程中發現,該規范下的統計數據,在分析用戶基于圖書與參考文獻類資源的閱讀行為和服務績效時,存在嚴重的統計失靈情況。該問題在當前提倡“用戶友好”、注重“用戶體驗”,數據資源供應商采用一切手段提高服務質量和方便用戶使用時尤其突出,導致原有使用統計構架所揭示內容無法繼續適用于現在的數據環境。
以中國農業科學院訂購Springer Protocols(實驗室指南)數據庫的實際使用統計結果為例。2011~2014年間,Springer Protocols數據庫年均新增叢書150余卷,對應“章節”等級的電子文檔3300余篇。年度資源數量增長整體平穩,即叢書卷冊年度漲幅約25%,電子文檔年度漲幅約13%(表2)。然而,該數據庫的使用統計數據卻出現了令人費解的激增(表3與圖1),2013與2014兩年的年度用量近似,但同比2011、2012年度用量約為5至6倍。分析歷年的使用數據可以看出,中國農業科學院Springer Protocols數據庫月度使用情況較為平均而且具有一定規律性,即資源使用峰值集中于每年2~4月與8~11月兩時間段。盡管2013年的統計數據依然表現出相似規律性,然而當年使用量增長十分異常。首先,本院用戶對該資源月度用量原本維持于“千篇”附近波動,但7月之后計量級別躍增至“萬篇”;再者,2013年1~6月的半年用量總和,竟然不及下半年的月平均用量。統計數據總體呈現出“被放大”的特征。

表2 2011~2014年度Springer Protocols資源數量

表3 2011~2014年度中國農業科學院(集團)Springer Protocols使用統計(BR2標準)

圖 2011~2014年度中國農業科學院(集團)Springer Protocols用量趨勢(BR2標準)
經查證,統計數據巨大變動由供應商對資源發布平臺服務功能的升級引起。2013年6月前,Springer Protocols資源在SpringerLink發布平臺中僅提供單篇文檔下載功能;隨后因為考慮整卷叢書所含實驗室指南具有專一性和關聯性特點,為方便用戶全面獲取并能系統對照參考,于2013年7月新增“整書下載(Download the Book)”功能。用戶可以在SpringerLink平臺檢索到某篇實驗室指南時,選擇性點擊“整書下載”鍵鈕,一鍵式獲取該指南所在叢書全部章節的電子文檔。然而,由于統計規范仍然采用BR2未作改變,用戶的資源使用情況將以“章節”為標準生成統計報告。因此,新功能的推出造就了電子文檔的下載量的倍增。
服務平臺功能升級,對COUNTER統計保持真實性、客觀性是一個挑戰。舉例說明:當A書全部內容包含在唯一的電子文檔中,用戶每次下載將在BR1中記錄使用一次;若A書有10個章節,而且被拆分為10個獨立的電子文檔,用戶下載每個文檔則在BR2記錄使用一次,下載全書10個章節生成使用記錄十次。簡而言之,現行BR1與BR2使用類統計報告分工明確,每個獨立電子文檔的下載情況是使用統計的數據基礎。在2013年6月之前,因為下載數值能夠與用戶的操作行為一一對應,這樣的統計數據具有一定參考意義。然而,面對“整書下載”功能,用戶的一個操作行為對應著全書章節總數的下載量,必然與用戶實際使用情況脫鉤。而且,由于不同叢書所含章節數目不同,所以同樣的“整書下載”操作,對應于BR2不同題名的統計數據差別很大。此外,因為整書下載功能與單篇下載功能并存,不同行為粒度產生的數據堆疊在同一標準的匯總報告中,使得報告本身失去了統一的量度。由此,BR2統計數據的使用情況反饋功能已經失靈,成為一個純粹的泡沫化的文檔下載量計數器。
截取2013年度中國農業科學院機構用戶的Springer Protocols數據庫BR2統計報告片段為例(見表4),Rice Protocols全年下載章節文檔796篇,上半年與下半年使用數據差異明顯,1月與7月是同一年中的兩個使用高峰,符合本院用戶的使用規律,但數值相差7倍有余。直觀數據顯示,Spermatogenesis 8個月均被使用且月度用量平穩,但是全年僅下載417篇;而Antibody Engineering全年下載3304篇,超出Spermatogenesis 7倍多,卻基本來自于8月份的單月用量。就這三卷叢書的自身屬性來說,每個圖書題名下包含文檔數目分別是24篇、47篇和52篇。直接分析這樣的數據顯得有些無從下手,其結果也基本失去了參考價值,圖書館員借助COUNTER使用統計工具,來了解用戶對圖書和參考文獻需求的方法已然實效。

表4 2013年度中國農業科學院(用戶)Springer Protocols使用統計片段(BR2標準)
信息技術與網絡通信技術的廣泛應用打破了原有的空間與時間維度束縛,連接了信息資源供應商與用戶之間的通路,改寫了傳統信息管理與服務模式中“出版商供給、圖書館匯集、讀者用戶查閱”的三方供需關系。出版商根據資源特征和用戶使用偏好而提供“用戶友好”服務模式,是建立在成熟技術基礎上的新運營方式,同樣顯露出顛覆效力。
第三方組織綜合權衡信息資源供應和服務機構的需求,制定了COUNTER實施規范,并依照時代發展的需求變化而不斷修正升級。但是,歷經供需關系變革的沖擊,部分統計報告已經不能發揮分析評估工具的應有作用。因此,圖書館有責任以信息服務中介的角色提出建議,修繕電子資源使用統計等工具的功能,從而有效利用并增強機構服務能力。“整書下載”功能導致的圖書使用報告失靈問題,在COUNTER實施規范修改圖書使用報告的內容與標準時將得到解決。通過區分整書下載與章節下載的用戶行為,調整BR1與BR2的使用決策,一方面提升數據可讀性,另一方面增強對用戶行為的敏感性。
COUNTER R4中幾個新增特性所釋放出的信號應當引起圖書館界重視,或將引起下一次資源供需關系與信息服務模式的重大變革。首先,開放獲取文章(Gold Open Access即金色OA)納入JR1使用統計體系當中,可視為COUNTER對新興運營模式的融入;以獨立文章為統計單位,將當前能夠用于分析的數據顆粒細化到極致,使用統計突破了用于資源建設成本與效益核算的初級認知,數據價值被拓展至學術傳播效果和用戶行為分析。其次,通過引入用戶與資源的各類標識符,多維度地記錄目標個體信息,可以預見未來統計數據所展現的內容,將更活躍在個體級別的用戶行為研究或資源特性分析。統計信息逐漸深入至終端微觀層面,預示大型集團采購與服務的時代將面臨小型網絡社區概念的挑戰。由個性化需求交匯組成的網絡用戶社區,將從資源需求、服務模式、獲得途徑等方面,拆分大集團建設環境中圖書館建立的“普遍受益”式信息資源保障體系,轉交供應鏈上游的資源所有者以尋得更為精確、靈活的服務。至此,圖書館有可能淪為純粹的付費機構。隨著信息供需個性化、內容碎片化、渠道多樣化的進一步升級,圖書館最后的采購功能也將被類似于開放獲取的新興商業模式替代。使用統計數據原本用于資源供給與服務機構了解資源的利用情況,經過數代演替之后,最終可能演化為資源供應商研究用戶從而扼殺圖書館的工具。
圖書館作為傳統信息供需關系鏈的中間環節,受到來自上游技術創新壓力與下游需求變化推力的雙方擠壓,處于信息服務變革影響作用的暴風眼。COUNTER使用統計規范被圖書館視為重要評估工具之一,雖然緊隨信息環境的變化而不斷完善,但是依然在創新的運營模式中失靈,可以看作一個典型例證,暴露出圖書館傳統運營模式在改革創新洪流中的孱弱。因此,圖書館積極投身改革創新已經刻不容緩。探索獨立自主并且客觀適用的資源建設與服務評價方法,加強對用戶需求與使用偏好的認知與滿足,鞏固信息服務中心的供需關系,主動適應環境、迎合需求,這即是在危機中尋找機遇的關鍵途徑,也是從COUNTER圖書使用統計失靈問題中獲得的警示。
[參考文獻]
[1]梅海燕.電子資源使用統計研究[J].大學圖書館學報,2006(3):82-86,107.
[2]張建,張蘇.在線電子資源使用統計的新標準——COUNTER[J].現代情報,2006(11):211-213,215.
[3]肖瓏,張宇紅.電子資源評價指標體系的建立初探[J].大學圖書館學報,2002(3):35-42,91.
[4]The COUNTER Code of Practice for e-Resources:Release 4[EB/OL].[2015-07-16].http://www.projectcounter.org/.
[5]李洪.新版COUNTER的特征及未來發展[J].中國圖書館學報,2012(6):29-37.
[6]劉廷蓉,嚴霞.COUNTER在線圖書和參考資料使用統計標準[J].現代情報,2007(11):125-128.
Function Failure of COUNTER System and the Cautions under User Friendly Environment
Dong Yue,Yan Yun,Wang Yue-fei,Ge Xin-xu,Lv Yan
Abstract:Based on various information technologies, the transmission of information resources is no longer limited by time and space, which led to great transformation of information supply and demand.Information suppliers have improve their service by creating User Friendly environment which resulted in the failure of COUNTER system to some extent.This article makes a deep analysis of COUNTER by pointing out how does User Friendly environment affect the system and how important of the innovation andreformfor the libraries as well.
Keywords:COUNTER; Usage Statistics; Reading Habit;User Friendly;E-books;Acquisition Estimation
[收稿日期]2015-08-25[責任編輯]菊秋芳
[作者簡介]董越(1985-),男,中國農業科學院農業信息研究所館員;顏蘊(1964-),女,中國農業科學院農業信息研究所研究館員,研究方向:文獻資源建設;王鸑飛(1973-),男,中國農業科學院農業信息研究所副研究館員;葛欣旭(1988-),女,中國農業博物館助理館員;呂燕(1977-),女,寧夏圖書館助理館員。
通訊作者:△王鸑飛
中圖分類號:G252.0;G253
文獻標志碼:B
文章編號:1005-8214(2016)02-0065-05