劉 涵
(長安大學圖書館 陜西西安 710006)
據全國新聞出版業最新統計數據顯示,2018年全國出版新書225 940種,覆蓋了585家出版社[1]。在眾多的出版社中,哪些出版社是高校所設學科專業的核心出版社?究竟要采用怎樣的采購模式,才能更合理地利用有限資金最大限度地購買到學校教學和科研所需的圖書?這些問題一直屬于高校圖書館學科資源建設的重點和難點。利用文獻計量學方法對出版社進行多指標、多維度分析,有助于采訪決策人員實施重點突出、目標明確的采購策略,能夠從魚龍混雜的書海中遴選出符合學校建設及學科發展需要的精品圖書,進而提高館藏圖書的采集質量和效率。
在分析館藏結構和學校學科發展趨勢的基礎上,長安大學圖書館(以下簡稱“我館”)近幾年形成了多學科的文獻資源保障體系,尤其強化公路交通、國土資源、城鄉建設等具有鮮明專業特色的文獻資源采集和保存。
本文以長安大學特色學科為切入點,分析學科所覆蓋的高被引出版社。通過分析出版社的一系列數據指標,得出較為合理的學術評價體系,建立客觀的核心出版社測定模型,為圖書館紙質資源提供準確的采購方向,優化館藏結構。
出版社數據來源于中國知網(CNKI)中的中國引文數據庫(Chinese Citation Database),本文選取自2000年以來的數據,利用數據庫中內嵌的分析模塊對長安大學特色專業的高被引出版社進行排序。步驟如下:進入中國引文數據庫,點擊被引文獻檢索下的被引學科檢索,在學科類別中分別篩選出公路交通、國土資源、城鄉建設所涵蓋的學科范圍,出版年設置起始年為2000年,點擊檢索。
在彈出頁面將被引文獻類型限定為圖書文獻,選擇被引文獻分析中的出版物分析,得到依據被引頻次高低排序的涉及特定專業的出版物基本信息。因數據量過于龐大,故本文僅分析具代表性的前10名的出版物如表1所示。

表1 出版社被引頻次排名
總被引頻次可以直觀測度出版社總的學術影響力,客觀地反映了出版社在某一學科領域出版的圖書被使用和受重視的程度。從上表可以看出,人民交通出版社、科學出版社、中國建筑工業出版社分別在三大專業領域上的被引頻次以巨大優勢領先于其他出版社。科學出版社、中國建筑工業出版社、化學工業出版社的綜合表現力更強,全部擠進了三大專業領域高被引出版物TOP10。其中科學出版社尤為突出,根據表1其出版物被引頻次位列國土資源領域第一,城鄉建設領域第二,公路交通領域第三,一方面反映了其出版內容涉及的范圍之廣,另一方面也說明了其出版圖書的質量之高。此外,諸如地質出版社、中國環境科學出版社、中國鐵道出版社、中國水利水電出版社等側重于專業出版方向的出版物在各自主攻領域里也有著不錯的表現。
總被引頻次只能測度出版社總的學術影響力,不能區分原創性和學術性更高的圖書[2]。為了更全面地評價學科領域出版社的學術影響力,除了前文中提及的總被引頻次指標外,基于已經成熟的期刊評價體系[3-5],就“h指數”“影響因子”“被引半衰期”這三種文獻計量學指標進行分析,以多角度來評價出版社,用充分的數據來佐證某出版社在某學科領域的學術影響力。
h指數最初是由美國加利福尼亞大學圣地亞哥分校的物理學家Jorge Hirsch在2005年提出來的,其目的是量化科研人員作為獨立個體的研究成果。h指數作為一種定量評價科研人員學術成就的新方法,具體定義是指引文數大于等于h的h篇論文數量[6-8]。將此概念引申至出版社出版的圖書h指數,可以定義為在引文數據庫中,該出版社至少有h部被引用至少h次的圖書。
參照前文中各出版社的被引頻次排序,借用文獻計量學的方法,采用中國知網引文數據庫模塊中的出版社分析器,得出各學科領域被引頻次前10的出版社h指數,具體如表2所示。

表2 出版社h指數排名
利用SPSS統計軟件進行相關性分析,得到各個出版社在三大學科領域總被引頻次和h指數的相關系數大小及顯著性檢驗結果如表3所示。
從表3可以看出,三大學科領域被引出版社的被引頻次和h指數之間存在高顯著相關關系,相關系數公路交通類為r=0.986,國土資源類為r=0.935,城鄉建設類為r=0.979。依照出版社被引頻次的排序和依照h指數排序,出版社的排名基本一致。如在被引頻次上表現突出的人民交通出版社、科學出版社、中國建筑工業出版社,各自在學科領域的h指數分別為211、195、261,排名第一。科學出版社在h指數上的綜合表現力依然突出,其在公路交通領域排名第四,國土資源領域排名第一,城鄉建設領域排名第二。
被引半衰期是指出版社在統計當年被引用的全部次數中,較新一半是在多長一段時間內發表的,是用來測度出版社老化速度的一種指標。
選擇中國知網中國引文數據庫被引文獻檢索下的被引出版社檢索,設定被引年為2018年,限定出版社輻射的學科類別,點擊檢索。出版社被引半衰期排名如表4所示。
利用SPSS統計軟件進行相關性分析,得到各個出版社在三大學科領域總被引頻次和被引半衰期的相關系數大小及顯著性檢驗結果如表5所示。
從表4可以看出,三大學科領域被引出版社的被引頻次和被引半衰期之間的相關性并不顯著,尤其在國土資源和城鄉建設學科中幾乎沒有相關性。科學出版社在該指標上的表現和之前相比出現了差異。雖然在國土資源及城鄉建設領域依舊表現出較高水平(分別是第四和第二),但是在公路交通領域的被引半衰期卻是最小的。一般來說,被引半衰期與出版社出版圖書的學科類型緊密相關。諸如上表中人民交通出版社、中國鐵道出版社、地質出版社、石油工業出版社、中國環境科學出版社、中國建筑工業出版社在各自側重的專業領域的被引半衰期較長,說明出版社在某學科方向的成熟度較高。因該指標是以統計出版社圖書在當年的被引情況為基礎,每年出版社的數據會有差異,采訪工作者可以以實時數據為依據,加強與學科領域被引半衰期大的出版社合作。因同一出版社在不同學科方向的被引半衰期可能會差別很大,所以在文獻資源采購時除了關注出版社信息外,更重要的是要關注出版社在不同學科領域的表現力,要集各家出版社之所長,為學校“雙一流”建設提供有力支撐。

表3 出版社總被引頻次和h指數關系

表4 出版社被引半衰期排名
影響因子指標多用于直觀反映期刊質量的好壞,在本文中根據其定義將其擴展用于出版社的評價。即出版社的影響因子=某出版社前兩年出版圖書在統計當年被引用的總次數/某出版社前兩年出版圖書總數。由于它屬于一種相對統計的評價指標,優勢在于可以消除出版社創社時長和規模大小的影響,所以可以用其比較不同歷史時長、不同規模的出版社。一般來說出版社影響因子越大,表明它在過去兩年出版圖書的平均學術影響力和作用也越大。不同于總被引頻次,影響因子反映的是出版社“最近”的學術影響力情況,對于當下研究更具有說服力[9]。
選擇中國知網中國引文數據庫被引文獻檢索下的被引出版社檢索,設定被引年為2018年,出版年為2016年和2017年,限定出版社輻射的學科類別,點擊檢索。出版社影響因子排名如表6所示。

表5 出版社總被引頻次和被引半衰期關系

表6 出版社影響因子排名
如前文所述,評定出版社是否適合館藏的指標不一,每個評價指標各自都會從自己獨有的角度反映出版社在某一方面的影響力。筆者試圖建立一種模型,盡可能用得分的形式直觀反映出版社在某學科領域的表現力。綜合各方關于館藏學科“核心出版社”的定義[10-12],筆者決定將學科指標(Subject Index,簡稱SI)、館藏指標(Library Index,簡稱LI)和文獻利用率(Literature Utilization,簡稱LU)三個因素作為評價出版社是否是館藏核心出版社的指標。
學科指標能直觀反映某一出版社在其學科領域的影響力,指標得分越高說明其學科地位越高。其定義為特定學科下某一出版社出版的圖書品種數占該學科領域所有圖書品種數的比例[13]。計算公式為:

式(1)中,SIi為第i(i=1,2,···,m)家出版社的學科指標值;mi為特定學科領域第i家出版社出版的圖書品種數;M為該學科領域所有出版社出版的圖書品種數。數據采集時間為2016—2018年。
館藏指標能直觀反映某一出版社出版圖書在本館的作用和地位,指標得分越高說明其館藏地位越高。其定義為本館采購的特定學科下某一出版社出版的圖書品種數占本館采購該學科領域所有圖書品種數的比例。計算公式為:

式(2)中,LIi為第i(i=1,2,···,m)家出版社的館藏指標值;ni為特定學科領域下本館采購的第i家出版社出版的圖書品種數;N為本館采購的該學科領域所有出版社出版的圖書品種數。數據采集時間為2016—2018年。
文獻利用率能直觀反映讀者對館藏圖書的利用情況,指標得分越高說明其利用率越高。其定義為特定學科下某一出版社出版的圖書年外借次數之和占本館該學科領域所有圖書年外借次數之和的比例。計算公式為:

式(3)中,LUi為第i(i=1,2,···,m)家出版社的學科指標值;UTi為特定學科領域第i家出版社出版的圖書年外借次數之和;UT為本館該學科領域所有出版社出版的圖書年外借次數之和。數據采集時間為2016—2018年。
關于核心出版社的測定方法不一,主要有布拉德福區域分析法、引文分析法、百分比法、累計80%法等[14-18],這些方法多是單方面系統分析研究對象,考慮的因素并不太全面。本文嘗試基于主成分分析法和綜合評價法測定核心出版社,克服了傳統方法忽略某一方面和主觀介入過多的缺點,將三個主要指標相對融合,最終引入一個量化的綜合得分來合理、客觀地測定核心出版社。計算公式為:

主成分及權重的分析由SPSS軟件執行。根據數理統計的相關知識結合SPSS軟件里面的因子分析模塊,得到主成分載荷矩陣。主成分載荷矩陣分別與三個原始評價指標的標準分乘積之和即為計算得到的主成分,全程分析計算均在SPSS軟件里面實現。
以前文分析的三大學科領域為背景,采用上述指標體系和計算模型測定我館的核心出版社。具體做法如下:先從CALIS聯合目錄公共檢索系統的高級檢索模塊(http://opac.calis.edu.cn/opac/advanceSearch.do)設定好檢索規則,檢索出上述三個學科領域2016—2018年出版的圖書書目,得到出版總數及各個出版社的出版目錄,計算出學科指標值。然后利用我館匯文文獻信息服務系統的統計數據,得到我館2016—2018年采購的學科領域圖書的出版社分布和借閱次數,從而計算出各個出版社的館藏指標值和文獻利用率。最后根據上述測定模型計算出各個出版社的綜合得分,如表7—表9所示。
國土資源、城鄉建設、公路交通是長安大學的三大重點學科,筆者取其綜合得分大于零的出版社作為我館的中文圖書絕對核心出版社,包括國土資源領域的地質出版社、科學出版社,城鄉建設領域的中國建筑工業出版社以及公路交通領域的人民交通出版社。其余出版社為核心出版社。

表7 國土資源領域出版社測定模型

表8 城鄉建設領域出版社測定模型

表9 公路交通領域出版社測定模型
2016—2018年表中出版社在國土資源領域出版的品種占該領域所有圖書的34.34%,城鄉建設領域占比46.53%,公路交通領域占比64.38%。館藏方面,我館這三大類圖書的占比分別為63.77%、43.13%和62.31%。在讀者利用方面,這三大類圖書借閱次數占該學科圖書總借閱次數分別是65.14%、61.05%和85.69%。這幾組數據說明了我們的采購導向較為準確。對我館來說,采訪重點學科類圖書應盡可能保證絕對核心及核心出版社的圖書百分百收集齊全,這些出版社的圖書是學科資源的重要保障,亦是讀者的廣泛需求所在。在保障這類館藏資源的前提下,可根據讀者實際薦購需求和文獻自身內容質量選擇其余出版社的品種進行補充。
通過以上分析我們可以得知:通過出版社出版圖書的科學計量評價指標分析可以客觀反映出版社的學術影響力,為圖書館確定館藏政策提供客觀依據。應用引文分析方法及各種文獻計量學客觀指標,從不同角度反映出版社的不同影響力。同時結合前人研究成果,采用主成分分析法及綜合評價法對出版社的三個重要評價指標作了直觀分析,建立了一種較為客觀、合理的核心出版社測定模型,為今后館藏資源建設的布局提供了一定的參考價值。