朱世偉,鞠鎂隆,于俊鳳,魏墨濟,王蕾
(山東省科學院情報研究所,山東 濟南 250014)
數字資源(電子資源)是被設計用來存儲海量的結構化或者半結構化數據的元數據倉儲。近年來,隨著對數字圖書館和電子資源投入日漸加大,進行數字資源績效評估的需求也更加迫切[1]。需要開發相關的績效評價模型來對電子資源的使用績效進行評估。
美國圖書館界在20世紀60年代后期把在企業管理界應用廣泛的績效評價方法引入到圖書館的服務績效評價中[2]。經過近半個世紀的發展,相關專家學者對圖書館服務績效評價的概念和內涵已經達成了部分共識:圖書館的績效評價,就是按照給定的標準和要求,設定一定的指標,利用科學評價方法和模型,對一定資金和其它資源投入的圖書館在一定時間內的產出和服務進行評價和測試[3],也就是說,對圖書館在一定投入資本下的產出效益進行評估和比較。
20世紀90年代中后期,以英美發達國家為首的部分國家和地區發起了一些針對數字圖書館服務績效進行評估的項目,并由此建立了一些績效評價的標準和指南。主要有:(1)美國圖書館研究協會發起的“ARL電子圖書館服務評價(E-METRICS)”項目[4-5]對數字圖書館數字資源的服務績效的評估進行了研究和分析,提出了一套數字資源績效評價的指標體系,該體系共包含14個數字資源績效評價指標;(2)網絡電子資源在線使用統計(COUNTER)項目[6]設定了4大類數字資源使用的規范和準則。截至目前,COUNTER已經成為了數字圖書館績效評估方面的國際通用標準和規范;(3)歐洲圖書館績效評價和質量管理系統EQUINOX項目從5個方面設定了14個指標對數字資源服務績效進行評價[7];(4)網絡環境中國家公共圖書館統計和績效測度項目出版了《公共圖書館網絡化服務統計和績效測度》手冊,提出了一整套對公共圖書館數字資源和服務進行評價的統計指標體系[7]。
國內的相關研究多數都是獨立進行的,幾乎沒有相關的學術團體或者部門對該類項目的開展進行任何形式的資助。索傳軍等[3]對電子資源在線使用統計進行了分析,指出數字資源績效評價的主要目標是為了促進電子資源的標準化和易用性。黃穎[8]以用戶感知為中心的圖書館績效評價模型LibQUAL+TM為理論基礎,進一步剖析了學術環境下的滿意程度與服務質量的辨證關系,構建了一個以內部圖書館專家群體確定和外部終端用戶群體感知為核心的、融合滿意程度和服務質量的大學圖書館電子資源績效評價理論模型。史繼紅[9]比較了EQUINOX項目和ARL E-Metrics項目的評價結果,提出了包括不同方法優缺點、指標選取原則等在內的一系列相關問題。
上述研究為數字資源建設做出了貢獻,然而,當前國內的研究還存在兩個弊端:一是國內學者開展的研究大多采用在國外廣為使用的方法和模型,對國內高校或者公立圖書館的數字資源提供的服務進行績效評價,卻忽視了尋找符合我國實際情況的評價模型和指標體系的工作;二是部分學者雖然提出了自己獨創的評價模型和方法,但是卻沒有進行實驗分析和驗證。本文提出了模糊神經網絡(fuzzy neural network,FNN)評價模型,對高校和公立圖書館數字資源的使用績效進行評價,并選取數據進行了實驗驗證。
模糊神經網絡的結構如圖1所示。為了簡單說明,我們假定本文考慮的模糊神經網絡具有多個輸入和一個輸出。模糊神經網絡的結構為5層結構,推理規則采用Takagi-Sugeno模糊推理邏輯,推理規則為[10]:

其中,Rk是第k個規則(1≤k≤L),L是規則的長度,x={xi},i=1,…,n為輸入向量,ωk是第 k個網絡的連接參數[11]。是Gaussian核函數定義的模糊集合:

圖1 模糊神經網絡結構圖Fig.1 Structure illustration of fuzzy neural network

其中 i=1,2,…,n,k=1,2,…,L,μik是 xi的成員函數,cik和σik分別是Gaussian核函數的中心和寬度,n是輸入向量的數量,L是每個輸入變量成員函數的數量[12-13]。
模糊神經網絡各層實現的主要功能如下:
第一層:輸入層,該層每一個節點代表一個輸入向量;
第二層:模糊化層,該層的每一個節點被劃分成L個組,每個組代表一個模糊規則的IF推理部分[14]。每一個節點都參與成員函數μik(xi)值的計算;
第三層:模糊推理層,該層的節點數目和模糊規則的數目相等,每個節點都參與計算第k個模糊規則Rk,其輸出為:

第四層:歸一化層,實現歸一化計算。節點的數目與第三層節點數目相等[15]。Nk節點的輸出為:

第五層:輸出層,輸出層只有一個節點,其輸出y為:

其中,ωk是規則k的連接參數(連接權值)。
傳統FNN輸入變量的成員函數數量需要根據專家知識來確定。然而,不同的模糊系統之間的差別是顯而易見的,因此,對于網絡設計者來說,針對特定系統選擇恰當的模糊規則數不是一件容易的事情。此外,固定結構的模糊神經網絡在面對不同的數據集時的適應性也是一個不可回避的問題。模糊規則過多或者過少都將會對系統的分析造成難以避免的錯誤和問題[16]。本文中模糊規則數的確定采用了由Qiao[17]提出的一種自組織的算法來執行,該方法能夠自動地按照實際問題的需求確定模糊規則數。
模糊神經網絡的自組織算法主要分為網絡結構的設計和參數的優化訓練兩個步驟進行。每個階段都假設數據集是由p個輸入-輸出對組成:

為給FNN選擇合適的模糊規則數,我們在輸入輸出空間的劃分中采用了聚類算法,利用改進的RPCL(Rival penalized competitive learning)[18]算法來獲得緊湊的網絡結構。聚類的數量在訓練的過程中自動的獲得,以此來獲得可伸縮性的輸入輸出空間劃分方法和優化的模糊規則數。然后,刪除部分冗余節點和連接,產生最終優化的模糊神經網絡結構。
網絡結構確定以后,便進入優化學習階段,該階段將采用自組織學習階段獲得的參數初始化網絡。參數的優化在相同的數據集合S上利用改進的反向傳播算法(Back propagation algorithm)執行,以獲得最終的最優網絡模型[19]。
給定集合S中任意的輸入xp,根據公式(1)~(4),可以得到網絡的輸出為:

假設網絡誤差函數為:

其中,yp和是p維的網絡輸出值和期望輸出值,可以得到:

從公式(8)可以計算得到:

同樣的我們可以分別得到方差σik和權值ωk,計算公式分別如式(10)、(11)所示:


數字資源服務績效評價系統是一個結構復雜的系統,包含特定的使用環境、服務條件和數字資源服務效益等諸多影響因素,因此,需要通過對數字資源的服務績效在縱向和橫向上進行比較,以此來確定最佳的評價指標,如此一來,便無形中提高了評價指標選取的難度。本文在評價指標的選取時,考慮借鑒美國國家信息標準化組織(NISO)頒布的《信息服務和使用:圖書館和信息服務機構統計指標——數據字典(ANSI/NISO Z39.7-2004)》標準,同時結合我國數字圖書館建設的實際狀況,依據科學性與全面性、定量指標與定性指標、可比性與可操作性等原則相結合,構建了一套數字資源服務績效評價的指標體系框架[3,6]。
綜上所述,本文選取的數字資源服務績效評價指標如表1所示。

表1 績效評價指標Table 1 Performance evaluation index
本文主要目標是為了驗證所提出的評價模型和方法的可行性與準確性,為了便于說明,我們以山東省內高校、科研院所的數字圖書館提供的數字資源為例,采集其2005—2010年的統計數據為研究對象。對樣本數據進行初步的分析,剔除難以獲取的數據和上述指標數據不完整的數字資源樣本,得到的研究樣本共計120家,其中訓練樣本和檢驗樣本數量分別為80和40。
隨著輸入維數的增加,FNN的模糊規則數量將按照指數級增加,因此,當輸入節點的數量過多時,就必然會增加模糊神經網絡的結構復雜度,進而增加網絡訓練的時間。為有效地克服上述問題,同時在最大程度上減少主觀因素對于網絡評價結果的影響,本文所采用的神經網絡將利用分層次的遞接評價方法。該方法首先利用BP神經網絡訓練樣本數據,對定性評價指標則采用模糊神經網絡進行訓練和學習,對經過BP網絡和FNN網絡訓練得到的結果再利用FNN進行模糊評價,最終得到數字資源績效評價的結果。我們假設最終的評價結果集合為F:Y→Z={優、良、中、差}。其中,Y為模糊神經網絡的最后輸出結果,Z為數字資源對應的績效評價等級。
本文構建的BP神經網絡為3層結構,其中輸入層神經元數個是20,輸出層神經元個數為1(輸出結果為數字資源服務績效的等級)。利用逐次對比和試用的方法,最終確定當隱含層神經元數為15時,BP神經網絡的訓練誤差最小,訓練時間最短。BP神經網絡訓練的誤差曲線如圖2所示。

圖2 BP神經網絡訓練誤差曲線Fig.2 Training error curve of BP neural network

圖3 FNN均方誤差變化曲線Fig.3 Mean square error curve of FNN

圖4 FNN的實際輸出與期望輸出Fig.4 Practical output and expected output of FNN
由定性評價指標構建的模糊神經網絡FNN,由6個輸入指標、1個模糊輸出和由16個神經元組成的模糊化層組成,該網絡的模糊規則數量為256(實驗分析得出)。
最終構造的FNN包含2個輸入節點(定量評價指標等級結果和定性評價指標等級結果)、1個輸出節點(數字資源服務績效評價結果),其中的模糊化層包含12個神經元,模糊規則數為24條。網絡訓練過程中產生的均方誤差曲線如圖3所示。
從圖3中可以得到,樣本數據訓練的均方誤差曲線相對平穩,當均方誤差達到1.7843×10-5時,神經網絡的學習效果為最好。
最后把檢驗樣本數據輸入到訓練完成的模糊神經網絡中,進行數字資源服務績效評價。我們得到網絡的期望輸出(用戶主觀評價結果)與網絡實際輸出如圖4所示,其中平均誤差為0.0019。
從圖4我們可以得到,本研究提出的模糊神經網絡評價模型能夠較好地完成電子資源績效評價的任務,績效評價的時間效率和準確率都比較理想。通過對實驗結果的分析,我們發現模糊神經網絡電子資源績效評價的準確率達到了83.7%,表明基于模糊神經網絡的電子資源績效評價模型和方法是切實可行的。
本研究提出的模糊神經網絡電子資源績效評價模型方法,較好地完成了電子資源績效評價的任務,并且由于有效地克服了傳統的基于統計的評價模型與方法的不足,減少了主觀因素對評價結果的影響,提高了評價結果的客觀性和準確率。
[1]曾照云,張永杰,楊蘭芝.數字資源服務績效評估研究綜述[J].圖書館和信息服務,2008,52(8):54-57.
[2]余勝.關于圖書館績效評估的研究與實踐[J].中國圖書館學報,2006(4):101104.
[3]索傳軍,王建朋.國外電子資源在線使用統計研究述評[J].圖書館,2006(6):43-46.
[4]BLIXRUD J C.Measures for electronic use:The ARL E-metrics project[J].Statistics in Practice-Measuring& Managing,2002,9:73-84.
[5]MILLER R,SCHMID S.E-metrics:Measures for electronic resources[J].The Journal for the Serial Community,2002,15(1):19-25.
[6]索傳軍.論電子資源在線使用統計數據的收集與分析[J].中國圖書館學報,2006,32(3):65-68.
[7]張秀華,楊洪勇,宋艷梅.基于灰色關聯分析和BP神經網絡的數字資源服務績效評價研究[J].情報學報,2010,29(3):468-473.
[8]黃穎.圖書館電子資源績效評價模型構建分析[J].現代情報,2009,29(8):106-107.
[9]史繼紅.兩個重要的電子資源使用績效評價體系的比較:歐洲的EQUINOX項目與美國的ARL E-metrics項目[J].數字圖書館論壇,2007,38(7):53-57.
[10]ZHANG Y.Application of T-S fuzzy neural network based on declination compensation in soft sensing[J].Mathematics and Computers in Simulation,2011,32(12):1 -8.
[11]BARBOUNIS T G,THEOCHARIS J B.A locally recurrent fuzzy neural network with application to the wind speed prediction using spatial correlation[J].Neurocomputing,2007,70(10):1525 -1542.
[12]KHAYAT O,EBADZADEH M M,SHAHDOOSTI H R,et al.A novel hybrid algorithm for creating self-organizing fuzzy neural networks[J].Neurocomputing,2009,73(1):517 -524.
[13]DENG X S,WANG X Z.Incremental learning of dynamic fuzzy neural networks for accurate system modeling[J].Fuzzy Sets and Systems,2009,160(5):972 -987.
[14]LENG G,McCINNITY T M,G Prasad,et al.An approach for on-line extraction of fuzzy rules using a self-organizing fuzzy neural network[J].Fuzzy Sets and Systems,2005,150(10):211 -243.
[15]YE B,YU Z,PAVLIKOVSKAYA E,et al.The neo-fuzzy neural network structure optimization using the GMDH for the solving forecasting and classification problems[C]//IWIM,2009.Krynica,Poland:IEEE computer society,2009:77 -89.
[16]LIN C T,YEH C M,CHUNG J F,et al.Suppoet-vector-based fuzzy neural networks[J].International Journal of Computational Intelligence Research,2005,1(2):138-150.
[17]QIAO J F,WANG H D.A self-organizing fuzzy neural network and its applications to function approximation and forecast modeling[J].Nurocomputing,2008,71(2):564-569.
[18]ALIEV R A,GUIRIMOV B G,FAZLOLLAHI B,et al.Evolutionary algorithm-based learning of fuzzy neural networks:Recurrent fuzzy neural networks[J].Fuzzy Sets and Systems,2009,160(8):2553 -2566.
[19]NAIR T M,ZHENG C L,FINK J L,et al.Rival penalized competitive learning(RPCL):A topology-determining algorithm for analyzing gene expression data[J].Compute Biol Chem,2003,27(6):565-574.