〔摘 要〕探討特色數據庫質量的評價指標體系、評語集及權重的測定方法,在此基礎上構建特色數據庫質量模糊綜合評價模型,以便對其進行更加客觀的定量化的評價。
〔關鍵詞〕特色數據庫;模糊綜合評價;評價模型
〔中圖分類號〕G250.74 〔文獻標識碼〕B 〔文章編號〕1008-0821(2009)05-0100-04
Fuzzy Comprehensive Evaluation Model of Characteristic DatabaseZheng Guiyu Liu Fang Zhang Xiaoying
(Library,China Three Gorges University,Yichang 443003,China)
〔Abstract〕This paper described evaluating indexes system,comment aggregation and weight measurement on the quality of characteristic database.On this basis,the author established a model of fuzzy comprehensive evaluation.More objectively and quantitatively could be evaluated on the quality of characteristic database.
〔Keywords〕characteristic database;fuzzy comprehensive evaluation;evaluation model
自90年代以來,一大批特色鮮明、實用性強、價值突出、技術先進的特色數據庫不斷涌 現出來,在圖書館文獻保障體系中發揮著重要的作用。但也不可否認,這些特色數據庫質量 參差不齊,如何科學、有效地評價和控制特色數據庫質量,是特色數據庫建設的一個重要問 題。在現有的文獻中,對特色數據庫質量評價的相關研究多是定性化的,對特色數據庫質量 的模糊綜合評價幾乎為空白。故而評價的結果往往準確度不高,造成了事實上的不可比性,實用性不高。由于特色數據庫質量的好壞和評價等級的劃分,其界限具有不確定性和模糊性 ,人為地用特定的分級標準去評價它是不確切的,運用常規的數學方法也難于解決,處理這 類問題有效而實用的評價方法是模糊綜合評價[1]。本文擬根據模糊數學原理,建 立特色數據庫質量模糊綜合評價的模型,對特色數據庫質量作出定量化的評價。
1 設計特色數據庫質量評價指標體系[2]
科學、客觀、全面地設計指標體系是模糊綜合評價的基礎。遵循科學性、合理性、可測性和 可行性的原則,結合特色數據庫建設的特點,有關特色數據庫質量方面的評價指標,筆者認 為主要應包括以下內容:
1.1 數據資源
任何一個數據庫都必須具有一定數量的數據資源,這是一個數據庫存在的基礎。①特色數據 。這是特色數據庫區別于一般數據庫的重要指標,包括地方特色、學科特色、專業特色、文 化特色、產業特色和館藏特色,與學科、地方文化和經濟建設發展相適應。②數據總量。數 據總量應不少于3萬條,學科門類覆蓋面要廣。③全文數據。全文數據與二次文獻比例不少 于20%。④數據來源。數據來源的準確性、完整性、連續性、權威性和時效性。 ⑤數據類型。包括期刊、會議論文、學位論文、報紙、專利、科技成果、專業書目、專家和 學術機構等,數據庫建庫內容應不少于三種文獻類型。⑥數據年限。收錄時間跨度越大越好 。⑦更新頻率。數據更新時間周期要短,日更新或周更新。
1.2 數據組織
①規范性。遵循數據庫建設的有關國際標準和國家標準,結合資源情況,制定數據組織的一 系列相關規范,如確定元數據標準、詞表的選用、標引方式、標引深度、關鍵詞的控制標準 、數據標引和錄入規則等。②建庫文檔。庫結構中要具有必備字段。③數據加工。數據加工 格式符合規范要求。④標引質量。分類、主題詞和關鍵詞標引正確、一致和專指,對詞間關 系(同義詞、近義詞、反義詞)控制好。⑤錄入質量。數據錄入程序規范,內容準確,必備 字段著錄完備。
1.3 檢索系統
①導航設置。包括學科導航、類型導航、資源導航、功能導航等。②檢索界面。界面友好、 直觀、功能多、操作簡便。③檢索途徑。提供檢索字段和入口多,如:題名、分類、刊名、 主題、作者、關鍵詞、摘要、全文、參考文獻、出版者、出版年、機構、ISBN、ISSN和統一 刊號等,至少提供前面八種檢索入口。④檢索方式。提供多種檢索方式,如簡單檢索、二次 檢索、高級檢索、專業檢索、分類檢索、瀏覽檢索等。⑤檢索技術。檢索技術先進、多樣, 如布爾檢索、截詞檢索、位置檢索、聚類檢索、字段檢索、全文檢索、引文檢索,以及中英 文等多種語言的聯合檢索功能等。⑥檢索效率。考察查全率和查準率。⑦鏈接功能。有文摘 、全文、引用文獻、同類文獻、相似文獻、被引文獻等的鏈接,及與其它數據庫和相關信息 的鏈接。⑧檢索顯示。每屏顯示條目數多、質量高、速度快,有篇名、作者、刊名、年代和 多種排序顯示(無序、時間、相關度)。⑨檢索結果輸出。在線瀏覽、存盤、復制、打印、 E-mail發送、加入收藏,檢索接口方便用戶隨時調整檢索策略。
1.4 服務功能
主要包括文獻傳遞、定制服務、推薦服務、專家咨詢、在線統計、用戶意見反饋。在線統計 主要是對用戶和利用的統計,提供訪問統計或點擊數統計和用戶分析報告。
1.5 使用情況
①點擊率。用戶網站訪問量和數據訪問量。②文獻下載量。③用戶評價。用戶對特色數據庫 使用后的總體評價。④共享度。能提供地區或更大范圍的資源共享服務,用戶可通過互聯網 訪問。
綜上構成特色數據庫質量評價指標體系(見圖1)。用U={U1,U2,U3,U4,U5}表示第一級指標集,Uj={u(j)1,u(j)2,…,形成一個整體,決定著特色數據庫的質量。2009年5月第29卷第5期現?代?情?報J
2 確定評語集合
評語等級及等級標準的確定也是模糊綜合評價的基礎工作之一。根據評價決策需要,將特色數據庫質量評價標準分為很好、較好、一般、較差和很差5個等級,即評語集合為V={v1,v2,v3,v4,v5}={很好,較好,一般,較差,很差}。為了研究結果的精確性,在此對各評語等級的值域進行界定,其中100~90分為很好,89~80分為較好,79~70分為一般,69~60分為較差,≤59分為很差。進一步取各組最大值對各評語等級賦值如下:很好為100分,較好為89分,一般為79分,較差為69分,很差為59分。設評語等級賦值之后的矩陣為S,則S=(1.00,0.89,0.79,0.69,0.59)T。
3 測定各指標權重
在模糊綜合評價中權重的測定占有重要地位,直接影響評價的結果。對權重的確定,通常是憑經驗給出,但它往往帶有主觀性,有時不能客觀地反映實際情況,評價結果可能“失真”。因此,權重應按科學方法來確定。權重的確定方法有多種,主要有專家估測法[3]、層次分析法[4]、加權統計法[3]和頻數統計法[3]等。較常用的是專家估測法,本文采用這種方法來測定特色數據庫質量評價諸指標的相對權重。
專家估測法的基本方法是,假設因素集W={x1,x2,…,xn},現有k個專家各自獨立地給出各單因素xi(i=1,2,…,n)的權重,如表1所示。表1 專家估測權重
專 家因素x1x2…xn∑專家1a11a12…a1n1專家
根據表1,取各因素權重的平均值作為其權重aj=1k∑ki=1aij根據專家估測法,就可測定出特色數據庫質量評價指標體系(圖1)中Uj和u(j)
4 建立二級評價模型
根據特色數據庫質量評價指標體系(圖1)建立二級評價模型[5]。
第一步,根據圖1,U={U1,U2,U3,U4,U5}為第一級指標集,Uj4(較差),v5(很差)}。由若干專家采用投票(或打分)的方法,直接對圖1中的第二級指對評語集V的隸屬向量(r(j)i1,r(j)i2,r
如果需要,對B作歸一化處理為B′。按最大隸屬原則,取B′中最大值對應的評語集V中的評語作為最終評價結果。
在對有些實際問題的處理中,為了充分利用綜合評價帶來的信息,將評價集的等級用1分制數量化,對評價結果進行加權平均,可得到特色數據庫評價總分,即
B′S=B′(1.00,0.89,0.79,0.69,0.59)T
這樣,依據分值多少,可對各特色數據庫進行排序和評價。
5 實例分析
假定對某一圖書館的特色數據庫甲質量進行模糊綜合評價。建立由若干個專家組成的評價組,評價組通過專家估測法測定出特色數據庫甲的各指標權重系數(見表2),然后對特色數據庫甲的第二級指標集按評語集V={v1(很好),v2(較好),v3(一般),v4(較差),v5(很差)}進行單因素評價,將其評價結果進行統計,建立如表2所示的匯總表。表
即特色數據庫甲質量綜合評價為88.9分,然后可依據這個分值與其它特色數據庫進行比較
和評價。
6 結 語
上述特色數據庫質量模糊綜合評價的模型簡便實用,不僅可根據模糊評價集上的值按最大隸 屬原則去評定特色數據庫質量所屬的等級,還可對特色數據庫按綜合分值的大小進行排序, 便于不同特色數據庫間質量的評價和對比,很好地解決了評價過程中定性指標難于比較的困 難,較常規的方法準確,可減少隨機性,評價結果更加接近客觀實際。
對特色數據庫質量進行模糊綜合評價,有利于特色數據庫建設水平的提高,促進特色數據庫 的建設和發展。但模糊綜合評價法奠基于模糊數學,綜合評價的可靠性和準確性依賴于選取 合適的評價模型和算法,如何使所選擇的評價模型更加客觀、科學和實用,還需要更多專家 的研究和實踐。
參考文獻
[1]Sadip R,Husain T,Veitch B,et al.Risk-Based Decision-making for Drilling Waste Discharges Using a Fuzzy Synthetic Evaluation Technique[J].Ocean Engineering,2004,31(16):1929-1953.
[2]李明伍,呂先競.特色數據庫系統建設評價指標分析[J].現代情報,2008,(1) :81-84.
[3]謝季堅,劉承平.模糊數學方法及其應用[M].武漢:華中科技大學出版社,2000:215-216.
[3]閻家杰.確定多因素權重分配的AHP方法[J].鄭州工學院學報,1994,(1):83-85.
[4]胡寶清.模糊理論基礎[M].廣州:華南理工大學出版社,2004:218-222.