摘 要 本文將粗糙集理論與模糊集理論結合起來,給出一種圖書館最優選書算法.該算法首先從已知數據的初始信息系統出發,計算各選書方案之間的相似度,從而構造相似矩陣,然后根據相似矩陣的傳遞閉包對各方案進行聚類,并根據粗糙集理論求各屬性重要性,最后利用加權綜合的思想及最小距離方法選擇最優買書方案.
關鍵詞 相似矩陣;模糊集;最優方案
中圖分類號 O159 文獻標識碼 A
The Optimal Algorithm of Library to Selection Books
Based on Rough Set and Fuzzy Set
ZHAO Liping1,LIU Wenjun2
(1.Changsha University of Science and Technology Library, Changsha,Hunan 410076,China;2.Department of Mathematics
and Computing Science, Changsha University of Science and Technology, Changsha,Hunan 410076,China)
Abstract Combining rough set and fuzzy set theory, an optimal decision algorithm of library to select books was put forward. During this algorithm, firstly, we constructed the similarity matrix from the original information system; secondly, we classified all the programs according to fuzzy clustering; thirdly, an algorithm to choose the optimal program was put forward according to the minimum distance of weighted relative deviation.
Key words Rough set; fuzzy set; optimal program.
1 引 言
圖書館是社會公眾文化領域的主陣地,是社會知識信息的存儲、咨詢中心,也是弘揚社會主義精神文明主旋律的重要載體.隨著科技的發展,圖書館不僅在數量上需要增加,而且圖書種類也須向多樣化發展,圖書館的價值不再僅僅以其所擁有的館藏圖書的數量來衡量,而是以它為用戶提供各種形式的信息的能力和質量來衡量.在這種新形式下,圖書館在選書決策時,如何利用目前有限的人力、經費資源,而又使所做決策符合讀者閱讀或參考,從而為廣大讀者提供高質量的服務,是目前圖書工作者需要認真研究和解決的一個重要課題.
在實際過程中,由于影響購書決策的因素很多,且大多數具有模糊性與不確定性,所以在處理這類問題時,可以結合不確定性理論.本文就是基于這種想法,結合粗糙集與模糊集這兩種不確定性理論,給出一種圖書館最優選書算法.
2 粗糙集相關知識簡介
粗糙集理論[1]是由波蘭學者Z.Pawlak在1982年提出的一種處理含糊和不確性問題的新型數學工具.經過20多年的發展,該理論已滲透到人工智能的各個分支,在機器學習、決策分析、過程控制、模式識別與數據挖掘等領域取得了成功的應用[2-6].該理論的一個最大優點是它無須提供問題所需處理的數據集合之外的任何先驗信息, 能客觀有效地分析和處理不精確、不確定與不完全數據,并從中發現隱含的知識,揭示潛在的規律.
為了處理智能數據,粗糙集理論將知識進行符號化,將所要研究的數據用一個信息系統的形式給出,信息系統的基本成分是研究對象的集合,關于這些對象的知識是通過指定對象的基本特征(屬性)和它們的特征值(屬性值)來描述.信息系統的數據以關系表的形式表示,關系表的行對應要研究的對象,列對應對象的屬性,對象的信息是通過指定對象的各屬性值來表達.
3 聚類分析
對數據進行模糊聚類分析,一般有數據規格化、建立模糊相似矩陣、聚類三大步.
第一步:數據規格化
在實際應用中,不同的數據可能有不同的量綱和數量級,故在運算過程中可能突出某數量級特別大的特性指標對分類的作用,而降低甚至排除了某些數量級很小的我一指標的作用,致使對各特性指標的分類 缺乏一個統一的尺度,為了清除特性指標單位的差別和特性指標數量級不同的影響,必須對各指標值施行數據規格化的處理,從而使每一個指標值統一于某種共同的數值特性范圍.
設U={u1,u2,…,un}為被分類的對象,每個對象有m個指標描述,即對第i個對象有ui={xi1,xi2,…,xim} (i=1,2, …,n), 則對應的數據信息見表1:
6 小 結
隨著科學技術的發展,社會對人才的要求最來越高,而圖書館的建設與發展是提高人們素質的一個重要基礎.在新形勢下,各圖書館如何針對自身的特色,選擇適合讀者研究需要和閱讀參考的圖書,是圖書館面臨的一項重要任務.本文結合模糊集與粗糙集理論,對擬選圖書根據給定的條件進行計算分析,為館員提供最佳選擇方案,從而讓館員在有限精力的條件下選擇確定合適圖書.節省了館員的時間,同時也可以使做出的購書決策更全面地符合實際需要.
參考文獻
[1] Z PAWLAK. Rough set:theoretical aspects of reasoning about data[M]. Dordrecht:Kluwer Academic Publishers,1991.
[2] Y Y YAO, Y ZHAO. Attribute reduction in decision-theoretic rough set models[J]. Information Sciences, 2008,178(17): 3356-3373.
[3] 胡清華,謝宗霞,于達仁.基于粗糙集加權的文本分類方法研究[J].情報學報,2005,24(1):91-100.
[4] 王國胤,張清化.不同知識粒度下粗糙集的不確定性研究[J].計算機學報,2008,31(9):1588-1598.
[5] 史忠植. 知識發現[M].2版.北京:清華大學出版社, 2011.
[6] 王國胤,姚一豫,于洪.粗糙集理論與應用研究綜述[J]. 計算機學報,2009,32(7): 1229-1243.
[7] 張振良. 模糊集理論與方法[M].武漢: 武漢大學出版社, 2010.
[8] 梁保松, 曹殿立. 模糊數學及其應用[M]. 北京: 科學出版社, 2007.