999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

聚類分析在圖書館管理中的應(yīng)用研究

2016-06-28 01:33:07裴勝玉廣西財(cái)經(jīng)學(xué)院廣西南寧530003
關(guān)鍵詞:數(shù)據(jù)挖掘

童 浪 裴勝玉(廣西財(cái)經(jīng)學(xué)院,廣西 南寧 530003)

?

聚類分析在圖書館管理中的應(yīng)用研究

童 浪 裴勝玉
(廣西財(cái)經(jīng)學(xué)院,廣西 南寧 530003)

摘 要:聚類分析是數(shù)據(jù)挖掘中的一種非監(jiān)督分類技術(shù)。聚類分析作為輔助技術(shù)在圖書館管理中發(fā)揮了巨大的作用。本文在介紹聚類分析的基礎(chǔ)上,分析了聚類分析在圖書館管理中的應(yīng)用研究,指出當(dāng)前聚類分析算法存在的不足,提出新的聚類分析方法。

關(guān)鍵詞:聚類分析;數(shù)據(jù)挖掘;非監(jiān)督學(xué)習(xí);圖書館管理

高等學(xué)校圖書館作為高校信息服務(wù)中心,提供高等學(xué)校教學(xué)和科學(xué)研究服務(wù),是培養(yǎng)人才和開展科學(xué)研究的重要基地之一,在高校發(fā)揮著舉足輕重的作用。隨著大學(xué)教育的發(fā)展,高校圖書館的藏書量大幅度增長(zhǎng),隨著計(jì)算機(jī)技術(shù)的普及和信息資源的日益增長(zhǎng),高校數(shù)字圖書館數(shù)據(jù)呈幾何倍數(shù)增長(zhǎng)。面對(duì)這些海量數(shù)據(jù),為更好地推動(dòng)高校圖書館管理,學(xué)者們相繼提出了各自的聚類分析算法,聚類分析也成為高校圖書館管理中的重要研究技術(shù)之一。

本文結(jié)合圖書館管理中的應(yīng)用,概述聚類分析的基礎(chǔ)上,對(duì)聚類分析在圖書館管理中的應(yīng)用研究進(jìn)行分析,指出當(dāng)前聚類分析算法存在的不足,提出新的聚類分析方法,從而推進(jìn)聚類分析在圖書館管理中技術(shù)研究。

1 聚類分析概述

需求是發(fā)明之母。20世紀(jì)70年代初,數(shù)據(jù)挖掘成為了慢慢興起的數(shù)據(jù)智能分析技術(shù),引起專家學(xué)者們的極大關(guān)注,主要源于存在大量數(shù)據(jù),而這些數(shù)據(jù)也迫切需要轉(zhuǎn)換成有用的信息和知識(shí)。在這一歷史發(fā)展階段,聚類分析是數(shù)據(jù)挖掘研究領(lǐng)域的重點(diǎn)課題。

1.1 聚類分析概念

數(shù)據(jù)挖掘(Data Mining,DM)又譯為資料探斟,它是數(shù)據(jù)庫(kù)知識(shí)發(fā)現(xiàn)中的一個(gè)步驟。數(shù)據(jù)挖掘一般是指從大量的、隨機(jī)的、不完全的、模糊的、有噪聲的數(shù)據(jù)中通過算法搜索隱藏于其中信息的過程。數(shù)據(jù)挖掘的任務(wù)主要包含關(guān)聯(lián)分析、聚類分析、分類、預(yù)測(cè)、時(shí)序模式和偏差分析等。聚類分析(Clustering analysis)正是數(shù)據(jù)挖掘中的一項(xiàng)重要任務(wù)。聚類分析以“物以類聚”作為劃分依據(jù),將按相似性將數(shù)據(jù)歸納成若干類別,相同類別的數(shù)據(jù)相似,不相同類別的數(shù)據(jù)彼此相異,聚類過程中劃為一組的稱為一個(gè)類(Cluster)。于是可以得出聚類分析的數(shù)學(xué)表達(dá)方式:

對(duì)于數(shù)據(jù)集合V{vi|i=1,2,...,n},這里,vi為數(shù)據(jù)對(duì)象,依據(jù)數(shù)據(jù)對(duì)象之間的相近程度將數(shù)據(jù)集合V劃分成k組,滿足以下條件

這一過程稱為聚類分析,Ci(i=1,2,...,n)稱為類(或簇)。

1.2 聚類分析原理

用有序?qū)Γ▁,s)或(x,d)表示輸入,s和d表示聚類樣本數(shù)據(jù)之間的相似程度和相異程度標(biāo)準(zhǔn)。x={G1,G2,...,Gk}作為輸出,其中Gk(k=1,2,...,N)為x的子集,即滿足以下條件

圖1 聚類分析算法分類及代表算法

子集G1,G2,...,Gk稱為類,這些子集都是通過一些關(guān)鍵特征進(jìn)行描述的。通常,可以通過這些樣本集合的重心或類(簇)中關(guān)系的點(diǎn)來表示n維空間的一類;或借助聚類樹的方式用于表示一類;或通過樣本點(diǎn)屬性的邏輯表達(dá)式表示一類。

1.3 聚類分析算法

聚類分析有許多種不同的方法,主要包含以下幾種:層次聚類方法、劃分聚類方法、基于密度的聚類、基于網(wǎng)格的算法和基于模型的算法。以下給出聚類分析算法的分類及代表算法。

2 聚類分析在圖書館管理中應(yīng)用研究

伴隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的快速發(fā)展,高校圖書館的藏書量大幅度增長(zhǎng),高校圖書館在人才培養(yǎng)和科學(xué)研究中所占的位置也日益提升,除了傳統(tǒng)模式的圖書館管理外,數(shù)字圖書館也迅速在高校推廣起來。

2.1 聚類分析在圖書管理系統(tǒng)中的應(yīng)用

在圖書管理中,運(yùn)用聚類分析技術(shù)主要體現(xiàn)在以下幾個(gè)方面。比如,從樣本數(shù)據(jù)中分析出讀者的閱讀傾向。如孫凌云在論文中分析了高校學(xué)生讀者的閱讀傾向,以及給出圖書館的相關(guān)對(duì)策;吳志強(qiáng)在論文中應(yīng)用了聚類分析來研究讀者閱讀傾向問題;孫銳等在論文中以重慶大學(xué)圖書館作為研究背景,通過圖書預(yù)約數(shù)據(jù)對(duì)讀者閱讀傾向展開研究。另外,運(yùn)用聚類分析算法創(chuàng)建圖書推薦系統(tǒng)。如孫彥超在其論文中,將讀者“查找”圖書轉(zhuǎn)變?yōu)橄蜃x者“推薦”圖書,運(yùn)用聚類分析來向讀者更好地推薦;王家勝在論文中提出了基于SPSS Clementine的聚類模型,并用于對(duì)讀者群體進(jìn)行細(xì)分。聚類分析技術(shù)應(yīng)用于圖書館管理系統(tǒng)中,不僅能充分了解到讀者的興趣和需求,還可以為圖書管理部門開展圖書采購(gòu)計(jì)劃提供及時(shí)可靠的數(shù)據(jù)依據(jù)。從而將傳統(tǒng)管理系統(tǒng)中的被動(dòng)服務(wù)轉(zhuǎn)化為主動(dòng)服務(wù),更好地發(fā)揮圖書館的功能。

2.2 聚類分析在數(shù)字圖書館中的應(yīng)用

相比傳統(tǒng)圖書館管理模式,隨著時(shí)間的遷移,高校數(shù)字圖書館數(shù)據(jù)呈幾何倍數(shù)增長(zhǎng)。面對(duì)這些海量數(shù)據(jù),為更好地推動(dòng)高校圖書館管理,學(xué)者們運(yùn)用聚類分析算法也提出了相應(yīng)的改革措施。如潘旭武等在論文中提出運(yùn)用數(shù)據(jù)挖掘技術(shù)對(duì)數(shù)字圖書館進(jìn)行結(jié)構(gòu)挖掘、內(nèi)容挖掘和用戶使用記錄的挖掘。張付志等在論文中提出一種基于聚類技術(shù)的數(shù)字圖書館個(gè)性推薦算法。無論在傳統(tǒng)圖書管理系統(tǒng),還是對(duì)于數(shù)字圖書管理,從這些文獻(xiàn)統(tǒng)計(jì)中,聚類分析扮演著越來越重要的角色,承擔(dān)起越來越重要的功能作用。

3 聚類分析新方法

綜上所述,這些聚類算法均為單一聚類算法,均為基于傳統(tǒng)聚類分析基礎(chǔ)上的算法。聚類問題的不同也決定了需要使用不同的最優(yōu)化準(zhǔn)則,不同的最優(yōu)化策略和不同的聚類準(zhǔn)則,因此將產(chǎn)生許多不同的聚類分析方法。目前,關(guān)于圖書館管理中所應(yīng)用的聚類分析方法均只是對(duì)一個(gè)目標(biāo)函數(shù)進(jìn)行優(yōu)化。單目標(biāo)聚類算法通常在檢測(cè)有意義的現(xiàn)實(shí)樣本數(shù)據(jù)集合時(shí),因?qū)嶋H樣本數(shù)據(jù)為高維的、稀疏的數(shù)據(jù)而失效。因此,考慮到單目標(biāo)算法的這些缺點(diǎn),本文將提出基于多目標(biāo)優(yōu)化的聚類分析算法用于解決圖書館管理中的問題。

3.1 基于多目標(biāo)優(yōu)化的聚類分析

基于多目標(biāo)優(yōu)化的聚類算法已提出許多種。K. Suresh,D. Kundu等在文獻(xiàn)[12]中提出了基于差分進(jìn)化的自動(dòng)多目標(biāo)聚類分析算法;K. S. N. Ripon,C. H. Tsang等在文獻(xiàn)[13]中提出了可變長(zhǎng)實(shí)數(shù)跳轉(zhuǎn)基因的多目標(biāo)進(jìn)化遺傳聚類分析方法;K. S. N. Ripon和M. N. H. Siddique在文獻(xiàn)[14]中提出了基于多目標(biāo)進(jìn)化聚類分析算法用于重疊聚類檢測(cè);S. Saha和S. Bandyopadhyay在文獻(xiàn)[15]中提出了對(duì)稱的多目標(biāo)自動(dòng)聚類分析算法。通過調(diào)查分析,圖書館管理中所遇到的問題中,樣本數(shù)據(jù)集合大多為多特征、多因素、多目標(biāo)優(yōu)化問題,因此基于多目標(biāo)優(yōu)化的聚類分析算法更適合求解此類問題。

參考文獻(xiàn)

[1] Oded Maimon, Lior Rokach(Eds.). Data Mining and Knowledge Discovery Handbook[M]. Springer, 2005: 321-352.

[2]張?jiān)茲?,龔?數(shù)據(jù)挖掘原理與技術(shù)[M].北京:電子工業(yè)出版社,2004:49.

[3]孫凌云.高校學(xué)生讀者的淺閱讀傾向及圖書館對(duì)策[J].圖書情報(bào)工作,2010,54(3):85-88.

[4]孫彥超.基于聚類分析算法的圖書推薦系統(tǒng)的研究[J].數(shù)字圖書館,2015(5):76-795.

[5]吳志強(qiáng).基于聚類分析的讀者閱讀傾向研究[J].圖書館工作研究,2011(15):82-84.

[6]孫銳,楊新涯.利用圖書預(yù)約數(shù)據(jù)進(jìn)行讀者閱讀傾向研究——以重慶大學(xué)圖書館為例[J].圖書館建設(shè),2011(1):31-34.

[7]王家勝.聚類分析在高校圖書館讀者群體細(xì)分中的應(yīng)用[J].農(nóng)業(yè)圖書情報(bào)學(xué)刊,2011,23(9):15-42.

[8]孫吉貴,劉杰,趙連宇.聚類算法研究[J].軟件學(xué)報(bào),2008(1):46-150.

[9]賀玲,吳玲達(dá),蔡益朝.數(shù)據(jù)挖掘中的聚類算法綜述[J].計(jì)算機(jī)應(yīng)用研究,2007(1).

[10]潘旭武,陳玲洪.數(shù)據(jù)挖掘在數(shù)字圖書中的應(yīng)用研究[J].浙江高校圖書情報(bào)工作,2007,1(81):36-55.

[11]張付志,姜志英.一種基于聚類技術(shù)的數(shù)字圖書館個(gè)性化推薦算法[J].計(jì)算機(jī)應(yīng)用與軟件,2008,7(25):84-99.

[12] K.Suresh, D.K.S.G.Automatic Clustering with Multi-objective Differential Evolution Algorithms[C].IEEE Congress on Evolutionary Computation, 2009: 2590-2597.

[13] K.S.N.Ripon, C.H.T.S. Multi-objective evolutionary clustering using variable-length real jumping genes genetic algorithm[C]. Proceeding of the 18th International Conference on Pattern Recognition, 2006: 1200-1203.

[14] K.S.N.Ripon, M.N.H.S.Evolutionary multi-objective clustering for overlapping clusters detection[C].IEEE Congress on Evolutionary Computation, 2009: 976-982.

[15] S.Saha, S.B.A symmetry based multiobjective clustering technique for evolution of clusters[J].Pattern Recognition,2010, 43(3): 738-751.

中圖分類號(hào):G25

文獻(xiàn)標(biāo)識(shí)碼:A

猜你喜歡
數(shù)據(jù)挖掘
基于數(shù)據(jù)挖掘的船舶通信網(wǎng)絡(luò)流量異常識(shí)別方法
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
數(shù)據(jù)挖掘技術(shù)在打擊倒賣OBU逃費(fèi)中的應(yīng)用淺析
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
數(shù)據(jù)挖掘在高校圖書館中的應(yīng)用
數(shù)據(jù)挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數(shù)據(jù)挖掘研究
利用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)LIS數(shù)據(jù)共享的開發(fā)實(shí)踐
主站蜘蛛池模板: 国产日韩欧美一区二区三区在线 | 少妇精品久久久一区二区三区| 亚洲欧美成aⅴ人在线观看| 欧美一区日韩一区中文字幕页| 毛片久久网站小视频| 午夜色综合| 亚洲AV无码乱码在线观看裸奔| 97视频免费在线观看| 全免费a级毛片免费看不卡| 亚洲国产精品一区二区第一页免 | 中文字幕第1页在线播| 亚洲二区视频| 一级毛片a女人刺激视频免费| 成人在线不卡视频| 亚洲一级毛片免费观看| 久久久久久久久18禁秘| 蜜桃臀无码内射一区二区三区| 青青热久免费精品视频6| 国产网友愉拍精品| 91网址在线播放| 亚洲精品亚洲人成在线| 日日摸夜夜爽无码| 美女一级免费毛片| 精品人妻无码中字系列| 亚洲国产AV无码综合原创| 国内精品久久久久久久久久影视| 亚洲一级毛片在线播放| 真实国产精品vr专区| 精品精品国产高清A毛片| 国产精品久线在线观看| 人妻一区二区三区无码精品一区 | 无遮挡国产高潮视频免费观看| 国产农村妇女精品一二区| 欧美在线一级片| 亚洲无线观看| 狠狠色狠狠色综合久久第一次| 亚洲国产日韩视频观看| 国产女人在线视频| 少妇极品熟妇人妻专区视频| 欧美成人午夜影院| 在线观看av永久| 国产91九色在线播放| 国产性生交xxxxx免费| 高清国产在线| 成人国产精品一级毛片天堂| 国产交换配偶在线视频| 国产伦片中文免费观看| 99热国产在线精品99| 一级全免费视频播放| 中文字幕在线播放不卡| 国产制服丝袜91在线| 亚洲色大成网站www国产| 日本不卡在线视频| 亚洲美女一区二区三区| 五月婷婷导航| 国产午夜一级毛片| 亚洲欧美日韩精品专区| 亚洲午夜国产片在线观看| 呦系列视频一区二区三区| 亚洲中文字幕97久久精品少妇| 26uuu国产精品视频| 亚洲精品天堂自在久久77| 亚洲黄色成人| 国产第二十一页| 欧美人与牲动交a欧美精品| 综合五月天网| 亚洲精品无码不卡在线播放| 免费无码一区二区| 国产一区二区福利| 在线观看国产黄色| 国产福利影院在线观看| 91麻豆精品视频| 欧美在线导航| 国产小视频a在线观看| 一区二区三区高清视频国产女人| 99无码中文字幕视频| 国产精品一区二区国产主播| 欧美特黄一免在线观看| 国产精品私拍99pans大尺度| 国产在线观看一区精品| 18禁黄无遮挡网站| 露脸国产精品自产在线播|