999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數(shù)據(jù)技術(shù)在圖書流通數(shù)據(jù)分析中的應(yīng)用研究

2021-06-18 02:44:18劉海峰
信息記錄材料 2021年5期
關(guān)鍵詞:關(guān)聯(lián)用戶

高 艷,劉海峰

(山西農(nóng)業(yè)大學(xué)信息學(xué)院 山西 太谷 030800)

1 引言

高校圖書館擁有大量的學(xué)生圖書流通數(shù)據(jù),具體包含圖書借閱時間、學(xué)生姓名、學(xué)生專業(yè)、學(xué)生所在院系、借閱圖書名稱、圖書索引號等,充分利用這些數(shù)據(jù),集合大數(shù)據(jù)技術(shù),可以發(fā)現(xiàn)學(xué)生借閱圖書之間的關(guān)系,預(yù)測學(xué)生對圖書的需求情況,有效進行學(xué)生個性化圖書的推薦,從而更好地確定圖書館圖書的購置方向,加大圖書館圖書的流通效率,創(chuàng)新圖書館管理服務(wù),更好地發(fā)揮圖書館的作用。下面具體介紹大數(shù)據(jù)相關(guān)算法在圖書流通數(shù)據(jù)中的應(yīng)用。

2 Apriori關(guān)聯(lián)規(guī)則算法在圖書流通數(shù)據(jù)中的應(yīng)用

Apriori算法是最有影響力的關(guān)聯(lián)規(guī)則算法,由Agrawal等[1]在1993年提出。主要應(yīng)用于零售行業(yè)的購物行為分析,如著名的沃爾瑪超市的根據(jù)顧客的購物行為,發(fā)現(xiàn)啤酒和尿布之間的關(guān)聯(lián)關(guān)系。同理,在圖書的流通數(shù)據(jù)中也可以應(yīng)用Apriori關(guān)聯(lián)規(guī)則算法發(fā)現(xiàn)學(xué)生借閱圖書之間的關(guān)聯(lián)關(guān)系。

Apriori算法是基于兩階段頻集思想實現(xiàn)的。第一步,尋找所有滿足用戶預(yù)先設(shè)定最小支持度的頻繁項集。第二步,根據(jù)頻繁項集產(chǎn)生強關(guān)聯(lián)規(guī)則,并繼續(xù)尋找滿足用戶設(shè)定最小置信度的強關(guān)聯(lián)規(guī)則[2]。在此應(yīng)用中,支持度是指兩類圖書A和B在總的借閱次數(shù)(N)中同時出現(xiàn)的概率,即A類與B類圖書同時被借閱的概率。置信度是指借閱A類圖書同時借閱B類圖書的概率[3]。

例如:如表1所示5條學(xué)生借閱圖書的數(shù)據(jù),ID為2019533123的學(xué)生同時借閱了H、K兩類圖書,ID為2019533226的學(xué)生同時借閱了B、H、K兩類圖書…,利用Apriori規(guī)則就可以算出這些學(xué)生所借圖書類別之間的關(guān)聯(lián)規(guī)則,將支持度設(shè)置為0.5,最后得出關(guān)聯(lián)規(guī)則如表2所示。從表2可以看出,H類圖書和I類圖書以及H類圖書和K類圖書之間有很大的關(guān)聯(lián)關(guān)系,即借閱了K類圖書的學(xué)生一定會借閱H類圖書,借閱了H類圖書再借閱K類圖書的概率為60%,借閱了I類圖書的學(xué)生一定會借閱H類圖書,借閱了H類圖書再借閱I類圖書的概率為60%。(注:由于數(shù)據(jù)集只選擇了一少部分?jǐn)?shù)據(jù),所以在計算出的關(guān)聯(lián)規(guī)則中會出現(xiàn)置信度為1的結(jié)果,在真實的大量數(shù)據(jù)集中一般不會出現(xiàn)置信度為1即100%的情況,即不會出現(xiàn)借閱了一類圖書一定會借閱另外一類圖書的情況。另外,圖書類別根據(jù)實際情況也可以進行進一步的細分)。

表1 學(xué)生借閱圖書數(shù)據(jù)集

表2 關(guān)聯(lián)規(guī)則表

得到關(guān)聯(lián)規(guī)則后,圖書館人員在圖書擺放的位置方面可以進行一定的調(diào)整,另外也可以根據(jù)關(guān)聯(lián)規(guī)則進行圖書的個性化推薦。

3 K-means聚類算法對圖書流通數(shù)據(jù)的分析

聚類方法包含基于密度的聚類、基于層次的聚類、基于距離的聚類算法等。K-Means算法是典型的基于距離的聚類算法。即該算法通過評價兩個對象的距離來確定是否聚為一類。

K-means算法的具體步驟是:

(1)隨機選取K個對象作為初始的聚類中心。

(2)分別計算樣本中其他樣本對象到K個對象的距離,按照最小距離分配原則進行聚類。

(3)根據(jù)聚類結(jié)果,重新計算K個聚類中心

(4)重復(fù)上述(2)(3)步驟,直到聚類中心不再發(fā)生變化。

3.1 基于圖書流通數(shù)據(jù)的讀者聚類

在圖書的流通數(shù)據(jù)中,記錄著讀者的借閱數(shù)量以及讀者借閱圖書的類型信息,利用這些信息可以進行K-Means聚類,將讀者分為不同的類別(如可分為經(jīng)常借閱圖書的讀者,借閱圖書量一般的讀者,不經(jīng)常借閱圖書的讀者,根據(jù)實際情況類別還可以進一步細分),根據(jù)聚類的結(jié)果針對不同的讀者進行不同的服務(wù)[4]。如針對經(jīng)常借閱和借閱量一般的讀者,進一步根據(jù)這些讀者喜歡借閱圖書的類型,圖書館可以在有一些相關(guān)類別新書的時候,針對這些讀者進行個性化的推薦,以及針對現(xiàn)在借用圖書的情況推薦相關(guān)的圖書。針對不經(jīng)常借閱圖書的讀者,圖書館應(yīng)該加強自身的宣傳和服務(wù),引導(dǎo)更多的讀者走進圖書館。

3.2 基于圖書流通數(shù)據(jù)的圖書聚類

根據(jù)圖書流通數(shù)據(jù)中,可以得到不同種類的圖書被借閱的次數(shù)。根據(jù)圖書被借閱的次數(shù)進行K-means聚類,可以將圖書分為不同的類別(如經(jīng)常被借閱的圖書;借閱次數(shù)一般的圖書;不經(jīng)常被借閱的圖書,也可以根據(jù)實際情況將圖書類別進行進一步細分)。針對經(jīng)常借閱的圖書類別可以在之后的圖書購置中加大該類圖書的購置,加強這些類別圖書的建設(shè)。針對不經(jīng)常借閱的圖書還需要圖書管理人員對其原因進行分析,是因為這些圖書出版的時間比較早,還是其他一些因素,以便做進一步的處理。

4 圖書推薦算法在圖書流通數(shù)據(jù)分析中的應(yīng)用

推薦算法主要包含基于內(nèi)容的推薦算法、基于協(xié)同過濾的推薦算法以及混合推薦算法。

4.1 基于內(nèi)容的推薦算法

基于內(nèi)容的推薦系統(tǒng)在圖書推薦中的應(yīng)用表現(xiàn)為從圖書流通數(shù)據(jù)中分析用戶之前喜歡的圖書類別,進而推薦同樣類別的其他圖書?;趦?nèi)容的推薦算法的原理如圖1所示。根據(jù)圖書流通數(shù)據(jù),分析得出用戶U1喜歡TP(計算機技術(shù))類別的圖書B1,于是將TP類別的圖書B2推薦給用戶U1,F(xiàn)0類別的圖書就不推薦給用戶U1了。

圖1 基于內(nèi)容的推薦算法原理

4.2 協(xié)同過濾算法

協(xié)同過濾算法包含基于用戶的協(xié)同過濾和基于物品的協(xié)同過濾,基于用戶的協(xié)同過濾在圖書推薦中的應(yīng)用原理如圖2所示,具體表現(xiàn)為如果用戶U1借閱了圖書B1,跟用戶U1興趣一致的用戶U2、U3借閱了圖書B2,則可以把圖書B2推薦給用戶U1。這里怎么得到U1和U2興趣一致,可根據(jù)上面介紹的聚類算法,也可以通過讀者借閱圖書的情況,應(yīng)用余弦公式或者皮爾遜相關(guān)系數(shù)計算讀者之間的相似度?;谖锲返膮f(xié)同過濾在圖書推薦中的應(yīng)用原理如圖3所示,表現(xiàn)為如果用戶U1借閱了圖書B1,同時根據(jù)圖書流通數(shù)據(jù)發(fā)現(xiàn)借閱了圖書B1的讀者還有用戶U2、U3,同時U2、U3用戶都借閱了圖書B2,則可以把圖書B2推薦給用戶U1。根據(jù)以上描述會發(fā)現(xiàn)基于用戶的協(xié)同過濾主要是根據(jù)跟用戶自己興趣一致的人喜歡的圖書進行推薦,而基于物品的協(xié)同過濾是根據(jù)都喜歡同一個圖書的其他用戶喜歡的圖書進行推薦。

圖2 基于用戶的協(xié)同過濾原理

圖3 基于物品的協(xié)同過濾原理

4.3 混合推薦算法

混合推薦算法,即在實際的應(yīng)用中可以將基于內(nèi)容的推薦算法以及基于用戶和基于物品的推薦算法一起使用給用戶進行推薦。

推薦算法是大數(shù)據(jù)技術(shù)在互聯(lián)網(wǎng)中最廣泛的應(yīng)用,將推薦算法應(yīng)用到圖書流通數(shù)據(jù)分析中,可以更好地提高圖書館的個性化服務(wù)水平,也能提高圖書的流通效率,對有效利用圖書資源有很重大的作用。

5 結(jié)語

文章在介紹關(guān)聯(lián)規(guī)則原理的基礎(chǔ)上介紹了學(xué)生借閱圖書之間的關(guān)聯(lián)規(guī)則,在實際的圖書流通數(shù)據(jù)中還可能存在學(xué)生專業(yè)與圖書之間的關(guān)聯(lián)規(guī)則,可以進行進一步的研究。在聚類算法方面文章只介紹了K-Means算法,還可以具體研究其他聚類算法在圖書流通數(shù)據(jù)分析中的應(yīng)用。在個性化推薦方面,除了可以根據(jù)圖書流通數(shù)據(jù)進行圖書推薦,還可以根據(jù)讀者相關(guān)查詢的日志記錄進行進一步的推薦。另外這些算法的實現(xiàn)可以直接應(yīng)用軟件Weka進行實現(xiàn),也可以用編程語言及相關(guān)庫來完成(如用python語言及sklearn庫),如果實際中圖書流通數(shù)據(jù)量特別大,還可以在hadoop大數(shù)據(jù)平臺基礎(chǔ)上應(yīng)用Mahout組件來完成[5]。

猜你喜歡
關(guān)聯(lián)用戶
不懼于新,不困于形——一道函數(shù)“關(guān)聯(lián)”題的剖析與拓展
“苦”的關(guān)聯(lián)
“一帶一路”遞進,關(guān)聯(lián)民生更緊
奇趣搭配
智趣
讀者(2017年5期)2017-02-15 18:04:18
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關(guān)注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
Camera360:拍出5億用戶
100萬用戶
主站蜘蛛池模板: 亚洲国产中文在线二区三区免| 亚洲综合一区国产精品| 国产AV无码专区亚洲精品网站| 成人午夜亚洲影视在线观看| 亚洲午夜片| 91丝袜美腿高跟国产极品老师| 亚洲天堂色色人体| 伊人精品视频免费在线| 国产呦精品一区二区三区下载| 91人妻日韩人妻无码专区精品| 天堂网亚洲系列亚洲系列| 国产人成在线视频| 国产免费黄| 婷婷丁香在线观看| 99久久亚洲综合精品TS| 久久人与动人物A级毛片| 精品国产一二三区| 久久黄色一级片| 亚洲av无码专区久久蜜芽| 日韩一区二区三免费高清| 欧美亚洲国产一区| 精品国产香蕉伊思人在线| 亚洲黄色激情网站| 福利视频久久| 亚洲国产中文在线二区三区免| 四虎在线观看视频高清无码| 午夜日本永久乱码免费播放片| 毛片久久久| 波多野结衣二区| 超薄丝袜足j国产在线视频| 国产99免费视频| 欧美一区二区三区国产精品| 国产一级二级在线观看| 国产一级毛片yw| 国产乱子伦手机在线| 色综合国产| 色综合狠狠操| 亚洲男人的天堂在线| 国产精品女同一区三区五区| 男人的天堂久久精品激情| 国产精品成人免费视频99| 亚洲视频黄| 国产一国产一有一级毛片视频| 激情五月婷婷综合网| 欧美天堂久久| 日本人又色又爽的视频| 99热精品久久| 日韩欧美中文字幕在线韩免费| 秋霞午夜国产精品成人片| 国产麻豆精品久久一二三| 日本欧美精品| 伊人大杳蕉中文无码| 国产精品三级专区| 国产大片喷水在线在线视频 | 国产毛片不卡| 日韩免费毛片视频| 亚洲男人的天堂网| 国产精品微拍| 亚洲男人的天堂网| 免费观看男人免费桶女人视频| 蜜臀AV在线播放| 国产久草视频| 91探花在线观看国产最新| 国产精品3p视频| 一本久道久久综合多人| 国产日本一线在线观看免费| 国产一级做美女做受视频| 视频二区中文无码| 免费看a级毛片| 超级碰免费视频91| 欧美视频在线观看第一页| 热久久这里是精品6免费观看| 午夜视频在线观看免费网站| 在线色国产| 91 九色视频丝袜| 怡红院美国分院一区二区| 国产不卡一级毛片视频| 色国产视频| 欧美国产菊爆免费观看| 国产真实二区一区在线亚洲| 人妻丰满熟妇av五码区| 欧美激情视频二区三区|