999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于大數據聚類的讀者借閱特征對比研究

2021-07-14 19:42:53鄭云濤沈晶晶徐真真李萍
錦繡·下旬刊 2021年7期

鄭云濤 沈晶晶 徐真真 李萍

摘要:隨著信息時代的到來和數字化圖書館的興起,大學生通過手機和互聯(lián)網獲取大量電子資源,導致了紙質圖書借閱規(guī)模持續(xù)下降。為更好地服務讀者,滿足讀者需求,需對讀者借閱行為進行信息挖掘。本文采用了52萬余條紙質圖書有效借閱記錄,應用SPSS軟件對15205名畢業(yè)生做降維因子分析,萃取了8個綜合決策因素,并創(chuàng)造性的依據萃取因素做聚類分析。聚類分析和卡方分析綜合結果表明,讀者群體有專業(yè)學習、休閑娛樂、語言文字、畢業(yè)去向、興趣愛好、歷史地理和思政教育等多種需求。借閱行為不僅受專業(yè)、年級、性別和入學年份等外在特征影響,還受活躍度、畢業(yè)去向優(yōu)良度、借閱目的和借閱連續(xù)性等內在特征影響,但不受校園文化和外部偶發(fā)因素的顯著影響。

關鍵詞:SPSS;聚類分析;內在特征;外在特征;讀者群體;

一、數據采集、預處理及分析工具

從學校圖書館的圖騰管理系統(tǒng)數據庫導出近五屆畢業(yè)生讀者信息和圖書借閱記錄,為保護讀者隱私和學校圖書館管理系統(tǒng)的知識產權,讀者信息表選取的關鍵字段僅為讀者號、性別、專業(yè)、入學年份和學院,圖書借閱記錄選取的關鍵字段僅為題名、館藏號、索書號、借書日期。篩選出東湖校區(qū)四年制本科應屆畢業(yè)生借閱記錄(不含獨立學院、專升本、退學、轉學、休學、延長學制和五年制的學生),最終得到15205名畢業(yè)生的529975條有效借閱記錄。

數據預處理是整個聚類挖掘中最為基礎的環(huán)節(jié),數據預處理的質量直接決定著聚類分析的效果。本文使用了學院、學科、專業(yè)、年級、入學年份等讀者自身在借書時所具有的外在特征以及數據離散化處理得到的專業(yè)聚類、借閱目、借閱連續(xù)性和活躍度等等預定義特征,整合借閱記錄和讀者信息得到了43547條讀者借閱信息。其后,為保證A-Z類借閱量的連續(xù)性,根據箱型圖和PP圖對借閱量進行異常值檢測、判定,并進行初步修正。為能實現更多SPSS分析,使用LN函數再次修正借閱量使其收斂于正態(tài)分布或近正態(tài)分布。后期實踐結果證實了上述預處理的有效性。

本文使用軟件SPSS 22.0,進行了相關性分析和卡方分析多種分析以對比各類特征對讀者借閱圖書的分類效果。

二、聚類分析

讀者借閱行為分析有抽樣調查和大數據分析兩類,已有的讀者借閱行為研究表明,少量數據的抽樣調查研究結果往往受偶然因素影響,具有更多地不確定性;大量數據的抽樣調查和大數據統(tǒng)計分析結果往往更加具有確定性。在研究中還發(fā)現,僅對圖書大類做借閱統(tǒng)計容易割裂讀者借閱行為需求,而讀者借閱具往往有復雜性和多樣性,聚類分析則能更好地體現讀者的借閱需求特征。

以讀者借閱歷史數據為基礎,利用聚類分析的方法對讀者群體進行細分,基于不同屬性依據進行聚類可以分別獲得基于不同角度的讀者類型群體。以借閱頻次為屬性依據進行聚類,可以獲得不同活躍度的讀者群體;以讀者借閱圖書類型作為屬性依據,聚類結果能夠清晰地揭示讀者群體的需求結構。

本文創(chuàng)新性地采用了8個降維的萃取因素聚類,既體現了讀者需求又體現了活躍度;而且降維萃取因素更側重讀者內在需求,并根據權重選擇了最為重要的內在需求因素作為聚類的考慮范疇,優(yōu)化了讀者分類。結果表明,讀者借閱借閱圖書考量的因素往往超過一個,是多因素綜合考量的結果。對于聚類得到的8個讀者類簇,計算每個類簇中讀者借閱22個大類圖書的生均借閱量,做雷達圖,結合主要借閱特征做匯總表。

各群讀者借閱圖書大類生均借閱量雷達圖結果顯示,圖形均不是圓形或近圓形,表示借閱范圍相對狹窄,并且8個讀者群體在借閱圖書的種類和數量上體現了顯著差異。文學類圖書幾乎在所有讀者中受歡迎;在文學和出國型讀者群體最受歡迎,而在工學型讀者群體受歡迎程度最低。這表明了讀者群體的圖書大類需求不同。

三、讀者特征分析

(一)讀者的內在特征

1.活躍度

根據讀者群體特征結合分群實際應用效果發(fā)現,農學型和管理學型的讀者生均借閱量一般,與其專業(yè)實驗實踐多特點有關;一方面實驗實踐相關的教輔材料不歸屬圖書館館藏范圍,另一方面也意味著高質量的通用全國的實驗實踐教輔材料匱乏,故大多采用具有地方特色的實驗實踐教輔材料,因此將其歸類為活躍讀者群體更適合。因此,活躍度分為活躍和不活躍兩類讀者群體即可。統(tǒng)計結果表明,活躍讀者群體生均借閱量在10-65區(qū)間內,讀者占比47.98%;而不活躍讀者群體的生均借閱量在1-9區(qū)間內,讀者占比高達52.02%。活躍讀者群體在22個大類生均借閱量上均顯著高于不活躍群體。

2. 借閱連續(xù)性

讀者借閱頻次有高有低,將每個學期都借閱圖書的讀者認定為連續(xù)借閱讀者,其他的則為非連續(xù)借閱讀者。統(tǒng)計結果顯示,5646名連續(xù)借閱讀者在大學四年共借閱了358228冊圖書,生均借閱63.4冊圖書;而9559名非連續(xù)借閱讀者則借閱了171747冊圖書,生均借閱18冊圖書。兩者借閱量比接近7:2,體現了借閱量的巨大差異。統(tǒng)計結果還發(fā)現,沉默型讀者群體中不連續(xù)借閱讀者高達68.7%,以不連續(xù)借閱為主;其余類型讀者群體中不連續(xù)借閱讀者僅介于34.8%-40.8%之間,以連續(xù)借閱讀者為主。說明活躍讀者不僅借閱量高,借閱頻次同樣高于不活躍讀者。

3.借閱目的

從圖書題名分析,發(fā)現讀者需求多種多樣。為了考研借閱O類圖書,為了考取公務員借閱D類圖書,為了出國深造借閱H類圖書,提高四六級考試成績借閱H類圖書,為了增強體能訓練借閱G類圖書,為了外出旅行借閱K類,為了提高素質修養(yǎng)借閱K類人物傳記,為了提高植物養(yǎng)護技能借閱Q類,為了身體保健借閱R類等等。

根據聚類特征,結合本館借閱實際,發(fā)現本館讀者借閱量排名靠前的七種借閱需求分別是專業(yè)學習(C類、F類、J類、P類、Q類、S類、T類和X類)、休閑娛樂(I類)、畢業(yè)去向(D類、N類和O類)、思政教育(A類和B類)、語言文字(H類)、興趣愛好(E類、G類、R類、U類、V類和Z類)和歷史地理(K類)。

讀者在圖書借閱時綜合考量了7種借閱需求,而不僅僅考量一種需求,故各類圖書均有借閱。每個類簇中主要需求圖書借閱量顯著高于其他6個需求借閱量,主要需求借閱比例由高到低依次為專業(yè)學習、休閑娛樂、語言文字、畢業(yè)去向、興趣愛好、歷史地理和思政教育,比例從71.52%降至46.37%,讀者占比依次為40.17%、28.20%、13.64%、7.94%、2.19%、3.75%和4.12%,其中專業(yè)學習、休閑娛樂和語言文字3個人數最多的群體占讀者群體總數的82%。這說明讀者需求的復雜性和多樣性。

4.畢業(yè)去向優(yōu)良度

出國、考研、司法考試和考取公務員等畢業(yè)去向在讀者群體劃分上顯示了顯著的影響效果,因此本文考慮按照畢業(yè)去向考量讀者群體劃分。研究表明,借閱量越高,學習成績越好。因此,綜合考量借閱量和畢業(yè)去向優(yōu)良度,分為三類讀者群體,出國、考公、司法考試和考研讀者均屬于成績好、學有余力的讀者,歸納為優(yōu)質畢業(yè)去向讀者群體,占讀者總數的19.35%,生均借閱量23.5本,其中I類和H類圖書生均借閱量最多;沉默型讀者借閱量最低,成績偏低,歸納為一般畢業(yè)去向讀者群體,占讀者總數的52.02%,生均借閱量僅4.3本;其余讀者歸納為良好畢業(yè)去向讀者群體,占讀者總數的28.63%,生均借閱量20.5本。

(二)讀者的外在特征

1.專業(yè)

我校本科招生專業(yè)涵蓋經、法、文、理、工、農、管、藝八大學科門類的66個專業(yè)和13個方向。生均借閱量均值T檢驗結果表明部分專業(yè)之間差異不明顯,如園藝和園藝(觀賞園藝)、國際經濟與貿易和工商管理、藝術設計(服裝藝術設計)和藝術設計(視覺傳達藝術設計),因此需要聚類以便更好的區(qū)分專業(yè)之間的差別。

本文創(chuàng)新性的采用了SPSS的R聚類專業(yè)劃分方法,計算各個聚類的22個大類圖書生均借閱量,做雷達圖。生均借閱量結果顯示,1類主要是工程技術類專業(yè)學生,借閱T類書籍最多;2類主要是工程技術類專業(yè)學生,借閱I類圖書最多,其次為T類和H類圖書;3類是英語專業(yè)和日語專業(yè)學生,借閱H類圖書最多,高達48%以上;4類主要是藝術設計類學生,借閱量從大到小依次為J類、I類和T類圖書;5類是數理化類基礎專業(yè),大量借閱了O類和I類圖書;6類是醫(yī)學類專業(yè)學生,借閱量從大到小依次為I類、R類和H類圖書;7類是法學學生,借閱D類書籍最多,超過借閱總量的60%;8類是漢語言文學專業(yè),借閱了巨量I類圖書,高達65%;9類是文科類專業(yè),借閱量從大到小依次為I類和F類圖書;10類是與動植物相關的專業(yè),借閱量從大到小依次為I類、H類和Q類圖書。

總體上,不同專業(yè)群體讀者的閱讀偏好往往比較符合學校的專業(yè)設置,借閱專業(yè)相關圖書及課程輔導資料,體現了不同讀者群體間鮮明的差異;還有一定共性,均大量借閱了H3常用外國語和I2中國文學。

和傳統(tǒng)的學院分類或者學科分類相比,該聚類不僅體現了顯性的專業(yè)聚類,還體現了隱性的專業(yè)聚類。如6類,我校沒有醫(yī)學院,但生物技術(生物制藥)和中藥學專業(yè)顯示了R類借閱量高的特點,其他的類似專業(yè)動物醫(yī)學則顯示出2類的特征。8類漢語言文學專業(yè)則顯示了借閱大類狹窄的顯著特點,其他的文科專業(yè)則體現了9類的特點。

2.年級

2015-2019屆畢業(yè)生生均借閱結果顯示,隨著年級增長借閱量在持續(xù)走低,從大一的生均借閱量14.3冊下降到大二的13.0冊再降到大三的12.0冊最后降至大四的7.5冊圖書。借閱種類各年級有所不同,大一借閱量最多地依次為I類、T類和H類;大二借閱量最多地依次為I類、T類和J類,其中I類小說借閱量顯著下降,T類和J類等專業(yè)類書籍顯著上升;大三和大二基冊持平,專業(yè)類圖書略有上升,大四各大類圖書借閱均顯著下降。

讀者群體結果表明,借閱類型與年級有關,生均借閱總量受到年級影響,大四最少且較前三年級的借閱量有明顯的減少。并且,除了藝術學型讀者外,其他讀者群體隨著年級的演變,增加了專業(yè)相關圖書的借閱比例和優(yōu)質畢業(yè)去向圖書的借閱比例,相應地減少了其他各類圖書的借閱比例。大部分專業(yè)相關圖書和畢業(yè)去向圖書的借閱量體現了低—高—低的總體變化特征;藝術學型讀者的J類專業(yè)圖書借閱量則一路走低,顯示了不同的借閱特點。總體上說明不同專業(yè)讀者群體借閱需求的復雜性和不均一性。

3.入學年份

本文采用入學年份分類統(tǒng)計,使用四年借閱量做生均計算消除了年級的影響,統(tǒng)計結果發(fā)現五屆學生圖書借閱類型基本保持一致,但紙質圖書借閱量持續(xù)下降,從2011屆的生均每學年借閱13.9冊下降到2012屆的13.5冊再下降到2013屆的11.7冊直至2014屆的10.8冊最后到2015屆的10.3冊。2012屆與2013屆之間的顯著下滑,說明2016年末有一次新網絡技術的重大突破導致紙質圖書借閱量的迅速下滑;也說明借助紙質圖書學習的方式正在弱化,其更希望通過手機和互聯(lián)網等獲取電子資源。意味著讀者借閱行為還是受到了外部大環(huán)境的影響。統(tǒng)計結果還表明后三屆入學學生借閱的休閑娛樂類圖書比例下降,專業(yè)圖書比例提升。從現有的結果看,其體現數字媒體和數字資源的迅速擴張的外部大環(huán)境變化特征;并且就業(yè)壓力變大,讀者對專業(yè)知識的需求增加。

(三)讀者特征對比分析

為進一步地了解讀者借閱行為特征的分類效果,本文采用了活躍度、畢業(yè)去向優(yōu)良度、專業(yè)聚類、借閱目的、借閱連續(xù)性、學院、學科門類、年級、性別和入學年份等盡可能多的特征做卡方檢驗,交叉表特征檢驗結果表明,各特征的差異檢驗SIG值均為0.000,說明均可作為差異變量予以保留。一般來講,卡方值越大說明其影響力越大,分群效果越好。據此可以認定影響力從大到小的特征依次為畢業(yè)去向優(yōu)良度、活躍度、專業(yè)、借閱目的、年級、借閱連續(xù)性、性別和入學年份;入學年份的卡方值最小,而df值又偏大,說明其不同分群間的差異最小。

比較各種分類的借閱量差異,發(fā)現SPSS顯示為顯著差異的最小借閱量之差為3465冊圖書,占借閱總量的0.8%,意味著小于0.8%的借閱量差值不具有顯著差異。這也間接證實了外部偶發(fā)因素未有顯著影響的正確性。

正態(tài)分布、聚類分析、卡方分析等均要求筆者能熟練使用SPSS或其他軟件,要求甚高,不容易操作;讀者外部特征分類效果略差,但易操作、易分析是其最顯著的特點。因此,從好學易用角度來說,內在特征分析不宜大范圍拓展使用。

四、結論

本文為讀者群體研究提供了新的分群特征,即畢業(yè)去向優(yōu)良度、借閱目的和借閱連續(xù)性,一種SPSS的R聚類的專業(yè)分類方式,一種新的聚類思路即萃取因素聚類。這些新思路既拓寬了讀者群體分析的研究思路,又詳細探究了讀者借閱特征全景分群對比,對圖書館的圖書推廣和資源建設工作來說具有重要的參考價值。同時當然,本研究還有一定的局限性,希望能更加深刻地理解讀者借閱圖書的內在需求,力求更加精準地服務好學生,進一步推進以讀者為中心、以讀者需求為驅動的一體化服務。

參考文獻

[1]楊皓珺. 基于數據挖掘的學校圖書館讀者借閱行為研究[D].上海交通大學,2016.

[2]孫娜,姬丹丹,吳婉紅,郭磊.基于學生行為數據和借閱數據的圖書借閱量分析[J].中國教育信息化,2018(11):73-77.

[3]王睿,楊晉蘇,彭聚霞.基于流通日志的高校學生圖書借閱行為分析與對策研究[J].福建電腦,2018,34(10):12-14+11.

[4]莊小峰,馬凌云.近十年高校圖書館讀者圖書借閱偏好及變化研究——以上海師范大學為例[J].河北科技圖苑, 2018,31(04):57-62.

基金項目:本文系浙江省教育廳項目“基于大數據的紙質圖書館讀者借閱行為偏好聚類分析”(編號:Y201942152)和浙江省圖書館學會項目“基于大數據分析的讀者群借閱畫像”(編號:Ztx2020B-10)的研究成果之一。

(浙江農林大學 ?浙江 ?杭州 ?311300)

主站蜘蛛池模板: 亚洲国产成人综合精品2020| 激情网址在线观看| 在线观看欧美国产| 91精选国产大片| 在线观看国产黄色| 99国产精品免费观看视频| 午夜日韩久久影院| 国产女人水多毛片18| 一本一道波多野结衣一区二区| 亚洲首页国产精品丝袜| 在线观看网站国产| 欧美中文字幕一区二区三区| jizz国产视频| 欧美成人精品一级在线观看| 日韩精品免费一线在线观看| 国产第一页免费浮力影院| 国产在线观看91精品亚瑟| 国产成人综合亚洲网址| 精品人妻系列无码专区久久| 亚洲综合二区| 无码区日韩专区免费系列| 国产欧美精品专区一区二区| 国产欧美日韩综合在线第一| 国产精品久久久久鬼色| 2020亚洲精品无码| 最近最新中文字幕在线第一页| 制服无码网站| 青青操国产| 婷婷色狠狠干| 国产精品一区在线麻豆| 欧美激情视频二区| 久久夜夜视频| 欧美性色综合网| 亚洲午夜国产精品无卡| 亚洲欧美另类中文字幕| 欧美日韩在线第一页| 国产91导航| 日韩成人在线一区二区| 九九九精品成人免费视频7| 欧美在线一二区| 国产成在线观看免费视频| 久久久噜噜噜| 毛片在线看网站| 欧美性久久久久| 天堂成人在线| 国产成人久久777777| 91丝袜乱伦| P尤物久久99国产综合精品| 在线国产资源| 亚洲最大综合网| 免费无码AV片在线观看国产| 99福利视频导航| 波多野结衣在线一区二区| 久久久波多野结衣av一区二区| AV不卡国产在线观看| 漂亮人妻被中出中文字幕久久| 2020国产精品视频| 亚洲AV成人一区二区三区AV| 99re热精品视频中文字幕不卡| 日韩毛片在线播放| 国产欧美精品一区二区| 福利片91| 夜色爽爽影院18禁妓女影院| 亚洲色中色| 正在播放久久| 久久无码高潮喷水| 91亚洲免费| 欧美中文字幕在线二区| 欧美三级不卡在线观看视频| 成人午夜久久| 日韩在线第三页| 天天躁夜夜躁狠狠躁图片| 国产成人三级在线观看视频| www中文字幕在线观看| 免费亚洲成人| 精品一區二區久久久久久久網站| 激情视频综合网| AV熟女乱| 国产高清色视频免费看的网址| 午夜老司机永久免费看片| 欧美综合激情| 免费无码又爽又刺激高|