

摘 要:為了使學生更好地挖掘圖書館資源,本文提出了基于學生學習軌跡培養體系的圖書推薦方式。本研究在原有圖書館管理系統的基礎上,以高校學生為主要用戶,按照其學習軌跡,采用合適的推薦算法,分別對讀者的課程、興趣愛好和職業領域給出圖書推薦結果。該系統提高了推薦效率,豐富了讀者獲取圖書的方式,完善了高校圖書館建設。
關鍵詞:圖書推薦系統;學生學習軌跡;高校圖書館
中圖分類號:G250.73 文獻標志碼:A 文章編號:1673-8454(2013)15-0072-04
一、前言
隨著信息技術的高速發展,數字圖書館的建設受到世界各國的高度重視,并迅速成為人們獲取知識和信息的另一種有效途徑。但隨著數字圖書館信息的海量增長,用戶“如何從龐大的數據信息中獲取到需要的信息”成為了新的難題,傳統的基于檢索的信息獲取方式已經不能完全滿足用戶的需要,個性化的圖書推薦系統(Recommender System)正逐漸成為數字圖書館不可或缺的部分。
高校數字圖書館中的個性化圖書推薦不同于電子商務中的圖書推薦,其用戶主要是在校大學生、研究生以及教師科研工作者,并且研究領域也相對固定。因此高校數字圖書館的個性推薦應該以輔助學生的學習為主,根據學生的學習軌跡推薦圖書,這樣不僅能豐富學生的專業知識,并且使圖書推薦更有針對性,效率更高。
二、背景
1.發展現狀
(1)高校圖書館中圖書推薦系統的發展現狀
推薦系統來源于信息過濾(Information Filtering)技術,是自動聯系用戶和物品的一種工具,它能夠在信息過載的環境中幫助用戶發現令他們感興趣的信息。圖書推薦是個性化推薦系統的一大應用領域。系統通過分析用戶行為日志,給不同用戶提供不同的個性化頁面展示,使用戶更好地獲取圖書信息。[1]近年來,隨著推薦算法的不斷完善和改進,圖書推薦的準確度得以提高,使其從原先的電子商務領域擴展到數字圖書館領域,成為人們獲取自己所需圖書的另一重要渠道。
(2)高校圖書館中圖書推薦系統的發展趨勢
目前,國內外大多數高校圖書館主要還是以搜索為主,一些高校已經開始提供個性化推薦服務,但針對性不強,形式大多與社會上的數字圖書館一樣,可根據用戶的行為習慣給出推薦書目的書名、作者、出版社、推薦理由等,但高校圖書館與數字圖書館不同,其用戶主要以學生為主,除了提供以往的個性化推薦外,應更進一步提供針對學生學習軌跡、人才定制培養方案的圖書推薦計劃。
綜上所述,針對高校圖書館的特殊性,本研究著眼于圖書館已有的圖書檢索系統的子系統,結合學生的學習軌跡,設計出符合高校學生的圖書推薦系統。
2.研究的必要性
(1)有助于完善高校圖書館建設,優化館藏資源
此系統能夠幫助用戶在海量圖書資源中快速尋找到適合自己的圖書,節省用戶的時間,滿足用戶的個性化需求,豐富用戶在圖書館獲取圖書的途徑。系統會根據每個學生專業的不同,按照其四年的學習計劃給出圖書推薦,輔助學生在學校的專業學習;此外,系統還實現了與學生校園個人門戶接口相連,方便學生查看自己在圖書館的借閱、圖書推薦列表等各種信息,完善了高校圖書館的建設。
另一方面,根據圖書的借閱熱門程度,還可以輔助圖書館管理者在定購圖書中以借閱熱門程度的資源共性為參考標準,加大對其定購力度,優化館藏資源。
(2)是數字化校園的重要組成部分
數字化校園是以數字化信息和網絡為基礎,在計算機和網絡技術上建立起來的對教學、科研、管理、技術服務、生活服務等校園信息的收集、處理、整合、存儲、傳輸和應用,使數字資源得到充分優化利用的一種虛擬教育環境。[2]
基于學生學習軌跡培養體系的圖書推薦系統是利用推薦算法、數據挖掘、信息檢索等技術,在學校原有的圖書管理系統上進行開發,根據學生的學習軌跡推薦適合學生的圖書,是教育管理和知識管理的重要補充和擴展。它擴展了原有系統的功能,使用戶獲取圖書的方式多樣化,為用戶提供了更多的便利,為數字化校園的建設添磚加瓦。
(3)幫助讀者挖掘圖書館資源
高校學生面對圖書館的海量資源時往往會不知如何檢索出自己需要的信息,圖書館的熱門書籍經常借閱不到,相反一些專業性強但相對冷門的書籍卻無人借閱。個性化的圖書推薦能充分挖掘圖書館的專業資源,給予學生專業輔導,形成良性的閉環反饋。
三、學生學習軌跡培養體系
1.學生學習軌跡培養體系的含義
學生的學習軌跡培養體系是以學生在學校的課程時間點為基礎,以教育部定制的培養計劃為綱要,根據學生的在校時間,為不同專業領域進行人才培養,以大學生為例,在校前兩年進行基礎課程學習,后兩年進行專業課程學習,此外,學校還為其提供了選修課程,培養學生興趣愛好,在畢業時為不同的職業領域輸送專業人才。
2.學生學習軌跡培養體系的特性
首先,不同于單純的教育教學目標,學生的學習軌跡培養體系更強調時間段,強調時間節點的重要性。與傳統的課程教學的側重點不同,學生學習軌跡培養體系更注重單位時間段內學生的學習狀況。這樣的設計思想有兩個優勢:一方面有助于學生更好地提高學習效率,督促自身更快地完成學習任務;另一方面也便于教師跟蹤了解學生的學習狀況,調整教學重點。
其次,更強調學生開展多方面的學習活動,傳統的教學更注重學生專業知識的培養,學生學習軌跡培養計劃在此基礎上更加注重學習興趣的培養,讓學生在多領域中汲取知識,融會貫通,以便更好地內化知識。
最后,更強調以就業為導向的培養體系,培養人才的重要目標之一是培養社會需要的可用性人才,學生學習軌跡培養體系更注重給學生提供在不同階段的就業指導意見,讓學生及早關注就業動向,更有針對性地積累專業知識。
四、總體框架和功能設計
本系統在分析現有電子商務中圖書推薦系統的基礎上,結合高校圖書館的特點,設計并實現以學生學習軌跡為基礎的圖書推薦系統,為在校學生提供了一套針對性強、高效、快捷的圖書推薦系統,輔助在校學生課程學習,實現圖書館資源的多元化互動。
1.系統的總體框架
圖1所示的是此系統的總體框架圖。以原有圖書館圖書管理系統為基礎,在不影響原有系統正常運行和使用的情況下增加圖書推薦功能以擴充原有的圖書管理系統,豐富用戶獲取圖書的渠道。本系統最底層為數據層,數據層主要包括用戶信息庫、圖書信息庫和歷史數據庫,主要為整個系統提供數據來源,記錄用戶信息(個人郵箱、年級、專業等)、圖書信息(書名、作者、出版社等)和用戶借閱圖書的歷史數據信息等;統計完數據信息后,即可利用結合學生學習軌跡的圖書推薦算法給出推薦圖書列表,這是本系統最重要的部分;之后,將推薦列表推送到學生的圖書館個人主頁、學生校園門戶以及個人郵箱中。
2.系統的功能架構設計
如圖2所示,本系統將總體圖書推薦分為基于課程圖書推薦、基于興趣愛好圖書推薦和基于職業規劃圖書推薦。其中基于課程的圖書推薦又分為基本課程圖書推薦和核心課程推薦。
(1)基于課程的圖書推薦
在學校中,大學生主要以上課為主,每一年每個專業的學生都會根據學校定制的培養計劃修一定數量的學分,前兩年主要以基礎課程為主,后兩年主要以專業課程為主,基于課程的圖書推薦即根據每個專業學生所上的課程推薦不同的圖書,以輔助課程學習。系統首先會收集各個專業的培養計劃(包括專業設置、開課時間等),然后會聯系相關的專業教師,結合教師經驗,給專業圖書分配不同的推薦系數,隨著學生的學習軌跡、課程安排,按照時間軸的形式,給出推薦的圖書列表。
(2)基于興趣愛好的圖書推薦
在學校中,除了培養學生的專業知識,還應培養多元化的知識架構,基于興趣愛好的圖書推薦即根據每個學生不同的興趣特點,從數據層收集用戶的行為數據,并建立相關模型,運用合適的推薦算法,給出推薦列表。
(3)基于職業規劃的圖書推薦
高校人才培養的一大趨勢就是與就業相聯系,培養出更符合社會需要、招聘方需要的人才。因此研究優秀畢業生的學習軌跡的重要一環就是跟蹤其讀書軌跡,從圖書館后臺數據中挖掘出優秀畢業生的圖書借閱行為數據,細化結業方向,給出圖書推薦列表,供廣大學生參考。
五、系統實現關鍵問題研究
1.數據的采集與挖掘
高校圖書館的圖書雖沒有社會上的數字圖書館多,但是隨著每年新進圖書的增加和學生規模的不斷擴大,后臺數據層的數據量也在不斷增長。基于學生學習軌跡的圖書推薦系統的數據采集主要來自于圖書館的后臺數據庫。采集的數據中包括讀者的個人屬性、借閱書目的歷史記錄以及相關的書目數據等,以西北工業大學圖書館為例,由于系統沒有提供底層數據庫接口,因此需要通過其報表功能間接獲取所需數據。經過分析,筆者選取了用戶數據、書目數據和借閱數據三種報表作為書目推薦系統的數據源。由于這些報表存儲格式獨特,且其中包括很多無效數據,因此需要進行數據清理和格式轉換。[3]
(1)數據清理具體來說是一個數據優化的過程。刪除那些不符合要求的借閱記錄,能夠更加有效地為用戶獲取高質量的推薦圖書服務。尤其是對于借閱數據而言,隨著時間段的變化,用戶學習或感興趣的內容會發生改變,圖書需求可能會有很大的差別,刪除了時間太早的用戶借閱記錄,能夠更好地把握用戶的當前需求。[4]
(2)清理完的數據仍然是不可用的,需將數據重新整理,確定其關聯規則,如對重要的參考圖書添加不同的推薦系數、按圖書館分編圖書的分類方法進行特征選擇等,解決數據稀疏性問題。
2.推薦算法的選擇
對于基于讀者興趣愛好的推薦算法,本系統采用根據時間上下文相關的基于物品的協同過濾算法,此方法是在基于物品的協同過濾算法(Item-based collaborative filtering)的基礎上加入時間信息,使推薦更具有時效性。
基于物品的個性化推薦算法的核心部分是:利用用戶行為離線計算物品之間的相似度,以及根據用戶的歷史行為和物品相似度矩陣,給用戶做在線個性化推薦。當加入時間信息后,計算用戶在相隔很短時間內喜歡的物品,提高物品相似度;此外,在預測用戶現在的興趣時,應該加重用戶近期行為的權重,優先給用戶推薦那些和他近期喜歡的物品相似的物品。[1]
而對于基于課程的推薦算法,是在基于物品的協同過濾算法(簡稱ItemCF)的基礎上,考慮任課教師對于每門課的重點推薦圖書,加重這些圖書的權重,給出推薦結果,使每門課的推薦更具有課程深度。
基于職業規劃的推薦算法的核心在于從圖書館后臺挖掘出優秀畢業生的圖書借閱歷史,結合就業單位領域,給出不同職業領域的圖書推薦列表。
3.推薦列表的呈現
推薦列表的呈現模塊是經過推薦算法處理后,將相關推薦結果通過可視化界面提交給用戶,用戶可以利用此界面瀏覽推薦結果并對結果進行評價,將評價反饋給系統。
此模塊是用戶與系統交互作用的部分,通過個性化推薦處理,將抽取出的知識信息呈現給用戶,對用戶的學習、閱讀起到指導或參考作用,同時用戶可以對相關推薦信息進行反饋,不斷優化個性化推薦算法,從而為用戶提供準確、及時、全面的個性化服務。[5]
對于本系統來說,主要從以下幾個方面產生目標并推薦圖書:
(1)基于課程的圖書推薦。按照每學期的課程安排、讀者的學習軌跡推薦每門課的參考圖書,完善每門課的課程學習。
(2)基于興趣愛好的圖書推薦。通過對圖書館數據的采集,挖掘到用戶數據、書目數據和讀者借閱數據三種報表,利用基于用戶資源的協同過濾算法,得到推薦列表,并將結果反饋給用戶,形成閉合回路。
(3)基于職業規劃的圖書推薦。將優秀畢業生的圖書館借閱記錄和就業領域相結合,給出推薦列表。
六、總結
隨著現代技術的發展,用戶面對海量數據的選擇,推薦系統越來越顯示出其重要性,本文是在學校圖書館管理系統的基礎上,提出了基于學生軌跡的圖書推薦算法,分別對讀者的課程、興趣愛好和職業領域給出圖書推薦結果,便于讀者發掘圖書館資源,使系統更加人性化,更便于使用。?
參考文獻:
[1]項亮.推薦系統實踐[M].北京:人民郵電出版社,2012.6.
[2]百度百科[EB/OL].http://baike.baidu.com/view/474879.htm#2.2013-03-24.
[3]趙麟.基于最大頻繁模式挖掘算法進行書目推薦系統的設計與實現[J].現代圖書情報技術,2010(5):23-28.
[4]孫守義,王蔚.一種基于用戶聚類的協同過濾個性化圖書推薦系統[J].現代情報,2007(11):139-142.
[5]姜雷,趙功群.數字圖書館系統中的個性化服務模型[J].圖書館學刊,2011(9):66-68.
(編輯:王天鵬)