吳花果
(許昌電氣職業學院 河南省許昌市 461000)
數據挖掘功能是個性化推薦服務系統設計過程中的必備功能,也是最為關鍵的功能,是后續個性化推薦服務的前提基礎和重要依據。其中聚類分析和關聯分析是數據挖掘分析當中最為主要的兩種方式。
聚類分析主要是先收集讀者的興趣偏好、搜索記錄等相關數據信息,然后結合相應聚類分析模型,對數據源信息進行分類、整合以及相應處理,從中得到數據源信息中的共同特征。聚類分析活動流程如圖1 所示。在實際進行聚類分析的過程中,系統需要先讀取用戶檢索圖書的歷史記錄,從中選取樣本的個數作為初始類,然后根據相應計算模型,按照接近原則對數據信息進行分類,得到數據類中心,并通過對類中心變化情況的判斷結果,進一步對類中心進行調整,直至不再發生變化,得到穩定的劃分類,也就是最終的聚類書目。
關聯分析主要是將讀者的搜索記錄與當前圖書館數據庫數據進行關聯分析,在此過程中,當分析結果達到一定閥值,那么就將此時所對應的書目確定為目標書目,實際上關聯分析與聚類分析是相反的過程。
書目檢索功能是圖書館系統當中的必備功能,在實際使用圖書館系統的過程中讀者會按照圖書的種類、名稱進行圖書檢索,除此之外,系統還需要具備查查看歷史檢索記錄功能,例如,可以通過關鍵字或者檢索時間查閱歷史記錄。
本文針對書目檢索功能的探討主要以書名檢索和分類檢索兩種方式為例進行分析。按照圖書分類進行檢索就是指在實際操作過程中,讀者按照圖書分類進行查詢,在查詢之后頁面上會顯示出圖書館中該類型的全部圖書,用戶可根據實際需求點擊自己所需要查閱的書籍信息。按照書名進行的檢索則是在搜索框中輸入書名實現具體圖書的檢索。
檢索歷史功能,指的是當讀者進入到檢索歷史頁面之后,系統會顯示出近期的查詢記錄和圖書列表,此外,讀者還可以根據檢索時間查詢早期的檢索歷史,找到相應記錄。
推薦服務功能主要包括查詢時的推薦、主動推薦以及清空推薦書目等多項功能。查詢時推薦就是指在讀者應用圖書館系統進行書目檢索和查詢的過程中,系統會基于查詢內容為其推薦相關書目。主動推薦就是指系統根據對讀者的查詢檢索記錄以及相關數據信息,在圖書館收錄相關新書時,會向讀者主動推薦圖書資源等[2]。
本文以主動推薦書目活動為例進行簡要介紹和分析。在讀者登錄圖書館系統之后,系統會顯示推薦書目,然后讀者對推薦的書目進行查看,再由系統結合讀者的歷史行為活動,例如檢索記錄以及借閱記錄等,獲取相應推薦書目,并顯示給用戶。
想要確保圖書館系統功能的有效實現,除需要具備檢索和推薦功能之外,還必須要具備相應控制管理功能,其控制管理功能主要包括以下幾種類型:

圖1:聚類分析活動流程
(1)對于用戶角色的控制管理,確保用戶角色和相應功能能夠一一對應,在這一模塊當中,管理員需要對用戶角色進行查詢、維護和調整;
(2)對于用戶的管理,例如用戶的新增,信息的變更、修改和刪除等相關操作,在此過程中,管理員需要對用戶身份進行驗證,確保操作者為用戶本人,以此避免相關數據信息的丟失和泄漏;
(3)用戶操作日志查詢功能,通過輸入用戶名和查詢時間,了解用戶系統登錄、查詢等相關操作。系統管理用例圖如圖3 所示。在實際進行系統管理活動的過程中,由于通常情況下不需要管理員對用戶操作日志的查詢操作進行干預,因此通常情況下管理員僅需要進行用戶管理以及角色控制管理即可。
隨著近年來我國互聯網以及信息技術水平的不斷發展,各種移動客戶端也逐漸得以開發和應用,為進一步提高智慧圖書館系統的便捷性以及智能性,很多高校已經逐漸開發并應用了移動端圖書檢索、查閱以及瀏覽功能,進一步提高了圖書館系統的個性化服務水平,滿足不同類型用戶以及讀者對于圖書館的多樣化需求。常見的有圖書館APP 以及微信公眾號查詢系統。以微信公眾號查詢系統為例,在實際構建微信公眾號圖書館服務系統的過程中,需要先在公眾號上建立URL 連接,并以手機端的需求和特點進行系統頁面設計。在實際使用過程中,讀者可以從微信公眾號登錄自己的用戶信息,然后進行書籍的檢索以及相關信息的查詢。

圖2:系統體系結構

圖3:系統物理結構
基于上文中對于高校智慧圖書館個性化推薦系統功能的設計需求,進行系統技術結構設計。整個系統結構共包括展示層、展示控制層、業務邏輯層以及數據層等多層結構,如圖2 所示。通過對系統結構以及各層功能的劃分,不僅能夠更加清晰地展示出各層結構的作用和職能,而且還有助于后續對系統進行維護和升級,例如在進行數據庫更換的過程中,僅需要對數據訪問接口進行更新即可[3]。
數據層主要承擔的就是數據的存儲和管理功能,其中主要包括圖書館系統中的書籍數據等。在進行圖書館個性化推薦系統設計的過程中,可以將Microsoft SQL Server 2008 作為數據庫平臺,為系統數據信息的存儲和調用等提供相應支持,除此之外,還可以將圖書館系統當中的部分數據存儲在結構化文件當中。例如,系統的初始化數據以及相關配置參數等。
業務邏輯層包括用戶角色設置、界面設置、檢所設置以及主題詞設置等幾個方面,主要是用于完成對于業務流程控制以及界面的設置等。其中用戶角色設置就是指對于用戶登錄操作角色的管理;界面設置主要就是指系統在運行和操作過程中,各個系統、錄入、內容等多部分的布局以及組合情況;檢索設置就是在用戶實際進行檢索操作的過程中,所進行的數據分析和挖掘流程以及相應規則;主題詞設置主要是針對于數據挖掘過程中主題詞的維護。
展示控制層的主要功能就是向業務邏輯層發送相應功能和數據請求,通過控制層能夠實現對于系統的控制和操作,使得系統執行相應任務。整個展示控制層的設計主要是根據系統的功能需求進行控制器功能的確定和選擇,例如,書目檢索管理控制器等。
展示層是直接面對用戶的系統層面,該層面會向用戶直接展示出系統的相應功能,例如書目的檢索、推薦等多方面內容。
高校在進行智慧圖書館系統設計的過程中,不僅要在功能以及技術層面進行設計,還需要對系統的物理架構進行設計。智慧圖書館系統要求不僅能夠為在校師生以及教職工提供相應的圖書館服務,同時,其他校外用戶還能夠借助外網通過瀏覽器,以關鍵詞的形式搜索圖書館中的部分數據信息,實現書籍檢索等。整個系統的物理架構設計采用了B/S 結構,在實際應用該結構的過程中,僅需要一個接入地址就能夠在瀏覽器中對相應服務進行訪問。隨著當前科學技術水平的不斷提升,B/S 技術已經得到了進一步的發展,這也使得無論是瀏覽器訪問還是客戶端操作,系統的運行效率以及功能性都得到了極大地提高。智慧圖書館系統物理結構設計如圖3 所示。
高校智慧圖書館功能模塊的設計,也是基于系統實際功能需求進行的,結合系統功能將圖書館功能模塊劃分信息收集、數據挖掘以及個性化服務三個部分。
其中,信息收集功能模塊所承擔的信息數據收集任務主要從兩個方面入手,一方面就是指圖書館系統中現有的文獻信息,另一個方面,就是從讀者角度出發,針對于讀者個人信息、檢索歷史數據、行為數據以及借閱信息等多方面的數據信息的收集,并通過特定方式對所收集到的數據信息進行預處理,以此為后續數據挖掘和個性化推薦提供可靠的數據支持。數據信息的收集和準備是實現整個圖書館系統以及個性化服務功能的重要基礎,該模塊直接影響著系統后續工作的正常推進,以及相關功能的有效發揮。
信息挖掘功能模塊主要包括兩方面內容:一方面,指的就是讀者數據的挖掘分析,包括聚類分析和關聯分析兩種類型;另一方面,指的就是圖書館數據信息的挖掘分析。此功能模塊主要是通過對讀者數據信息、檢索歷史以及相關操作等進行數據分類整理,然后按照聚類分析以及關聯分析方式,對數據信息進行深入挖掘,并將其與圖書館系統數據庫當中的圖書數據進行匹配,為其建立符合讀者興趣愛好、搜索需求的相應數據庫,形成個性化推薦書目。
最后,讀者個性化服務功能模塊,包括資源檢索、查詢時推薦、資源主動推薦以及好友推薦等功能。在實際進行該模塊設計的過程中,需要先建立讀者信息需求模型的建立,以此提高個性化推薦服務的準確性以及針對性,該模型主要包括讀者自建的興趣模型以及根據數據挖掘結果建立的讀者興趣模型兩個部分,后者需要借助數據挖掘技術,針對所收集的到的數據信息進行深入挖掘,并結合用戶的興趣愛好、日常偏好以及檢索需求等,有針對性地為用戶提供書目的檢索、好友推薦以及資源推薦等個性化服務[4]。
智慧圖書館系統不僅要具備書目檢索、系統管理等常規功能,還需要具備數據挖掘、推薦服務以及客戶端圖書瀏覽等個性化功能,以此滿足不同讀者的不同需求。在實際進行個性化推薦服務系統設計的過程中,需要從技術結構、物理架構以及功能模塊等多個部分進行系統的設計和研究,進一步滿足讀者的個性服務需求。相信隨著圖書館個性化推薦服務系統的建設,我國高校智慧圖書館將會朝著更好的方向發展。