徐暉 武漢商學院圖書館
引言:圖書館對于每個大學來說都是重要的知識寶庫,每個在校的學生都可以通過在圖書館的學校來獲得進步。因此,圖書館建設的好壞關系著萬千學子的成長與發展。面對日新月異的科學技術,線上的數字圖書館也逐漸進入人們的視線。同時,大學生是對新興事物的接受能力是最強的,已經有很多大學生通過線上圖書館進行學習查找資料。因此,數字圖書館項目的建設也越來越重要,對其中的各種圖書資源也需要合理的進行歸類和分類。這就需要關聯數的數字圖書館資源聚合方法,并且對服務系統進行合理的設計。提高用戶的體驗感受,優化數字資源的合理利用,提高資源的利用率,擴大圖書的使用效率,這一直是我國的數字圖書館所追求的目標,同時也是當前對于數字圖書館資源聚合研究的熱點問題。
當今世界,各國各方面的現代化建設規模不斷擴大,在我國亦是如此。不僅是在工程建筑領規模擴大,在信息科技方面的進展也是日新月異的,特別是對待科學教育方面,更是走在前列。因此,對于數字圖書館資源聚合與服務設計領域的研究也越來越重視。同時還有用到很多關聯數據,通過對這些信息數據進行整合優化,可以建立起一個優化的模擬模型,為下一步的建設工作提供客觀的信息。
隨著科技的發展,各行各業的信息化程度逐步提升,信息化也已成為當今社會的一個主要特征。社會中的各行各業都因網絡技術和智能電子技術的應用而得到更好的發展。對于高校的教育事業也不例外。現在網絡信息技術和數據檢索技術水平越來越高,對于各大高校中的數字圖書館建設也帶來了巨大的好處和便利。
國外對于圖書館的智能化信息模型的建設和應用起步較早。由于國際形式變化越來越快,各個的教育問題也因此受到了很大的關注。例如教育的普及率,教育資源的利用率,學生的成就等一系列問題。因此,學生的教育問題是一個重要的問題。國外對于各種教育資源的利用率一直處于較高的行列。對于圖書館的資源聚合與服務設計,國外一些學者聚焦于復合圖書館的研究,這個符合圖書館的原理是通過統一的界面來為用戶提供多樣化的服務,并且可以提高資源的利用率,另外這個認證的網關也是唯一的。即可以保證資源的安全性和重復性,不會被外界所干擾,是處于一種安全的模式之下,保障了數字圖書館龐大數據庫的安全性。
我國的大多研究均是從數字聚合資源模型的定義這個角度出發,構建出適合各種類型數字圖書館。目前,可以在管理領域建立合適數據信息模型,利用數據信息模型技術進行項目成本優化等探索。基于此,對我國已經建設成功的數字圖書館進行評估和成本計算。將合適的服務設計導入新的數據信息模型庫中,利用程序方程得出成本的預算流程,從而達到節約成本的目的。另外,還可以進行基于成本預算流程對整個項目系統的軟件框架設計和功能設計,為數據信息模型在成本預算方面的應用提供了進一步研究提供基礎。
現階段,相比于國外數字圖書館建設的研究狀況,我國是仍是處于落后狀態的。但是,我們的研究是在一定方向和基礎上開展的,進行了針對性的研究。從關聯數據的信息管理的角度,利用大量的時間來分析各種具有不同特點的資源聚合,進而可以指出目前國內存在的數字圖書館信息模型的優點和不足,通過信息集成的方法,將優點繼續發揚,對缺點進行優化改進。
對于關聯數據是一種大型模型設計。基于此的協同信息推薦的主要工作和關鍵點在于觀察大多數用戶經常檢索的數字資源,得到客戶需求的規律,并對查找內容進行資源評價。隨后,可以利用大數據庫對近期所被查找的內容進行總結,再進行數據的錄入和輸出。
此處推薦的模型是采用比較的方法來對用戶之間的相似度評價進行計算。基礎此,我們選用皮爾森相關相似性計算法,用戶i和j對項目C的評分是用ri,C和ij,C來表示的,用戶j對共同評分過的項目的平均評分用ij來表示,而用戶i和j對項目評分平方的平均值用ri2和ij2;來表示,則用戶i和用戶j之間的相似性Sim(i,j)的計算公式如下:

根據上述皮爾森相關相似性的計算公式,對所有用戶與當前用戶U的相似性進行具體計算,這些計算出來的結果就構成了當前用戶U的最近鄰居集合,如下表達式所示:

其中 sim (u,uk) 這樣一輪下來,先對項目的預測評分進行排序,選擇預測評分最高的n項目并將其推薦給用戶,這一過程就是TOP-N推薦。 數字圖書數字資源聚合方法是多種多樣的,針對不同的圖書館類型有著不用的聚合方法。在進行計算和模擬的時候,需要根據所屬的條件進行二次篩選,以便選到合適的類型,在此,我們列舉了一些常用那個數字資源聚合方法,以供參考: (1)基于OPAC系統的數字資源聚合; (2)基于跨庫檢索、異構數據源的數字資源聚合; (3)基于數字資源導航的聚合; (4)基于鏈接導航的數字資源聚合。 我們所處的時代是一個信息化的時代,生活中的各個環節都離不開信息的推送,可以說如果失去了信息,那么就像失去了雙眼一樣。各種各樣的信息推送組成如今信息化的世界。同時,個性化的信息推送了隨之而來。而在數字圖書館中,我們也可以進行個性化的信息推送。因此,在數字圖書館中,對于數據的管理運用是非常重要的一個環節。如何對關聯數據進行整合歸類,關系著個性化信息推送的命脈。在日常的資源利用中,資源的聚合可以擴大資源的利用率,同時我們可以通過對關聯數據的整合,了解用戶最新的需要和最想找到的資源有哪些,從而可以的主動地向用戶或讀者提供其所需的數字資源及相關檢索意見。更為重要的是,對于用戶搜索的內容,可以進行一定的定位追蹤,然后就可以為用戶提供一些解決問題的方法和一些特定服務,這些就是關聯數據和資源聚合而實現對讀者的服務設計內容。 由于共同出現的查詢詞具有某種程度的語義相似性,如果能夠對查詢的相似度進行定量計算,則可通過數值反映出查詢詞之間的語義聯系。因此,為了體現查詢詞之間關系,首先需要對查詢條目進行分詞處理。 進行標準化之前,應該統計查詢詞的出現頻率,在所有 詢詞中確定了a個待選核心查詢詞,這樣能把日志條目中的所有查詢詞按照a個待選核心 詢詞按按主題進行查詢詞的相似度分析,一定程度上保證相似度計算的準確性。接著按某種屬性對a個核心查詢詞分成P類,然后確定o/p個核心查詢詞。每個核心查詢詞可以代表同一屬性的查詢詞集合,對于每個集合而言,不是所有的核心查詢詞的共現 詢詞都適合做后續處理,比如一些與其它查詢詞共現頻率不高,原則是根據該查詢詞的頻率以及共現頻率。經過上述處理,可以得到反應不同屬性的查詢詞集合。例如,有四個查詢條目(A,B,C,D),(A,C,D),(B,C,D,E,F),(D,E,F),則可構造出如下所示的6*6對稱矩陣 W(i,j): 在該矩陣中,Wij表示第i個查詢詞與第j個查詢詞一起出現的頻率。我們需要將基于共現頻率的相似矩陣轉化為基于共現頻率的標準化相似矩陣。現有多種轉化公式,本文采用相似距離公式,如下所示, 其中有2個參數n和k。n表示可視化空間的維度,一般情況下,n取2或3。k只能取正整數。當k=l時,表示兩個點上在標準坐標系上的絕對軸距總和;當k=2時,公式1變為歐氏距離公式,它能測量在m維空間中兩個點之間的真實距離;當k趨近正無窮時,變為確界距離。公式2中的參數c為非0的正小數。當01時,S (X,y)值處于(0,1)之間,C越小,S (x, y)的值越趨近1;當0 本文是從關聯數據的角度,介紹數字圖書館的資源聚合和服務設計等方面。研究了國內外對于數字圖書館的研究方向。在基于關聯數據、資源聚合、服務設計等思維標準下描述了數字圖書館的一個含義、原則和方法。首先介紹了數字圖書館研究的現狀、資源聚合概念、關聯數據結構,使對這個數字圖書館有一個具體的了解。同時介紹了一個資源聚合的模型實例,并可以從中檢索出有用的數據信息,從而進一步使數字圖書館得到更好的應用和發揮,使數字圖書館的使用率、重復率和資源利用率等功能更好的展現出來。數字圖書館對學校的教育事業的發展是功不可沒的,在提高學生學習查閱資料速度和學習效率的同時,還能節約各方面的成本,提高學生的積極性,可操作性和便捷性。針對各個方面存在的問題都可以及時的進行預測和優化調整。以后的研究和發展可以向更多有效的數據信息的獲取方面進行探究,爭取獲得更精準詳細的數據,建立起完善的數據庫系統,為日后數字圖書館信息模型的建立打下良好的基礎。
2.2 數字圖書數字資源聚合方法
3 基于關聯數據的數字圖書館創新服務
3.1 基于關聯數據的信息個性定制與推送
3.2 數字圖書館數據格式標準化


4 結束語