崔文 薄建全



摘? 要: 針對當前圖書館信息生態模型中對讀者重視不夠、智能化程度低、可實現性差等問題,文中提出一種以讀者為中心的智能圖書館信息生態模型。該系統以讀者為中心,代替傳統信息生態模型中以圖書館為中心構建圖書館信息生態模型的思路。在數據處理、資源管理等方面引入大數據、人工智能、數據挖掘等智能化信息數據處理手段,代替傳統的信息處理方式。文中對所構建圖書館信息生態模型的每個部分給出具體實現方法,以提高該模型的可行性。實際應用測試結果表明,該算法的準確率平均在85%以上,效果良好。
關鍵詞: 圖書館; 信息生態模型; 模型設計; 模型實現; 人工智能; 神經網絡
中圖分類號: TN911.23?34; TP393? ? ? ? ? ? ? ?文獻標識碼: A? ? ? ? ? ? ? ? ? ? ? 文章編號: 1004?373X(2020)10?0127?03
Construction and analysis of library information ecological model
CUI Wen, BO Jianquan
(Qingdao University of Science and Technology, Qingdao 266061, China)
Abstract: In allusion to the problems in the current library information ecological model, such as the lack of attention to the readers, the low level of intelligence and the poor realization, a reader?centered intelligent library information ecological model is proposed. In this system, readers are taken as the center, which replaces the idea of building the library information ecological model with the library as the center in the traditional information ecological model. In data processing, resource management and other aspects, the big data, artificial intelligence, data mining and other intelligent information data processing means are introduced to replace the traditional way of information processing. The specific implementation methods for each part of the library information ecological model is given to improve the model′s feasibility. The actual application testing results show that the accuracy of the algorithm is more than 85% on average, and the effect is good.
Keywords: library; information ecological model; model design; model realization; artificial intelligence; neural network
0? 引? 言
隨著信息的爆炸式增長和信息化的發展,信息生態的概念應運而生,分析信息內部相互作用中引入生態結構的概念,從而實現對信息行為的分析與解釋。圖書館作為一個重要的傳遞信息的公共文化機構,已成為信息生態技術應用的重要領域。
文獻[1?3]利用信息生態技術對圖書館的服務模式創新與服務能力影響因素進行研究。文獻[4]研究信息生態視角下圖書館綜合實力的評價。由此可見,當前針對圖書館信息生態的研究主要集中在服務能力、創新能力的提高與理論探討方面。隨著智能化技術的不斷成熟,其在管理、識別、預測等領域被廣泛應用。文獻[5?6]利用物聯網及人工智能技術分別進行了煤礦機電設備及企業智能管理系統的設計;文獻[7?8]使用大數據及數據挖掘技術分別實現對無人機故障識別與船舶異常數據的識別;文獻[9?10]通過神經網絡技術實現對交通流及柱塞泵的狀態預測。
使用這些物聯網技術、人工智能技術、數據挖掘技術也可以較好地解決當前圖書信息生態智能化程度較低、重內容而輕讀者等現實問題。基于此,本文提出一種以讀者為中心的智能化信息生態模型。
1? 信息生態模型結構
圖1為本文所設計的圖書館信息生態模型。整個信息生態模型為環狀結構,信息生態模型中,以讀者為中心,圖書館為主體,通過人工智能技術將兩者相連接。圖書館的信息生態環境主要由讀者需求構成的內部環境與圖書館外圍的外部環境組成。
通過物聯網技術、數據挖掘技術、人工智能技術及創新支撐實現讀者與圖書館間進行雙向信息交流,促進圖書館內部環境和外部環境進行信息交流。
圖書館通過各項技術滿足讀者的信息需求,這些需要可分為:文獻需求、培訓需求、研習需求和服務需求。文獻需求泛指與獲取各種形式知識內容相關的需求,如:資料查詢、信息咨詢、圖書文獻借閱、電子信息獲取等,可通過大數據、數據挖掘技術對文獻及讀者進行分類,從而提高資源獲取及傳遞效率;培訓需求指讀者對于各種技能提高而具有的需求,如:信息檢索能力培訓需求、信息處理能力培訓需求等;研習需求指讀者對于討論、交流、學習等活動的需求,既有對相關活動的需求,也有對場地環境的需求;服務需求指讀者對于圖書館中休閑、基礎工具設施的需求,如:休息間、咖啡廳、打印、掃描等的需求。后3種需求可結合物聯網技術、人工智能技術等對相關設備進行管理和分配。
隨著互聯網技術的發展,圖書館信息生態中外部環境及內部環境呈爆炸式增長,對圖書館的信息處理能力提出了新的要求。伴隨著信息的快速增長,基于數據信息的大數據技術、數據挖掘技術及人工智能技術的發展成為解決信息爆炸的一個研究熱點。本文除了構建圖書館生態模型結構,還將相關成熟的信息智能處理技術引入圖書館信息生態模型結構中。具體解決方案如圖2所示。
針對讀者的文獻需求,在復雜、大量的資源環境中,圖書館信息生態需要完成資源篩選及資源傳遞的工作。本文提出運用數據挖掘及人工智能的解決方案,同時解決資源篩選與傳遞的問題。針對讀者研習需求、培訓需求及服務需求,在管理環境、空間環境及基礎設施環境相互關聯的復雜情形下,圖書館要根據需求完成相關資源的合理高效管理及配置。在上述理論的基礎上,本文提出基于物聯網及人工智能技術的環境管理配置方案。
2? 模型實現
隨著當前對圖書館建設的重視,圖書館信息生態系統中,資源環境數據獲取,空間環境、管理環境、基礎設施的硬件配套建設已相當完備。故本文只針對信息生態中缺失的智能化部分給出具體實現方案,主要為資源篩選及資源傳遞問題,以及空間環境、管理環境、基礎設施中的硬件智能管理問題。
2.1? 資源篩選及資源傳遞的智能化實現
對于資源的篩選及資源的傳遞問題,本質上為大數據下的分類問題,即:
1) 資源數據的分類:資源對應類別及該資源是否獲取;
2) 讀者的分類:讀者的專業、層次、文獻偏好等分類。
當前的主要分類算法有:支持向量機、K?means、決策樹算法。決策樹算法作為經典的分類算法,已相當成熟,有著分類效率高、實現過程簡便且分類過程清晰、易復現等特點。基于圖書館資源篩選及資源傳遞任務的特點,本設計選用決策樹算法實現對資源的篩選及傳遞。
讀者分類和資源篩選分類原理相同,此處僅針對讀者分類進行論述。具體實現過程如下:
1) 決策樹算法利用信息熵原理不斷選擇分類屬性,直到完成對數據的分類。信息熵代表當前樣本的混亂程度,其定義為:
[S1=-i=1nliLlnliL]? ? ? (1)
式中:[li]為每類人員在總讀者數據集中的個數;L為數據集中讀者總人數。
2) 選擇信息增益最大的屬性為當前節點的分類屬性,具體算法如下:
[Z(T)=t∈leafPt?L(t)? ? ΔZ=Zi,j-Zi]? ? ? (2)
式中:[Pt]為表示當前分類枝的概率;[Zi]為當前待分類人員節點的信息熵;[Zi,j]為添加分割屬性j后的該人員節點的信息熵。
3) 以信息增益最大的分類屬性為當前的分類屬性。
4) 以分割出來的新節點為根節點,重復上述過程。
由此,即可建立讀者分類的決策樹模型,且決策過程完全透明并可復現。最終的決策樹結果示例如圖3所示。
2.2? 硬件設施管理的智能化實現
隨著物聯網及人工智能技術的發展,使硬件設施的管理效率大幅度提升。基于以讀者為中心的思想,對圖書館中硬件管理及配置的問題,本文采用基于智能算法的讀者需求預測及基于物聯網的設備管理實現硬件設備管理的智能化。圖4為硬件設施智能化實現原理框圖。由于當前物聯網管理系統已廣泛應用,在此只對讀者需求預測的實現進行闡述。
本系統采用BP神經網絡算法對讀者設備需求進行預測,具體實現步驟如下:
1) 根據圖書館設備數量及類別劃分預識別需求類別的數目,并對每個狀態進行數字化編碼,通常編碼方式為:
[xi=eni]? ? ? ? ? ? (3)
式中:[xi]為第i種需求類別;n為預識別需求類別的總數目;[eni]表示只有第i個元素為1的n維單位向量,則神經網絡的輸出層神經元個數為n。
2) 確定讀者可獲取狀態數目m,對m個狀態分別進行編碼,并進行標準化、歸一化處理,作為神經網絡的輸入,則m即為神經網絡輸入層神經元數目。
3) 確定神經網絡層數,收集大量數據集,利用BP學習規則,使用獲取到的數據對神經網絡進行訓練、測試。
4) 使用訓練好的BP神經網絡對讀者需求狀態進行識別。
至此,已實現設施管理的智能化。
3? 模型分析
對于本文所提出的基于決策樹的讀者分類方法及基于BP神經網絡的讀者需求預測方法,使用某高校圖書館進行測試。
對于所設計的讀者分類方法,隨機抽取其100名在冊讀者作為待分類數據集,對所設計方法進行驗證。選取年級、學院、性別、成績、學科類別5個屬性作為分類指標,根據借閱文獻類別不同將所有讀者分為5類,分別為A~E。以前80人為訓練集,后20人為測試集。使用訓練好的決策樹對測試集20人進行分類驗證,分類結果如表1所示。
由表1可知,其分類正確率平均可達95.0%,也驗證了該方法的有效性。同理,對所設計的需求預測BP神經網絡進行了測試。最終在測試集中,其預測需求類別與讀者實際需求類別的相符率達86.7%,較好地完成了需求預測的任務。
4? 結? 語
本文對圖書館信息生態模型進行了構建與分析,提出以讀者為中心的信息生態模型,且在模型中引入決策樹、神經網絡等智能化算法,并給出實現框架,解決傳統圖書館信息生態模型對讀者目標對象重視不夠、模型智能化程度低、實現困難等問題。在實際測試中,取得了較好的效果。但文中未能給出前期訓練數據的統一獲取方法,在實際運用時,還需根據實際情況進行前期數據獲取。
參考文獻
[1] 唐姍姍.圖書館信息生態構成要素及其作用機理研究[D].長春:東北師范大學,2019.
[2] 張旭,張向先,李中梅.信息生態視角下高校圖書館智庫信息服務能力影響因素研究[J].圖書館工作與研究,2019(2):30?39.
[3] 李業根.網絡文庫信息生態構建及其對圖書館自建數據庫的啟示[J].大學圖書情報學刊,2019,37(2):106?110.
[4] 鄭榮,王潔.信息生態視角下高校圖書館綜合實力評價與對策研究[J].情報科學,2018,36(8):39?45.
[5] 劉振華,徐緒堪.基于物聯網的煤礦機電設備智能管理平臺設計[J].工礦自動化,2019,45(4):101?104.
[6] 梁艷華.基于大數據的智能企業管理系統設計[J].現代電子技術,2019,42(6):158?161.
[7] 孟魁杰,董瑩,趙宗濤.一種基于數據挖掘的無人飛行器故障分析方法[J].計算機技術與發展,2010,20(6):225?227.
[8] 郝建.船舶移動網絡大數據異常數據優化識別研究[J].艦船科學技術,2019,41(4):133?135.
[9] 孫國道,曹帝胄,梁榮華.神經網絡驅動的交通流量預測可視分析方法[J].浙江工業大學學報,2019,47(5):573?580.
[10] 張乃祿,張茹,陳雷,等.基于物聯網的稠油注采柱塞泵狀態監控系統[J].西安石油大學學報(自然科學版),2019,34(2):112?116.
[11] 吳小冰,王丹菲,吳文革.基于圖書館學五定律視角的智慧圖書館建設研究[J].安徽農業大學學報(社會科學版),2019(2):88?92.
[12] 肖秋紅,彭堅,林志成.智慧圖書館建設實證分析與研究:以佛山科學技術學院新館為例[J].佛山科學技術學院學報(社會科學版),2018(6):85?89.