曹 亮,李湘麗*,劉雙印,徐龍琴,尹 航,鄭建華
(1.仲愷農業工程學院,廣東 廣州 510225;2.廣東省高校智慧農業工程技術研究中心/廣州市農產品質量安全溯源信息技術重點實驗室,廣東 廣州 510225)
高校圖書館是學校文獻信息資源中心,是師生教學、科研和創新的“動力池”,具有組織、存儲和傳遞教學科研文獻資源的重要作用,是校園與社會的文化樞紐,是推動圖書館全民閱讀推廣工作的有效手段。隨著信息技術快速發展,圖書館經歷了從傳統手工操作方式→數字化分布式信息系統→信息流與物質流并存復合圖書館→智慧圖書館模式[1]。然而,融合了現代信息技術和物聯網技術的智慧圖書館,雖然館藏信息資源量日益劇增,積累了大量的、形式復雜多樣的信息數據,但讀者和數據之間、不同類型數據之間的關聯也存在著模糊地帶,海量的信息數據與用戶需求之間存在不確定性,延緩了智慧圖書館的建設進度。
知識圖譜是一種知識管理技術,能讓海量的信息數據有效組合和應用,可根據用戶需求提供個性化服務,與現代高校圖書館建設需求不謀而合。因此,將知識圖譜技術運用到圖書館建設中,不僅可以滿足用戶個性化、多元化和主動性的信息服務需求,而且能讓讀者快速、有效從海量的文獻資源中搜索到高質量的信息,快速提升圖書館的服務及管理水平。
知識圖譜是一種輻射狀的圖形,揭示各領域實體之間關系的網絡圖形。知識圖譜有四大特征:知識抽取、知識表示、知識融合和知識推理。其中,知識抽取是對大規模的結構化、半結構化和非結構化數據進行實體抽取、數據關系抽取和數據屬性抽取[2];知識表示是把知識客體中的知識因子和知識通過各種模型關聯起來,如距離模型、矩陣分解模型、復雜關系模型等;知識融合是把來自于不同知識源的知識通過整合、去歧、關聯、驗證、更新等達到與人的思維相融合的特需型知識庫;知識推理就是在原有知識庫中挖掘類似于人類思維的知識對象之間的層次關系。
高校智慧圖書館是伴隨智慧城市、智慧農業和智慧校園等發展起來的,具有多樣性特征,最主要特點是全面感知[3],即感知知識、感知需求和感知存在。其中,感知知識表示知識的廣度和寬度,感知到知識的存在并讓知識有機的匯聚起來;感知需求表示知識的需求與被需求之間可以通過某種方式快速建立鏈接,進而達到各方需求;感知存在就是通過微博、微信、移動圖書館等大數據讓你感知圖書館無處不在。高校智慧圖書館的“三感”特點,正契合了知識圖譜的技術優勢:挖掘用戶行為數據間潛在關聯,主動推薦高價值信息,為讀者提供精準服務。
高校智慧圖書館知識抽取包括信息實體抽取、關系抽取和屬性抽取(見圖1)。(1)信息實體抽取即結構化數據實體抽取,主要是對圖書館文獻中的文獻名、姓名、地名、機構名、時間、關鍵詞等信息實體進行抽取,采用迭代方式對實體進行聚類算法,抽取新的命名實體。(2)關系抽取即把實體間存在的顯式和隱式關系進行抽取,再組織、定義。在高校智慧圖書館館藏資源中,文獻名和作者之間就是顯式關系,同一作者的文獻名之間的關系就是隱式關系,關系抽取采用馬爾可夫邏輯網聯合推理關系抽取方法。(3)屬性抽取即把實體本身的屬性、實體屬性與屬性之間、開放域數據集中屬性進行提取,形成屬性對應關系,再進行抽取。

圖1 高校智慧圖書館知識抽取關系
基于知識圖譜的智慧圖書館就是從不同來源、不同結構的數據中進行抽取,形成數據知識存入到知識圖譜庫中[4]。
知識表示有分布式表示、三元組表示、復雜關系表示。通常是以三元組方式進行知識表示,可以直接表示實體、關系和其之間的復雜語義關聯。高校智慧圖書館中,實體之間的關系、關系之間的關系存在著復雜的交叉關系,例如:作者之間、讀者之間、文章之間、作者和文章之間、讀者和文章之間的關系等,都存在著交叉關系。
通過知識圖譜的知識表示,就可有效把高校智慧圖書館多源信息表示出來,給人以清晰和明確的認識和理解。
知識圖譜中的知識融合可讓高校智慧圖書館中多樣性、多源性和重復性的知識數據有效聚合。通過在同一規范下進行實體對齊、實體鏈接和關系推演等操作,把不同來源的知識進行融合。高校智慧圖書館知識融合技術流程如圖2所示。

圖2 高校智慧圖書館知識融合技術流程
首先,對目標讀者和所需數據進行預處理,剔除無用信息后用Hash函數進行分塊處理;其次,把原數據信息和目標數據信息相對應,根據對應的復雜度確定是否進行四層負載均衡處理;再次,把原數據信息和目標數據信息進行屬性相似度和實體相似度計算,并給出相對應鏈接;最后,對知識融合的結果進行反饋評估參數校正,最終輸出正確結果或反饋原因。
通過知識圖譜的知識融合將智慧圖書館中數量龐大、種類繁多和關系復雜的資源數據進行深度融合處理,揭示館藏資源的潛在知識關聯規律,為研究數據價值提供參考。
高校智慧圖書館中的知識推理就是將館藏資源實體知識經過推理,挖掘出隱含的關聯信息和知識點。其中,實體知識包括實體及其屬性,已知或是推理出的實體間關系可以再次作為新實體知識被推理,如此循環可反復挖掘出有價值信息。知識推理方法主要有基于邏輯的推理和基于圖的推理,邏輯推理最基本的架構為:A通過關系a推出B,B通過關系a推出C,由此可推理出A通過關系a推出C。基于圖的推理相對復雜些,一般用圖來表示,可以方便地表示結點與結點間多重關系路徑,體現出關系的多樣性,得到更多信息,推理的范圍更加廣泛。
高校智慧圖書館海量的、復雜的館藏資源,采用知識推理可以有效挖掘和推理出潛在的關系信息,通過提供接近“專、精、深”的搜索查詢功能,為用戶提供“懂需求”的智能服務,達到精準推送。
知識圖譜在高校智慧圖書館建設中提供精準的上傳下達服務,為知識的大數據化合理利用提供優質路徑,為讀者與高校智慧圖書館之間建立起了網絡紐帶。預期在不久將來,基于知識圖譜的高校智慧圖書館結合人工智能技術,將會把書、人、時間和空間有效融合為一個知識生態有機體,通過對讀者各種行為數據分析,主動推薦圖書、推送資源,構建“會猜想、懂(你)心思”的現代智慧圖書館,實現無障礙、橫跨時空的資源共享,資源利用的最大化,為讀者帶來便捷、生動、有趣和智能的閱讀體會。