(河北大學管理學院 河北 保定 071000)
基于知識體系建設創建數字圖書館
——以河北大學圖書館APP為例
劉曉曉韓秀靜
(河北大學管理學院河北保定071000)
伴隨著信息技術的迅速發展,將事物的透明性、智能性和便捷性表現在大眾的視野下,進而也為數字圖書館的發展帶來了機遇和挑戰,并指引著數字圖書館的發展方向,進一步向智能化邁進。筆者通過文獻調查法和實地調查法,同時借鑒知識體系建設的理論,借助提取知識元、對知識元進行標引以及語義識別技術等的知識點,構建河北大學數字圖書館一個可以多窗口閱讀和方便查閱資料的APP,以此增加河北大學圖書館的智能服務。
數字圖書館;知識服務;知識體系構建
筆者認為,數字圖書館(Digital Library)是借助數字技術處理存儲各種文獻的圖書館,即將不同載體、不同地理位置的信息資源用數字存儲技術存儲到一起,進而方便世界各地的讀者進行閱讀和使用。數字圖書館就是虛擬的、沒有圍墻的圖書館,是在網絡環境中擁有共享功能的知識網絡系統,是一個規模巨大、便于使用、沒有時間空間限制的智能檢索中心。
據國家統計信息中心的研究表明:我國在信息技術和設備方面在亞洲國家中占有靠前的位置,但是在信息資源的開發和利用方面還是較低的。我國數字圖書館對網上資源認識不夠,利用率低,不能通過技術整理未被挖掘的信息,為讀者所用。數字圖書館建設的最終目的是為讀者和用戶提供知識服務,同時為圖書館員等知識服務人員提供卓有成效的知識服務平臺[1]。
數字圖書館(Digital Library,以下簡稱DL)理論研究與實際應用始于20世紀90年代的美國。在我國DL的建設已經開始進入資源整合與面向用戶的數字化服務階段,是評價一個國家現代信息基礎設施水平的重要標志[2]。
迄今為止,國內外學者對于DL的定義各抒己見,還沒有達成統一的認識。比較有代表性的觀點有以下幾種:徐文伯[3]認為:DL就是對有高度價值的圖像、文本、語音、音響、影視、軟件和科學數據等多媒體信息進行收集、組織規范性加工,進行高質量保存和管理,實施知識增值,并提供在廣域網上高速橫向跨庫鏈接的電子存取服務。同時還包括知識產權、存取權限、數字安全管理范疇;朱復成[4]認為:DL是傳統圖書館在信息社會中的邏輯延伸和擴展;王軍[5]認為:DL是網絡環境+信息集合+信息管理工具;劉峰[6]認為:DL是一個全球性的分布式的大型知識庫,即以分布式海量數據庫群為支撐,基于智能技術的大型、開放、分布式信息庫;譚祥金[7]認為:DL實際上就是通過互聯網連接起來的數字資源庫群,實行分布式管理的知識共享的計算機系統;陳源蒸[8]認為:數字圖書館與傳統圖書館有著質的區別,數字圖書館非圖書館,把圖書館數字資源建設的局部行為當作數字圖書館的整體開發項目是一大誤解,數字圖書館是全社會的共同責任。
雖然諸位學者對DL的認識雖然不同,但綜上可得出:DL仍然具有收集、整理、加工、保存、傳遞和服務的基本功能;并且借助計算機技術對信息資源進行處理、保存;同時具有全球性、共享性、便捷性,為全球用戶提供服務;DL是作為傳統圖書館的補充和擴展而出現的,是傳統圖書館收納信息資源方面、服務方面、便捷方面的補充與深化,兩者之間不存在對立關系,DL是傳統圖書館在服務行業的繼承和進一步的發展而存在的。
(一)知識體系構建
知識體系構建是由知識元不斷累積構成。知識元是一種不可分割、邏輯完整、語義連接、相互關聯的新知識。

圖1 知識元關聯圖
由圖1可知,很多知識元聚集在一起,會形成新的知識點;將新的知識點通過知識點之間的關聯構成新的知識鏈;各個知識鏈相交構成知識網;知識網交叉形成知識庫,構建知識體系,進而為人類提供知識服務。
(二)Web定義
語義Web技術主要應用于“以計算機形式可處理的表示信息的語言”,從而使得機器和信息資源之間建立起語義聯系;本體的對象則是獲取、描述相關領域的知識,將該領域對特定知識的認知統一規劃,確定該領域內共同認可的詞匯,并從不同層次上給出詞匯和詞匯之間相互關系的定義。準確來說,語義Web技術在數字圖書館的知識體系構建和知識服務方面有著非常重要的作用[9]。
1.知識組織工具
語義Web技術的出現,使得數字圖書館知識組織工具不只是之前的分類法、主題詞法,而且出現了新的知識組織工具——知識地圖、語義網絡、以本體為核心的語義Web技術和語義網格等。其中,知識地圖和語義網絡可以將知識結構化,表現出知識之間的關聯性,而語義網格通過語義互操作能力來提高信息共享能力。
2.知識組織方法
語義Web技術的出現,改善了知識構建對技術的需求,為其提供了新的知識組織方法,基于語義Web技術的知識構建方法主要體現在利用本體表示語言對信息資源進行標引:為本體構建知識元模型、為自然語言轉化為機器語言提供標引,用機器標引的語言可以直接被計算機存儲、加工、利用,或在不同的系統之間進行互操作。對本體進行標注后,其語義特征才能被知識組織系統所識別,并利用知識庫中的知識搜索引擎對語義內容進行重構,形成某個特定領域的知識網絡,進而向廣大讀者傳遞的語用服務更易于理解。
3.知識組織體系
語義對知識體系構建有著重要的影響。語義Web將自然語言轉化為計算機語言,被計算機識別,進而來進行語言的設計,使得獨立的數據庫融合為一個整體。
在語義Web技術的帶動下,數字圖書館的知識服務從物理層次的文獻單元上升到認知層次的知識單元,為數字圖書館的知識體系構建提供了很好的知識服務的環境。
借助知識體系構建理論,以河北大學圖書館為例,構建河北大學數字圖書館APP產品。河北大學數字圖書館APP產品面向學生、教師及培訓人員,以河北大學圖書館資源為基礎,通過知識體系的建設和知識化加工形成知識化資源,并通過專用的功能展示和體現資源內容的知識體系和知識化資源的應用,為用戶提供知識服務。
為達到以上目的,該系統應包含以下兩個部分:1)運營管理平臺:用戶行為分析、廣告管理、用戶管理和管理員管理;2)客戶端:分別設有知識導航、知識地圖、專題知識和知識元檢索等知識模塊,條目閱讀模塊設有多窗口閱讀、深度閱讀、收藏、目錄、上/下、亮度控制等屬性,個人中心模塊設有閱讀歷史、消息中心、我的收藏、個人信息等屬性;
筆者希望通過構建河北大學數字圖書館APP產品,為廣大河大師生提供有效的學習方法和提高知識節能,進而可以為數字圖書館的發展做出貢獻。總之,此款產品具有以下特點:1)知識分類較多,可滿足不用用戶的需求;2)多窗口閱讀模式,可滿足用戶對比和參考閱讀需求;3)按照用戶搜索熱度推薦知識元,反映用戶搜索行為;4)以知識元為單位,進行知識標引,滿足用戶碎片化學習需求,同時也具有系統化的黑鉆提閱讀,滿足用戶系統化學習需求。
(一)知識資源加工
知識資源加工包括三方面任務:結構化加工、知識體系建設和知識化加工。三者關系如下圖2所示:

圖2 知識資源加工結構
如上圖2所示:結構化加工指將圖書PDF和排版文件轉化為epub格式的結構化資源,為知識體系和知識化加工提供數據基礎。
知識體系建設則需要根據10本核心資源進行抽詞和構建關聯關系,形成知識元及關聯關系的有機整體,作為知識導航、知識地圖等功能的數據基礎。知識化加工的主要任務是通過程序和人工輔助的方法將知識體系的標簽標引到結構化資源中,形成知識化資源,作為知識標簽和深度閱讀功能的數據基礎。
(二)資源內容抽詞
從人的角度來看,給出一段話或一篇文章之后,從中找出存在的詞語并不是很難得一件事情,因為對于人類,語言是存在和交流的根本,具有明顯的特征;而計算機處理、識別語言的能力并不像人類那么簡單,對于計算機語言來說具有兩個特征:字符和字符串頻數[10]。
統計抽詞的所有具體方法是以這兩種語言為基礎,進行資源內容的基本抽詞。其中比較有代表性的是基于統計詞頻、互信息判斷、信息熵判斷、尋找最長字共現、后綴數組等方法,這些方法基本都屬于基于統計量的抽詞方法。借助計算機技術和語言對信息資源內容進行抽詞,完成資源內容的分類,進而方便進一步的知識標引,為計算機系統識別知識資源內容增加便利之處,同時也方便廣大讀者進行深度閱讀,享受知識服務帶來的便利。
(三)資源內容標引
在對信息資源內容進行標引之前,首先必須要提到“編目”,資源內容標引是編目的重要環節,一般是先對整個資源進行整體內容的標引,然后根據不同類型的廣大讀者的內容需求靈活選擇進行標引,進而方便用戶準確、及時的查找到自己需要的內容[11]。
總之,內容標引是對所需要標引的內容資源進行高度概括,最后作
為知識標簽進行引導,區別資源之間的不同,為資源之間的相同之處做指引,方便資源內容的歸類整理,實現對資源內容的有效管理;內容標引可以認為是最資源內容的描述,是為廣大讀者提供一種便捷并且準確的搜索到所需要的內容的一種方法。
互聯網時代的發展,數字圖書館要想更好地服務于廣大用戶,是離不開強大的數據庫和先進的信息技術。筆者希望以河北大學圖書館APP為例,數字圖書館的發展可以大量普及運用知識體系構建理論、知識元的抽取、分類標引,和web技術等,進而給讀者提供一個泛在知識環境下的以用戶需求為中心的服務,最大限度地滿足知識經濟發展的需求,促進知識社會可持續發展。
[1]張會田.泛在知識環境下的數字圖書館發展研究[D].西北師范大學,2008,11(1)
[2]江濤.我國數字圖書館研究綜述[J].現代情報,2007,5(25)
[3]徐文伯.建設中國數字圖書館意義重大[N].光明日報,2000,3(8)
[4]朱復成.DigitalLibrary涵義及有關問題[J].圖書館情報工作,2000,(3)
[5]王軍等.數字圖書館的研究內容和方向[J].中國圖書館學報,2001,(6)
[6]劉峰.國家計劃中國數字圖書館發展對策及研究動態[J].情報資料工作,2001,(2)
[7]譚祥金.面對數字圖書館浪潮的思考[J].中國圖書館學報,2002,(1)
[8]陳源蒸.數字圖書館非圖書館[J].大學圖書館學報,2005,(4)
[9]姜永常.基于知識構建的數字圖書館知識服務研究[J].黑龍江大學,2007(5)
[10]劉洋.基于字邊界特征的中文抽詞模型研究[D].湖南大學.2013.5(23)
[11]毛晴寒.基于互朕網應用的涉農視頻資源內容標引研究[D].華中師范大學.2016.5
劉曉曉,河北大學2015級在讀碩士研究生,研究方向:信息政策;韓秀靜,河北大學2016級在讀研究生,研究方向:信息資源管理。