999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

館藏數字資源聚合理論體系研究探賾

2016-03-16 03:26:15劉學平
濰坊學院學報 2016年3期
關鍵詞:關聯語義理論

劉學平

(濰坊學院,山東 濰坊 261061)

館藏數字資源聚合理論體系研究探賾

劉學平

(濰坊學院,山東 濰坊 261061)

探賾館藏數字資源聚合理論的目的在于,使其形成完整的理論體系,為聚合實踐提供強有力的指導。在分析館藏數字資源聚合概念內涵、概念理論分析框架、多學科視角下概念理論的基礎上,認為館藏數字資源聚合要以共享理論、集群理論、共生理論、長尾理論、認知語言學理論、評價學理論為基礎引導,以網絡分析方法理論、分眾分類方法理論、計量學方法理論、本體方法理論、關聯數據分析方法理論、共現分析方法理論為理論分析工具,融合關聯數據發布理論、語義聚焦爬蟲理論、網頁抓取理論、索引理論、語義網理論、聚合機制理論的技術理論支撐,實現資源超網絡語義模式、資源類型模式、資源作者合作模式、資源元數據互操作模式、資源選題模式等聚合模式理論的實踐展現,凸顯理論引進與本土化、理論新理念與研究新視覺、理論催生性與相關性發展的理論超越。

館藏數字資源;聚合理論體系;理論發展超越

數字時代,讀者在被館藏數字資源里的科學實驗數據、統計數據、元數據等“大數據”包圍的同時,又處在自然信息、社會信息、新生信息、老化信息等信息的“海洋”之中。盡管如此,讀者仍苦于難覓想要的資源。盡管檢索系統為讀者提供了搜尋的手段,互聯網為檢索提供了更大的平臺,數據融合、信息資源整合為檢索提供了更多的內容,但讀者仍是疲于應對數字資源的快速增長。[1]因而以滿足讀者對快速增長館藏數字資源需求而發展起來的資源整合,已從傳統的文獻層面、記錄層面轉向更加碎片化的知識間關聯聚合的高級層面。實踐證明,資源聚合成為數據融合、資源整合等研究的延伸,是未來資源研究的發展方向。學者對此研究與館藏數字資源聚合的實踐探索相比,其理論建構遠遠落后于人們對實踐的熱衷。眾所周知,館藏數字資源的聚合,一方面,聚合的實踐需要理論指引。沒有理論指導的聚合實踐,只能是一種低層次的重復勞動,無法實現突破、創新和發展。同時,理論研究滯后于聚合的實踐,則會制約聚合實踐的發展,因而,聚合要進行突破和創新,就必須用相關的理論作支撐。另一方面,聚合理論的發展需要理論體系。當前,聚合理論研究的分散、不成體系,使聚合實踐活動受到了來自各方面的質疑。因而,聚合理論的完善和發展已成為一個不可回避的關鍵問題,迫切需要從理論提升的高度,對源自各個方面、各種類型和各種層次的聚合理論加以概括、總結、凝練和上升,形成完善的聚合理論體系。[2]至此,從多理論視角探索館藏數字資源聚合理論,提出其發展的理論體系,用以指導館藏數字資源聚合的實踐,使其產生質的飛躍,顯得十分必要和及時。

一、館藏數字資源聚合的概念理論

1.概念內涵。聚合是指兩個或多個個體通過某種聯系形成聚合體的過程,館藏數字資源(數據庫資源——書目數據庫、學術論文數據庫、特色數據庫、專業數據庫圖片數據庫等;外采資源——CNKI、ACS、IEEE等;流動網絡資源——新聞、消息以及定期管理和更新的政務、服務信息等[3]聚合是一種創造性的融合和重組資源的過程,它不同于傳統信息組織與物理的資源整合,它有語義關聯之意,是在數字資源內部與資源之間建立有針對性的、適宜的語義關聯標簽,通過此標簽的內容反映出特定資源的語義關聯特征,實現計算機對特定資源特征的識別與信息內容的理解,并通過本體、關聯數據、分眾分類法、社會網絡分析、計量學等方法和技術,[4]對其從時間上聚合過去、現在及未來,從空間上聚合不同區域和不同專業領域館藏資源,使分散無序、相對獨立的館藏數字資源重新組織為一個新的有機整體,以滿足讀者對資源語義關聯的需求。它在使資源具備交互性、專業性、層次性、復合性、關聯性等特點的同時,凸顯資源“歸于整,理為序、求其真”的聚合功效。

2.概念理論分析框架。由于館藏數字資源聚合涵蓋數據融合、資源整合集成等內容,因而在理論上存在一個多序列、多層級的概念體系,實踐上受到本體性因素和條件性因素的制約,由此建構出包括本體論、領域論、條件論和發展論的理論分析框架為:本體論主要研究館藏數字資源聚合概念的內涵、起源、性質、特征、作用等;領域論主要探討館藏數字資源聚合的種類、范圍;條件論主要討論館藏數字資源聚合的制約因素;發展論主要研究館藏數字資源聚合的運行狀況、成功經驗、存在問題及其規律。把握館藏數字資源聚合理論分析框架,將為其聚合實踐提供理論指導基礎。

3.多學科視角下的概念理論。概念內涵決定其理論不能單純歸屬某個學科,它以多學科理論的綜合體,對其運行的特征、演變規律和聚合模型進行指引,它在契合館藏數字資源分布式、多元化、智能化發展趨勢的同時,對其實用性與前瞻性進行預測和指導。[5]體現為:生態學關注聚合資源的生態環境與生態系統平衡;組織學關注資源與資源之間的關聯與組織;方法論關注資源的多樣性、完整性和系統性;系統論關注資源的整體與部分、結構與功能之間關系的處理與融合;哲學終極關懷關注能為讀者獲取數字資源提供多大的空間自由度;倫理學關注資源聚合的版權利益平衡;社會學關注為讀者提供普遍服務;經濟學關注資源聚合的成本與效益保障;服務學關注讀者能否參入到資源聚合過程;法學關注資源聚合法律制度的保障與實現。這為我們從多個側面認知館藏數字資源聚合提供了理論來源。

二、館藏數字資源聚合的基礎理論

聚合的理論來源和創造性融合與資源重組的聚合過程,決定館藏數字資源聚合涉及的基礎理論是一個綜合交叉的理論體系。

1.共享理論。共享理論實質是資源的共建、共知、共享,共建與共知是共享基礎,共享又能很好地引導共建,同時共享需要多種形式來實現,聚合便是其中一種。首先,館藏數字資源聚合是基于資源共享理念形成和發展的。資源共享理念是資源聚合產生的動機。資源共享能使圖書館原來的倉儲積累、備用資源的基本結構轉變為選擇積累、目標資源的提供模式,而在資源聚合框架里這種模式可得以實現。所以說,由資源共享理念推生的資源聚合是對館藏數字資源建設的最大貢獻。其次,館藏數字資源聚合是實現資源共享的有效組織方式。數字資源的異質異構,形成了資源之間的差異,資源聚合是建立在資源的優化組合與合理配置基礎之上的聚合形式,它借助資源優勢互補,使得資源獲得某種質和量的放大效應,[6]從而形成一種資源擴充效果。

2.集群理論。集群理論是通過互聯網和合作協議,把數字資源的機構與組織按照一定模式集中在特定虛擬區域內,對各資源機構中分散獨立的數字資源進行統一處理和邏輯聚合,用統一的界面,為用戶提供一站式集成服務。而館藏數字資源聚合是在資源整合的基礎上,對資源數據進行深度挖掘,提取出隱藏在資源數據之中的新資源,在聚合中融入知識和智慧,產生知識溢出效應。它謀求資源之間聚合,以彌補資源自身的不足,強調資源高度集中、重視新技術應用、實現資源增值。凸顯資源1+1>2的協同效應。[7]它與資源集群理論指導思想正適切。

3.共生理論。共生理論源于生物學,意指“不同種屬的生物按某種物質聯系共同生活”。它由共生單元、共生模式和共生環境三要素構成,共同進化、共同適應、共同發展是共生的本質。共生的過程是共生單元采取合作性競爭的方式,通過同類資源的共享和異類資源的互補實現共生單元功能的重新分工和定位,最終達到一體化共生的理想模式。[8]而這個模式正好與館藏數字資源聚合共享的理念相一致。在館藏數字資源聚合中,如果把層次不同和類型異構館藏數字資源共享看成一個共生體時,那么,各個資源就成為一個個的共生單元。根據共生理論,一方面,共生單元之間必定存在一個聯系的紐帶,不同館藏資源之間的這種聯系紐帶主要體現在資源之間的隱性關聯和互補兩個方面。另一方面,共生關系形成過程中,共生伙伴的選擇并不是隨機的,而是表現出一定的規律性,任何共生單元都會優先選擇能力強、匹配性好的共生單元作為共生對象。這一規律為館藏數字資源聚合的路徑提供了依據;共生模式是指共生單元之間相互作用的方式,“一體化共生、多樣化組合”是館藏數字資源聚合共生模式。一體化共生是為實現各資源自身優勢,借助共生界面,通過資源之間的隱性聯系,對資源采取全方位聚合合,實現資源的自由流動以及信息和品牌共享的基礎。多樣化組合是指館藏數字資源盡可能多樣化,在差異的資源之間實現資源組合的互補性,增強資源的吸引力。創造整體競爭優勢,獲得1+1=∞的效果;共生環境是共生單元以外的一切影響因素的總和,是共生關系存在發展的外生條件。館藏數字資源聚合的共生環境是指為促進數字資源聚合所推出的政策、投入的資金、制定的制度以及建立的機制等。

4.長尾理論。館藏數字資源的長尾現象表現在10%的資源占全館90%資源使用率,80%的讀者只利用了全館20%的資源等。資源聚合對長尾現象不能采用傳統的“取頭截尾”做法,因為處在分布后面的80%的資源以其龐大的總量對總體起著不可低估的作用,完全忽略是不合理的。為了不丟棄“尾部”,長尾理論主張應有盡有,但考慮成本、空間等限制,做到數字資源完全聚合是不可能的。權威數據庫收集的資源雖然多,但價格昂貴。既然做不到“全盤照收”,根據長尾理論對尾部信息總量優勢的重要性論斷,[1]資源聚合要從中提取有用的知識,努力做到信息提煉“簡而不漏”,即簡化信息但不丟失重要信息。

5.認知語言學理論。認知語言學是一門研究語言的普遍原則和人的認知規律之間關系的語言學流派,主要研究領域包括認知語義學和認知語法。將認知語言學作為館藏資源聚合語義化理論體系中的一部分,是因為語義化的目標是希望機器能夠識別人們說話的深層語義,而不是字義,認知語言學則提供了從字、詞開始解剖的語義。它涉及概念結構、語義結構、語義表征、語義構建、體驗性、概念化這6個概念,這6個概念完整地體現了館藏資源聚合語義化的全過程,即構建概念、構建關系、構建概念關系、形式化。[2]也就是說,認知語言學理論為館藏資源聚合語義化構建過程提供了理論基礎。

6.評價學理論。評價學是一門實踐科學,其理論體系包括基于學科(針對評價學本身)的理論體系、基于應用(針對評價學的應用領域)的理論體系和基于過程的理論體系。而這三種理論正好貫穿于館藏數字資源聚合的全過程,因為一次完整的聚合過程至少需要經過資源分類效果是否良好、資源提取效果是否良好、資源關聯效果是否良好、聚合形式效果是否良好4次評價過程,每一次評價都需要設計一套評價體系,即為館藏數字資源聚合質量評價方案。而后進行的評價信息收集、評價結果分析、評價過程控制,只需按照評價學基本方法和技術逐步進行即可。[2]因此,評價學理論為館藏數字資源聚合質量提供了理論保障。

三、館藏數字資源聚合的方法理論

按照聚合過程數字資源再組織動態演化所體現出的資源因需而由大變小、語義化程度由弱到強、形態在語法、語義和語用之間轉化、不同知識單元之間的多元化關聯、關聯的方式是直接的還是間接的、是顯現的還是潛在的等特征,[4]館藏數字資源聚合主要方法理論如下:

1.網絡分析方法理論。網絡分析的目標是用機器來處理海量資源,最終形成一個資源關聯的強強網絡,基本原理是讓計算機能夠理解資源,解決計算機與讀者間的資源溝通問題。館藏資源聚合的最終目的也是實現網絡分析,因此,網絡分析資源組織原理是館藏資源聚合最核心的理論。按照此理論,可將資源網絡看成是由知識單元(知識關聯網絡中的知識節點)、知識關聯(知識節點之間的關聯關系)、知識群落(依據關聯關系劃分的知識單元的集合,而不同知識群落之間的交叉關聯則構成多維立體的知識關聯網絡體系)構成的三元組。網絡分析法在聚合過程中主要是圍繞資源網絡的中心性、群聚性、關聯性三個維度展開。中心性主要用于衡量節點在整個資源網絡中的地位和影響力;群聚性主要用于實現節點分類和定位,用于資源網絡結構和層級劃分;關聯性主要用于判斷資源網絡節點間關系以及節點的重要程度。[9]通過這三個維度,將不同資源的關聯特征或不同資源間建立的網絡進行整合、提取,并按讀者的需求組織資源,主要體現在以館藏數字資源的內、外部特征(如關鍵詞、作者、主題、出版機構)為基礎,通過作者互引關系分析、作者合作關系分析、作者-關鍵詞分析等關系分析,[10]實現相關資源的聚合。

2.分眾分類方法理論。分眾分類法是“以讀者為中心基于大眾一致意見而產生的分類體系”,用戶依據知識結構、情感體驗、個人喜好等賦予數字資源特征標識,研究人員通過標識規范、統計和聚類等挖掘數字資源之間的關聯關系,從而擴大讀者標注和檢索的范圍。分眾分類法的主體主要是互聯網普通讀者,在數字資源聚合過程中,用戶不需要借助專業人員、技術或工具的幫助,就可獨立完成數字資源聚合任務。分眾分類法“以讀者為中心”,從三個維度“讀者、資源和標簽”對資源進行劃分,采用標簽過濾技術、標簽分類技術、標簽推薦技術,依托R語言、Wordle、tagCloud發生器、ImageChef等工具,[4]實現數字資源的再組織與聚合。

3.計量學方法理論。計量學包括文獻計量學、信息計量學、知識計量學。文獻計量是利用數理統計等方法對相關文獻的數量特征進行統計,通過數據描述的方式揭示文獻資源的分布特征及變化規律的定性和定量相結合的數字資源聚合方法。[4]信息計量學是采用數學、統計學等各種定量方法,對資源信息在交流過程中的信息進行組織、存儲、分布、傳遞、利用等定量描述和統計;知識計量學是對知識存量和流量、知識分配與轉移、知識生產和應用、知識投入和產出、知識價值和價格等方面進行的計量研究。[2]館藏數字資源聚合過程,需要多次用到計量學理論和方法。文獻是館藏資源的一種,文獻計量學的研究對象就是文獻,館藏資源聚合的對象同樣包括文獻,這種聯系造成了文獻計量學成為館藏資源聚合的一部分。用信息計量學方法得到的詞頻、著者數、出版者數、被引頻次等測度數字,也是館藏資源聚合能夠使用的量化結果。用知識計量學方法得到的資源深層語義信息和信息之間的定量關系,則是館藏資源聚合時可利用的重要內容。可見,在館藏數字資源聚合過程中,計量學的理論和方法為聚合提供的不僅僅是聚合的對象,還提供了定量資源關系的確切方法和手段,為館藏資源的深度聚合提供了量化支撐。

4.本體方法理論。本體是指對共享概念模型的規范化、形式化和明確化的說明,其強調領域中的本質概念以及概念之間的關聯關系。[4]在本體中,概念之間、實例對象之間存在著各種復雜語義關系,如等級關系、等同關系、相似關系、相關關系、互操作關系等。通過對不同領域的資源集合構建領域本體,利用語義映射機制實現異構資源和系統之間的語義關聯,就可以實現異構的、不同類型資源的深度聚合[9]。本體是構建數字資源關聯最理想的方法之一。

5.關聯數據分析方法理論。關聯數據是指共享、連接各類數據、信息和知識的一種資源組織方式,它克服了本體的領域局限性,實現了各類數據的無縫鏈接。其本質在于為各類分布的、異構的數據建立語義關聯,[9]表現為:基于機構資源的關聯、基于學者資源的關聯、基于主題資源的關聯、基于知識資源的關聯、基于文獻資源的關聯、基于讀者需求資源的關聯以及研究主體(機構學者等)、研究客體(主題知識點)、研究載體(文獻、期刊)交叉資源的關聯等。這些關聯,從單一維度到多元維度,使得數字資源再組織的新體系能夠根據讀者不同的資源需求設定出與之相適應的維度[4],拓寬了傳統意義上資源再組織的視角,更易滿足讀者的多樣化需求。它在對分布式異構資源進行組織、集成、關聯并提供關聯訪問的同時,為館藏數字資源聚合提供了得天獨厚的優勢。

6.共現分析方法理論。共現分析理論是一種時空相關分析方法,是采用定量化的方法來分析資源中因特征項的共同出現所產生的文獻之間的內容關聯。一般而言,共現的特征項之間一定存在著某種關聯,關聯程度可用共現頻次來測度。通過共現分析可以從多個維度挖掘和揭示隱含在資源中的各類知識信息單元的內容關聯和邏輯關聯。共現分析通常包括共詞分析、耦合分析、同被引分析和合作分析等。目前,研究較多的是二重共現,即兩個文獻特征項的共現。[9]如果將共現現象擴展到三重或者更多,則其揭示的關聯關系和邏輯聯系會更加豐富,其價值也會更大。

四、館藏數字資源聚合的技術理論

聚合的方法需要與之匹配技術作支持,主要的技術理論如下:

1.關聯數據發布技術理論。關聯數據發布技術是一種先進且簡單易行的數據組織與發布技術,技術優勢是:統一資源標識符;標識名稱標準化;提供標準格式的有用信息;提供相互關聯的標識名稱。[3]此技術是實現館藏數字資源聚合中書目數據關聯化、資源關聯服務、關聯結構化查詢、資源智能檢索等聚合的關鍵技術。

2.語義聚焦爬蟲技術理論。此技術分為資源目標的定義和描述、策略的分析與制定、頁面語義標注和分析三步完成。首先以事先遴選好的URL作為種子樣本來決定爬行的起點,從而達到對爬蟲為發現新目標頁面URL而進行漫游的深度控制和引導。其次采用傳統的深度優先、廣度優先和啟發式搜索等策略,對提取到的URL列表進行鏈接排序和下載,得到不含任何語義關聯信息的數據和相關的元數據。最后對得到的資源進行分析和分類,從語義化的網頁或文件格式中如URL文件、OWL文件、XTM文件、XML文件、嵌入相關語義標記如RDFa、Microdata的HTML和XHTML文件中提取和分離出語義標注信息。常采用的方法是編寫自定義的解析程序或者采用語義分離器RDF API等。對非語義化標注的網頁文檔,則通過一些自動化語義標注軟件或人工輔助標注方式補充語義信息,[11]實現對獲取到相關實體數據和元數據語義標注的完善,最終根據語義標注信息完成發現新知識的資源聚合。

3.網頁抓取技術理論。由于館藏數字資源主要以網頁的形式存在,所以頁面資源的抓取至關重要。網頁抓取主要是html頁面的抓取和分析,配合htmlconnector即網頁連接器一起使用,抓取雙層鏈接并保存頁面內容。常見的抓取方法有三種,一是url地址中包含分頁信息;二是通過asp.net開發的網站分頁控件,通過post方式提交分頁信息到后臺代碼;三是翻頁過程中找不到頁碼信息,[12]只能用代碼模擬手動翻頁,然后抓取。

4.索引技術理論。索引技術貫穿于資源聚合的整個過程,包括結構索引和內容索引。結構索引:以網頁中的頁面和鏈接作為索引的節點和邊的有向圖,有了節點和邊的有向圖就可以對超鏈接創建索引。內容索引:內容索引主要是web頁面的文本資源,[12]是在資源挖掘時查詢內容相關度的主要方法。

5.語義網技術理論。語義網技術是解決數字資源語義描述、構建資源之間語義關聯關系的技術。館藏數字資源聚合所涉及的語義網技術主要包括語義描述標準和本體。語義描述標準規定了網絡資源的語義描述方式,為資源間的聚合提供了統一的語義接口,包括 RDF、RDFS等模式,SKOS、LCSH等公共詞表以及XML、OWL等置標語言。本體主要用于對館藏內外部資源進行語義重組,其中,對內部資源進行語義描述的本體有 MarcOnt、BIBO、OAI-ORE、FRBR等。對外部資源進行語義描述的本體有FOAF、EVENT、DBpedia Ontology等。[13]

6.聚合機制技術理論。館藏數字資源聚合機制技術主要包括數據倉庫聚合機制技術、封裝器聚合機制技術、A-gent聚合機制技術等。數據倉庫聚合機制技術是將海量的館藏網絡數字資源按主題、學科的方式建模并存儲在同一數據倉庫內進行集中管理,從而將分散異構數據庫進行無縫鏈接,剔除相關數據庫內的重復信息后,給讀者提供一站式地訪問館藏數字資源的平臺。此技術是一種物理集成的聚合技術,它通過一致的方式將異質異構的資源統一集中存儲起來,有利于實施更加深人、復雜的數據挖掘、資源發現等資源聚合;封裝器聚合機制技術是一種虛擬的資源聚合技術,此技術無需真正存儲需要聚合資源,同時又能很好地解決資源聚合問題,它能克服異質異構資源難以集中存儲的不利因素,以統一的形式將聚合過的結果提供給讀者,更加適應館藏數字資源信息量大、更新快等特點,[14]它是目前提高館藏數字資源聚合質量的主流技術;Agent聚合機制技術是將聚合框架中的主要功能模塊封裝為A-gent的技術,主要有讀者A-gent技術、資源Agent技術和代理方Agent技術三種。讀者Agent技術負責維護讀者信息、方便讀者與聚合系統進行交互,資源Agent技術將信息資源按照聚合系統的表示形式進行描述和轉換,代理方Agent技術負責將從讀者Agent發出的查詢請求與所要查詢的資源Agent進行匹配,各Agent之間進行通信、交互和合作,使聚合系統能更加適應館藏數字資源異構性及分布性的特點,從而有效地實現資源聚合[14]。可見,以Agent作為核心模塊,可以增強館藏數字資聚合的靈活性。

五、館藏數字資源聚合的模式理論

聚合模式是使資源以什么樣的方式呈現,它解決的是資源的采集與處理(資源問題)、資源基礎設施(技術問題)、資源分析與應用(利用問題)三個核心問題。聚合模式包括多層次、多類型、多方式,主要有以下幾種:

1.資源超網絡語義聚合模式。超網絡是由多個網絡關聯而成的網絡,它可以同時描述同質事物以及異質事物間的聯系。由于館藏數字資源是由多個網絡關聯(超網絡)而成的資源,因而可運用超網絡聚合模式,對資源中涉及的人、知識、載體之間的語義關系(等級關系、屬性關系、等同關系、相關關系、引用關系、論述關系等)進行分析,形成基于語義關系的數字資源聚合模式。此模式從下至上分為基礎層、描述層、聚合層和應用層共4個層次,基礎層是各種類型的文獻數據、知識數據和讀者數據,此層利用自動化語義標注系統進行自動標注,從中提取人、知識、載體等知識要素信息;描述層主要實現對不同類型的數字資源及知識要素的結構化描述和存儲,采用XML語言描述數字資源超網絡中各節點和要素間的語義關系,方便計算機之間的互操作和搜索引擎細粒度化的查找與匹配;聚合層通過語義關系提取,對數字資源超網絡中人、知識和載體要素,從等級關系、等同關系、屬性關系、相關關系、引用關系、論述關系等語義關系角度進行關聯映射和資源聚合;應用層面向終端讀者,讀者通過簡潔的檢索界面輸入查詢項,系統自動分析查詢項并進行語義計算和匹配,以可視化的方式將計算結果輸出,[15]同時給出供讀者控制的參數選項,方便讀者調整和優化檢索結果。

2.資源類型聚合模式。此模式包括數據聚合、信息聚合、知識聚合。數據聚合是對異質異構數據庫資源在邏輯上或物理上有機地集中,提供統一的表示和操作,以解決多種異構數據資源的互聯與共享。它分為網格聚合、跨庫檢索聚合、中介模式聚合三種方式;信息聚合是通過一定的標準和技術實現異構異質資源信息物理或邏輯上的集中與互聯互通,實現多種資源的“一站式”檢索,但并沒有對資源對象之間的關系進行有效揭示和組織;知識聚合則是對資源中的內在概念及概念之間的關系進行表征。本體技術的發展,為知識聚合提供了強有力的工具,本體是知識聚合的核心。[16]知識聚合是資源聚合的高級階段,也是資源聚合的最終目標。

3.資源作者合作聚合模式。此方式是通過對某一領域內資源作者合作進行分析,揭示該領域內的研究團體、核心作者以及研究的主題。分為作者合作關系聚合和機構合作關系聚合。作者合作關系聚合是把相關作者的知識信息聚合在一起,用網絡分析法分析資源作者之間的關系,揭示資源網絡中的主要成員和個體之間的復雜關系;機構合作關系聚合是利用網絡分析法對相關資源信息進行挖掘。把具有合作關系的機構確認網絡的節點,在此基礎上確定資源機構合作的關系,構造機構合作的矩陣,對所呈現的機構合作網絡進行相應的分析,[17]聚合成一個相互聯系而產生不同影響的機構資源網絡。此模式能夠揭示作者合作交流的資源信息,向讀者提供更加精準、全面的信息。

4.資源元數據互操作模式。元數據互操作方式有:映射、復用與集成、互操作協議、關聯數據等。映射是指兩個元數據標準的元素之間直接轉換,通過一對一、一對多、多對一及多對多等多種映射方式解決語義互換及統一檢索問題;復用與集成:當映射模式無法有效滿足已賦值的元數據互操作需求時,就需要借助復用與集成等方式實現不同文化機構的元數據記錄的整合。復用與集成的實現途徑以METS和RDF兩種方式為主、多種方式并用;互操作協議:要實現對參建機構分布式異構平臺的跨庫檢索,可以借助元數據互操作協議方式來實現。目前被廣泛應用的元數據互操作協議有OAI-PMH,Z39.50,ZING等;關聯數據:關聯數據是將數字資源的每個元素用RDF三元組的形式表示,聚合時只需在兩個系統的元數據之間建立匹配點,[18]實現不同數據集之間的關聯,實現異構系統之間的元數據互操作。

5.資源選題聚合模式。資源選題聚合模式是針對資源某一領域內的選題進行聚合,包括多題選做、專題精做、舊題新做、一題多做。多題選做是對資源選題進行取舍,“取”哪些與讀者需求相契合、有傳承價值、學術價值的資源選題。“舍”哪些與讀者需求相背離、一般性的、重復性的平庸化資源選題;專題精做是實施精品戰略,在資源選題的精度和深度上狠下功夫,集中優勢力量對某個專業領域的資源選題進行精耕細作,打造出一批不可被替代的或替代程度很低的資源,從而獲得“人無我有,人有我精”的資源獨特競爭優勢;舊題新做是回頭看,聚合挖掘舊的資源選題,賦予舊資源以新意義,使其重新煥發出活力和生命力,贏得讀者的認可;一題多做是以資源聚合為依托,對同一資源選題進行不同媒介形式如網頁、影品、游戲互動、專業數據庫等方向的延伸開發,[19]形成資源選題的多次開發、多媒體互動發展的綜合效應。

六、館藏數字資源聚合理論的發展超越

在大數據和云計算背景下,館藏數字資源突破了傳統的資源整合、集成等研究局限,出現了突破和創新,向數字資源的聚合方向發展,因而其理論發展也凸顯出超越性。

1.聚合理論的引進與本土化研究的結合。資源聚合的出現,雖然帶有很深的西方移植痕跡,但其發展的方向是本土化研究,因而學者對西方研究成果的引進,是在在系統總結西方主要聚合理論的基礎上,結合中國的實際,引進了西方一些諸如聚合資源說、聚合資源關系說、聚合資源差異說等資源聚合理論研究成果,并指出這些理論的共性在于:視資源聚合為一種現存的狀況。其差異性在于:對資源聚合概念的理解、對資源聚合對象的把握與資源聚合的價值取向等方面存在分歧與差異。引進理論與土化研究的有機結合是館藏數字資源聚合理論發展超越的關鍵所在。

2.聚合理論新理念的出現與研究視覺的創新。館藏數字資源聚合是一種主觀體驗、社會制度、現實狀態和理想追求,是大數據時代特有的現象。隨著研究的不斷深入,出現了理論創新:社會資本理論。由大數據時代引發而出現的社會資本新理論,將館藏數字資源聚合理論融入了一個全新理念。該理論從新的角度引導館藏數字資源聚合理論研究的新內容,出現了諸如資源聚合成本節約、資源聚合信任、資源聚合嵌入等理論研究新視野;生產組織形式理論。館藏數字資源聚合不僅僅是一種資源重組織現象,更是一種社會生產組織形式。我們知道,一種新的社會生產組織形式的產生和發展,必然帶來整個社會整體結構和觀念的變遷。筆者認為,館藏數字資源聚合正是這樣一種新的社會生產組織形式,它需要更寬廣的理論作支撐;負面影響理論。目前對館藏數字資源聚合的論述幾乎都是正面的,對于它的負面影響關注不夠,這是不正夠的。因此,未來研究需要拓展廣度和深度,明確聚合理論的發展與館藏數字資源聚合之間是否存在著負面影響,如果存在,存在的條件是什么、具體的作用機制是什么、理論依據又是什么。[6]這些問題有待于以后進一步研究。

3.聚合理論催生性的凸顯。由聚合理論創新引導的館藏數字資源聚合,由于其具有的特殊性,將催生一批適應館藏數字資源聚合發展的專業技術人才,如資源數據分析師、圖書數據分析師等。分析師的出現,將館藏數字資源聚合從基礎性分析、推測性分析提高到更加成熟的預測性分析上。推測性分析是根據資源的連貫性、概率性、相關類推原則等對資源發展進行定性推測,目前館藏數字資源聚合大多采用這種定性推測。預測性分析則是分析館藏數字資源集合以識別其趨勢,并通過建立模型進行預測,發現資源之間的相關關系,[20]從而準確預測資源發展方向,及時為聚合提供解決問題方案。

4.聚合理論相關性的超越。盡管館藏數字資源聚合涉及很多理論,但這些理論并不是孤立的指導資源聚合,他們之間有相關性。“相關性”是指兩個或者兩個以上變量的取值之間存在某種規律性。這就是說,如果找到某個現象的良好關聯物,相關關系就可以幫助我們捕捉現在和預測未來。這種通過洞察細理論之間相關性的分析方法,為館藏數字資源聚合理論打開了一扇新窗戶。按照這樣的思路,未來館藏資源聚合可以在常規理論指導下,結合理論之間的相關關系,從原有的靜態理論指導向動態理論拓展,提供更加精準的理論跟蹤。[20]聚合理論的相關性將成為今后館藏數字資源聚合理論研究的新領域,它能幫助我們走出對直覺、經驗、常規邏輯推斷、因果關系分析等傳統思維路徑的依賴,將思維拓展飛躍到從眾多指導館藏數字資源聚合理論中不斷發現新指導理論的視野。

結語

館藏數字資源聚合理論,不僅引領著聚合的路徑和發展方向,而且在其實踐研究中呈現出理論整合與理論創新,形成新的理論研究領域,指導館藏數字資源聚合形態豐富多彩,立體化多層面地為讀者提供多角度多層次服務。本文在學者研究的基礎上,對館藏數字資源聚合的理論體系進行了分析與構建,旨在為其理論研究的繼續和深入提供新思路、新視角,真正將館藏數字資源聚合的理論研究推向多學科、多領域、多維度、多視角、多方法的交叉融合。本文只是初步研究的嘗試,相信隨著學者研究的深入,館藏數字資源聚合理論的研究必將出現質的飛躍。

[1]牛奉髙.數字文獻資源高維聚合模型研究[D].武漢:武漢大學, 2014.

[2]樓雯館.藏資源語義化理論體系研究[J].圖書館學研究,2015,(2): 35-40.

[3]陳德容.基于關聯數據的圖書館數據發布及數據服務[J].圖書館工作與研究,2015,(2):25-27,43.

[4]畢強,尹長余,滕廣青等.數字資源聚合的理論基礎及其方法體系建構[J].情報科學,2015,33(1):9-14,24.

[5]賀興,艾芊,余志文等.電力生態系統視角下的電網演變及電力系統聚合理論[J].電力系統保護與控制,2014,42(22):100-107.

[6]劉學平.理論視野內多類型集群圖書館發展的理性認識[J].圖書館理論與實踐,2012,(2):52-57.

[7]肖希明,李碩.信息集群理論和公共數字文化資源整合[J].圖書館,2015,(1):1-4,11.

[8]董淵,孫紅莉,程結晶.基于共生理論的高校數字化教學資源共享策略研究[J].南昌教育學院學報,2014,(4):52-55.

[9]陳蘭杰,侯鵬娟.數字文獻資源關聯關系揭示方法研究[J].圖書館,2015,(2):41-45.

[10]王雨.基于社會網絡分析的數字圖書館資源聚合研究[D].長春:吉林大學,2014.

[11]王思麗,劉巍,祝忠明等.語義化的知識資源發現方法探析[J].圖書館學研究,2014,(9):2-6.

[12]許微.基于知識發現機制的企業決策支持系統構建研究[D].湖南:湘潭大學,2013.

[13]劉曉娟,黃海晶,尤斌.語義網技術在圖書館數字資源深度聚合中的應用[J].圖書館雜志,2015,(6):76-82.

[14]伏琰.基于云計算的數字資源整合技術研究[J].農業圖書情報學刊,2015,27(4):21-24.

[15]畢強,王傳清,李潔.基于語義的數字資源超網絡聚合研究[J].情報科學,2015,33(3):8-12.

[16]肖希明,唐義.國外多領域數字資源整合研究進展[J].中國圖書館學報,2013,(4):26-35.

[17]李星星.館藏資源深度聚合及應用研究[D].武漢:華中師范大學信息管理學院,2013.

[18]肖希明,田蓉.國外公共數字文化資源整合的現狀與發展趨勢[J].國家圖書館學刊,2014,(5):48-56.

[19]周乾隆.中小出版社選題資源整合四種模式[N].中國新聞出版報,2015-04-01(4).

[20]吳敏慧.大數據與圖書館信息服務新構想[J].圖書館理論與實踐,2015,(2):14-16.

On the Theoretical System of Library Digital Resources Aggregation

Liu Xue-ping
(Library of Weifang University,Weifang 261061)

Study on Library Digital Resources aggregation theory aims to,form a complete theoretical system,and provide strongguidance for the practice of polymerization.Byanalyzingthe concept ofthe collection ofdigital resources,conceptual framework,concept theoryfrommulti discipline perspective,we think the collection ofdigital resources should be basicallyguided bysharingtheory,cluster theory,symbiosis theory,the longtail theory,cognitive linguistics theory and evaluation theory,use etwork analysis method,theory of classification method,theory of measurement method,ontology method theory,correlation data analysis method and the theory of Co-occurrence analysis method for theoretical analysis tools,and be supported byFusion elated data publishingtheory,semantic focused crawler theory,web crawling theory,index theory,semantic web theory,and aggregation mechanism theory,so as to put the theory of aggregation pattern such as resource super network semantic pattern,resource type mode,resource author cooperation mode,resource metadata interoperabilitymodel,resource selection model intopractice and tohighlight theoretical introduction and localization,newideas and research on the theoryofnewvision,theoretical birth and correlation theoretical transcendence ofdevelopment.

collection ofdigital resources;aggregation theory;theoretical development

G251

A

1671-4288(2016)03-0111-06

責任編輯:孫延波

2016-04-23

山東省社科規劃項目“數字圖書館資源語義關聯可視化實現研究”(15CTQJ01);山東省文化廳項目“圖書館服務公共數字文化的創新模式研究”(1506327);濰坊市科學技術發展計劃軟科學項目“生態理念下濰坊文化生態發展路徑研究”(項目號:2015RKX049)階段性成果。

劉學平(1964-),男,山東諸城人,濰坊學院圖書館副研究館員。

猜你喜歡
關聯語義理論
堅持理論創新
當代陜西(2022年5期)2022-04-19 12:10:18
神秘的混沌理論
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
理論創新 引領百年
相關于撓理論的Baer模
語言與語義
奇趣搭配
智趣
讀者(2017年5期)2017-02-15 18:04:18
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
認知范疇模糊與語義模糊
主站蜘蛛池模板: 久久久噜噜噜| 国产你懂得| 欧美α片免费观看| 国产女同自拍视频| 国产亚洲精品自在久久不卡| 亚洲成人高清在线观看| 亚洲美女久久| 精品人妻无码区在线视频| 亚洲国产成人麻豆精品| 九九香蕉视频| 欧美日韩va| 国产网站在线看| 亚洲色图综合在线| 亚洲美女高潮久久久久久久| 欧美丝袜高跟鞋一区二区| 色婷婷电影网| 中国一级特黄视频| 午夜影院a级片| 福利视频一区| 欧美一区精品| 国产美女无遮挡免费视频| 亚洲天堂啪啪| 草逼视频国产| 五月激情综合网| 亚洲男人天堂久久| 婷婷六月综合网| 福利在线一区| 一本大道香蕉高清久久| 午夜电影在线观看国产1区| 国产欧美视频在线观看| 成人免费黄色小视频| 伊人激情综合网| 区国产精品搜索视频| 亚洲国产91人成在线| 久久99热66这里只有精品一| 免费 国产 无码久久久| 五月婷婷综合色| 国产精品香蕉| 亚欧成人无码AV在线播放| 不卡无码网| 亚洲视频一区在线| 久久亚洲精少妇毛片午夜无码| 老司机aⅴ在线精品导航| 国产精品所毛片视频| 日本一区二区不卡视频| AV无码无在线观看免费| 五月激激激综合网色播免费| 国产精品亚洲精品爽爽| 国产精品任我爽爆在线播放6080| 日本高清在线看免费观看| 国产不卡一级毛片视频| 狠狠色综合久久狠狠色综合| AV网站中文| 日本在线欧美在线| 一级一级特黄女人精品毛片| 亚洲无码在线午夜电影| 国产成人做受免费视频| 久久久久久尹人网香蕉| 日韩在线播放欧美字幕| 免费看黄片一区二区三区| 国产精鲁鲁网在线视频| 国产小视频a在线观看| 这里只有精品在线播放| 色综合天天视频在线观看| 中文无码毛片又爽又刺激| 一级毛片在线免费视频| 亚洲无码精品在线播放| 亚洲h视频在线| 亚洲精品中文字幕无乱码| 99偷拍视频精品一区二区| 999在线免费视频| 中文字幕欧美成人免费| 久久大香香蕉国产免费网站| 黄色在线网| 久久窝窝国产精品午夜看片| 日本在线国产| 九一九色国产| 久草中文网| 国产爽歪歪免费视频在线观看| 国产视频只有无码精品| 亚亚洲乱码一二三四区| 国产在线观看第二页|