999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數(shù)據(jù)時代高校圖書館特色數(shù)據(jù)庫建設研究

2014-08-08 16:11:24譚黔林
圖書館界 2014年2期
關鍵詞:大數(shù)據(jù)研究

譚黔林

[摘要]針對目前高校圖書館特色數(shù)據(jù)庫的建設現(xiàn)狀,結合大數(shù)據(jù)時代的特點,提出了大數(shù)據(jù)環(huán)境下高校圖書館特色數(shù)據(jù)建設的設想,從數(shù)據(jù)標簽、子節(jié)點建設、虛擬大數(shù)據(jù)庫系統(tǒng)、用戶訪問機制探討了特色大數(shù)據(jù)庫系統(tǒng)的建設模式、實現(xiàn)方式以及用戶訪問機制。利用“數(shù)據(jù)標簽”將分散在不同高校不同類別的特色數(shù)據(jù)庫虛擬地集中起來,實現(xiàn)了特色數(shù)據(jù)的集中展示、統(tǒng)一檢索和共建共享。

[關鍵詞]大數(shù)據(jù);特色數(shù)據(jù)庫;數(shù)據(jù)標簽;研究

1引言

特色數(shù)據(jù)庫是指依托館藏信息資源,針對用戶的信息需求,對某一學科或某一專題有利用價值的信息進行收集、分析、評價、處理、存儲,并按照一定的標準和規(guī)范將本館的特色資源數(shù)字化,以滿足用戶個性化需求的信息資源庫[1]。就國內高校圖書館特色數(shù)據(jù)庫的建設情況來看,高校圖書館特色數(shù)據(jù)庫群分散在全國各地,數(shù)據(jù)總量可用PB級甚至是EB級來計數(shù),并以一定的周期成TB級的態(tài)勢增長。

2大數(shù)據(jù)與特色數(shù)據(jù)庫

2.1 大數(shù)據(jù)

學術界對大數(shù)據(jù)概念并沒有一個統(tǒng)一的定義,但大數(shù)據(jù)的“4V”特征已成科學界的共識,即規(guī)模性、高速性、多樣性以及價值性,正是這四個特征對數(shù)字時代的數(shù)據(jù)存儲技術、數(shù)據(jù)共享技術、數(shù)據(jù)挖掘技術等方面帶來了巨大的沖擊和挑戰(zhàn),大數(shù)據(jù)的新技術正逐漸應用于互聯(lián)網、超級計算、生物工程等領域。

2.2 國內高校圖書館建設與共享情況

為彰顯館藏特色、傳承民族文化、滿足特色教學和科學研究需求,特色數(shù)據(jù)庫已成為各高校圖書館的建設重點,在CALIS地方特色數(shù)據(jù)建設項目的支持下,全國高校圖書館進一步掀起了特色數(shù)據(jù)庫的建設熱潮,其中東三?。ê邶埥?、吉林、遼寧)建有210個特色數(shù)據(jù)庫[2],兩廣地區(qū)(廣東、廣西)建有100個特色數(shù)據(jù)庫[3],兩湖地區(qū)(湖北、湖南)建有160個特色數(shù)據(jù)庫[4—5],此外海南、陜西、天津、重慶等地區(qū)高校圖書館都分別建有不同數(shù)量和類別的特色數(shù)據(jù)庫。

從目前對國內高校圖書館特色數(shù)據(jù)庫抽樣訪問情況來看,數(shù)據(jù)內容的共享情況不容樂觀,以廣西高校圖書館特色數(shù)據(jù)庫的共享情況為例,21所高校圖書館所建的57個特色數(shù)據(jù)庫中,僅有12個數(shù)據(jù)庫可以訪問和下載,其余45個特色數(shù)據(jù)庫都作了不同形式的限制,基于時空和地域條件的差別,數(shù)據(jù)庫的共享程度還有待進一步提高。

3大數(shù)據(jù)時代特色數(shù)據(jù)庫建設設想

(1)由于數(shù)據(jù)庫的特色性,不同的地域文化、資源類別、辦學特點、學科優(yōu)勢等決定了特色數(shù)據(jù)庫的建設只能是分散建設,但是能否用同一種途徑或手段將這些不同的特色數(shù)據(jù)庫有效地集中起來。

(2)能否讓已建成的特色數(shù)據(jù)庫通過一個統(tǒng)一的平臺,直觀地展現(xiàn)在用戶眼前,而不需要用戶通過逐一訪問各高校圖書館的特色數(shù)據(jù)庫平臺而獲取。

(3)在眾多的特色數(shù)據(jù)庫類別中,不論采取何種技術的數(shù)據(jù)庫建設方式,使用何種類型的檢索系統(tǒng),用戶都能通過統(tǒng)一的檢索平臺,從不同高校、不同類別的數(shù)據(jù)系統(tǒng)中獲取所需要的信息。

(4)基于大數(shù)據(jù)處理技術的優(yōu)越性,能否將各高校圖書館這些分散的處理系統(tǒng)、存儲系統(tǒng)、數(shù)據(jù)信息等看成是另一個類別的大數(shù)據(jù)系統(tǒng),從而利用大數(shù)據(jù)的核心技術來進行處理。

4大數(shù)據(jù)時代特色數(shù)據(jù)建設的技術手段

基于以上幾點設想,本節(jié)將從數(shù)據(jù)標簽(Data Label)、子節(jié)點建設、虛擬大數(shù)據(jù)庫系統(tǒng)、用戶訪問機制四個方面來探討大數(shù)據(jù)時代特色數(shù)據(jù)庫的建設和實現(xiàn)形式。

4.1 數(shù)據(jù)標簽

數(shù)據(jù)標簽是元數(shù)據(jù)的身份標志,主要起到數(shù)據(jù)的定位、查詢、獲取等作用,它在整個系統(tǒng)鏈中處于核心地位?;谔厣珨?shù)據(jù)庫數(shù)據(jù)內容的唯一性和特殊性,數(shù)據(jù)標簽的字符長度不必太大,也不必太復雜,太大、太復雜的數(shù)據(jù)標簽雖然能夠提高信息的獲準率,但同時也延長了數(shù)據(jù)獲取的時間,增加了計算系統(tǒng)的運行成本。數(shù)據(jù)標簽內容從幾B到幾K不等,在設計數(shù)據(jù)標簽的過程中,考慮到標簽內容的普遍性、可檢性和預覽性,它主要包括:建設單位、數(shù)據(jù)庫類別、數(shù)據(jù)庫名稱、標題、作者/出處/來源、關鍵詞、內容簡介、元數(shù)據(jù)獲取標志(詳見圖1)。

數(shù)據(jù)標簽是特色數(shù)據(jù)庫系統(tǒng)的最小組成單元,它是用戶通過一定的條件限制,從大數(shù)據(jù)中過濾冗余數(shù)據(jù)的身份標記,它貫穿于特色數(shù)據(jù)庫從建設到利用的始終,在特色數(shù)據(jù)庫建設過程中,數(shù)據(jù)標簽可以是由內容管理系統(tǒng)自動生成,也可以后期導出數(shù)據(jù)表進行加工處理,每一個特色數(shù)據(jù)庫的元數(shù)據(jù)按照數(shù)據(jù)標簽的格式進行著錄建立一個數(shù)據(jù)標簽表,給予它一個身份識別標志,其中數(shù)據(jù)標簽的部分內容可以是重復的,但是構成數(shù)據(jù)標簽的“元數(shù)據(jù)獲取標志”字段必須是唯一的,因為它是用戶從大數(shù)據(jù)中獲取原文件的唯一身份識別標志。標簽字符上限長度30B20B30B40B50B20B800B30B建設單位類別名稱標題作者/出處/來源關鍵詞內容簡介元數(shù)據(jù)獲取標志圖1數(shù)據(jù)標簽

4.2 特色數(shù)據(jù)庫子節(jié)點的建設

特色大數(shù)據(jù)庫系統(tǒng)是由不同地域、不同類別的子庫構成。目前,國內高校圖書館在特色數(shù)據(jù)庫建設方面已有了成功的經驗和比較成熟的技術手段,基于數(shù)據(jù)庫的特色性,考慮到設備、人力、財力、管理、資源的屬地性、效率等諸多因素,特色數(shù)據(jù)庫子節(jié)點應由各高校圖書館分散異步建設,而不適用于重新組建統(tǒng)一的機構來承擔建設,在子節(jié)點的建設過程中,應不拘泥于何種建庫標準,采用何種建設方式,使用何種數(shù)據(jù)庫內容管理系統(tǒng)。它可以是已建好的特色數(shù)據(jù)庫,也可以是正在建設的特色數(shù)據(jù)庫,還可以是任何結構化數(shù)據(jù)或非結構化數(shù)據(jù)類型。

在子節(jié)點建設過程中,數(shù)據(jù)標簽是數(shù)據(jù)內容的基礎單元,對于已經建成的特色數(shù)據(jù)庫,可以通過導出相關的字段信息和原址,進行簡單匹配重新生成數(shù)據(jù)標簽表;對于正在建設的特色數(shù)據(jù)庫,通過制定相應的數(shù)據(jù)著錄規(guī)則,從而實現(xiàn)數(shù)據(jù)標簽的自動生成。

4.3 虛擬大數(shù)據(jù)庫系統(tǒng)

盡管不同種類的海量數(shù)據(jù)存在一定差異,但總的來說,支持海量數(shù)據(jù)管理的系統(tǒng)應具有如下特性:可擴展性(滿足數(shù)據(jù)量增長的需要)、高性能(滿足數(shù)據(jù)讀寫的實時性和查詢處理的高性能)、容錯性(保證分布系統(tǒng)的可用性)、可伸縮性(按需分配資源)和盡量低的運營成本等[6]。

基于大數(shù)據(jù)系統(tǒng)的特點,虛擬數(shù)據(jù)庫系統(tǒng)主要由用戶、虛擬數(shù)據(jù)中心、特色數(shù)據(jù)庫子節(jié)點所構成(如圖2)。子節(jié)點由每個高校圖書館的服務器群集、GPU群集、存儲設備、網絡設備、軟件系統(tǒng)、特色數(shù)據(jù)庫資源系統(tǒng)等組成,每個子節(jié)都有獨立的運算系統(tǒng),一個節(jié)點的丟失不會影響到其他系統(tǒng)的運行。此外,從理論上來說,子節(jié)點可以無限地進行擴容,它們所承擔的任務就是數(shù)據(jù)的并行計算和與用戶的信息交匯。

虛擬數(shù)據(jù)中心,是整個特色大數(shù)據(jù)群的前臺,主要承擔展示特色數(shù)據(jù)庫、傳遞用戶與子節(jié)點的信息交匯、任務分派等任務。虛擬數(shù)據(jù)中心并不直接處理用戶提交的需求,也不存儲數(shù)據(jù)原文件,可以建立多個數(shù)據(jù)中心,避免一個虛擬數(shù)據(jù)中心系統(tǒng)的停機影響整個數(shù)據(jù)庫系統(tǒng)的正常運行,同時可以對它們做負載均衡處理以提高運行效率。虛擬數(shù)據(jù)中心通過Internet與每一個子節(jié)點進行連接,特色數(shù)據(jù)庫的子節(jié)點將數(shù)據(jù)標簽表傳遞給每一個虛擬數(shù)據(jù)中心,數(shù)據(jù)中心根據(jù)一定的規(guī)則生成Web預覽目錄和索引表,將不同高校圖書館、不同類別的特色數(shù)據(jù)庫集中展現(xiàn)在虛擬數(shù)據(jù)中心上,從而實現(xiàn)元數(shù)據(jù)預覽和統(tǒng)一檢索的功能。

圖2虛擬大數(shù)據(jù)系統(tǒng)4.4 信息獲取機制

大數(shù)據(jù)環(huán)境下,用戶獲取信息機制與傳統(tǒng)意義上的信息獲取機制有所不同,用戶通過虛擬數(shù)據(jù)中心的統(tǒng)一搜索框提交新的查詢需求,虛擬數(shù)據(jù)中心通過存儲在本地的數(shù)據(jù)標簽表與用戶提交的查詢需求進行內容的匹配,如果沒有匹配到對應的數(shù)據(jù)標簽(DL)則向用戶返回查詢結果,如果匹配到對應的數(shù)據(jù)標簽將把查詢的結果返回用戶。用戶根據(jù)需要提取其中某一條標簽,虛擬數(shù)據(jù)中心則根據(jù)數(shù)據(jù)標簽內容的建設單位、類別、名稱、數(shù)據(jù)獲取標志等字段判定標簽所屬節(jié)點,同時將用戶查詢信息、IP地址信息、數(shù)據(jù)標簽等內容進行封裝提交給所屬子節(jié)點,子節(jié)點在接收虛擬數(shù)據(jù)中心傳遞來的封裝信息后進行解包,根據(jù)數(shù)據(jù)標簽內容的“元數(shù)據(jù)獲取標志”子字段,將本地存儲的原數(shù)據(jù)提取出來,再將原文件傳遞給查詢用戶,至此,整個原文件的獲取過程結束(見圖3)。

圖3大數(shù)據(jù)下用戶訪問機制

5大數(shù)據(jù)時代高校圖書館特色數(shù)據(jù)建設特點

5.1 實現(xiàn)了不同數(shù)據(jù)庫的統(tǒng)一展示和檢索

在傳統(tǒng)模式下,用戶想要獲取特色數(shù)據(jù)的內容,首先要知道哪些高校建有此類型的特色數(shù)據(jù)庫,其次再進入特定的數(shù)據(jù)庫進行相關的查閱和下載,這樣既浪費了用戶的時間,也閑置了資源。特色大數(shù)據(jù)系統(tǒng)將所有高校圖書館所建設的特色數(shù)據(jù)庫資源通過虛擬數(shù)據(jù)中心集中展示在用戶眼前,用戶可以根據(jù)數(shù)據(jù)庫類別進行瀏覽,也可以根據(jù)所屬高校進行預覽,同時還可以通過統(tǒng)一的檢索界面一站式地進行查詢和檢索,從而提高了特色數(shù)據(jù)庫的利用效率和用戶資源獲取的效率。

5.2 便于特色資源的共建共享

在特色大數(shù)據(jù)庫系統(tǒng)環(huán)境下,各子節(jié)點通過虛擬數(shù)據(jù)中心可以直觀看到其他各節(jié)點特色數(shù)據(jù)庫的建設情況,這樣在很大程度上可以避免特色數(shù)據(jù)庫的重復建設和盲目建設。此外,特色數(shù)據(jù)庫的建設由各子節(jié)點來承擔,多個節(jié)點的分散建設大大地提高了特色數(shù)據(jù)庫的產出效率,節(jié)點之間通過虛擬數(shù)據(jù)中心進行發(fā)布,實現(xiàn)了相互之間資源訪問、下載。

5.3 靈活性

特色大數(shù)據(jù)庫系統(tǒng)建設的靈活

猜你喜歡
大數(shù)據(jù)研究
FMS與YBT相關性的實證研究
2020年國內翻譯研究述評
遼代千人邑研究述論
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統(tǒng)研究
新版C-NCAP側面碰撞假人損傷研究
大數(shù)據(jù)環(huán)境下基于移動客戶端的傳統(tǒng)媒體轉型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數(shù)據(jù)背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數(shù)據(jù)+輿情:南方報業(yè)創(chuàng)新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
主站蜘蛛池模板: 欧美一区二区人人喊爽| 天堂亚洲网| 99久久精品免费看国产免费软件 | 网友自拍视频精品区| 国产h视频免费观看| 久久亚洲精少妇毛片午夜无码| 亚洲成人高清在线观看| 国产成人一区免费观看| 999国产精品永久免费视频精品久久| 亚洲无码高清免费视频亚洲| 欧美特级AAAAAA视频免费观看| 手机精品福利在线观看| 亚洲最大看欧美片网站地址| 国产成人高清在线精品| 日韩第一页在线| 中文字幕免费视频| 国产99免费视频| 国产大片黄在线观看| 99re热精品视频中文字幕不卡| 午夜色综合| 国产乱人伦精品一区二区| 成人午夜视频网站| 久久a毛片| 在线日本国产成人免费的| 国产在线精彩视频二区| 久久综合亚洲鲁鲁九月天| 强乱中文字幕在线播放不卡| 中文字幕 91| 伊人色综合久久天天| 国产swag在线观看| 午夜日b视频| 欧美日韩国产高清一区二区三区| 成年女人a毛片免费视频| 日本少妇又色又爽又高潮| 无码免费的亚洲视频| 亚洲成人www| 91久久夜色精品国产网站| 国产一级毛片在线| 伊人久久福利中文字幕| 亚洲视屏在线观看| 91 九色视频丝袜| 97精品国产高清久久久久蜜芽 | 久久精品免费国产大片| 91在线一9|永久视频在线| 无码精品一区二区久久久| 亚洲国产成人超福利久久精品| 久久精品aⅴ无码中文字幕| 久草热视频在线| 日韩av无码精品专区| 国产女人在线观看| 最新亚洲人成无码网站欣赏网 | 亚洲欧美日韩中文字幕在线一区| 国产精品第一区在线观看| 国产毛片高清一级国语 | 最新国产网站| 欧美亚洲国产精品第一页| 亚洲伊人久久精品影院| 精品三级网站| 免费高清a毛片| 久久久亚洲色| 热久久综合这里只有精品电影| 国产精品久久自在自线观看| 国产精品无码AⅤ在线观看播放| 亚洲精品动漫| 毛片基地美国正在播放亚洲| 亚洲国产欧美国产综合久久| 国产国产人免费视频成18| 国产无码性爱一区二区三区| 欧洲精品视频在线观看| 亚洲欧美不卡中文字幕| 久久综合伊人 六十路| 亚洲日本中文字幕乱码中文| 精品久久777| 无码啪啪精品天堂浪潮av| a毛片在线免费观看| 在线不卡免费视频| 色欲色欲久久综合网| 国产日韩欧美成人| 91精品免费久久久| 97青青青国产在线播放| 精品一區二區久久久久久久網站| 亚洲欧美不卡视频|