李曉敏,李晶河北省地質(zhì)調(diào)查院
淺析地質(zhì)數(shù)據(jù)倉庫的特點(diǎn)及數(shù)據(jù)組織
李曉敏,李晶
河北省地質(zhì)調(diào)查院
摘要:在我國地質(zhì)行業(yè)的不斷發(fā)展中,研究人員獲得了大量有價(jià)值的地質(zhì)數(shù)據(jù)。有效地對海量數(shù)據(jù)進(jìn)行存儲、管理和利用,是提升地質(zhì)行業(yè)發(fā)展速度和水平的關(guān)鍵。因此,有必要建立強(qiáng)大的數(shù)據(jù)倉庫管理系統(tǒng),來更好地對地質(zhì)數(shù)據(jù)進(jìn)行管理。本文對地質(zhì)數(shù)據(jù)倉庫的特點(diǎn)以及數(shù)據(jù)組織進(jìn)行了具體分析,希望對我國地質(zhì)行業(yè)的快速發(fā)展有所幫助。
關(guān)鍵詞:地質(zhì)數(shù)據(jù)倉庫;特點(diǎn);數(shù)據(jù)組織
數(shù)據(jù)倉庫指的是集成的、面向主題的、反映歷史變化的數(shù)據(jù)集合,是一種對海量數(shù)據(jù)進(jìn)行管理和分析的技術(shù),具有能方便研究人員存取相關(guān)數(shù)據(jù)信息以及對當(dāng)下問題作出科學(xué)決策的作用。從類型上,數(shù)據(jù)倉庫可分為屬性數(shù)據(jù)庫、多媒體數(shù)據(jù)庫以及空間數(shù)據(jù)庫等三種。地質(zhì)數(shù)據(jù)倉庫的建立,極大地方便了地質(zhì)工作者對地質(zhì)資料的管理,它通過友好的界面和便捷的操作流程為廣大行業(yè)人員的研究工作提供了有力支持。
2.1空間性特點(diǎn)
根據(jù)目前的地質(zhì)資料所建立的地質(zhì)數(shù)據(jù)倉庫,具有較為明顯的空間性的特點(diǎn)。在數(shù)據(jù)信息的收集過程中,工作人員通常選取的都是靜態(tài)的、描述性的數(shù)據(jù)信息,這些信息在一段時(shí)間內(nèi)可被認(rèn)為是不隨時(shí)間變化的。同時(shí),這些數(shù)據(jù)信息所構(gòu)造的整體在整個(gè)空間都有分布,通過立體三維方式來展現(xiàn)地質(zhì)情況。因此,地質(zhì)數(shù)據(jù)倉庫在構(gòu)建時(shí),要注意考慮空間方面的特點(diǎn),從而更好的展現(xiàn)數(shù)據(jù)信息的內(nèi)在聯(lián)系,從而構(gòu)造清晰明了的數(shù)據(jù)體系。
2.2非永久性特點(diǎn)
地質(zhì)數(shù)據(jù)并不像大多數(shù)據(jù)那樣具有永久不變的特點(diǎn)。地質(zhì)情況隨著時(shí)間的累積,處在不斷變化之中,變化速度也有長有短。一般情況下,實(shí)際數(shù)據(jù)信息的變化速度較慢,往往幾年或幾十年才會發(fā)生顯著改變,且質(zhì)變發(fā)生時(shí)其特征不容易被人們捕獲,因此,有必要在一定期限內(nèi)對數(shù)據(jù)進(jìn)行重新調(diào)查和錄入,及時(shí)用新信息替代已失效信息,從而保證相關(guān)人員在使用數(shù)據(jù)庫時(shí)得到真實(shí)有效的數(shù)據(jù)。
2.3類型復(fù)雜的特點(diǎn)
地質(zhì)倉庫數(shù)據(jù)由于包含聲音、圖像、原始信號以及其他各種類型的信息,只是用整型、實(shí)型、字符型等簡單的數(shù)據(jù)類型已無法對所有地質(zhì)資料數(shù)據(jù)進(jìn)行描述,個(gè)別情況下甚至需要設(shè)立專門的表示方法和手段,包括使用技術(shù)上的處理等方式。面對海量的數(shù)據(jù)再加上其種類繁多復(fù)雜,使得地質(zhì)數(shù)據(jù)倉庫的建設(shè)人員有必要采用跨學(xué)科跨行業(yè)的新技術(shù)手段來完成這一棘手的工作。唯有創(chuàng)新數(shù)據(jù)的管理方式,根據(jù)數(shù)據(jù)類型及使用特點(diǎn)有針對性的建立地質(zhì)數(shù)據(jù)倉庫,才能使其真正地發(fā)揮作用。
2.4集成性特點(diǎn)
地質(zhì)數(shù)據(jù)倉庫在結(jié)構(gòu)上采用的是集成的方式,與一般數(shù)據(jù)庫類似,該種方式可極大地提升數(shù)據(jù)的管理和存取效率,將分散的數(shù)據(jù)進(jìn)行集成管理,從而使工作更加系統(tǒng)和科學(xué)。同時(shí),這種方式還能將數(shù)據(jù)內(nèi)部的聯(lián)系顯露出來,方便研究人員對數(shù)據(jù)的控制和存取。總而言之,集成性特點(diǎn)大大簡化了地質(zhì)數(shù)據(jù)倉庫的結(jié)構(gòu),而且很好地解決了地質(zhì)資料數(shù)量眾多和種類繁雜的特點(diǎn),對數(shù)據(jù)庫作用的發(fā)揮具有很大意義。
2.5多源性特點(diǎn)
地質(zhì)數(shù)據(jù)倉庫中的數(shù)據(jù)來源十分廣泛,主要包括了工程地質(zhì)、水文地質(zhì)、地震地質(zhì)、地質(zhì)災(zāi)害、地質(zhì)環(huán)境以及地質(zhì)資源等眾多類別。數(shù)據(jù)庫的多源性給數(shù)據(jù)系統(tǒng)的建設(shè)和管理帶來很大挑戰(zhàn),又由于數(shù)據(jù)的離散性較大,造成了數(shù)據(jù)異構(gòu)的現(xiàn)象,形成了較多的信息“孤島”,為數(shù)據(jù)信息的管理者帶來不小麻煩,也對研究人員進(jìn)行信息提取和分發(fā)共享等工作帶來困擾。因此,有必要建立一定的行業(yè)標(biāo)準(zhǔn),對各種數(shù)據(jù)源進(jìn)行合理規(guī)范,使其成為標(biāo)準(zhǔn)、統(tǒng)一的數(shù)據(jù)源,從而使地質(zhì)數(shù)據(jù)倉庫更加方便的被使用和管理。
2.6多層次特點(diǎn)
一個(gè)結(jié)構(gòu)完整功能完善的地質(zhì)數(shù)據(jù)倉庫其框架必然至少包括以下幾個(gè)層次:1、存儲層。該層的作用主要是對海量的地質(zhì)資料數(shù)據(jù)進(jìn)行存儲,采用面向主題的方式進(jìn)行分類,而這一層次又可細(xì)分為三部分:元數(shù)據(jù)、公用庫和數(shù)據(jù)集市。數(shù)據(jù)集市是以某一內(nèi)容作為主題的部分?jǐn)?shù)據(jù)的集合,它是數(shù)據(jù)存儲的主體;公用庫由方法庫、模型庫和代碼庫等組成;元數(shù)據(jù)則是最基本的數(shù)據(jù)信息。2、分析層。通過對存儲層的數(shù)據(jù)進(jìn)行分析,從而使研究人員獲取所需的信息,在具體運(yùn)作時(shí)一般都會采用數(shù)據(jù)挖掘技術(shù)和多維分析工具作為分析手段。3、表達(dá)層。該層的作用是將分析層的結(jié)果轉(zhuǎn)化為研究人員能夠直接理解的類型并顯示出來。
3.1數(shù)據(jù)組織結(jié)構(gòu)
地質(zhì)數(shù)據(jù)倉庫的數(shù)據(jù)組織結(jié)構(gòu)與一般數(shù)據(jù)庫不同,主要體現(xiàn)在如下幾點(diǎn):1、數(shù)據(jù)的流向有差異。在一般的數(shù)據(jù)庫中,各層都能直接接受外界的數(shù)據(jù),而在地質(zhì)數(shù)據(jù)倉庫中,只有部分結(jié)構(gòu)能接受外界的數(shù)據(jù),并且其它結(jié)構(gòu)的數(shù)據(jù)也只能由這一部分得來,這就在一定程度上使地質(zhì)數(shù)據(jù)倉庫具有很大的局限性,且數(shù)據(jù)的更新變得復(fù)雜和繁瑣;2、度量參數(shù)的選擇不同。一般數(shù)據(jù)庫都是選擇時(shí)間作為相關(guān)數(shù)據(jù)的度量參數(shù),而在地質(zhì)數(shù)據(jù)倉庫中,需要用空間作為度量參數(shù)方能全面系統(tǒng)的對數(shù)據(jù)進(jìn)行管理和描述,這在一定程度上增加了數(shù)據(jù)倉庫建設(shè)的復(fù)雜程度,給相關(guān)人員帶來一定難度;3、可更新屬性有差異。地質(zhì)數(shù)據(jù)倉庫的數(shù)據(jù)是可以更新的,這也是實(shí)際情況的要求,因?yàn)橥庠诃h(huán)境處在不斷變化之中,而數(shù)據(jù)若沒有及時(shí)更新,會產(chǎn)生因失效導(dǎo)致的研究工作出現(xiàn)差錯(cuò)等問題。同時(shí),數(shù)據(jù)的更新還具有整體性,即對于基層數(shù)據(jù)的修改也會影響到上層數(shù)據(jù),最后全體數(shù)據(jù)都可能因此發(fā)生變動,這也是數(shù)據(jù)在改動時(shí)需要注意的地方。
3.2粒度與分割
一般數(shù)據(jù)庫與地質(zhì)數(shù)據(jù)倉庫在關(guān)于粒度的概念上并沒有多大差異,表示的都是對數(shù)據(jù)綜合程度的度量或采樣率的高低。而分割則是將數(shù)據(jù)進(jìn)行分散,通過與各自的物理單元相配合,提升數(shù)據(jù)的處理效率,而在地質(zhì)數(shù)據(jù)的物理組織上,則采用空間尺寸來作為分割標(biāo)準(zhǔn)。
地質(zhì)數(shù)據(jù)倉庫對于地質(zhì)行業(yè)的發(fā)展具有重大意義,建立和完善地質(zhì)數(shù)據(jù)倉庫系統(tǒng)不僅能使海量地質(zhì)資料信息得到更加有效的管理,方便研究人員的工作,還能促使人們發(fā)現(xiàn)數(shù)據(jù)之間的潛在聯(lián)系,從更加立體的角度來看待實(shí)際地質(zhì)情況。本文對地質(zhì)數(shù)據(jù)倉庫的特點(diǎn)進(jìn)行了仔細(xì)分析,并客觀詳細(xì)地說明了其內(nèi)部的數(shù)據(jù)組織形式,為相關(guān)研究人員提供了一定幫助。
參考文獻(xiàn):
[1]王珊.數(shù)據(jù)倉庫技術(shù)與聯(lián)系分析處理[J].科學(xué)出版社,2013.
[2]屠躍明.數(shù)字檔案信息融匯服務(wù)系統(tǒng)的研究與實(shí)踐[J].檔案學(xué)研究,2014,(4):65-70.
[3]張紅軍,李亞芬,周小林.大型數(shù)據(jù)庫應(yīng)用系統(tǒng)中基于角色的權(quán)限管理方案[J].現(xiàn)代計(jì)算機(jī),2014,(5).