姜大昌,李豐伊,甘 敏,黃 潔
云南省科學(xué)技術(shù)情報(bào)研究院
數(shù)據(jù)庫(kù)與數(shù)據(jù)挖掘技術(shù)探析
姜大昌,李豐伊,甘 敏,黃 潔
云南省科學(xué)技術(shù)情報(bào)研究院
在現(xiàn)代信息收集及信息儲(chǔ)存過(guò)程中,數(shù)據(jù)庫(kù)以及數(shù)據(jù)挖掘技術(shù)屬于十分重要的內(nèi)容,在實(shí)際工作過(guò)程中發(fā)揮十分重要的作用,并且有著十分廣泛的應(yīng)用。在當(dāng)前數(shù)據(jù)存儲(chǔ)中,通過(guò)對(duì)數(shù)據(jù)挖掘技術(shù)進(jìn)行合理有效應(yīng)用,可對(duì)數(shù)據(jù)庫(kù)中所儲(chǔ)存數(shù)據(jù)進(jìn)行更好應(yīng)用,從而保證數(shù)據(jù)信息利用率能夠得以有效提升,使這些數(shù)據(jù)能夠發(fā)揮更好的作用。
數(shù)據(jù)庫(kù);數(shù)據(jù)挖掘技術(shù);應(yīng)用
數(shù)據(jù)庫(kù)是當(dāng)前儲(chǔ)存信息資源的一種主要系統(tǒng),可大量?jī)?chǔ)存相關(guān)信息資源,可為更好利用這些信息資源奠定理想基礎(chǔ)。而數(shù)據(jù)挖掘技術(shù)主要就是對(duì)數(shù)據(jù)進(jìn)行尋找、轉(zhuǎn)化及分析的一種技術(shù),能夠使一些比較雜亂的數(shù)據(jù)信息更加有序,可實(shí)現(xiàn)數(shù)據(jù)信息的更加有效利用。因此,在數(shù)據(jù)庫(kù)中有效運(yùn)用數(shù)據(jù)挖掘技術(shù)可使兩者實(shí)現(xiàn)有效結(jié)合,使數(shù)據(jù)信息應(yīng)用更加高效,提升其利用率及利用價(jià)值,保證數(shù)據(jù)信息資源作用能夠得以充分發(fā)揮。
1.1 Web數(shù)據(jù)庫(kù)技術(shù)
在當(dāng)前網(wǎng)絡(luò)信息不斷建立及不斷發(fā)展過(guò)程中,Web技術(shù)具有十分廣泛的應(yīng)用,通過(guò)對(duì)該技術(shù)進(jìn)行應(yīng)用可與數(shù)據(jù)庫(kù)內(nèi)容實(shí)現(xiàn)有效結(jié)合,從而可使動(dòng)態(tài)數(shù)據(jù)庫(kù)對(duì)實(shí)現(xiàn),并且Web數(shù)據(jù)庫(kù)系統(tǒng)當(dāng)前已經(jīng)成為特定性比較強(qiáng)的一種技術(shù)。在Web數(shù)據(jù)系統(tǒng)實(shí)際應(yīng)用過(guò)程中,其能夠與數(shù)據(jù)庫(kù)之間實(shí)現(xiàn)記性連接,可使動(dòng)態(tài)頁(yè)面得以實(shí)現(xiàn),可使用戶在不同領(lǐng)域內(nèi)對(duì)有關(guān)實(shí)際內(nèi)容進(jìn)行操作,并且也能夠使遠(yuǎn)程系統(tǒng)監(jiān)控得以實(shí)現(xiàn)。Web數(shù)據(jù)庫(kù)系統(tǒng)實(shí)現(xiàn)及應(yīng)用可使數(shù)據(jù)存儲(chǔ)更加靈活,并且能夠使數(shù)據(jù)存儲(chǔ)更加安全,同時(shí)也能夠使數(shù)據(jù)應(yīng)用更加方便。
1.2 數(shù)據(jù)庫(kù)挖掘
對(duì)于數(shù)據(jù)挖掘而言,其也被稱(chēng)為數(shù)據(jù)庫(kù)中知識(shí)發(fā)現(xiàn),當(dāng)前比較公認(rèn)的定義即為在大量不完整,比較雜亂的一些隨機(jī)數(shù)據(jù)集合中,通過(guò)相關(guān)技術(shù)進(jìn)行提取,從而獲得一些隱含的,并且具有較大利用價(jià)值的一些相關(guān)信息,對(duì)于所提取信息可通過(guò)規(guī)則、概念以及規(guī)律與模式等相關(guān)形式進(jìn)行表示。對(duì)于數(shù)據(jù)挖掘而言,其屬于決策支持的一種過(guò)程,對(duì)各組織原有數(shù)據(jù)進(jìn)行分析,并且對(duì)其實(shí)行歸納推理,在此基礎(chǔ)上對(duì)數(shù)據(jù)庫(kù)中潛在數(shù)據(jù)模式進(jìn)行挖掘,從而可為管理人員更好進(jìn)行決策提供一定理論依據(jù)及知識(shí)[1-2]。
2.1 分類(lèi)法及預(yù)測(cè)法
在數(shù)據(jù)挖掘技術(shù)中,十分重要的一個(gè)環(huán)節(jié)就是對(duì)于無(wú)排列規(guī)律標(biāo)號(hào)實(shí)行分類(lèi),這一點(diǎn)也屬于基礎(chǔ)環(huán)節(jié)。利用這種分類(lèi)方式,才能夠正確地充分顯示出依據(jù)某些特定需求所挖掘出相關(guān)數(shù)據(jù)特點(diǎn),在此基礎(chǔ)上依據(jù)各數(shù)據(jù)集所具備的不同特點(diǎn)對(duì)其進(jìn)行劃分,使其在相同類(lèi)別或者相似類(lèi)別中。當(dāng)前比較常見(jiàn)的就是決策樹(shù)、貝葉斯以及遺傳算法等。而對(duì)于預(yù)測(cè)法而言,其所指的就是在分析連續(xù)值函數(shù)模型基礎(chǔ)上,預(yù)測(cè)今后可能會(huì)出現(xiàn)的一些發(fā)展規(guī)律,并且對(duì)于這一過(guò)程而言,其相關(guān)數(shù)據(jù)集分類(lèi)情況可提前預(yù)知。就當(dāng)前實(shí)際情況而言,在數(shù)據(jù)預(yù)測(cè)方面所應(yīng)用方法種類(lèi)也比較多,主要包括回歸分析以及實(shí)踐序列等相關(guān)方法。
2.2 聚類(lèi)分析法
在數(shù)據(jù)挖掘過(guò)程中,數(shù)據(jù)分析也是一個(gè)十分重要的環(huán)節(jié),選擇科學(xué)有效數(shù)據(jù)分析方法屬于數(shù)據(jù)挖掘能夠得以較好開(kāi)展的基本保障。對(duì)于聚類(lèi)分析法而言,其在數(shù)據(jù)挖掘技術(shù)中屬于進(jìn)行數(shù)據(jù)分析的一種最常見(jiàn)方法,該方法所指的就是對(duì)于已經(jīng)整合成為整體的物理對(duì)象及抽象對(duì)象,使其實(shí)行分類(lèi),并且對(duì)于相同或者比較相似的一些對(duì)象應(yīng)當(dāng)細(xì)化、深入分析,從而對(duì)相關(guān)數(shù)據(jù)能夠?qū)崿F(xiàn)有效分類(lèi)。在數(shù)據(jù)挖掘技術(shù)中,對(duì)于相關(guān)數(shù)據(jù)以聚類(lèi)分析法實(shí)行分類(lèi)及分析,其主要就是對(duì)事物間規(guī)律性進(jìn)行充分認(rèn)識(shí),從而可使實(shí)現(xiàn)智能化深入學(xué)習(xí)不同領(lǐng)域內(nèi)相關(guān)數(shù)據(jù)。對(duì)于聚類(lèi)分析法而言,其主要可分為兩種不同方式,即模糊聚類(lèi)與硬聚類(lèi),其中對(duì)于硬聚類(lèi)而言,其所指的就是對(duì)數(shù)據(jù)對(duì)象實(shí)行精細(xì)劃分,使其能夠處于與其最相近類(lèi)別中;對(duì)于模糊聚類(lèi)而言,其所指的就是設(shè)置一定取值范圍,在此基礎(chǔ)上對(duì)數(shù)據(jù)對(duì)象實(shí)行劃分,所以可能會(huì)出現(xiàn)的現(xiàn)象就是一個(gè)對(duì)象具有多種不同類(lèi)別。
2.3 關(guān)聯(lián)分析法
對(duì)于關(guān)聯(lián)分析法而言,其所利用的主要就是蝴蝶效應(yīng),該方法就是對(duì)事物之間關(guān)聯(lián)性及相互依賴(lài)性進(jìn)行充分把握,在此基礎(chǔ)上有效預(yù)測(cè)其中規(guī)律。對(duì)于關(guān)聯(lián)分析法而言,在分析由數(shù)據(jù)挖掘技術(shù)而得到數(shù)據(jù)方面具有十分理想的效果,可對(duì)數(shù)據(jù)進(jìn)行深入分析,對(duì)數(shù)據(jù)特點(diǎn)可充分把握,從而可為更高進(jìn)行決策提供較好理論支持及依據(jù)[2-3]。
數(shù)據(jù)挖掘技術(shù)作為一種現(xiàn)代化數(shù)據(jù)獲取及分析處理技術(shù),在社會(huì)上很多行業(yè)及領(lǐng)域內(nèi)均具有十分廣泛的應(yīng)用。其一,數(shù)據(jù)挖掘技術(shù)在現(xiàn)代科研領(lǐng)域內(nèi)具有十分廣泛的應(yīng)用,通過(guò)對(duì)該技術(shù)進(jìn)行應(yīng)用,可使大量實(shí)驗(yàn)數(shù)據(jù)分析對(duì)較好實(shí)現(xiàn),可使數(shù)據(jù)分析實(shí)現(xiàn)智能化及自動(dòng)化;其二,數(shù)據(jù)挖掘技術(shù)在市場(chǎng)營(yíng)銷(xiāo)中具有十分廣泛的應(yīng)用,在市場(chǎng)營(yíng)造中通過(guò)對(duì)該技術(shù)進(jìn)行應(yīng)用,實(shí)現(xiàn)準(zhǔn)確分析市場(chǎng)情況,在此基礎(chǔ)上可較好把握市場(chǎng)動(dòng)態(tài)及消費(fèi)者需求,從而也就能夠依據(jù)市場(chǎng)規(guī)律使決策人員制定更好決策,在預(yù)測(cè)市場(chǎng)發(fā)展方面具有不可替代的作用;其三,數(shù)據(jù)挖掘技術(shù)在互聯(lián)網(wǎng)中具有十分廣泛的應(yīng)用,對(duì)于互聯(lián)網(wǎng)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用而言,其主要體現(xiàn)在兩個(gè)方面內(nèi)容:利用數(shù)據(jù)挖掘技術(shù)可研制更優(yōu)秀搜索引擎;在當(dāng)前搜索引擎系統(tǒng)的基礎(chǔ)上,可進(jìn)一步開(kāi)發(fā)更好層次系統(tǒng)及引擎[3]。
隨著現(xiàn)代社會(huì)信息時(shí)代快速發(fā)展,越來(lái)越多的現(xiàn)代化技術(shù)得以出現(xiàn),并且得到十分廣泛的應(yīng)用,其中數(shù)據(jù)庫(kù)及數(shù)據(jù)挖掘技術(shù)就是比較常見(jiàn)的兩種。通過(guò)對(duì)數(shù)據(jù)庫(kù)及數(shù)據(jù)庫(kù)挖掘技術(shù)進(jìn)行應(yīng)用,可實(shí)現(xiàn)數(shù)據(jù)信息有效分析及處理,從而可更好實(shí)現(xiàn)信息利用。因此,相關(guān)工作人員應(yīng)當(dāng)對(duì)其充分了解及掌握,以便更好對(duì)其進(jìn)行應(yīng)用。
[1]梁琰.基于Web數(shù)據(jù)庫(kù)的數(shù)據(jù)挖掘技術(shù)及應(yīng)用初探[J].科技展望,2015(32).
[2]李明江,唐穎,周力軍.數(shù)據(jù)挖掘技術(shù)及應(yīng)用[J].中國(guó)新通信, 2012(22).
[3]唐明燈.基于數(shù)據(jù)庫(kù)技術(shù)的數(shù)據(jù)挖掘分析與研究[J].信息與電腦(理論版),2010(2).