摘 要:電子政務(wù)工程因在推動(dòng)政府轉(zhuǎn)變傳統(tǒng)管理方式、提高政府工作效率、推動(dòng)政府公開透明、規(guī)范政府執(zhí)政行為等方面起到積極作用,得到了世界各國(guó)政府的普遍關(guān)注。得益于計(jì)算機(jī)技術(shù)以及網(wǎng)絡(luò)通信技術(shù)的飛速發(fā)展,電子政務(wù)技術(shù)也隨之不斷成熟,應(yīng)用日趨廣泛,在各國(guó)政府及相關(guān)職能部門的業(yè)務(wù)系統(tǒng)中日益積累了大量數(shù)據(jù)。由于傳統(tǒng)的數(shù)據(jù)處理手段對(duì)數(shù)據(jù)量大的業(yè)務(wù)系統(tǒng)做深層次數(shù)據(jù)處理效果不理想,對(duì)數(shù)據(jù)的潛在有用信息不能更好地識(shí)別和利用,日漸滿足不了不斷深化的電子政務(wù)應(yīng)用的需求。數(shù)據(jù)挖掘技術(shù)作為近十年來(lái)不斷發(fā)展成熟的數(shù)據(jù)處理技術(shù),日益在政府部門的日常工作中得到廣泛的運(yùn)用。鑒于上述方面,研究數(shù)據(jù)挖掘技術(shù)在電子政務(wù)領(lǐng)域中的應(yīng)用就顯得尤為重要。
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);電子政務(wù);應(yīng)用研究
中圖分類號(hào):TP311.13 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-7712 (2014) 22-0000-02
由于電子政務(wù)能夠很大程度上滿足政府以及相關(guān)職能部門的高效運(yùn)轉(zhuǎn)要求,同時(shí)能夠在政府服務(wù)公眾方面起到很好的輔助和推動(dòng)作用,電子政務(wù)工程在世界范圍內(nèi)得到了廣泛的應(yīng)用和不斷的深化。在國(guó)內(nèi)多年的電子政務(wù)實(shí)踐中不難看出,電子政務(wù)無(wú)論是在頂層設(shè)計(jì)還是具體應(yīng)用系統(tǒng)建設(shè)都頗有成效,政府各級(jí)各部門結(jié)合自身職能和業(yè)務(wù)積極推進(jìn)電子政務(wù)建設(shè),很大程度上推動(dòng)了政府更加公開透明,群眾網(wǎng)上辦事更加便捷,部門之間的數(shù)據(jù)共享也取得長(zhǎng)足進(jìn)展,在這個(gè)過程中建立和積累了大量的數(shù)據(jù)資源,并且數(shù)據(jù)量還在逐年呈指數(shù)級(jí)不斷增長(zhǎng)。而傳統(tǒng)的數(shù)據(jù)處理方式在對(duì)數(shù)據(jù)進(jìn)行深層次挖掘處理、對(duì)數(shù)據(jù)的潛在有用信息進(jìn)行識(shí)別和利用上效果不夠理想,只能對(duì)數(shù)據(jù)進(jìn)行采集、統(tǒng)計(jì)、整理和簡(jiǎn)單分析,并未涉及對(duì)龐大的數(shù)據(jù)資源進(jìn)行深入挖掘,進(jìn)而發(fā)現(xiàn)深層次的知識(shí)和潛在的信息,這與電子政務(wù)不斷深化的應(yīng)用需求的矛盾逐漸突顯。因此,研究數(shù)據(jù)挖掘技術(shù)在電子政務(wù)中的應(yīng)用具有重要意義。
一、數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘技術(shù)又可以稱作數(shù)據(jù)采掘技術(shù)、數(shù)據(jù)開采技術(shù),即指在海量的數(shù)據(jù)庫(kù)中進(jìn)行數(shù)據(jù)提取,通常提取的內(nèi)容包括人們感興趣的知識(shí),然而這些被人們感興趣的知識(shí)多為隱含性的、潛在性的、事先未知的一些有用信息。這一海量數(shù)據(jù)庫(kù)中的原始數(shù)據(jù)既可以是結(jié)構(gòu)化的,也可以是在網(wǎng)絡(luò)上分布著的異構(gòu)數(shù)據(jù),結(jié)構(gòu)化的類似文本、圖像數(shù)據(jù)或者圖形等,從中挖掘數(shù)據(jù)、挖掘知識(shí)的方法既可以是數(shù)學(xué)式的,又可以是非數(shù)學(xué)的;既可以是演繹的,又可以是歸納的等多種多樣,形式不拘泥。整體來(lái)說(shuō),數(shù)據(jù)挖掘是一種廣義的交叉學(xué)科,集結(jié)了各個(gè)領(lǐng)域的研究者,其中最為主要的即數(shù)據(jù)庫(kù)、數(shù)理統(tǒng)計(jì)以及人工智能等方面的專家。
從另一方面來(lái)講,數(shù)據(jù)挖掘技術(shù)整體即一個(gè)挖掘的過程,它是一種新型的信息處理技術(shù),挖掘技術(shù)的基礎(chǔ)是人工智能,挖掘方式是通過分析處理數(shù)據(jù),從而將數(shù)據(jù)中所蘊(yùn)含的有用信息發(fā)現(xiàn)并提取出來(lái),將數(shù)據(jù)之間的內(nèi)在聯(lián)系、模式以及規(guī)則等挖掘出來(lái),從而對(duì)領(lǐng)導(dǎo)的決策起到輔助作用。因此毋庸置疑,在電子政務(wù)中應(yīng)用數(shù)據(jù)挖掘技術(shù)對(duì)其來(lái)說(shuō)是一種非常有利的技術(shù)支持,對(duì)電子政務(wù)的廣泛普及以及深度發(fā)展來(lái)說(shuō)有極大的促進(jìn)作用,從而最終推動(dòng)電子政務(wù)的應(yīng)用深入發(fā)展。
二、數(shù)據(jù)挖掘技術(shù)在電子政務(wù)中的具體應(yīng)用
(一)政府電子貿(mào)易
電子政務(wù)中數(shù)據(jù)挖掘技術(shù)的具體應(yīng)用之一是政府電子貿(mào)易,對(duì)于用戶的訪問模式以及相關(guān)行為方式進(jìn)行挖掘,挖掘的“地點(diǎn)”是服務(wù)器、瀏覽器端等的日志記錄數(shù)據(jù),其中隱藏有海量的模式信息,這時(shí)應(yīng)用Web日志挖掘就可以對(duì)電子政務(wù)中政府電子貿(mào)易起到相當(dāng)程度上的輔助作用,其能夠自動(dòng)的發(fā)現(xiàn)系統(tǒng)中的相關(guān)訪問模式以及用戶的行為模式等,從中對(duì)其進(jìn)行具體的預(yù)測(cè)分析。在政府電子貿(mào)易這一方面的具體應(yīng)用,譬如說(shuō),通過數(shù)據(jù)挖掘技術(shù)在對(duì)用戶的一些信息資源,類似資源瀏覽所花費(fèi)的時(shí)間這一數(shù)據(jù)進(jìn)行挖掘,那么最終的數(shù)據(jù)顯示加上對(duì)于數(shù)據(jù)的分析預(yù)測(cè),就可以非常明確地判別出用戶對(duì)于哪一部分、那些信息資源更感興趣,繼而就可以做出更為個(gè)性化的服務(wù)。現(xiàn)如今,數(shù)據(jù)挖掘技術(shù)在政府電子貿(mào)易中得到了非常有效的應(yīng)用。
(二)離群孤立異常點(diǎn)挖掘
離群孤立異常點(diǎn)即在數(shù)據(jù)源中與其他數(shù)據(jù)有非常明顯的偏離,這些點(diǎn)與其他數(shù)據(jù)對(duì)象完全不同,或者說(shuō)是對(duì)于一般的模式以及行為表現(xiàn)出了很大的反差。然而,就是這些離群孤立異常點(diǎn)常常可能會(huì)含有一般數(shù)據(jù)不涉及的相對(duì)有價(jià)值的信息,一旦經(jīng)過分析,就能得到一些真實(shí)甚至是出乎意料的信息。對(duì)于離群孤立異常點(diǎn)的挖掘通常包括數(shù)據(jù)挖掘技術(shù)的兩個(gè)步驟,即檢測(cè)和分析,檢測(cè)就可以得知并非所有的離群孤立異常點(diǎn)都是錯(cuò)誤的。譬如說(shuō),在石獅市經(jīng)濟(jì)管理部門對(duì)于石獅服裝企業(yè)進(jìn)行調(diào)查和數(shù)據(jù)采集,如果所調(diào)查的內(nèi)容中只有幾個(gè)生產(chǎn)商出現(xiàn)了產(chǎn)量大幅降低的現(xiàn)象,那這幾個(gè)生產(chǎn)商的相關(guān)數(shù)據(jù)就可以作為離群孤立異常點(diǎn),數(shù)據(jù)挖掘技術(shù)此時(shí)派上用場(chǎng),通過對(duì)其的步步分析,自然就能找到產(chǎn)量降低的具體原因,那么生產(chǎn)商的上報(bào)數(shù)據(jù)是否屬實(shí)自然也就一目了然。
(三)網(wǎng)站設(shè)計(jì)
在組織政府網(wǎng)站信息方面,為了其結(jié)果更為有效、更為有利,能夠便捷的通過網(wǎng)站既可以進(jìn)行網(wǎng)站內(nèi)容的挖掘,類似于文本內(nèi)容的挖掘操作等,這時(shí)可以采用聚類技術(shù),即通過對(duì)網(wǎng)站的相關(guān)文本內(nèi)容作出一定的自動(dòng)化分,使其呈現(xiàn)為類別屬性相異的幾個(gè)類別,繼而就可以將網(wǎng)站信息的層次性組織實(shí)現(xiàn)出來(lái),同時(shí)進(jìn)行文本內(nèi)容的分類瀏覽或者做出檢索操作時(shí)就變得特別方便。另外,通過對(duì)于網(wǎng)絡(luò)數(shù)據(jù)挖掘技術(shù)的應(yīng)用,其序列模式中就可以發(fā)現(xiàn),在時(shí)間有序的一系列事務(wù)中,可以特別方便的集中式的找到“一些項(xiàng)跟隨另一個(gè)項(xiàng)”般的相關(guān)內(nèi)部事務(wù)模式,這就顯得在在服務(wù)器方進(jìn)行針對(duì)性頁(yè)面的挖掘和選取變得特別便捷,對(duì)于訪問者某些特定的需求就有了最大程度上的滿足。除上述之外,通過對(duì)于瀏覽者訪問記錄的相關(guān)信息挖掘,就可以在用戶自動(dòng)搜索其信息之前提供出由服務(wù)器推測(cè)出的相關(guān)內(nèi)容和檔案,這就有利于網(wǎng)站信息的推送服務(wù),和個(gè)人相關(guān)信息的定制服務(wù),對(duì)于網(wǎng)站設(shè)計(jì)而言意義重大。
(四)聚類分析
將對(duì)象的集合進(jìn)行分組,使其成為是由類似的對(duì)象組成的多個(gè)不同類的過程就是聚類分析,數(shù)據(jù)挖掘技術(shù)在這一方面的應(yīng)用不同于分類分析,聚類分析并沒有給出劃分類的標(biāo)準(zhǔn),它只是以信息相似度為分類依據(jù),從而進(jìn)行信息聚集的一個(gè)方法,因此可以說(shuō),聚類分析中所輸入的數(shù)據(jù)集合是一組未經(jīng)標(biāo)記的對(duì)象,最終目的是呈現(xiàn)在同一類中的個(gè)體之間有盡可能小的差別,而不同類之間的個(gè)體其距離差別要盡可能大。在電子政務(wù)中,采用數(shù)據(jù)挖掘技術(shù)中的聚類分析對(duì)數(shù)據(jù)進(jìn)行分割,一步步的縮小數(shù)據(jù)庫(kù),從而將采集到所有相關(guān)指標(biāo)以口徑權(quán)限為依據(jù)進(jìn)行自動(dòng)的聚類,從而能夠更明顯的看出每一指標(biāo)的大致特點(diǎn)與趨勢(shì),為政府部門更便捷的掌握大體的經(jīng)濟(jì)發(fā)展情況做出輔助參考。
(五)為重大政策提供決策支持
基于數(shù)據(jù)挖掘技術(shù)自身屬性,其最主要的特點(diǎn)就是能夠?qū)φ?wù)數(shù)據(jù)庫(kù)中存儲(chǔ)的大量業(yè)務(wù)之類的數(shù)據(jù)做出抽取、分析、轉(zhuǎn)換或者各式各樣模型化的處理,從而從中提取一些關(guān)鍵性的內(nèi)容,以輔助商業(yè)做出重大決策,其作為政府商業(yè)重大決策的關(guān)鍵依據(jù)當(dāng)仁不讓,為重大決策的出臺(tái)和實(shí)施提供了強(qiáng)有力的決策支持。數(shù)據(jù)挖掘技術(shù)在電子政務(wù)中進(jìn)行相關(guān)內(nèi)容的挖掘,并提供出最終設(shè)想是數(shù)據(jù)挖掘技術(shù)最為基本的功能之一。譬如,通過對(duì)于政府網(wǎng)站以及政府公眾網(wǎng)站等的信息進(jìn)行大量搜集,之后應(yīng)用數(shù)據(jù)挖掘技術(shù)進(jìn)行有用信息的挖掘,繼而就可以得到那些能夠?yàn)檎ぷ髌鸬教岣咦饔玫挠幸嬷R(shí),相關(guān)政府部門工作人員從中獲取到科學(xué)實(shí)用的輔助決策支持;再譬如,在12345信箱中,各級(jí)地方政府就可以直接獲取到市民對(duì)于政府工作的意見和看法,繼而就可以據(jù)其做出相關(guān)工作計(jì)劃和決策。
(六)處理電子政務(wù)中龐大的信息量
在政務(wù)系統(tǒng)中,之所以要廣泛的應(yīng)用數(shù)據(jù)挖掘技術(shù),原因之一即其可以處理電子政務(wù)中龐大的信息資源。在電子政務(wù)業(yè)務(wù)系統(tǒng)中,所有的面向應(yīng)用的數(shù)據(jù)經(jīng)過數(shù)據(jù)挖掘技術(shù)的應(yīng)用可以得到重新的、以面向分析的方式進(jìn)行一次整體的組織,同時(shí)還是依照的相關(guān)數(shù)據(jù)倉(cāng)庫(kù)的主題,從而使得各種各樣形式的數(shù)據(jù)源中的信息,通過一步步的抽取和轉(zhuǎn)換,逐漸將業(yè)務(wù)數(shù)據(jù)與分析數(shù)據(jù)進(jìn)行漸小差距的靠攏,這種方式在電子政務(wù)中起到了相當(dāng)大的輔助作用,將其中海量的、龐大的信息量做出了十分明確合理的規(guī)劃,從更深層次來(lái)說(shuō),數(shù)據(jù)挖掘技術(shù)之所以有必要在電子政務(wù)中廣泛應(yīng)用,是因?yàn)樗谧畲蟪潭壬媳苊饬撕A繑?shù)據(jù)信息的組合爆炸,技術(shù)的實(shí)施結(jié)合抽取的方式,使得電子政務(wù)中龐大的信息量得到了更高效率的挖掘,同時(shí)其還可以在數(shù)據(jù)轉(zhuǎn)移的整個(gè)過程中,應(yīng)用專門的元數(shù)據(jù)對(duì)其進(jìn)行實(shí)時(shí)控制。
三、結(jié)束語(yǔ)
總而言之,數(shù)據(jù)挖掘技術(shù)作為一種新型的技術(shù)和科學(xué),其誕生到現(xiàn)在短短十幾年里,廣泛受到了各行各業(yè)相關(guān)研究人員的研究興趣。當(dāng)前而言,它堪稱近幾年對(duì)于我們?nèi)祟惿从绊懥ψ畲蟮腎T技術(shù)之一。只是現(xiàn)階段而言,它的發(fā)展畢竟仍處于幼年期,在很多方面所取得的成功也只能定位為初步階段,想要使得數(shù)據(jù)挖掘技術(shù)能夠在電子政務(wù)中得到充分并且廣泛的應(yīng)用,就必須從多方面著手,敢于應(yīng)對(duì)、面對(duì)大量的挑戰(zhàn)課題,給予其足夠的重視,從而最終提供出最為合理、可靠、科學(xué)、準(zhǔn)確的服務(wù)。
參考文獻(xiàn):
[1]劉同明.數(shù)據(jù)挖掘技術(shù)及其應(yīng)用[M].北京:國(guó)防工業(yè)出版社,2001(02).
[2]李云輝,柳炳祥,章義來(lái).基于數(shù)據(jù)挖掘的電子政務(wù)數(shù)據(jù)分析系統(tǒng)[J].福建電腦,2013(11):34-36.
[3]陳海金,熊海鷗.數(shù)據(jù)挖掘技術(shù)在電子政務(wù)中的應(yīng)用初探[J].大眾科技,2012(10):45-47.
[作者簡(jiǎn)介]謝維烽(1983-),男,福建石獅人,在讀碩士,研究方向:信息化工程。