摘?要:在數字化時代里,信息變得更加多樣化、數據變得更加復雜化。為了在海量的信息和數據當中快速找到需要的內容,就需要專門的信息處理系統。而數據挖掘服務就是在這個背景下產生的,它可以對數據進行分析與處理,促進數據的開發應用。在云計算環境下,數據挖掘服務需要面對很多虛擬化的技術,做好各類運算。因此這對數據挖掘服務提出了更高的要求。
關鍵詞:信息化時代;云計算環境;數據挖掘;服務模式;技術分析
1?數據挖掘的基本概述
數據挖掘指的是通過分析大量的信息來發現數據發展的趨勢、了解這些數據未來的發展情況,并建立起自動化的過程。在信息化的時代,數據呈爆炸式增長,為了高效地從這些數據當中找到需要的信息,就需要使用數據挖掘服務模式。與此同時,只有將這些信息與數據進行整合才能更好地應用于各種系統服務當中。因此在現代化的網絡環境當中,數據挖掘是必不可少的。
在云計算的環境下,數據挖掘技術具有以下幾個特點。第一是數據挖掘技術在應用的過程當中可以自動將底層隱蔽掉,這使得我們在應用該技術的時候更加便利,不需要對計算進行分配、也不需要對計算任務進行調度和對數據進行人工劃分,去除了這些繁雜的工作可以使我們的應用效率更高。第二是云計算技術與數據挖掘服務模式相結合可以相得益彰,最大化地提高了系統對大數據的處理能力。第三,對于企業來說,數據挖掘服務模式可以代替一些機器來完成數據整合,因此可以降低購買機器的成本,提高企業經濟效益。最后是數據挖掘服務模式不僅可以為用戶提供需要的信息,同時還可以為用戶創造良好的系統服務和應用環境,使數據挖掘的操作變得簡單。
2?基于云計算環境下的數據挖掘服務
2.1?數據挖掘服務建模
在建立數據挖掘服務結構之后,使用這些結構建立服務組建模式也是十分有必要的。這需要對這些結構進行詳細分析,建立起結構之間的關聯性,并將其中的服務進行識別和描述。數據挖掘服務主要包括定義、綁定數據、構建組建這三個部分。定義服務的作用主要是在問題區域內搜集相關的服務信息,同時將服務的流程挖掘出來,然后對服務的功能和內容重新進行定義,這樣才能為用戶提供所需要的服務。與此同時,通過定義服務功能,在系統當中還可以將候選服務列舉出來,提高服務的精準度和服務的效率。綁定數據的服務包括功能和數據這兩部分構成,它主要是用來搜集行為過程當中所需要的信息與數據內容的,同時還可以對信息的調用過程做出規定。在這個過程當中得到相關聯的信息與服務,通過服務組件的構建來實現定義服務功能。構建組建的主要功能有兩個。第一個是使之前的定義服務更好地實現,第二個是將整個服務過程連接成為一個獨立的整體,并形成獨立的服務組件。
2.2?數據挖掘服務體系
數據挖掘服務體系是使數據挖掘發揮作用的重要保障,同時也是服務模式運行的載體。具體來說,該體系主要包括基礎設施層、虛擬化層、平臺層和應用層這四個層次?;A設施層的主要作用是為整個服務體系提供信息資源,并將這些資源通過終端接口傳送到互聯網當中去,實現信息的共享,這可以為系統虛擬化的計算提供重要保障。虛擬化層的主要作用是通過各種虛擬的工作來將云計算環境當中的各類信息資源進行整合,然后將它們分類為統一的服務資源,使他們能夠在平臺層被進一步開發與應用。平臺層是數據挖掘服務體系的重要層次,它可以為整個系統提供可供應用的信息資源。應用層主要是由應用接口層和終端層組成,前者的主要功能是處理用戶應用過程當中產生的問題,比如對用戶的身份進行驗證、對用戶的個人信息進行管理等。而后者的主要功能則是構建訪問途徑的接入方式,為用戶的訪問提供便利的服務,使用戶無論是在網站還是在應用程序還是在移動終端上都可以獲得服務。
3?基于云計算環境下的數據挖掘服務模式技術
在具體應用的過程當中,數據挖掘技術需要經過分析—設計-開發-維護-衰亡這一過程,通過對數據的清理、變化、挖掘與實施、評估、知識表示等步驟來完成對數據的處理。在這個過程當中,數據的搜集與存儲是最重要的數據挖掘內容。
3.1?數據搜集處理技術
數據挖掘服務模式在對數據進行搜集與處理的時候,首先需要對訪問數據進行分類,經過決策來判斷這些數據是來源于用戶訪問還是網站機器人。然后將數據進行篩選、轉換和整合,最終使信息通過可擴展標記語言的形式來進行儲存。目前已經出現了很多編程模型,但是它們的開發工具還有待完善,并沒有大規模地投入使用。在未來,隨著數據挖掘技術的不斷完善,數據的搜集與處理將與分形維數相結合,應用其他先進的技術,使數據挖掘能夠更好地為應用系統提供便利的服務。
3.2?數據存儲技術
與云計算相結合的數據挖掘服務模式所應用的存儲技術主要是分布式存儲,這種技術的特點是對同一個數據可以存儲為多個副本形式,這可以有效防控數據丟失的風險,提高存儲的可靠性。與此同時,在數據存儲的過程當中,還可以通過心跳檢測、錯誤隔離的措施來進一步保障存儲的安全性與穩定性。它的缺點是由于需要存儲多個數據副本,因此存儲的效率并不高。在應用的過程當中經常需要對數據進行遷移處理,這時候我們通常會使用特定的系統來完成。為了解決存儲效率不高的問題,通??梢詫ふ蚁鄳臄祿北緛淼种疲惯w移工作與其他工作同步進行,有效提高遷移的效率。
4?結語
總的來說,云計算環境下的數據挖掘技術還處于不斷發展的階段,挖掘服務模式在構建的過程當中也需要不斷完善。為了促進我國電子商務的進一步發展,加強對數據挖掘技術的研究是十分有必要的,這可以很好地應對用戶規模不斷擴大、用戶需要多樣化的發展趨勢,為用戶提供精準的挖掘服務、提高云計算技術的實用價值。為了實現這一目標,研究人員需要對數據挖掘服務模式進行完善,對數據挖掘技術進行不斷創新。
參考文獻:
[1]李忠,嚴莉.“云計算”環境下創新人才培養新模式及發展路徑研究——基于智慧教育的數據挖掘視角[J].信息通信,2016(09):258-259.
[2]邱昕,甘超,江雄心,涂海寧,顧嘉.基于云計算環境下Apriori算法的設備故障診斷技術研究[J].組合機床與自動化加工技術,2018(04):45-48.
國社科:大數據環境下中醫醫案數據規范與特色保護協同機制研究16BGL181
作者簡介:李珊珊(1982-),女,漢族,山東濟南人,本科,助教,研究方向:數據挖掘。