黃鳳
伴隨著科研技術的不斷發展以及社會的不斷創新,網絡信息技術強化了社會信息交流的流暢性和拓展性。隨著信息的不斷增多,如何快速、準確的提取有使用價值的信息,成為 分析可視化數據挖掘技術。
【關鍵詞】可視化 數據挖掘 技術分析
傳統的數據挖掘技術在應用過程中,應用者是無法觀察到數據挖掘的過程,只能夠獲得結果,在數據分析與挖掘的過程中使用者并不能直觀的觀察過程,其往往會導致使用者更與單一性的分析數據挖掘結果,失去數據挖掘的意義。可視化數據挖掘技術結合了計算機與用戶的視覺感受,是一種能夠直觀觀察的數據挖掘方式,在數據挖掘過程為用戶提供直觀性的信息數據,便于用戶交互流量數據,從而極大程度提升數據挖掘的效率、準確性、有效性,獲得更有使用價值意義的數據結果。
1 可視化及數據挖掘的含義
所謂的可視化,也就是指人借助視覺觀察并在思維中形成客觀事物影像的過程,這是一種心智處理的過程。可視化能夠提升人們對事物的觀察準確性并形成一個完整的整體概念。可視化結果能夠便于人們理解和記憶,并且對于信息的表達方式、處理方式是其他方式無法替代的。可視化技術普遍是以人所習慣的圖形、圖像為工具融入到信息處理技術當中,主要是將信息化數據以更加直觀的方式讓人所接受和理解。通過仿真化、形象化、模擬化等全新技術方式重現出來。可視化不僅可以以客觀的現實展現數據內容,還可以為使用者提供富有規律、客觀、真實的數據信息。數據挖掘主要是指借助檢測和分析數據,獲得更多潛在的有使用價值的信息。數據挖掘的定義主要分為狹義與廣義。狹義的數據挖掘主要是按照已經處理過或分析過的數據,從當中提煉出有使用意義的信息數據,從廣義上分析,主要是在數據庫當中分析出富有應用價值的數據信息。可視化數據挖掘對于當前許多企業而言均有著顯著的應用意義,尤其是在大數據時代下,數據局逐漸成為現代化企業分析市場需求、掌握企業客戶群體的主要手段。
2 可視化數據挖掘的提出
由上述分析可以發現,可視化技術與數據挖掘技術本質上是兩個不同的領域,但是都與計算機技術有一定程度的關聯性。數據挖掘的過程需要可視化技術的支持,可視化分析本身也是數據挖掘的一個過程。其中,可視化主要是指將某一些無法看見的或抽象的事物通過能夠看見的圖像或圖形可視化出來;可視化主要是采用計算機創建相應的圖形,從而理解哪些大量、復雜、無需的數據信息。可視化數據挖掘主要有三個階段,數據準備、模型生成、知識使用以及流程可視化。
數據準備:數據的準備階段主要是借助可視化數據挖掘技術將數據預處理的過程展現出來,簡單而言,就是將復雜、大量的原始數據通過某種規律進行展現和規劃,這里所致的可視化技術主要是包括數據的轉換、丟失值得處理、數據的裁剪以及數據的采樣等;生成模型:生成模型這一過程中主要是將目標數據庫通過數據挖掘操作技術細化數據挖掘每一個細節、過程,并將其展現出來。其中主要包括模型的選擇、參數的設計、數據的訓練集、數據的挖掘細節以及結果的儲存等過程;數據使用。在數據使用這一階段中,可視化數據挖掘技術的操作目的主要是把數據挖掘的結果通過某種可視化方式展現出來,例如將結果通過樹形圖形展現出來,從而為數據使用者提供更加真實、可靠、完整的數據分析結果。普遍狀況下,數據挖掘的結果抓喲分為分類與關聯兩種,其都是以人類視覺能容易接受的方式展現;流程的可視化。數據挖掘的流程可視化最終目的是將數據挖掘的整個過程以某種可視化方式顯示出來,讓用戶看懂,這也是為知識分析師、企業管理者提供更多依據進行決策和分析。
3 可視化數據挖掘的主要技術分析
可視化數據挖掘的主要技術主要是以下四種:1、標準2D與3D技術。這一技術主要是用于統計應用,但是不是能應用于多維數據。主要是借助條形圖、柱形圖和餅圖等常用的標準2D、3D技術,這也是可視化的主要方式和結果;2、分層技術。分層技術的基本意義就是按照層次的特征,將多維數據空間劃分為多個子空間,并按照各個層之間的關聯性,將子空間以層次的結構形式重新進行組建,并以圖形的形式顯示。分層技術主要依據層次軸、雙曲線、錐形圖等時機方式進行描述;3、幾何變換技術。幾何變換技術主要是對數據集進行降維處理。其基本意思就是借助投影、映射將多維數據轉變為3D、2D的形式,準便成為人視覺所能夠理解的投影。幾何變換技術適用于多維數、低數據量的數據庫。其實施方式主要有平行坐標法與投影追蹤等;4、面向像素技術。面向像素技術主要是分析像素點在屏幕當中的分布狀況,其能對于一些數據量龐大的數據庫進行細致的分析,進而獲得數據的整體結構和分布狀況。因為面向像素技術分析的是像素點,所以其能夠按照分析目標的不同,選擇不同的排列方式,其應用方式主要是遞歸技術與數據管道技術。
例如,在信貸方面的應用中,信貸數據的挖掘和普通數據挖掘不相同,主要是統計和挖掘一些信用度較高的用戶。金融行業的信貸欺騙行為不斷增多,這也為可視化數據挖掘技術的應用提供了更多的空間,借助挖掘技術防止信貸欺騙的發生,從而提高信貸企業的經濟利益。借助可視化數據挖掘技術,應用異常檢測與人工神經網絡的方式檢測信貸申請的過程,并借助Clementine軟件對所獲得的數據庫進行統一性分析和記錄,對具備信貸欠款和拖欠的信貸人統計到一起,并在信用貸款的申請中計算其可能存在的信用欺騙度,首先,是多次申請信貸的記錄;其次,個人或企業的經濟狀況以及信貸類型是否符合企業的記錄。對于一些偏離長條的行為進行記錄并標記,借助可視化的數據挖掘過程,決策者能夠更加準確的掌握是否能夠放貸于該個人或企業。
4 總結
綜上所述,在大數據時代環境下,做好數據挖掘工作有著非常明顯的作用和意義,假設如果無法完成良好的數據挖掘技術工作,便無法展現大數據的優勢,導致缺乏針對性的數據信息,從而逐漸降低企業的競爭力。此外,伴隨著信息技術與計算機技術的不斷發展,數據挖掘技術必然會隨之創新,對此,就必須相關工作者及時掌握社會上全新的數據挖掘技術,并將其合理應用。
參考文獻
[1]耿學華,傅德勝.可視化數據挖掘技術研究[J].計算機應用與軟件,2006(02):85-87.
[2]段曉君,杜小勇,易東云.可視化數據挖掘技術及其應用[J].計算機應用,2000(01):54-56.
[3]張俊.可視化數據挖掘技術的研究與實現[J].重慶工商大學學報(自然科學版),2013(03):58-61+92.
作者單位
江蘇省泰興中等專業學校 江蘇省泰興市 225400