摘 要:隨著互聯網時代的不斷深入,數據變得越來越多,針對這些數據如何進行有效的處理和管理,進行深層次的分析是一個重要的問題,由此而來,數據挖掘技術伴隨著互聯網就不斷的產生和應用。數據挖掘技術目前在我國應用的范圍也十分廣泛,在各個領域都有所涉及,對整個國家和社會經濟提供了很多的幫助。而且數據挖掘技術和統計學之間有著密切的關系,本文主要針對數據挖掘技術和統計學之間的關系做出討論。
關鍵詞:數據挖掘;統計學;關系
引言 ?科學技術在不斷的深入和發展,在實際發展的過程中能夠利用數據庫存儲技術來對數據進行有效的管理,同時,還能夠利用機器學習的方法對數據進行有效的分析,這樣能夠挖掘數據背后存在的邏輯關系,這樣的思想被應用的越來越廣泛,也在我們社會發展過程中受到了廣泛的關注,本文主要針對數據挖掘技術進行有效的討論,希望能夠促進數據挖掘統計的進步。
1 簡述數據挖掘技術
數據挖掘技術是伴隨著互聯網不斷發展而進行有效深入的一種技術。數據挖掘技術是從大量的,不完整的數據中提取對人們有效的信息。針對人們不知道的信息但是對人有效的信息進行有效的管理,而且數據挖掘技術是一門交叉的學科,在實際應用的過程中匯聚了數據庫和人工智能以及統計學等等不同的學科領域,尤其是在最近幾年來,伴隨著社會經濟的不斷發展,互聯網的不斷拓展,數據挖掘技術被應用的也越來越廣泛,在實際發展和利用的過程中,通過在海量的數據中進行有效的挖掘和建模,發現數據之間存在的關系,通過得到的結果,能夠有效地利用得到的數據結果進行決策和測試。數據挖掘技術強調對大量觀測到的數據進行有效的處理,而且在發展的過程中涉及到的科目和知識有很多,也算是一種邊緣學科,作為一門新興的數據技術,數據挖掘技術在發展的過程中也存在很多的問題,由于目前發展的程度并不是很高,在發展的過程中也經常會出現問題,在未來發展過程中也需要針對存在的問題進行有效的解決,才能夠更好地促進數據挖掘技術的進步。
2 數據挖掘技術的實現
2.1 篩選數據
在實際發展的過程中,會產生大量的數據。數據挖掘技術,需要針對存在的數據進行有效的篩選和抽取,由于數據庫是一個獨立的數據環境,需要在數據庫發展過程中從中抽取和聯機事務處理系統,外部數據源以及有用的數據最終才能夠導入到數據庫中,在數據庫抽取的過程中,要涉及復制、增量、轉換、調度、監控等等幾個方面的處理,每一個方面和細節都會對整個數據的挖掘有重要的影響。
2.2對數據進行存儲和管理
不同的數據具有不同的屬性,要根據數據的相關屬性,對這些數據進行有效的存儲和管理,數據的屬性和方式也決定了外部數據的表現形式,在數據倉庫的組織管理方式過程中,應該選擇有效的數據進行存儲和管理,隨著時間的不斷推移和增加,在管理倉庫數據過程中會遇到很多的問題,如何從大量的數據中選擇有效的數據進行優化和查詢,是整個數據挖掘技術過程中重要的一部分。
3 統計學的含義及作用
在對信息處理的過程中經常會用到統計學。統計學技術是一門綜合性比較強的學科,在使用統計學的過程中涉及到的方面也有很多,從原材料以及施工設備、生產包裝、出售等多個環節都會應用到統計學。統計學在發展的過程中也得到了不斷深的擴展,為企業的決策提供了很大的參考價值。不斷的促進企業的發展,在統計學實際發展的過程中有很多的作用,這些作用也會在一定程度上促進社會經濟的發展。比較明顯的作用就是了解企業的經營狀況,在企業日常生產過程中,每天都會產生的資料和記錄都會被收集,在企業發展的過程中就會應用到統計學這個理念,在對信息進行有效的處理和收集。領導者在處理信息的過程中,需要對統計部門資料進行有效的查閱,這樣一來,能夠對企業的日常經營狀況,更好的準確的了解,不斷的了解企業的發展動態資產負債情況等等,這些也有利于整個企業的發展,除此之外,想要企業擴大生產經營規模,就會采取不同的措施來尋找不同的招商伙伴,企業在發展的過程中合理的利用統計知識,就能夠針對各項指標進行合理的預判和評估。根據得到的指標以及結果對實際的情況進行如實地反饋,這也包含整個資產人員的調配,想要保障企業順利平穩的發展,需要決策者結合自身的不斷能力,不斷擴大規模企業的規模,不斷提高整個企業的投資效率。在企業生產的過程中,還能夠有效地利用統計學知識對市場的行情進行一定的評估和把握,企業在面臨決策的過程中,需要根據市場的行情以及實際情況制定不同的施工策略,如果決策沒有按照實際的情況進行制定,最終會影響整個企業的施工效果,在利用統計學過程中能夠有效地對市場部門的基本情況進行有效的處理,在參考的過程中還能夠掌握信息的安全性可靠性,保障整個施工以及工程計劃的順利進行。
4 數據挖掘和統計學的結合
在對數據不斷進行分析和預測的過程中,產生了數據挖掘技術,數據挖掘不是為了代替傳統的統計分析技術,而是為了得到更好的延展和拓展。大部分的統計分析技術都是在完善的數學理論以及高超的技巧下運用生成的。最終的預測結果也能夠滿足人們的日常需求,針對知識者的要求比較高,計算機不斷發展的時候,數據挖掘技術也獲得了更深入的發展,不斷為企業的進步發展提供強大的動力。這些方法被決策者合理的使用之后,就會使得企業的生產不斷擴大,達到預期的效果,數據挖掘和統計學有著密切的聯系,在發展的過程中也獲得了有效的提升,數據挖掘工具能夠通過可選和自身提供的統計分析功能,不斷對數據進行有效的分析和處理,在對數據分析和處理的過程中,也需要借助統計學這個科目和實際中的能力進行對數據的處理。不斷找出數據挖掘的題目,找出數據挖掘的目標,確定數據挖掘之間所涉及到的關系和變量,對數據挖掘進行抽樣調查等等,這些工作整個對數據的產生有都有很大的影響。統計分析和數據挖掘兩者是相互促進共同依賴的作用,二者缺一不可,都會對整個數據進行有效的處理,不斷促進企業的進步。
結語
伴隨著信息時代的不斷增強和發展,統計學和數據挖掘技術在企業生產的過程中被應用的越來越廣泛。在未來發展的過程中,我們也應該注重統計學和數據挖掘技術的發展,不斷改善在發展過程中存在的問題,更好地應用到生產,生活過程中,促進數據的管理和收集,不斷地為企業和社會經濟的發展提供強大的動力
參考文獻:
[1].韓明:《數據挖掘及其對統計學的挑戰》,《統計研究》,2001年08期
[2]. 孫薇斌:《數據挖掘中統計方法的作用和問題點》,《數理統計與管理》,2004年05期
作者簡介:
韓穎霄(1999.04.19)女,漢族,河北省唐山市,本科生,研究方向:數學金融專業。