丁慶偉
摘要:早當今時代背景下,我國經濟已經得到顯著的發展,信息技術水平也得到明顯的進步,這也就代表著計算機技術已經被社會廣泛的應用并且已經影響到社會的每個領域。在我國社會各個領域中都離不開信息系統,在信息技術廣泛應用的背景下我國傳統的數據分析和統計技術也有了很大的進步和創新,隨著社會的不斷進步,我們必須要對挖掘技術不斷的革新。其中機械學習算法就是很有效的一種方式,它能夠將數據挖掘中的漏洞很好的補上。我們在進行機械學習的過程中,要學會借助計算機來不斷完善自己的技能,通過提高技能來提升機械的性能。機械學習是一個自我完善的過程,其在很多方面都沒有人類大腦強,但是它能夠在完善過程中不斷積累經驗來提高自身的性能。再加上其是建立在計算機基礎上的,具備較強的數據整理能力,因此,數據挖掘中的機械學習算法目前已經得到廣泛的應用。
關鍵詞:數據挖掘;機械學習;算法;應用
目前,我國各大企業的數據管理技術都離不開計算機管理,其已經得到廣泛的應用。在計算機作用下的計算機管理技術是企業中部門與部門之間聯絡和交流的主要途徑。然而,數據管理技術在使用過程中還存在很多的題,其主要原因就是數據的不斷增加使得其分析能力受到一定的限制。
一、完善GABP神經網絡模型
筆者在傳統機械算法的基礎上來對機械學習算法方式和途徑進行分析,目前已經發明出一種新的形式,也就是GA-BP神經網絡模型。這種神經網絡模型主要是在傳統機械算法的基礎上對其進行全面的優化和創新,在對GA-BP神經網絡中的各個性能進行優化的過程中主要采取的方式是自適應變又和變異概率。下面筆者對這一過程進行逐條分析介紹。
1.設計染色體結構
通過前文的闡述我們能夠李教導新型染色體的基因結構主要分為兩種,也就是控制基因和參數基因,這兩種形式是缺一不可的,其關系到對GABP神經網絡模型能否實現最佳的優化。GA-BP神經網絡模型在很大程度上對傳統模型的兩種形式進行優化和創新,最終使得GA-BP神經網絡參數更為的穩定。控制基因形式的主要表現就是對GABP神經網絡模型中的隱性節點進行優化和改良。而參數基因主要表現形式和作用就是對GABP神經網絡內部鏈接所需的標準值進行控制和優化。
2.對適應度函數進行設計
根據以上的闡述我們能建立函數規律。也就是將訓練樣本設定為n個,而訓練數據內部所存在的各方面誤差用r表示,其誤差鏡應該控制在0-1之間。
3.選擇算子
自從遺傳算法正式實施改進和創新之后,GA-BP神經網絡模型其網絡算法主要以常規算法為主,在此進出上再設計最佳的保留數據法,通過這種方式來降低計算過程中出現的各種誤差。
4.交又、變異算子
單點交又和基本變異算子搜是本文所重點要闡述的計算方式,也是傳統優化GABP神經網絡過程中所采取的重要網絡算法,這種網絡算法主要是將遺傳基因算法進行改進和優化。
二、機械學習算法實例
下面就舉出有關的例子對上文所提出的優化過程進行簡要分析,下文所采用的實例是煤礦空壓機的故障診斷系統,然后対改進型遺傳優化BP神經網絡算法進行有效的探索研究。
1.首先應該做好相應的準備工作,閱讀相關的空壓機的說明書,例如使用說明書和故障說明書等。在使用空壓機的時候,還應該對使用過程中的經驗進行積累,在使用結東后再對相關經驗進行分析總結,空壓機的故障類型以及故障是怎么來的,在進行數據整理的時候都要進行分析研究,及時的發現問題所在。煤礦空壓機的故障診斷系統就是本文所采用的實例。通過相應的實驗數據分析,煤礦空壓機呈現出5種工作狀態,用符號Y1-Y5表示,以此作為神經網絡故障診斷模型的輸出。機潤滑油壓力不足;X10表示軸承溫度超限。
2.空壓機經過數據挖掘之后的故障診斷分析。通過對空壓機可能出現的故障進行分析,為了看出新的神經網絡的良好的性能,采用傳統的遺傳神經網絡算法建立了煤礦空壓機故障針對系統,在進行網絡訓練的時候應該采用相同的訓練數據樣本,在測試的時候也應該采用相同的測試數據樣本。
三、結語
在社會的不斷發展進步的過程中,數據挖掘技術也在不斷的創新,在社會中的運用也越來越廣泛,發展速度也越來越快。本文就在傳統的遺傳算法的基礎上提出了一種新的改進型遺傳優化BP神經網絡模型。這種神經網絡模型對傳統的神經網絡模型在遺傳算法的染色體結構和遺傳算子兩個方面進行了相關的優化,然后在進行BP神經網絡結構參數改進的時候,采用了自適應交叉和變異概率,這樣有利于各種數據的處理。
參考文獻:
[1] 郝艷妮. 基于機器學習的數據挖掘算法在葡萄酒信息數據分析系統中的研究[J]. 計算機科學, 2016(S1):501-504.
[2] 佚名. 大數據環境下機器學習在數據挖掘中的應用研究[J]. 智庫時代, 2018, 147(31):264-265.
[3] 張紹成, 孫時光, 曲洋,等. 大數據環境下機器學習在數據挖掘中的應用研究[J]. 遼寧大學學報(自然科學版), 2017, 44(1):15-17.
[4] 孫雪松, 王曉麗. 數據挖掘常用算法及其在醫學大數據研究中的應用[J]. 中國數字醫學, 2018, 13(3).