王尉旭
摘??要:正則化彈性網絡是一種強大的深度學習模型,結合線性回歸和邏輯回歸的特點,可以同時進行特征選擇和參數控制,避免了傳統(tǒng)正則化的部分局限性。離散傅里葉變換特征提取是一種常用的信號處理方法,可以提取信號中的特定頻率的特征,在眾多領域都有著廣泛的應用。通過彈性網絡正則化和加窗離散傅里葉變換的信號分析技術結合,進行了相應的研究和應用。以凱斯西儲大學故障軸承振動數據為例,進行信號分析處理,再經過神經網絡模型的學習和預測,從而得到了一個準確率較高的彈性網絡模型。其方法對于眾多復雜的問題都有著重要的研究價值。
關鍵詞:深度神經網模型???正則化彈性網絡???數據分析工具???信號處理
中圖分類號:TP183
Research?and?Application?Based?on?the?Combination?of?Data?Analysis?and?the?Deep?Neural?Network
WANG?Weixu
Chongqing?Jiaotong?University,?Chongqing,?400074?China
Abstract:?A?regularized?elastic?net?is?a?powerful?deep?learning?model,?which?can?combine?the?characteristics?of?linear?regression?and?logistic?regression?to?perform?both?feature?selection?and?parameter?control,?avoiding?some?of?the?limitations?of?traditional?regularization.?Discrete?Fourier?transform?feature?extraction?is?a?commonly-used?signal?processing?method?that?can?extract?specific?frequency?features?from?signals,?and?it?has?a?wide?range?of?applications?in?many?fields.?This?article?combines?the?signal?analysis?technology?of?elastic?net?regularization?and?windowed?discrete?Fourier?transform?to?conduct?corresponding?research?and?applications.?This?article?takes?the?vibration?data?of?faulty?bearings?from?Case?Western?Reserve?University?as?an?example,?performs?signal?analysis?and?processing,?and?then?obtains?an?elastic?net?model?with?high?accuracy?through?the?learning?and?predicting?of?the?neural?network?model.?This?method?is?of?great?research?value?for?many?complex?problems.???Key?Words:?Deep?neural?network?model?;??Regularized?elastic?net;??Data?analysis?tool?;??Signal?processing
隨著科技的飛速發(fā)展,人工智能技術逐漸滲透到各個領域,為人類社會帶來了前所未有的變革。而神經網絡的研究和應用備受關注。正則化彈性網絡是一種重要的神經網絡深度學習模型,有著線性回歸和邏輯回歸的優(yōu)點,廣泛應用于圖像識別、自然語言處理等領域,其能夠更好地處理非線性化問題。傅里葉變換峰值特征提取是利用傅里葉變換來識別和提取信號中的重要特征方法,這種強大的數據分析工具,可以幫助我們更好地去了解信號和數據的內在結構和特征。
本文旨在探討傅里葉變換數據分析工具與正則化彈性網絡結合的技術原理和應用,通過深入剖析其中的正則化彈性網絡和傅里葉變換峰值提取結合的基本原理和算法,揭示其內在的規(guī)律和特點,為進一步的研究和應用奠定基礎。
在應用方面,本文將詳細介紹正則化彈性網絡和傅里葉變換特征提取的應用。通過滾動軸承故障診斷為例,本文將證明正則化彈性網絡和傅里葉變換特征提取的數據分析方法在信號數據處理的應用效果和優(yōu)勢,為相關領域的研究和實踐提供有力支持。
最后,本文將對正則化彈性網絡和傅里葉變換特征提取的應用前景進行展望。希望通過本文的研究,能夠進一步推動神經網絡人工智能領域的發(fā)展,為人類社會的進步和發(fā)展做出更大的貢獻。
1?正則化彈性網絡
1.1??正則化彈性網絡概述
正則化彈性網絡是強大的深度學習模型,結合了線性回歸和邏輯回歸的優(yōu)點,將神經網絡的參數進行稀疏化約束,對于稀疏化特征篩選,引入L1正則項,在模型中完成特征篩選[1],通過L1范數和L2范數作為正則項來優(yōu)化模型的損失函數。通過不斷地調整參數,控制權重限制的程度,進一步優(yōu)化模型的復雜度和泛化能力之間的平衡,使得模型的預測誤差最小化,能夠處理高維數據和復雜的非線性問題。
正則化彈性網絡的優(yōu)點這就是能夠同時實現特征選擇和模型復雜度控制。所以,彈性網絡在高緯數據集和特征相關性較高的情況下表現出色。更是可以在復雜的問題中,實現有效解,不會產生交叉的路徑。在特征選擇、回歸分析、圖像處理、自然語言處理、推薦系統(tǒng)和生物信息學等領域有著廣泛的應用。
1.2?正則化彈性網絡原理
正則化彈性網絡的原理主要基于線性模型的優(yōu)化,通過添加L1范數和L2范數的懲罰項,對線性模型進行正則化,對這兩個正則化項的權重調節(jié)來控制模型的特征選擇和模型復雜度。
彈性網絡中的L1范數的懲罰項促使部分特征權重變?yōu)?來實現特征選擇,而L2范數的懲罰項來控制模型的復雜度,所以通過調整這兩個正則化項的權重,來找到一個較為良好的平衡點,提高模型泛化能力。
2?傅里葉變換特征提取
頻域特征的基礎是傅里葉變換[2],傅里葉特征抽取是一種常見的信號處理技術,它通過傅里葉變換來提取信號的特征。這種方法將信號從時間域轉換為頻率領域,然后通過對信號進行頻域分析,將信分解成為一系列不同頻率和振幅的正弦波的疊加。通過頻譜分析,我們能夠了解信號在各個頻率上的能量分布,從而提取出信號的特征信息。
傅里葉特征提取應用于眾多領域,例如音頻處理、圖像處理、信號處理等。在音頻處理中,可以利用傅里葉特征提取來提取音頻信號的頻譜特征,用于音頻分類、聲音識別等任務。在圖像處理中,可以將圖像轉換為頻率域表示后,提取圖像的頻譜特征用于圖像分類、圖像識別等任務。
3??正則化彈性網絡和離散傅里葉變換特征提取結合在軸承故障診斷中的應用
3.1??凱斯西儲振動數據分析處理
本文選取了凱斯西儲大學的軸承振動數據作為數據集進行數據分析和神經網絡訓練[3],常見的故障特征提取方法包括時域特征、頻域特征和時頻域特征[4],所以研究人員選用傅里葉特征提取來解決軸承故障類型故障診斷的多分類問題。
將振動數據進行歸一化處理后進行Blackman窗口函數加窗處理。Blackman窗口函數是一種常用的窗函數,具有較窄的主瓣寬度和較低的旁瓣高度,能夠提供較好的頻率分辨率和較小的頻譜泄漏。在故障診斷領域,Blackman窗口函數可以對振動信號進行增強處理,突出信號中的特定頻率成分,提取特征,以用于模式識別算法,如向量機和本文使用的人工神經網絡。
傅里葉變換可以將信號從時域轉換到頻域,其基本思路是將信號轉換為一組正弦波的線性組合,將信號分解成不同頻率的分量,用于信號的頻率分析。
離散傅里葉變換是傅里葉變換的一種離散形式,在離散傅里葉變換中,信號只在特定的時間點上有值,用于處理離散信號,如數字信號、離散傳感器信號。離散傅里葉變換將離散信號轉換為復數序列,每個復數對應一個頻率分量,從而將離散信號轉換到頻率,對于一個有限長度的離散信號,x其離散傅里葉變換可以用以下公式表示:
X[k]?=?∑_{n=0}^{N-1}?x[n]?*?e^{-i2πk*n/N}
這個公式表示,離散傅立葉變換將每個樣本x乘以e^{-i2πk*n/N},然后將所有的乘積進行求和,其中表示第k個頻率分量的振幅。
加窗離散傅里葉變換后的頻率信號,有利于分析信號的頻率成分,在故障診斷領域中可以反映出不同故障的特有頻率,對于本文的軸承故障診斷數據應提取其高幅峰值頻率。本文對歸一化后幅值大小前20的頻率數據進行記錄并排序,用于神經網絡輸入。
3.2??正則化彈性網絡的Matlab構建
fitnet函數用于創(chuàng)建一個具有一層隱藏層的神經網絡函數,通過使用基于誤差的反向傳播算法進行網絡訓練。該函數在網絡輸入時會自動將數據進行適當的預處理,如歸一化、標準化。在使用fitnet訓練神經網絡時,Matlab會自動使用trainlm函數進行正則化,包括L1和L2正則化。
Trainlm函數使用Levenberg-Marquardt算法來訓練多層感知器LMP,該算法是一種迭代優(yōu)化算法,用于解決最小二乘優(yōu)化問題。該函數與fitnet函數結合時,Trainlm函數會自動計算L1和L2正則化項的權重,并最小化帶正則化的損失函數,有助于在訓練過程中自動調整正則化強度,從而得到一個具有良好泛化能力的彈性網神經網絡模型。
L1正則化式:
將其加入損失函數(表示為loss),變成:
是超參數。除了能夠約束參數量級之外,L1正則化還能起到稀疏化參數的作用。
L2正則化式:
L2代表求權重的歐幾里得范數,也叫作L2范數:
假設待正則的網絡層參數為,L2正則式為:
將其加入損失函數(表示為loss),變成:
上述式中,是一個模型中的超參數,一般被稱作為正則化參數。
在Matlab中fitnet?函數中,L1實現的公式:
,其中,W是模型矩陣,取其絕對值然后求和。
L2則是用Matlab中的vecnorm函數可以實現。通過計算矩陣的范數來實現。公式如下:
L2=norm(A,2)A?是模型矩陣,對于矩陣中每一個元素平方后求和,然后取平方根。
彈性網絡正則化則是結合L1和L2正則化,正則化式:
3.2.3??配置網絡參數
(1)傳遞函數。
本文選取Tansig函數作為隱藏層激活函數。
Tansig函數是神經網絡模型中的一種常用的激活函數,其非線性映射能力強,可以將輸入值非線性映射到輸出值,從而有效地解決線性不可分的問題。Tansig函數還有計算效率高的優(yōu)點,其采用簡單的數學公式和計算方法,速度快。
(2)隱藏層節(jié)點個數。
根據樣本數據和問題的復雜程度,本文設置了一層隱藏層以避免網絡復雜化、網絡訓練時間過長和出現過擬合的傾向。
隱藏層節(jié)點數應小于訓練樣本數減一,否則網絡模型的系統(tǒng)誤差與訓練樣本的特性無關而趨于零,即建立的網絡模型沒有泛化能力,也沒有任何使用價值[5]。
訓練樣本數必須多于網絡模型的連接權數,一般為其的2~10倍,否則樣本必須分成幾部分且必須采用“輪流訓練”的方法才能得到可靠的神經網絡[5]。
本次網絡訓練樣本量為2?717,輸入特征序列長度為20,輸出層節(jié)點數即分類類別為32,得到隱藏層節(jié)點數范圍應在6~25之間,因此研究人員選取中間數15作為隱藏層節(jié)點個數。
(3)性能指標。
本文選取了MSE作為彈性網神經網絡訓練的訓練指標,MSE易于計算和理解,值越小,模型的性能越好。并且,MSE適用于各種不同類型的模型和數據集,對于分類問題,MSE能夠作為評估性能的有效指標。
(4)設置目標誤差1。
3.3??模型訓練及驗證
將樣本集隨機打亂后劃分為訓練集和測試集,測試集用于評估驗證該模型的分類正確率。通過Matlab神經網絡工具箱對該網絡進行代碼實現,在訓練集樣進行訓練后,得到彈性網神經網絡模型,各參數如圖?1所示。
圖?1展示了模型預測輸出和目標輸出之間的誤差分布情況,將訓練數據集的每個樣本的誤差進行統(tǒng)計,并進行分組,可以直觀地看出模型在不同誤差范圍內的表現,以及是否存在異常點。
圖?2是訓練過程變化圖,圖二中第一個曲線表示了訓練過程,顯示了訓練過程中每一次誤差迭代的變化,用于了解網絡的改進過程;第二個是訓練誤差的曲線,用于評估模型在未見過的數據上的性能;第三個曲線表示了權重和偏置的變化,顯示了權重和偏置參數隨迭代次數的變化;
用測試集對模型驗證評估。
準確率驗證:對于分類問題,準確率能直觀地體現神經網絡的性能,表明模型的泛化能力,能夠在新數據上進行有效的推斷。
準確率計算過程:將測試集預測輸出矩陣進行二值化處理,即每列(一份樣本輸出)中最大概率化為1,其余概率化為0,與測試集的預期輸出矩陣進行比較,得到該測試集經過本神經網絡預測的準確率。
本模型經過多次初始化并訓練,求得模型的準確率范圍在0.965~0.980,準確率高,說明模型對于軸承故障類型診斷問題的解決能力強。
4??結論
本文以凱斯西儲大學的正常及各故障類型的振動數據為例,對信號分析和神經網絡結合方法進行研究應用。將振動信號進行歸一化處理后進行Blackman窗口函數進行加窗處理。從而對振動信號進行增強并提取特征。然后經過離散傅里葉變換將信號從時域轉換為頻域,根據不同軸承故障類型具有獨有的高幅度高頻特征頻率,對幅頻譜進行峰值提取,以最高的20個幅值對應的頻率歸一化處理后作為正則化彈性網絡的訓練樣本,選擇神經網絡的訓練函數并調整各參數,經驗證后,得到準確率較高的神經網絡模型。本文方法得到的神經網絡模型高效準確,足以證明該結合方法有效且具有良好的前景。
正則化彈性網絡在回歸和分類問題上表現出色。在醫(yī)療、金融等眾多領域都取得了顯著的成果。隨著計算能力的提升和算法的優(yōu)化,正則化彈性網絡的性能也將會不斷優(yōu)化。
而離散傅里葉變換提供了對信號頻率特性的深入理解,在許多應用中具有重要的價值。隨著計算能力的提升,未來可以利用更高效的方法實現離散傅里葉變換特征提取,可以將其探索于其他更廣泛的領域。
總之,隨著技術的不斷進步和應用需求的不斷提升,信號分析技術與神經網絡技術的結合方法將會是一種高效準確的信號處理技術,將會為各種實際應用提供更好的支持。
參考文獻