趙婕
(陜西工業職業技術學院 信息工程學院, 陜西 咸陽 712000)
音樂可以給人們帶來精神上的享受,消除人們身體和精神疲勞,減輕工作上的壓力,由于電子技術不斷地發展,一些專業人員通過電子設備進行電子音樂的合成,產生了大量的電子音樂,給人們提供了更多的音樂欣賞素材,但是由于每一個人對電子音樂都有自己的偏好,如老年人喜歡聽一些旋律比較慢的古典音樂,而年輕人喜歡聽一些快節奏的搖滾音樂,因此幫助人們對電子音樂進行有效辨識,給他們提供最適合的電子音樂具有十分重要的意義[1-3]。
由于國內外學者們的重視,當前有許多類型的電子音樂辨識方法,其中人工神經網絡的電子音樂辨識方法最多,如回聲狀態網絡的電子音樂辨識方法,BP神經網絡的電子音樂辨識方法,RBF神經網絡的電子音樂辨識方法、極限學習機的電子音樂辨識方法等,由于人工神經網絡的工作原理與人腦的神經網絡工作原理相似,可以模擬人腦對電子音樂進行辨識,電子音樂辨識效果較好,其中BP神經網絡的實際應用范圍最為廣泛[4-6]。在實際應用過程中,BP神經網絡還有許多難題沒有得到有效的解決,如BP神經網絡的結構不穩定,使得電子音樂辨識效果極不穩定,可信度比較低,導致電子音樂辨識效率低,而且學習速率采用經驗方式隨機確定,使得電子音樂辨識誤差比較大[7-9]。
針對神經網絡在電子音樂辨識過程中存在的參數優化問題,為了改善電子音樂辨識結果,提高電子音樂辨識精度,提出了改進神經網絡的電子音樂辨識方法,采用自適應遺傳算法快速、有效地尋找最優的參數,使得神經網絡結構達到最優,測試結果表明,改進神經網絡的電子音樂辨識精度高、速度快,具有十分明顯的優越性。
由于BP神經網絡的學習能力強,與電子音樂辨識過程具有較強的相似性,標準BP神經網絡常采用3層結構,如圖1所示[10]。
電子音樂辨識特征為x1,x2,…,xm,其直接作為BP神經網絡的輸入,那么其相應的輸出為式(1)。
(1)
隱含層的輸入、輸出分別為式(2)、式(3)。
(2)
(3)

輸出層的輸入、輸出分別為式(4)、式(5)。
(4)
(5)

采用電子音樂辨識誤差作為BP神經網絡的訓練目標,BP神經網絡的訓練過程實際就是不斷對隱含層和輸出層的連接權值進行調整,使電子音樂辨識誤差朝最小化方向發展,如式(6)、式(7)。
(6)
(7)
式中,η為學習速率。
參數學習速率η直接影響BP神經網絡的隱含層和輸出層的連接權值確定的優劣。η越大,隱含層和輸出層的連接權值變化量比較大,使得BP神經網絡的學習速度快,但是過大,可能使得BP神經網絡出現過擬合現象,即學習精度降低;而η越小,隱含層和輸出層的連接權值變化量比較緩慢,BP神經網絡的學習速度慢,影響學習效率。當前主要通過經驗方式確定η,難以獲得理想的BP神經網絡的學習效果,為此本文采用自適應遺傳算法確定參數學習速率η的值,在加快BP神經網絡學習速度的同時,提高BP神經網絡的學習精度。
遺傳算法的性能與交叉概率(Pc)和變異概率(Pm)直接相關,標準遺傳算法的交叉概率和變異概率采用固定方式,在其運行過程中是一個常量,難以產生優異的后代個體,使得遺傳算法易限入局部最優解,因此本文采用自適應遺傳算法,其交叉概率和變異概率隨著進化代數的變化而變化,這樣不斷產生優秀個體,避免限入局部最優解。自適應遺傳算法的Pc和Pm變化曲線如圖2所示。

圖2 交叉變異概率變化曲線
自適應遺傳算法的Pc和Pm的計算式,如式(8)、式(9)。

(8)

(9)
式中,fmax和favg分別為適應度函數的最大值和平均值;f′為交叉后較優個體的適應度函數值;f為變異后的個體適應度函數值;ki為0—1范圍的常數。
本文采用電子音樂信號的短時能量特征、時域方差特征進行電子音樂辨識,它們提取步驟具體如下。
Step1:Em為電子音樂信號{y(n)}的能量,那么其短時能量計算如式(10)。
(10)
式中,c(m)為電子音樂信號的滑動窗,電子音樂信號幀長度是N。
Step2:電子音樂信號可以劃分為N幀,即可以表示為Yt(n)={yt(n,1),yt(n,2),…,yt(n,N)},計算電子音樂時域的均值Ei(n)和方差Di(n),如式(11)、式(12)。
(11)
(12)
Step1:采集電子音樂信號,并對其進行去噪處理,以提高電子音樂信號的信噪比。
Step2:從去噪后的電子音樂信號中提取短時能量特征、時域方差特征,并對它們進行歸一化處理,如式(13)。
(13)
式中,feature(i)表示第i個特征。
Step3:對于每一種電子音樂信號,選擇比較重要的特征進行建模。
Step4:根據電子音樂信號的重要特征數量和電子音樂的類型數量確定BP神經網絡的輸入和輸出節點的數量。
Step5:根據一定的規則,確定電子音樂信號辨識的BP神經網絡隱含層節點的數量。
Step6:采用自適應遺傳算法確定BP神經網絡參數學習速率η的值。
Step7:BP神經網絡對電子音樂信號訓練樣本進行學習,建立最優的電子音樂信號辨識模型。
為驗證改進神經網絡的電子音樂辨識效果,選擇當前最流行的10類種電子音樂作為實驗對象,而且對于每一類電子音樂,采集不同數量的電子音樂樣本,如表1所示。

表1 10種電子音樂的樣本數量
由于電子音樂的類型不同,那么其特征數量應該不同,因此提取不同的電子音樂特征,并選擇比較重要的特征進行電子音樂辨識,得到的重要特征數量如表2所示。

表2 10種電子音樂的重要特征數量
為了驗證本文對神經網絡改進的有效性,選擇傳統神經網絡進行電子音樂辨識對比實驗,傳統神經網絡采用經驗方式確定其參數,改進神經網絡和傳統神經網絡的電子音樂辨識精度和時間,如圖3、圖4所示。

圖3 與傳統神經網絡的電子音樂辨識精度對比

圖4 與傳統神經網絡的電子音樂辨識速度對比
從圖3和圖4可以看出,無論是電子音樂辨識精度或者是電子音樂辨識速度,改進神經網絡均要明顯優于傳統神經網絡,這是因為改進神經網絡引入自適應遺傳算法解決了參數優化的難題,能夠獲得更優的神經網絡,建立了高精度的電子音樂辨識模型,而且加快了電子音樂辨識速度,在相同時間可以辨識更多的電子音樂辨識樣本,這樣可以降低電子音樂辨識成本,實際應用價值更高。
為了進一步測試改進神經網絡的電子音樂辨識的優越性,選擇當前經典電子音樂辨識方法進行對比實驗,具體為:隱馬爾可夫模型的電子音樂辨識方法[11]、支持向量機的電子音樂辨識方法[12],所有方法的電子音樂辨識精度如圖5所示。

圖5 與經典電子音樂辨識方法的精度對比
從圖5可以看出,相對于支持向量機、隱馬爾可夫模型,改進神經網絡的電子音樂辨識精度均有了不同程度的得升,這表明改進神經網絡可以有效減少電子音樂辨識錯誤率,能夠準確辯識各種電子音樂,改進神經網絡可以解決當前電子音樂辨識方法存在的弊端,獲得了更加理想的電子音樂辨識結果。
支持向量機、隱馬爾可夫模型、改進神經網絡的電子音樂辨識時間變化情況,如圖6所示。

圖6 與經典電子音樂辨識方法的速度對比
對圖6的電子音樂辨識時間進行對比可以清楚看出,相對于支持向量機、隱馬爾可夫模型,改進神經網絡的電子音樂辨識時間明顯減少,改進神經網絡的電子音樂辨識時間復雜度明顯降低,提高了電子音樂辨識效率,電子音樂辨識速度得到了明顯的改善。
為了改善電子音樂的辨識精度,針對當前神經網絡存在的缺陷,提出了改進神經網絡的電子音樂辨識方法,并與其它方法進行了電子音樂辨識仿真實驗,通過對仿真實驗結果分析可以發現,改進神經網絡的電子音樂辨識精度高,不僅錯誤率要小于其它電子音樂辨識方法,而且電子音樂辨識速度快,具有十分廣泛的應用前景。