孟令紅



摘要:為了提高音樂分類和檢測正確率,設計了一種復雜噪聲環境中的音樂分類和檢測模型。首先分析當前音樂分類和檢測的研究進展,指出各種音樂分類和檢測模型存在的缺陷,然后采集音樂分類和檢測信號,引入去噪技術對噪聲進行消除處理,從信號中提取特征,最后將特征和音樂類型分別作為神經網絡的輸入和輸出向量,通過神經網絡的訓練建立音樂分類和檢測模型。在相同環境下,與其它音樂分類和檢測模型進行了對比測試,結果表明,無噪聲環境下,這個模型的音樂分類和檢測精度超過95%,在復雜噪聲環境下,文中模型的音樂分類和檢測精度超過90%,遠遠超過音樂處理的實際應用控制范圍,音樂分類和檢測效果優于對比模型,具有一定的實際應用價值。
關鍵詞:噪聲干擾;音樂分類;檢測精度;提取特征向量;神經網絡;仿真測試
中圖分類號:TP181
文獻標志碼:A
MusicClassificationandDetectionModelinComplexNoiseEnvironment
MENGLinghong
(
HebeiRadioandTelevisionStation,Shijiazhuang050031,China
)
Abstract:Inordertoimprovetheaccuracyofmusicclassificationanddetection,amusicclassificationanddetectionmodelincomplexnoiseenvironmentisdesigned.Firstly,thispaperanalyzesthecurrentresearchprogressofmusicclassificationanddetection,andpointsoutthedefectsofmusicclassificationanddetectionmodels.Thenthemodelcollectsmusicclassificationanddetectionsignals,introducesdenoisingtechnologytoeliminatethenoise,extractsfeaturesfromthesignals,andfinallytakesfeaturesandmusictypesasinputandoutputvectorsofneuralnetwork,respectively.Themodelestablishessoundthroughthetrainingofneuralnetwork.Theresultsshowthattheaccuracyoftheproposedmodelisover95%innoiselessenvironmentandover90%innoisingenvironment,whichisfarbeyondtheactualapplicationcontrolrangeofmusicprocessing,andtheeffectofmusicclassificationanddetectionisbetterthanthecomparisonmodel,andithasacertainpracticalapplicationvalue.
Keywords:noiseinterference;musicclassification;detectionaccuracy;featurevectorextraction;neuralnetwork;simulationtest
0引言
隨著人們生活水平的不斷提高,人們享受生活的方式多元化,其中聽音樂成為一種重要的消遣方式。但是在音樂采集過程中,由于環境中一些不利影響的干擾,使得音樂包括了一些對音質有損的信息,這些信息統稱為噪聲。在復雜噪聲環境,有時噪聲會淹沒了有用的音樂信號,使得人們無法識別正確的音符,因此如何進行噪聲環境中的音樂分類和檢測具有十分重要的研究意義[13]。
當前復雜噪聲環境中的音樂分類和檢測模型主要有兩大類型,一類是線性的音樂分類和檢測模型,最具有代表的為k最近鄰算法,其音樂分類和檢測過程十分簡單,使得音樂分類和檢測效率相當高,但是音樂分類和檢測精度比較低,使得使用范圍受到了限制[45];另一類為非線性的音樂分類和檢測模型,最具代表性為人工神經網絡算法,如BP神經網絡的音樂分類和檢測模型,深度置深網絡的音樂分類和檢測模型等[68],它們的音樂分類和檢測要優于線性的音樂分類和檢測模型,但是當音樂的噪聲環境比較復雜時,它們的音樂分類和檢測效果急劇下降,對噪聲的魯棒性比較低,使得音樂分類和檢測錯誤率變大,難以滿足音樂分類和檢測的實際應用要求[911]。
為了提高音樂分類和檢測正確率,設計了一種復雜噪聲環境中的音樂分類和檢測模型。在相同條件,與其它音樂分類和檢測模型進行了對比測試,結果表明,無論是無噪或者噪聲環境下,本文模型的音樂分類和檢測精度均要明顯優于對比模型,對比結果有效的證明了本文音樂分類和檢測模型的有效性和優越性。
1多種噪聲環境下的音樂分類和檢測模型
1.1音樂噪聲的去除技術
當音樂含有噪聲時,音樂信號變化曲線就會發生改變,設含噪
聲為t(n),有用、干凈的音樂信號為s(n),那么復雜噪聲環境中的音樂信號如式(1)。
y(n)=s(n)-at(n)
(1)
式中,a表示噪聲類型,如白噪聲、高斯噪聲等。
噪聲t(n)通常使得音樂信號存儲空間增加,變化曲線發生變異,無法正確識別音樂信號類型,因為需要消除噪聲所起的負面影響,本文選擇軟閾值的小波變換對音樂信號噪聲進行去除,設一個含有噪聲的音樂信號去除前后變化曲線如圖1所示。可以明顯看出,無噪音樂信號和含有噪聲的音樂信號變化特征差別十分明顯,其中縱坐標為信號幅度,橫坐標為采集時間,如圖1所示。
1.2音樂分類和檢測特征提取
音樂分類和檢測的特征很多,由于音樂中包含信息發生變化時,其短時能量頻譜就會發生相應的改變,因此短時能量頻譜是一種有效的信號識別特征。本文選擇短時能量頻譜特征進行音樂分類和檢測建模。設音樂的采樣頻率為fi,音樂的頻譜信號方差值計算公式如式(2)。
sp=∑Ni=1(fi-i)2p(fi)∑Nn=1p(fi)
(2)
音樂短時能量頻譜特征計算公式如式(3)。
ff=∑Ni=1(fi-i)2p(fi)sp3∑Nn=1p(fi)
(3)
1.3BP神經網絡算法
音樂短時能量頻譜特征數量為BP神經網絡輸入層的節點數量,音樂類型為BP神經網絡的輸出層的輸出,隱含層映射函數為:
f:Rm→R,神經網絡其輸入和輸出分別如式(4)、式(5)。
Sj=∑mi=1wijx(i)-θj
(4)
bj=11+exp∑mi=1wijxi-θj,j=1,2,…,p
(5)
式中,wij和θj為隱含層的節點權值和閾值。
根據同樣的原理,可以得到輸出層的輸入和輸出如式(6)、式(7)。
L=∑pj=1wjkbj-θk
(6)
xi+1=1(1+exp(∑pk=1wkjbj-θk))
(7)
式中,wkj和θk分別為輸出層的節點和閾值。
1.4噪聲環境中的音樂分類和檢測步驟
Step1:對音樂的噪聲場景進行模擬,然后從噪聲場景中采集大量的音樂信號,并去除前面和最后一段音樂信號,保持音樂信號的連續性。
Step2:引入去噪技術,對音樂信號進行噪聲消除處理,去除音樂信號中噪聲,得到干凈有用的音樂信號,有利于后續的音樂分類和檢測。
Step3:從無噪的音樂信號中提取短時能量頻譜特征,并采用如下方式對短時能量頻譜特征進行預處理如式(8)。
ff′i=max-ffimax-min
(8)
式中,max和min分別表示短時能量頻譜特征的最大和最小值。
Step4:短時能量頻譜特征和音樂類型分別作為BP神經網絡的輸入和輸出向量,通過訓練確定BP神經網絡的最優網絡結構以及參數。
Step5:采用最優網絡結構以及參數的BP神經網絡建立音樂分類和檢測的分類器,并對分類器的性能進行分析和測試。
綜合上述可知,復雜噪聲環境中的音樂分類和檢測流程,如圖2所示。
2音樂分類和檢測模型的性能對比測試
2.1測評平臺
為了測試復雜噪聲環境中的音樂分類和檢測效果,在相同測試平臺上,選擇BP神經網絡的音樂分類和檢測模型,該模型沒有引入去噪技術,和基于KNN的音樂分類和檢測模型,該模型采用了去噪技術,但是采用KNN建立音樂分類分類器,采用復雜噪聲環境中的音樂分類和檢測精度和檢測效率對各模型的性能進行分析,選擇的測試平臺設置,如表1所示。
2.2測評對象
為了使音樂分類和檢測效果具有說服力,選擇5種音樂,每一種音樂包括有噪和無噪數據,它們的樣本數如表2所示。
2.3音樂分類和檢測精度分析
采用本文模型、BP神經網絡、KNN對表2中的音樂進行分類和檢測,得到的實驗結果如圖3、圖4所示。
從圖3和圖4的音樂分類和檢測精度進行對比和分析可以發現:
(1)KNN的音樂分類和檢測精度最低,無法準確描述音樂信號包含的信息,雖然引入了去噪技術,對噪聲的干擾可以進行抑制,但是由于KNN只能建立音樂分類和檢測的線性分類器,使得音樂分類和檢測錯誤率比較高,實際應用價值很低。
(2)BP神經網絡的音樂分類和檢測精度要高于KNN的音樂分類和檢測精,可以更好的描述音樂信號變化特點,這是因為BP神經網絡可以建立非線性的音樂分類和檢測分類器,但是由于沒有引入去噪技術,無法消除噪聲對音樂分類和檢測的影響,使得音樂分類和檢測錯誤率相對比較大,音樂分類和檢測效果有待改善。
(3)本文模型的音樂分類和檢測精度最高,可以更加全面、準確描述音樂信號包含的信息,大幅度減少了音樂分類和檢測錯誤率,對于有噪音樂,音樂分類和檢測精度超過了90%,對于無噪的音樂,音樂分類和檢測精度更是達到了95%以上,完全可以滿足音樂檢索的實際應用要求,獲得較好的音樂分類和檢測結果,這主要是由于本文模型利用了去噪技術和神經網絡的優點,克服了當前音樂分類和檢測過程中存在的不足,對比結果體現了本文音樂分類和檢測模型的優越性。
2.4音樂分類和檢測效率析
對于有噪的音樂,統計3種模型的音樂分類和檢測時間,如圖5所示。
從圖5可以看出,KNN的音樂分類和檢測時間最少,速度最快,但是由于音樂分類和檢測精度太低,不能滿足音樂分類和檢測的實際應用要求,本文模型的音樂分類和檢測時間要少于BP神經網絡,說明通過對噪聲的消除,很好的抑制了噪聲對音樂分類和檢測的干擾,提高了音樂分類和檢測效率。
3總結
音樂分類和檢測是音樂檢索的重要技術,由于噪聲的干擾,當前音樂分類和檢測模型無法獲得理想的音樂分類和檢測結果,使得音樂分類和檢測錯誤率比較高,為了獲得更優的音樂分類和檢測效果,設計了一種復雜噪聲環境中的音樂分類和檢測模型。首先采集音樂分類和檢測信號,并進行噪聲消除處理,然后提取音樂分類和檢測特征向量,并采用神經網絡對各種類型的音樂信號變化特點進行描述,建立了音樂分類和檢測模型,測試結果表明,本文模型是一種精度高、魯棒性強的音樂分類和檢測精模型,具有十分廣泛的應用前景。
參考文獻
[1]
杜威,林滸,孫建偉,等.一種基于分層結構的音樂自動分類方法[J].小型微型計算機系統,2018,39(5):888892.
[2]楊曉宇,黃浩,王浩華.基于改進的T型關聯度在音樂分類中的應用[J].數學的實踐與認識,2017,47(20):155163.
[3]顏景斌,吳石,伊戈爾·艾杜阿爾達維奇.基于單類支持向量機的音頻分類[J].計算機應用,2009,29(5):14191422.
[4]倪璐.基于Android與JAVA的音樂在線分類管理與播放系統研究[J].自動化技術與應用,2020,39(2):4547.
[5]陳志高,張旭龍,肖寒,等.基于UNet和BGRURNN的實用歌聲檢測系統[J].微型電腦應用,2019,35(10):109112.
[6]孫慧芳,龍華,邵玉斌,等.基于過零率及頻譜的語音音樂分類算法[J].云南大學學報(自然科學版),2019,41(5):925931.
[7]王潔,朱貝貝.面向中文歌詞的音樂情感分類方法[J].計算機系統應用,2019,28(8):2429.
[8]符朝興,沈威,高述勇,等.PCA改進RPROP方法的BP算法在音樂信號分類中的應用[J].測控技術,2019,38(7):8488.
[9]鄭旦.基于深度置信網絡的多特征融合音樂分類算法[J].電子設計工程,2020,28(4):132136.
[10]黃歡歡,盧亞玲.改進的BP算法在音樂分類中的應用研究[J].武漢輕工大學學報,2018,37(4):7075.
[11]龔安,丁明波,竇菲.基于DBN的多特征融合音樂情感分類方法[J].計算機系統應用,2017,26(9):158164.
(收稿日期:2020.03.12)