李顏汐
摘 要: 為了準(zhǔn)確描述背景音樂的類別,提出基于情感特征的背景音樂分類方法。針對(duì)當(dāng)前方法沒有考慮情感特征的缺陷,提取情感特征,并與其他特征進(jìn)行融合組成背景音樂分類特征向量,然后對(duì)特征進(jìn)行篩選,作為神經(jīng)網(wǎng)絡(luò)的輸入向量,最后采用神經(jīng)網(wǎng)絡(luò)進(jìn)行自動(dòng)學(xué)習(xí),建立背景音樂分類器,并對(duì)具體背景音樂數(shù)據(jù)進(jìn)行分類和識(shí)別。實(shí)驗(yàn)結(jié)果表明,該方法能夠準(zhǔn)確區(qū)別各種背景音樂,分類正確率高達(dá)98%以上,同時(shí)也可以應(yīng)用于其他音樂的分類,具有良好的推廣性。
關(guān)鍵詞: 背景音樂; 分類器設(shè)計(jì); 情感特征; 特征向量
中圖分類號(hào): TN912?34; TP391 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2017)15?0115?04
Abstract: In order to describe the categories of background music accurately, a background music classification method based on emotional feature is put forward. Since the defects of the emotional feature aren′t considered in current methods, the emotional feature is extracted, and fused with other features to compose the feature vector of background music classification. The feature is selected as the input vector of neural network. The neural network is used to perform the automatic learning to establish the background music classifier. The specific background music data is classified and identified. The experimental results show that the method can distinguish various background music accurately, its classification accuracy can reach up to 98%, which can be applied to the classification of other music, and has perfect generalization.
Keywords: background music; classifier design; emotional feature; feature vector
0 引 言
背景音樂是音樂的一種類型,在許多場(chǎng)合都會(huì)用到,如電影等[1?2]。如何選擇最合適的背景音樂與相應(yīng)的場(chǎng)景搭配具有重要的實(shí)際應(yīng)用價(jià)值。而背景音樂分類是背景音樂選擇的前提和基礎(chǔ),因此背景音樂自動(dòng)分類引起了人們的廣泛關(guān)注[3]。
針對(duì)背景音樂的自動(dòng)分類問題,人們的研究一直沒有停止過,隨著研究不斷深入,當(dāng)前背景音樂自動(dòng)分類方法主要有基于時(shí)域特征的背景音樂自動(dòng)分類方法和基于頻域特征的背景音樂自動(dòng)分類方法兩種[4?5]。在實(shí)際應(yīng)用中,單一的時(shí)域特征或者頻域特征都無法準(zhǔn)確描述背景音樂的類別,自動(dòng)分類和識(shí)別的準(zhǔn)確性不高,而且錯(cuò)誤分類率很高[6]。為此有學(xué)者結(jié)合了時(shí)域特征或者頻域特征優(yōu)點(diǎn),提出基于組合特征的背景音樂自動(dòng)分類方法[7],與單一時(shí)域特征或者頻域特征,組合特征可以提供更多背景音樂信息,出現(xiàn)了線性判斷、灰色模型等背景音樂自動(dòng)分類方法,但是當(dāng)背景音樂中含有噪聲時(shí),背景音樂自動(dòng)分類效果變差[8?10]。特征太多,使得背景音樂自動(dòng)分類器結(jié)構(gòu)更加復(fù)雜,背景音樂自動(dòng)分類效率低下。相對(duì)于其他音樂,背景音樂有自身的特殊性,因?yàn)橐秩練夥眨尤肓饲楦刑卣鳎?dāng)前背景音樂分類方法卻忽略了情感特征,分類正確率有待進(jìn)一步提高[11?12]。
為了準(zhǔn)確描述背景音樂的類別,提出基于情感特征的背景音樂分類方法。首先提取背景音樂的情感特征,然后采用蟻群優(yōu)化算法進(jìn)行特征選擇,作為神經(jīng)網(wǎng)絡(luò)的輸入向量,最后采用神經(jīng)網(wǎng)絡(luò)進(jìn)行自動(dòng)學(xué)習(xí),建立背景音樂分類器,并對(duì)具體背景音樂數(shù)據(jù)進(jìn)行分類和識(shí)別。結(jié)果表明,該方法能夠準(zhǔn)確區(qū)別各種背景音樂分類,分類正確率高達(dá)98%以上。
1 背景音樂信號(hào)的采集和處理
1.1 背景音樂信號(hào)的采集
采用專用設(shè)備對(duì)背景音樂信號(hào)進(jìn)行采集,然后采用Cool Edit Pro2.1將其保存,結(jié)果如圖1所示。
1.2 背景音樂信號(hào)的預(yù)處理
背景音樂信號(hào)采集過程受到多種外界因素的干擾,包含有噪聲,噪聲對(duì)后繼的背景音樂信號(hào)分類產(chǎn)生不利影響,為了抑制噪聲對(duì)后續(xù)背景音樂信號(hào)自動(dòng)分類的干擾,選擇小波變換對(duì)背景音樂信號(hào)進(jìn)行去噪處理。選擇db6基函數(shù),閾值為:
2 提取背景音樂的特征
在背景音樂分類過程中,情感特征比較多,本文選擇短時(shí)能量、時(shí)域方差和頻域方差作為特征,將它們組合作為背景音樂分類的特征向量。
2.1 提取背景音樂的短時(shí)能量特征
對(duì)背景音樂信號(hào)進(jìn)行采集和去噪后,得到理想的背景音樂信號(hào)為提取其短時(shí)能量為:
2.2 時(shí)域方差特征提取
對(duì)于背景音樂信號(hào)的第幀,可以描述為:
2.3 提取背景音樂信號(hào)的頻域方差特征
對(duì)于某幀背景音樂信號(hào)進(jìn)行傅里葉變換,相應(yīng)的頻域信號(hào)為,具體可表示為:
3 篩選背景音樂的重要特征
通過上述步驟提取背景音樂分類特征,情感特征比較多,本文選擇短時(shí)能量、時(shí)域方差和頻域方差特征,原始特征數(shù)量比較大,若直接采用這些特征進(jìn)行背景音樂分類,那么分類器的結(jié)構(gòu)會(huì)十分復(fù)雜,對(duì)背景音樂分類效率產(chǎn)生負(fù)面影響,因此采用蟻群優(yōu)化算法對(duì)原始背景音樂分類特征進(jìn)行篩選,簡(jiǎn)化背景音樂分類器的結(jié)構(gòu),提高背景音樂分類效率,同時(shí)獲得更加理想的背景音樂分類結(jié)果。
蟻群優(yōu)化算法根據(jù)螞蟻爬行、覓食群體行為對(duì)問題進(jìn)行求解,問題搜索的速度快,而且具有正反饋功能,因此性能要優(yōu)于其他人工智能算法。采用蟻群優(yōu)化算法進(jìn)行背景音樂特征篩選就是要得到一條最優(yōu)路徑,該路徑每一個(gè)點(diǎn)組成了最后篩選出的最優(yōu)背景音樂特征,如圖2所示。
蟻群優(yōu)化算法篩選背景音樂特征的步驟如下:
(1) 螞蟻在進(jìn)行背景音樂特征選擇過程中,通過節(jié)點(diǎn)的轉(zhuǎn)移來確定方向,而方向根據(jù)轉(zhuǎn)移概率實(shí)現(xiàn),螞蟻從背景音樂特征移到特征的概率計(jì)算公式為:
式中:為啟發(fā)因子,根據(jù)背景音樂分類正確率估計(jì);表示在時(shí)刻背景音樂特征與的路徑上的信息素濃度;為螞蟻移動(dòng)過程中的節(jié)點(diǎn)禁忌表。
(2) 螞蟻完成一輪背景音樂特征搜索后,路徑上的信息濃度需要進(jìn)行更新,具體為:
式中:表示迭代數(shù);表示信息素殘留因子;為適應(yīng)度函數(shù)值;為一常數(shù)。
(3) 時(shí)刻時(shí),螞蟻找到第個(gè)背景音樂重要特征后,當(dāng)進(jìn)行第個(gè)特征搜索時(shí),對(duì)前面?zhèn)€特征集合進(jìn)行精細(xì)搜索,的任意子集為且有那么應(yīng)該滿足如下條件:
(4) 若連續(xù)3次增加背景音樂特征時(shí),的值沒有太大變化,那么說明此時(shí)背景音樂特征可以表示原始背景音樂特征信息,它們?yōu)樽钪匾谋尘耙魳诽卣鳌?/p>
蟻群優(yōu)化算法篩選背景音樂特征的流程圖如圖3所示。
4 背景音樂分類器的設(shè)計(jì)
采用BP神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)背景音樂分類器,其學(xué)習(xí)過程具體為:
BP神經(jīng)網(wǎng)絡(luò)通過對(duì)權(quán)值和閾值進(jìn)行自動(dòng)調(diào)整,使得誤差最小,從而結(jié)束學(xué)習(xí),并輸出相應(yīng)的結(jié)果。
5 實(shí)驗(yàn)結(jié)果與分析
為了分析基于情感特征的背景音樂分類效果,選擇一些背景音樂數(shù)據(jù)作為實(shí)驗(yàn)對(duì)象,背景音樂有4種類型,分別為高興、悲傷、痛苦、舒緩,采集的每一種類型背景音樂樣本數(shù)量如表1所示。
選擇文獻(xiàn)[11?12]的音樂分類方法進(jìn)行對(duì)比實(shí)驗(yàn),均執(zhí)行5次仿真實(shí)驗(yàn),選擇最高正確率為最終背景音樂分類的正確率,同時(shí)統(tǒng)計(jì)3種分類方法的平均分類時(shí)間(單位:s),結(jié)果如表2所示。
對(duì)表2的實(shí)驗(yàn)結(jié)果進(jìn)行分析,可以得到如下結(jié)論:
(1) 對(duì)比方法的背景音樂分類正確率低于本文分類方法,分類錯(cuò)誤數(shù)比較多,說明對(duì)比方法不能很好地描述背景音樂分類的信息,難以準(zhǔn)確區(qū)別背景音樂的類型。
(2) 本文方法的背景音樂分類正確率高于對(duì)比方法,大幅度降低了背景音樂的錯(cuò)識(shí)分類數(shù),主要是由于本文方法引入了情感特征,豐富了背景音樂的信息量,獲得了更優(yōu)的背景音樂分類結(jié)果。
(3) 相對(duì)于對(duì)比方法,本文方法的背景音樂平均分類時(shí)間最少,加快了背景音樂的分類速度,可以用于大規(guī)模背景音樂的檢索,實(shí)際應(yīng)用價(jià)值更高。
6 結(jié) 語
為了正確區(qū)分背景音樂的類別,提出基于情感特征的背景音樂分類方法。針對(duì)當(dāng)前方法忽略情感特征的作用,提取多種情感特征作為背景音樂分類特征向量,引入蟻群算法對(duì)特征進(jìn)行篩選,降低了特征維數(shù),簡(jiǎn)化了背景音樂分類器的結(jié)構(gòu),神經(jīng)網(wǎng)絡(luò)建立了背景音樂分類器,實(shí)驗(yàn)結(jié)果表明,該方法可以快速、準(zhǔn)確地區(qū)別各種類型的背景音樂,分類正確率要高于其他音樂分類方法,具有明顯的優(yōu)越性。
參考文獻(xiàn)
[1] DUNKER P, NOWAK S, BEGAU A, et a1. Content based mood classification for photos and music: a generic multi?modal classification framework and evaluation approach [C]// Procee?ding of the 1st ACM International Conference on Multimedia Information Retrieval. Vancouver: ACM, 2008: 97?104.
[2] YANG Y H, LIU C C, CHEN H H. Music emotion classification: a fuzzy approach [C]// Proceedings of the 14th Annual ACM international Conference on Multimedia. Santa Barbara: ACM, 2006: 81?84.
[3] YANG Y H, SU Y F, LIN Y C, et a1. Music emotion recognition: the role of individuality [C]// Proceedings of 2007 International Workshop. Augsburg: ACM, 2007: 13?21.
[4] 范勁松,方廷健.特征選擇和提取要素的分析及其評(píng)價(jià)[J].計(jì)算機(jī)工程與應(yīng)用,2001(13):95?99.
[5] 白亮,老松楊,陳劍,等.音頻自動(dòng)分類中的特征分析和抽取[J].小型微型計(jì)算機(jī)系統(tǒng),2005,26(11):2029?2034.
[6] 秦丹,馬光志.基于挖掘技術(shù)的音樂風(fēng)格識(shí)別系統(tǒng)[J].計(jì)算機(jī)工程與設(shè)計(jì),2005,26(11):3094?3096.
[7] 馬希榮,梁景蓮.基于情感音樂模版的音樂檢索系統(tǒng)研究[J].計(jì)算機(jī)科學(xué),2009,36(1):239?241.
[8] 陳功,張雄偉.一種基于灰關(guān)聯(lián)分析的語音/音樂分類方法[J].聲學(xué)技術(shù),2007,26(2):262?267.
[9] 石祥濱,趙健諭,劉芳,等.一種分段式音樂情感識(shí)別方法[J].小型微型計(jì)算機(jī)系統(tǒng),2012,33(8):1847?1850.
[10] 孟永輝,蔣冬梅,付中華,等.一種新穎的語言/音樂分割與分類方法[J].計(jì)算機(jī)工程與科學(xué),2009,31(4):106?109.
[11] 高林杰,張明.基于熵和支持向量機(jī)的音樂分類方法[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2014,23(5):83?88.
[12] 張燕,唐振民,李燕萍,等.基于MFCC和HMM的音樂分類方法研究[J].南京師范大學(xué)學(xué)報(bào)(工程技術(shù)版),2008(4):112?114.
[13] 王小鳳,耿國(guó)華,李鵬,等.一個(gè)基于相關(guān)反饋的神經(jīng)網(wǎng)絡(luò)音樂情感分類器構(gòu)建算法[J].西北大學(xué)學(xué)報(bào)(自然科學(xué)版),2012,42(1):30?35.