王 秀, 謝志成, 張 棟
(福州大學數學與計算機科學學院, 福建 福州 350116)
一種基于特征差異度和SVM投票機制的數字音樂語音情感識別算法
王 秀, 謝志成, 張 棟
(福州大學數學與計算機科學學院, 福建 福州 350116)
針對數字音樂語音情感識別問題, 提出一種基于特征差異度和SVM投票機制進行識別的方法. 該方法不僅降低了特征向量的維度, 而且保留了足夠的能夠描述數字音樂語音不同情感之間差異的特征. 同時, 該方法利用多個二分SVM分類器進行投票, 減少了每個分類器的權重, 從而降低了誤差. 實驗結果表明, 該方法能夠有效地提高識別準確率.
數字音樂語音; 情感識別; 支持向量機; 特征差異度
隨著科學技術的發展, 人們的娛樂生活越來越豐富多彩, 對于娛樂內容的要求也不斷提高. KTV作為娛樂的一種形式, 已經被人們廣為接受. 如何提高人們對于KTV服務質量的滿意程度也開始受到學術界和業界的廣泛關注. 目前, KTV系統已經可以對演唱者的音高、 音長等音準方面的因素進行評判和打分, 但是并不能評判演唱者的演唱是否帶有符合歌曲本身的情感, 導致評分反映不出演唱主觀質量, 這樣就會降低評分的準確性, 影響用戶的體驗. 針對上述情況, 本研究提出一種基于特征差異度(DBC, difference between characteristics)系數和SVM投票機制的數字音樂語音情感識別算法, 將識別結果加入評分系統中, 從而增加評分的主觀性. 語音情感識別方法的一般流程如圖1所示.

圖1 語音情感……