999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

面向中文歌詞的音樂情感分類方法①

2019-08-22 02:30:04朱貝貝
計算機系統應用 2019年8期
關鍵詞:分類情感音樂

王 潔, 朱貝貝

(北京工業大學 信息學部,北京 100124)

1 引言

隨著計算機網絡與多媒體技術的快速發展,互聯網上涌現了越來越多的文本、圖像、音頻和視頻等多媒體數據. 音樂是多媒體數據的重要組成部分. 面對音樂作品數量的爆炸式增長,音樂種類的不斷增多,如何有效的管理音樂成為一個值得關注的問題,對音樂資源進行合理的分類是一個有效的解決辦法. 音樂是情感的載體,情感是音樂最重要的語義信息,音樂的情感分析廣泛應用于音樂檢索、音樂推薦和音樂治療等領域[1]. 音樂情感的自動識別屬于音樂心理學和計算機學科的交叉領域[2],至今已有十幾年的歷史,國內外眾多學者都對該領域做了深入的研究,并取得了一定成果.2010年,Kim等曾對當時音樂情感識別研究的進展做了全面綜述[3]. 2012年,Yang等對音頻音樂情感識別研究做了詳盡的總結[4]. 2017年,陳曉鷗等人回顧了最近幾年音頻音樂情感識別的研究進展情況,提出了若干問題及可能的解決方案[5].

音樂主要由音頻信號與歌詞文本這兩種模態的數據組成. 目前大多數研究者致力于使用機器學習方法研究音頻信息對音樂情感分類的作用[6-8]. 2003年,Li等提取音色、節奏和音階等音頻特征,并最早使用SVM (Support Vector Machine)對音樂情感分類[9].2014年,Weninger等提取MFCC (Mel Frequency Cestrum Coefficient)等底層音頻特征后,使用LSTM(Long Short-Term Memory)對音樂情感分類[10].2017年,Jakubik等使用GRU(Gated Recurrent Unit)對音頻進行特征學習,并引入語義嵌入的思想[11]. 同年,鄧永莉等提出基于中高層特征的音樂情感識別模型[12].

采用現有頻域和時域特征的機器學習方法,很難使音樂情感識別的性能再提高[5]. 一些心理學研究表明歌詞文本中確實蘊含著一些特有的語義信息,包括情感信息[13]. 結合歌詞進行音樂情感分類可以進一步提高分類性能,基于歌詞的情感分類也逐漸成為熱門的研究方向. 歌詞本質上屬于文本的范疇,詞語的情感判別是歌詞情感分析的基礎. 構建一部合理的音樂情感詞典,實現詞匯的情感分析是歌詞情感分析的前提和基礎. 國內情感詞典構建起步較晚,情感詞典的領域特性也日趨明顯. 已有研究構建的情感詞典主要集中在中文評論領域,如微博評論和商品評論,評論情感分析一般只判別情感極性,即褒貶性,而歌詞具有更加豐富的情感,目前還沒有被廣泛認可的音樂領域的中文情感詞典. 2010年,夏云慶等基于文本向量空間模型提出了情感向量空間模型,并利用實驗驗證了情感向量模型在解決稀疏性、特征表示能力、表示效率和特征歧義消除等方面具有較明顯的優勢[14]. 2014年,蔣盛益等利用 HowNet中語義相似度計算的思想,構建音樂領域的中文情感詞典,再進行音樂情感分類[15],2015年,Furuya等通過對非情感詞加權構造情感向量,使用聚類方法進行音樂情感分類[16]. 2017年,黃仁等基于Word2Vec建立情感詞典,用構建的情感詞典對互聯網商品評論進行情感分類[17],該詞典僅包含詞的情感極性,不包含詞的情感強度,沒有考慮情感詞本身的分類影響程度. 在基于歌詞文本的情感向量的構建過程中,夏云慶等僅統計每個情感類別的情感詞個數,忽略了情感詞的情感強度是不同的. 蔣盛益和Furuya等均未考慮實詞詞頻和詞性的影響作用.

針對以上問題,本文基于Word2Vec構建音樂領域的中文情感詞典,并基于情感詞加權和詞性進行中文音樂情感分析. 本文首先以VA情感模型為基礎構建情感詞表,采用Word2Vec中詞語相似度計算的思想擴展情感詞表,構建中文音樂情感詞典,詞典中包含每個詞的情感類別和情感權值. 然后,依照該詞典獲取情感詞權值,基于TF-IDF構造特征向量,并進一步考慮詞性對情感分類的影響,最終實現音樂情感分類.

2 基于歌詞的音樂情感分類

2.1 構建情感詞表

音樂是情感的載體,情感是音樂最重要的語義信息,不同的音樂必然與不同的情感相聯系. 為了更準確的描述音樂情感,與人的情感體驗一致,需要選擇合適的音樂情感模型.

選擇VA模型作為音樂情感分類的依據. VA模型(也稱為環形情感模型)是由Russel提出的,是廣泛采用的通用連續維度模型[18,19]. 該模型認為情感狀態是分布在一個包含效價度(valence)和激活度(arousal) 的二維環形空間上的點,如圖1所示. 其中橫軸表示效價度,縱軸表示激活度,圓心代表中性的效價度和中等水平的激活度.

為了適應中文情感分類,結合VA模型的情感類別以及音樂表達情感的特點構建情感詞表. 情感詞表如表1所示,第1列為情感類別,即本文用于情感分類的標簽. 其它列為對應每一個情感類別的情感詞匯.

2.2 中文音樂情感詞典

情感詞表中的詞是經過提煉而成的情感詞,而歌詞中包含的情感詞是有限的,因此,需要對情感詞表進行擴展以滿足歌詞情感分類的需求. 借助Word2Vec計算詞語相似度,使用《哈工大同義詞林》和歌詞語料庫對情感詞表的38個情感詞匯進行擴展,從而構建出一部適用于中文歌詞情感分類的詞典,用于歌詞文本分析.

2.2.1 計算詞語相似度

情感詞一般是指能表達情感的形容詞,如“喜悅”、“悲傷”、“憤怒”. 歌詞中包含的情感詞較少,而歌詞中的某些非情感詞也能表達情感. 比如,“夜”可以表達“靜”的情感,“告別”可以表達“悲傷”的情感. 因此,可以通過計算有情感傾向的實詞(包括名詞、動詞、形容詞和副詞)與情感詞表中的情感詞匯的詞語相似度,對實詞進行情感分類,從而實現對情感詞表的擴展.

表1 情感詞表

采用Gensim的Word2Vec進行相似度計算,并用搜狗實驗室的語料數據訓練模型. 因為該語料庫規模較大,訓練好的模型可以涵蓋盡可能多的詞語. 因此,可以利用訓練好的模型計算任意兩個詞語的相似度,相似度值在0-1之間.

2.2.2 構建音樂情感詞典

首先使用《哈工大同義詞林》對情感詞表進行擴展,構建基礎情感詞典. 并結合歌詞語料庫對基礎情感詞典做進一步擴展,構建音樂情感詞典.

使用《哈工大同義詞林》對情感詞表進行擴展,擴展后的詞典僅包含情感詞,稱為基礎情感詞典. 首先,從《哈工大同義詞林》獲取情感模型中的情感詞對應的同義詞列表. 然后,計算同義詞列表中的實詞與情感詞的詞語相似度,選擇相似度值最大的情感詞與實詞對應. 最后,提取相似度高于0的實詞構成基礎情感詞典. 實現過程如圖2所示. 情感詞典的存儲結構為四元組(實詞,情感詞,情感類別,情感權值),比如(傷感,憂傷,-V-A,0.91). 其中,“傷感”是選自《哈工大同義詞林》的實詞; “憂傷”是選自情感詞表的情感詞; “-V-A”是“憂傷”對應的情感類別; 0.91對應于情感權值,即“憂傷”與“傷感”的詞語相似度. 基礎情感詞典共包含1527個詞匯,其中4類情感的詞匯量分布情況如表2所示.

圖2 基礎情感詞典構建流程

表2 基礎情感詞典詞匯量分布

基礎情感詞典僅包含情感詞,而歌詞中所包含的情感詞較少,但歌詞中的某些非情感詞也有情感傾向.因此可以利用包含一萬首中文歌曲的歌詞語料庫對基礎情感詞典做進一步擴展,以更適用于中文歌詞情感分類,擴展后的詞典稱為音樂情感詞典. 首先,將歌詞語料庫中的歌詞進行處理,并提取實詞構建歌詞詞匯語料庫. 然后,計算歌詞詞匯語料庫中的實詞與情感詞的詞語相似度,選擇相似度值最大的情感詞與實詞對應. 最后,提取相似度高于0的實詞與基礎情感詞典合并,構成音樂情感詞典. 實現過程如圖3所示. 音樂情感詞典的存儲結構與基礎情感詞典相同. 音樂情感詞典共包含45 374個詞匯,其中4類情感的詞匯量分布情況如表3所示.

圖3 音樂情感詞典構建流程

表3 音樂情感詞典詞匯量分布

2.3 構建基于歌詞的特征向量

本文依照所構建的情感詞典獲取情感詞權值,基于TF-IDF構造特征向量,并進一步考慮詞性對情感分類的影響,將特征向量擴展到16個維度.

2.3.1 TF-IDF

基于情感向量模型,采用情感詞表的4類情感類別作為音樂的情感特征向量,共4個維度. 該特征向量的每個維度表示音樂與每類情感的相似關系. 將歌詞中的實詞與情感詞典進行匹配,可以得到每個實詞的情感類別和情感權值,從而計算出每個情感類別的統計值.

采用TF-IDF規則計算情感特征. TF-IDF是一種統計方法,TF表示詞頻,可以評估歌詞中某個實詞在特定歌詞文件中的的情感重要程度. IDF表示逆向文件頻率,可以評估某個實詞對于區分特定歌詞文件和其他歌詞文件的情感重要性.

對于歌詞文本中的實詞ti,tf(ti)表示ti對情感類別的重要程度,反映出一個實詞在特定歌詞文件中的局部統計特征. si表示ti在情感詞典中對應實詞的情感權值,如果ti匹配失敗,si值為0. ni,j表示ti在該歌詞文本中的出現次數. N表示該篇歌詞經過分詞后得到的詞語總數.

IDF由式(2)計算:

對于歌詞文本中的實詞ti,idf(ti)表示ti對于區分特定歌詞文件和其他歌詞文件的情感重要性. |D|表示歌詞文檔總數表示歌詞中出現ti的歌詞文檔數.

歌詞文本的特征向量表示為:

其中,c表示情感類別數,特征向量的每個維度由式(4)計算:

其中,ek表示特征向量第k維度對應的情感類別,lyric表示歌詞經過分詞后得到的詞語.

2.3.2 詞性

不同的詞性表達情感的能力是不同的,比如,形容詞比名詞表達的情感更豐富. 因此,本文將結合詞性信息構造特征向量. 我們將每篇歌詞文本經過分詞后得到的詞語根據詞性分為4類,每類詞性對應的特征向量如式(5)所示. 將4類詞性的特征向量結合得到最終的特征向量,如式(6)所示.

2.4 歌詞情感分類

音樂情感分類通常采用標準的監督學習模型,如K近鄰(KNN)、高斯混合模型(GMM)和支持向量機(SVM). 本文采用KNN分類算法用于歌詞情感分類.

KNN的核心思想是如果一個樣本在特征空間中的k個最相鄰的樣本中的大多數屬于某一個類別,則該樣本也屬于這個類別,其中k通常是不大于20的整數.

選擇中文歌詞數據集中的80%作為訓練集,20%作為測試集. 利用KNN分類的思想,對每個測試樣例,計算它與所有訓練樣例之間的情感特征向量的歐幾里德距離,以確定其最近鄰列表,選擇最近鄰中出現次數最多一個類別作為測試樣例的類別. 在本文實驗中,當k=5時分類效果最佳.

3 實驗結果及分析

3.1 數據集

數據集是200篇情感類別鮮明的中文歌詞文檔,每個情感類別約50篇. 每篇歌詞的情感標簽由多個人進行標記,選擇標記人數最多的類別作為該歌詞的標簽.

3.2 評價指標

本文使用準確率、精確率、召回率和F值來評價分類效果. 以情感類別“-V-A”為例,正類(Positive)表示該歌詞的預測結果是“-V-A”,負類(Negative)表示該歌詞的預測結果不是“-V-A”. TP,FP,TN和FN的具體含義如表4所示. 則準確率A、精確率P、召回率R、F值的計算公式如下:

表4 TP,FP,TN和FN含義表

3.3 實驗結果與評價

本文做了兩組對比實驗,所有實驗均使用相同的數據集. 第一組對比實驗中,情感詞典的選擇不同,分別使用2.2.2節構造的基礎情感詞典和音樂情感詞典,構造特征向量均考慮詞性的影響. 實驗結果如表5所列. 可以看出,基于音樂情感詞典的中文歌詞情感分類能夠達到更好的效果,所有情感類別的準確率以及4種情感類別的精確率、召回率和F值均高于基礎情感詞典. 同時,實驗結果表明,基于歌詞的音樂情感分類更適用于“+V+A”和“-V+A”這兩類情感的識別.

第二組對比實驗中,特征向量的構造方式不同,均使用2.2.2節構造的音樂情感詞典. 實驗結果如表6所列. 可以看出,在構造特征向量時考慮詞性的影響可以提高所有情感類別的準確率,“-V+A”和“-V-A”的評價指標值都有一定提高.

表5 情感詞典對比實驗結果(%)

表6 特征向量對比實驗結果(%)

4 結論與展望

本文基于Word2Vec構建音樂領域的中文情感詞典,并基于情感詞加權和詞性進行中文音樂情感分析.首先以VA情感模型為基礎構建情感詞表,采用Word2Vec中詞語相似度計算的思想擴展情感詞表,構建中文音樂情感詞典,詞典中包含每個詞的情感類別和情感權值. 然后,依照該詞典獲取情感詞權值,基于TF-IDF構造特征向量,并進一步考慮詞性對情感分類的影響,最終實現音樂情感分類. 實驗結果表明基于所構建的音樂情感詞典進行中文歌詞情感分類能夠達到更好的效果,同時在構造特征向量時考慮詞性的影響也可以提高準確率. 但基于歌詞的音樂情感分類更適用于“+V+A”和“-V+A”這兩類情感的識別. 今后將研究結合歌詞與音頻的多模態融合的音樂情感分類,以實現多個信息源互補,從而提高所有情感類別的分類精度.

猜你喜歡
分類情感音樂
分類算一算
如何在情感中自我成長,保持獨立
失落的情感
北極光(2019年12期)2020-01-18 06:22:10
情感
分類討論求坐標
如何在情感中自我成長,保持獨立
數據分析中的分類討論
圣誕音樂路
兒童繪本(2017年24期)2018-01-07 15:51:37
教你一招:數的分類
音樂
主站蜘蛛池模板: 亚洲av无码成人专区| 人妻中文久热无码丝袜| 国产农村精品一级毛片视频| 国产成人高清精品免费软件| 大学生久久香蕉国产线观看| 精品国产一区二区三区在线观看 | 亚洲人成色在线观看| 日本免费一级视频| 99ri国产在线| 亚洲一级毛片在线观播放| 在线看国产精品| 日本欧美成人免费| 国产成年女人特黄特色毛片免| 国产精品熟女亚洲AV麻豆| 国产精品性| 亚洲精品国产日韩无码AV永久免费网| 久久人午夜亚洲精品无码区| 久久精品人人做人人爽| 亚洲丝袜中文字幕| 亚洲综合精品香蕉久久网| 99在线观看国产| 在线色综合| 欧美午夜小视频| 久久久精品无码一二三区| 特级精品毛片免费观看| 国产女同自拍视频| 国产乱人视频免费观看| 国产精品嫩草影院视频| 中文字幕亚洲专区第19页| 伊人91视频| 成人噜噜噜视频在线观看| 国模视频一区二区| 91系列在线观看| 91国内在线观看| 中文字幕在线日本| 日韩av在线直播| 国产成人综合在线视频| 青青青视频蜜桃一区二区| 久久影院一区二区h| 一级毛片基地| 亚洲精品视频在线观看视频| 三上悠亚在线精品二区| 欧美精品一二三区| 精品国产成人三级在线观看| 欧美成人午夜影院| 经典三级久久| 久无码久无码av无码| 国产不卡网| 白丝美女办公室高潮喷水视频| 很黄的网站在线观看| 婷婷色丁香综合激情| 亚洲国产天堂久久九九九| 国产Av无码精品色午夜| 人人91人人澡人人妻人人爽| 国产精品一老牛影视频| 久久国产亚洲欧美日韩精品| 国产极品美女在线播放| 成人午夜久久| 久综合日韩| 超清人妻系列无码专区| 精品无码日韩国产不卡av| 亚洲欧美在线看片AI| 亚洲国产AV无码综合原创| 久久久成年黄色视频| 国产亚洲精品自在久久不卡 | 国产成人做受免费视频| 四虎免费视频网站| 99人妻碰碰碰久久久久禁片| 国产主播在线观看| 欧美一级夜夜爽www| 免费国产福利| 久久青草免费91线频观看不卡| 激情综合网激情综合| 亚洲精品图区| 国产毛片网站| 熟妇无码人妻| 手机永久AV在线播放| 91久久天天躁狠狠躁夜夜| 亚洲人成网站在线观看播放不卡| 国产在线视频欧美亚综合| 欧美亚洲综合免费精品高清在线观看 | 亚洲精品爱草草视频在线|