999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于關聯規則數據挖掘技術在音樂分類中應用

2020-03-03 13:20:44張婷婷
現代電子技術 2020年1期
關鍵詞:數據挖掘

摘 ?要: 為了提高音樂分類的精準性及個性化,提出基于關聯規則的數據挖掘技術在音樂分類中的使用,解決單一軌道提取的局限性問題。首先,對音樂文件預處理進行分析,主要包括提取主旋律、分析和聲;之后,對基于FP_Growth關聯規則挖掘算法的音樂風格進行分析。因為FP_Growth算法只需要掃描兩遍原始數據,對原始數據進行壓縮具有較高的效率,所以將FP_Growth關聯規則挖掘算法應用于音樂媒體的風格分類中,并且創建基于FP_Growth關聯規則挖掘的音樂風格分類,減少所需頻繁項集的數量,從而提高數據庫掃描速度,在此過程中不需要候選項集,實現音樂分類過程中的數據挖掘;最后,對數據挖掘的效率進行Matlab測試,測試結果表示,相比基于LAD和Apriori算法的音樂風格分類,基于FP_Growth的音樂風格分類減少了I/O開銷,提高了運行效率和分類的精準性。

關鍵詞: 音樂分類; 數據挖掘; 關聯規則算法; 音樂風格分析; 主旋律提取; FP_Growth

中圖分類號: TN911.1?34; TP393 ? ? ? ? ? ? ? ? ? 文獻標識碼: A ? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2020)01?0099?03

Application of data mining technology based on association rules

in music classification

ZHANG Tingting

Abstract: In order to improve the accuracy and individualization of music classification, the application of data mining technology based on association rules in music classification is proposed to solve the limitation problem of single track extraction. The preprocessing of music files is analyzed, including extraction of the main melody and analysis of harmony. Then, the music style based on FP_Growth association rules mining algorithm is analyzed. Because the FP_Growth algorithm only needs to scan the original data twice, it is more efficient to compress the original data, so the FP_Growth association rule mining algorithm is applied to the style classification of music media, and the music style classification based on FP_Growth association rules mining is created to reduces the number of the needed frequent itemsets, so as to improve the scanning speed of the database. There is no need of candidate itemsets in this process for realization of the data mining in the process of music classification. The efficiency of data mining is tested with Matlab. The test results show that, in comparison with the music style classification based on LAD and Apriori algorithms, the music style classification based on FP_Growth algorithm can reduce the overhead of I/O, and improve the running efficiency and the classification accuracy.

Keywords: music classification; data mining; association rule algorithm; music style analysis; main melody extraction; FP_Growth

0 ?引 ?言

數字化技術的發展導致音樂產業發生了翻天覆地的變化,傳統模式的音樂運營已經逐漸銷聲匿跡,依托互聯網平臺的數字音樂產業已經成為現今社會的主流。隨著創新型個性化服務產業的發展,要求數字音樂媒體需要根據用戶的興趣不同,推薦符合其喜好風格的音樂,但是互聯網平臺中的音樂數據文件是海量的,如何在大規模音樂文件數據庫中進行風格分類是現階段研究的熱點問題[1?3]。

目前,主流的研究方向是采用數據挖掘技術實現音樂風格分類,例如文獻[4]提出基于LDA主體挖掘模型的音樂推薦算法,實現了基于音頻信息的音樂推薦以及協同過濾。文獻[5]提出基于特征旋律挖掘的二階馬爾可夫鏈算法,該算法是在關聯規則挖掘Apriori算法的基礎上引入特征旋律挖掘(Interval Sequence Mining,ISM)來實現音樂作曲風格訓練。常見的挖掘頻繁項集算法有兩類[5?9]:一類是Apriori算法;另一類是FP_Growth算法。因此,本文提出將FP_Growth關聯規則挖掘算法應用于音樂媒體的風格分類任務中,可有效提高數據庫掃描的速度且無需候選項集。此外,采用多維度數據庫中數據結構Skyline算法[10]提取多軌道的音頻媒體文件的主旋律,并進行和弦構成分析。

1 ?音樂媒體文件的預處理

1.1 ?主旋律提取

主旋律是音樂風格劃分的關鍵因素,直接影響后續分類算法的性能,是一個重要的預處理環節。目前,較為典型的主旋律提取算法是Skyline旋律提取算法,但是Skyline算法只能實現單一軌道的旋律提取,因此對每個軌道執行Skyline算法。具體通過如下公式對音軌[ci]的平均音調值[pi]進行計算:

[pi=j=1npijn] ? (1)

式中:[pij]表示音軌[ci]中音符[j]的音調值;[n]為音軌[ci]中音符的個數。

然后將每個音軌上音符的音調值做12維映射投影[10],每個統計表如下所示:

[hi=(hi1,hi2,…,hi12)] (2)

對于一個音樂媒體文件來說,12維映射的整體統計表示為:

[h=(h1,h2,…,h12)] (3)

其中:

[hi=j=1ChiCC] (4)

式中[C]表示音樂媒體文件中的音軌數量。

通過式(5)計算[hi=(hi1,hi2,…,hi12)]和[h=(h1,h2,…,h12)]之間的歐幾里得距離:

[edistj=i=112hij-hj2] (5)

在上述距離差計算結果的基礎上對兩個音軌進行簇劃分[11],判斷方式如下:

[edisti-edistj<δ for ?hi,hj] (6)

式中[δ]表示設定的閾值。如果任意兩個音軌[hi,hj]之間的歐幾里得距離滿足式(6)的條件,則表示這兩個音軌屬于同一簇。

1.2 ?和聲分析

設定[ni],[ni+1]分別表示不同的音符,[ei],[ei+1]分別表示兩個音符的停止時刻,[si],[si+1]分別表示兩個音符的開始時刻,則兩個音符和聲的表示方式為:

[ni,ni+1si≤si+1,ei>ei+1] (7)

[ni],[ni+1]的音程計算方式如下:

[Ii,i+1=pi-pi+1] (8)

式中[pi]和[pi+1]分別表示兩個音符的音調值。

此外,利用頻繁與不頻繁的統計來實施音樂的分箱操作[12],方式如下:

[fi=frequenet, ? ?f(xi)>δinot, ? ?else] (9)

式中[f(xi)]表示頻度。

2 ?基于FP_Growth關聯規則挖掘算法的音樂風格分類

關聯規則是指形如[X→Y]的表達式。關聯規則挖掘Apriori算法需要通過不斷地構造候選集、篩選候選集挖掘出頻繁項集,需要多次掃描原始數據,當原始數據較大時,磁盤I/O次數太多,效率比較低下。不同于Apriori算法的“試探”策略,作為一種常見的挖掘頻繁項集算法,FP_Growth算法只需掃描原始數據兩遍,通過FP?tree數據結構對原始數據進行壓縮,效率較高[13]。因此,將FP_Growth關聯規則挖掘算法應用于音樂媒體的風格分類任務中。

令[I=i1,i2,…,id]表示音樂數據中所有項的集合,而[T=t1,t2,…,tN]表示所有事務的集合。每個事務[ti]包含的項集都是[I]的子集。

在關聯分析中,支持度(support)和置信度(confidence)[14?15]的具體表示方式為:

[s(X→Y)=σ(X?Y)N] (10)

[c(X→Y)=σ(X?Y)σ(X)] (11)

式中[N]表示事務的數量。

本文提出的音樂分類方式的支持度計算方式如下:

[s={xx∈D,rulei∈x}] (12)

式中:[D]表示訓練數據集;[rulei]為[D]的規則。在關聯分析中集合被視為項集(itemset)。

基于FP_Growth關聯規則挖掘的音樂風格分類的核心步驟是構建FP?tree樹節點,以便減少所需頻繁項集的數量。事務型數據庫的示例如表1所示,FP_tree樹的節點結構如圖1所示,其構造FP_tree樹的每個節點的結構體代碼如下:

class TreeNode {

private:

int32 N_Nodes; ?//節點名稱

int Numbers; ?//支持度計數

TreeNode *P_Nodes; ?//父節點

Vector C_Nodes; //子節點

TreeNode *Ner_Nodes; ?//指向同名節點

}

3 ?仿真結果

實驗數據庫為互聯網音樂平臺中隨機選取的500首音樂文件,共包括6種音樂風格類型(POP,ROCK,JAZZ,METAL,BLUES,FOLK)。所有實驗運行環境配置信息為:操作系統為Windiws 10,CPU為Intel Pentium4@2.4 GHz,內存為4 GB DDR SDRAM,硬盤為7 200轉的500 GB IDE硬盤。

將基于FP_Growth關聯規則挖掘算法的音樂風格分類方法與基于LAD主題[4]、Apriori算法[5]的音樂風格分類方法進行對比分析。針對相同的音樂數據庫,當置信度為56%時,在支持度分別為0.4%,0.5%,0.6%,0.8%,1.0%,1.2%和1.5%的情況下,三種方法的運行時間比較結果如圖2所示。

從圖2可以看出,隨著支持度逐漸增大,三種方法的運行時間均逐漸減少。但是在支持度較小時,本文提出音樂風格分類方法具有明顯的效率優勢,在0.4%最小支持度時,本文方法運行時間約為其他兩種方法的35%。這是因為基于FP_Growth關聯規則挖掘算法的音樂風格分類方法在支持度很小的情況下仍只掃描兩次數據庫,即I/O開銷較小,而其他兩種方法會隨著選項集的長度變大而增加I/O開銷。

三種音樂風格分類方法的準確性對比結果如表2所示。可以看出,相比于其他兩種方法,基于FP_Growth關聯規則挖掘算法的音樂風格分類方法的準確率更高,分類準確率提高約2%。

4 ?結 ?語

本文提出一種高效的適用于音樂媒體分類的FP_Growth關聯規則數據挖掘方法,在單一軌道旋律提取的基礎上,采用多維度數據庫中數據結構Skyline算法提取多軌道的音頻媒體文件的主旋律。仿真測試結果顯示,基于FP_Growth關聯規則挖掘算法的音樂風格分類方法的性能表現(在運行時間和準確度方面)較為突出,勝過其他所有的方法。但是在某些類型的音樂識別中表現欠佳,例如ROCK風格類型,后續將針對該方面進行側重分析。

參考文獻

[1] DENG J J, LEUNG C H C, MILANI A, et al. Emotional states associated with music: classification, prediction of changes, and consideration in recommendation [J]. ACM tran?sactions on interactive intelligent systems, 2015, 5(1): 1?36.

[2] KOUR G, MEHAN N, KOUR G, et al. Music genre classification using MFCC, SVM and BPNN [J]. International journal of computer applications, 2015, 112(6): 12?14.

[3] CHOI K, LEE J H, HU X, et al. Music subject classification based on lyrics and user interpretations [J]. Proceedings of the association for information science & technology, 2016, 53(1): 1?10.

[4] 李博,陳志剛,黃瑞,等.基于LDA模型的音樂推薦算法[J].計算機工程,2016,42(6):175?179.

[5] 鄭銀環,王嘉珺,郭威,等.基于特征旋律挖掘的二階馬爾可夫鏈在算法作曲中的研究與應用[J].計算機應用研究,2018,35(3):849?853.

[6] NAJI M, FIROOZABADI M, AZADFALLAH P. Emotion classification during music listening from forehead biosignals [J]. Signal image & video processing, 2015, 9(6): 1365?1375.

[7] BANIYA B K, LEE J. Importance of audio feature reduction in automatic music genre classification [J]. Multimedia tools & applications, 2016, 75(6): 1?14.

[8] KHONGLAH B K, PRASANNA S R M. Speech/music classification using speech?specific features [J]. Digital signal proces?sing, 2016, 48(3): 71?83.

[9] RODRIGUES F A. A survey on symbolic data?based music genre classification [J]. Expert systems with applications, 2016, 60(3): 190?210.

[10] FARROKHMANESH M, HAMZEH A. Music classification as a new approach for malware detection [J]. Journal of computer virology & hacking techniques, 2018(2): 1?20.

[11] ULAGANATHAN A S, RAMANNA S. Granular methods in automatic music genre classification: a case study [J]. Journal of intelligent information systems, 2018(23): 1?21.

[12] ROSNER A, KOSTEK B. Automatic music genre classification based on musical instrument track separation [J]. Journal of intelligent information systems, 2017(2): 1?22.

[13] 王建明,袁偉.基于節點表的FP?Growth算法改進[J].計算機工程與設計,2018,39(1):140?145.

[14] WANG B, DAN C, SHI B, et al. Comprehensive association rules mining of health examination data with an extended FP?Growth method [J]. Mobile networks & applications, 2017, 22(2): 1?8.

[15] KHONGLAH B K, PRASANNA S R M. Clean speech/speech with background music classification using HNGD spectrum [J]. International journal of speech technology, 2017, 20(6): 1?14.

作者簡介:張婷婷(1983—),女,甘肅平涼人,碩士,講師,主要研究方向為音樂教育理論。

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 精品一区二区三区四区五区| 亚洲日韩在线满18点击进入| 亚洲欧美成人影院| 免费看a毛片| 制服丝袜一区| 日本高清在线看免费观看| 欧美不卡视频在线| 国产精品xxx| 久久性视频| 乱人伦视频中文字幕在线| 老司机久久精品视频| 2021国产在线视频| 国产99精品久久| 特级aaaaaaaaa毛片免费视频| 四虎免费视频网站| 精品久久香蕉国产线看观看gif| 夜夜拍夜夜爽| 中国精品久久| 99热最新网址| 国产日韩久久久久无码精品 | 亚洲第七页| 亚洲最大福利网站| 国产福利在线免费| 久久伊人久久亚洲综合| 一级爱做片免费观看久久 | 亚洲国产看片基地久久1024| 亚洲第一成年人网站| 尤物午夜福利视频| 美女一级毛片无遮挡内谢| 亚洲精品在线观看91| 色久综合在线| 精品欧美一区二区三区久久久| 热99精品视频| 97视频精品全国在线观看| 日韩精品专区免费无码aⅴ| 影音先锋丝袜制服| 无码人妻热线精品视频| 亚洲视频三级| 亚洲国产av无码综合原创国产| 精品无码国产自产野外拍在线| 国产成人啪视频一区二区三区| 99热这里只有精品免费| 青青草国产一区二区三区| 91在线播放免费不卡无毒| 亚洲天堂久久久| 亚洲AⅤ波多系列中文字幕| 亚洲最大看欧美片网站地址| 日韩精品成人在线| 国产精品美女在线| 精品无码一区二区三区电影| 久久久久国产一级毛片高清板| 国产亚洲精品精品精品| 国产无遮挡猛进猛出免费软件| 福利视频一区| 曰AV在线无码| 99久久精品免费观看国产| 欧美成人怡春院在线激情| 久久成人免费| 伊人久久精品无码麻豆精品| 成年A级毛片| 伊人福利视频| 国产专区综合另类日韩一区 | 亚洲欧美日韩中文字幕在线| 伊人久久大香线蕉影院| 91久久天天躁狠狠躁夜夜| 香蕉在线视频网站| 91久久精品日日躁夜夜躁欧美| 亚洲国产看片基地久久1024| 天天综合色网| 91久久国产综合精品女同我| 中文字幕在线欧美| 热久久国产| 成年人视频一区二区| 欧美成人手机在线视频| 97国产一区二区精品久久呦| 国模视频一区二区| 婷婷色一二三区波多野衣| 色AV色 综合网站| 欧美a级在线| 日韩天堂网| 午夜不卡福利| 99精品福利视频|