王倩



摘 要: 針對在云計算環境下海量音樂資源挖掘的定位檢索準確性不高的問題,對云計算環境下海量音樂資源的定位挖掘方法進行改進設計,提出基于自適應級聯檢索控制的海量音樂資源的高精度定位挖掘方法。首先對海量音樂資源庫的數據信息按關鍵詞和音樂類型進行語義特征分割和時間序列狀態空間重構,然后進行云計算環境下海量音樂資源的自相關特征提取,以提取的自相關特征為信息素導引進行高精度定位挖掘,采用自適應級聯檢索控制模型進行挖掘精度控制。最后進行仿真分析,結果表明,該方法能提高音樂資源的定位挖掘精度,提高資源利用率和檢索的數據查準率。
關鍵詞: 云計算環境; 海量音樂資源; 定位挖掘; 檢索控制
中圖分類號: TN911?34; TP391 文獻標識碼: A 文章編號: 1004?373X(2017)12?0019?03
Abstract: As the location retrieval accuracy of mining massive music resources in the cloud big data environment is not high, positioning mining method of massive music resources in cloud computing environment is improved, and a high?precision positioning mining method of massive music resources based on adaptive cascade retrieval control is proposed. The semantic feature segmentation and time series state space reconstruction of data information in massive music resource database are conducted according to the key words and music types, and then the self?correlation feature extraction of massive music resources in cloud computing environment is carried out. The extracted self?correlation features are taken as the pheromone guide to make high?precision positioning mining. The adaptive cascade retrieval control model is used to control the mining accuracy. The simulation analysis results show that this method can improve the positioning mining accuracy of music resources, resource utilization and data precision ratio.
Keywords: cloud computing environment; massive music resources; location mining; retrieval control
隨著大數據信息技術和云計算技術的發展,大量的音樂資源通過Deep Web數據庫的形式存儲于網絡空間中,提供給網絡用戶進行有償或者免費的下載[1]。對海量音樂資源的高效優化管理能提高音樂欣賞用戶的體驗,提高對音樂播放軟件的認可度,海量音樂資源信息庫是搜集、整理、收藏音樂資源并供人下載和播放的數據庫,結合音樂播放軟件實現音樂共享和傳播。在云計算環境下,需要對海量音樂資源進行高精度定位,對云計算環境下海量音樂資源進行優化配置和訪問控制,提高云計算環境下海量音樂資源的管理和檢索效率;因此研究音樂資源在云計算環境下的高精度定位挖掘方法具有重要意義。
1 海量音樂資源信息預處理
1.1 音樂資源信息語義特征分割
為了實現對云計算環境下海量音樂資源的高精度定位挖掘,需要進行語義特征分割,降低資源定位挖掘的計算開銷,采用自適應特征分割模型進行海量音樂資源庫的存儲音樂信息的數據特征重構和特征分割,去除冗余的信息特征[2?3]。音樂資源存儲區域按音樂的歌詞的關鍵詞和音樂類型進行語義特征分割。音樂類型的存儲本體特征通過自適應均衡分割方法被分為若干個(K個)數據子集,為云計算環境下海量音樂資源的語義特征并查集,滿足:。根據音樂的播放環境和流行程度,進行資源分布區間的網格模型構建,使得音樂資源存儲的狀態分布結構滿足,其中且。由此,采用決策樹模型構建音樂資源信息檢索和挖掘的特征訪問控制模型。在進行音樂資源信息語義特征分割中需要首先創建一個空節點root作為根節點,在匹配節點的父節點處創建語義特征分割的分支結構模型[4],并通過規則數據集匹配的音樂資源的存儲空間,進行節點匹配,搜索節點為root節點,以葉節點B:0.7為起始節點進行語義特征分割。在匹配節點的父節點處得到候選數據項為: ,以節點C:0.8中的BC為搜索節點,得到語義特征分割的自適應概率分布為0.7×0.8=0.56,由此構建壓縮的UF?tree決策樹模型,實現對云計算環境下的音樂資源信息存儲空間的語義特征分割如下:
式中:表示待匹配本體的關系模型;為到當前數據項在TID集的概率分布。云計算環境下海量音樂資源庫中的特征空間采樣數據集,根據音樂資源信息語義特征分割結果,進行了分布式特征重構分析。
式中,為云計算環境下的音樂資源檢索的統計頻次參量。通過自適應級聯檢索控制,挖掘音樂資源的候選項集和產生頻繁項集,提高對音樂的準確檢索和定位挖掘能力。具體算法描述如下:
輸入: 音樂資源搜索節點初始化參數,音樂資源定位挖掘的概率向量,候選集AllCandidate
輸出:音樂資源挖掘的繁項集和規則集FrequentItems
(1) group?dependen=new MapReduce framework (Null);
(2) parallel closed frequent T in DBgid
(3) LocalFPtree.insert_tree(T,LocalFPtree.root,G?List);
(4) file management item in nowGroup
//閉頻繁項集特征分解
{ Heap HP= Parallel FP?Growth ();
LocalFPtree.FPGrowth(mining large data.,item, HP);
//遍歷每條事務數據
Support=0.0f;
Add(candidateItem,FrequentItems)
End}
3 實驗測試分析
對海量音樂資源的定位挖掘仿真實驗建立在Hadoop云計算平臺上。仿真的硬件CPU為Intel? CoreTM i7?2600。采用Matlab仿真工具進行數學仿真,結合酷狗、QQ音樂軟件進行音樂資源的嵌入式訪問接口設計和兼容性數據庫存儲,音樂軟件通過100 MB以太網相連在互聯網中。對音樂資源進行語義特征分割的尺度為1.45,音樂資源的數據信息流采樣樣本長度為1 024,頻帶2~30 kHz、時寬3.6 ms,對DeepWeb數據庫中的海量音樂資源進行信息采樣和挖掘定位仿真。根據上述實驗環境設定,進行音樂資源的定位挖掘,以挖掘精度為測試評價指標,進行10 000次挖掘實驗,采用不同方法進行對比,得到挖掘精度對比結果如圖2所示。圖3為數據查準率對比。
據查準率對比
圖3給出了以酷狗音樂軟件為訪問接口,采用本文設計的音樂資源定位挖掘方法和傳統的挖掘方法進行音樂資源檢索的查準率對比。分析上述仿真實驗結果得知,采用本文方法進行云計算環境下海量音樂資源的定位挖掘的精度較高,信息檢索的查準率高于傳統方法,實現高精度的定位挖掘。
4 結 語
本文研究了在云計算環境下的音樂資源定位挖掘和優化檢索問題,提出基于自適應級聯檢索控制的海量音樂資源的高精度定位挖掘方法。并進行了實驗對比分析,從結果可知,采用本文方法對音樂資源進行挖掘時,器挖掘精度較高、檢索性能較好。
參考文獻
[1] 南洋,陳琳.基于客觀權重確定的數據中心網絡性能評估方法[J].計算機應用,2015,35(11):3055?3058.
[2] 汪中才,黎永碧.基于數據挖掘的入侵檢測系統研究[J].科技通報,2012,28(8):150?152.
[3] KARLSSON J, ROWE W, XU L, et al. Fast missing?data IAA with application to notched spectrum SAR [J]. IEEE transactions on aerospace electronic systems, 2014, 50(2): 959?971.
[4] BARNICH O, VAN D M. ViBe: a universal background subtraction algorithm for video sequences [J]. IEEE transactions on image processing, 2011, 20(6): 1709?1724.
[5] MOGHADAM A A, KUMAR M, RADHA H. Common and Innovative visuals: a sparsity modeling framework for video [J]. IEEE transactions on image processing, 2014, 23(9): 4055?4069.
[6] 曹玖新,陳高君,吳江林,等.基于多維特征分析的社交網絡意見領袖挖掘[J].電子學報,2016,44(4):898?905.
[7] 劉經南,方媛,郭遲,等.位置大數據的分析處理研究進展[J].武漢大學學報(信息科學版),2014,39(4):379?385.