


摘 要 在云計算環境下進行分布式數據挖掘系統設計,提高數據的并行網格式調度和計算能力,傳統的數據挖掘方法采用關聯特征匹配方法,當數據存儲空間中干擾強度較大時,數據挖掘的精度不高。在云計算環境下,提出一種基于分布式自適應特征調度和高階累積量后置聚焦的數據挖掘算法,并在嵌入式Linux的內核下進行數據挖掘系統設計。首先進行了云計算的分布式數據結構分析和數據挖掘算法設計,然后進行分布式數據挖掘系統設計,系統包括程序加載模塊、數據存儲模塊、數據緩存調度模塊和數據通信傳輸模塊等。實驗結果表明,采用該方法進行基于云計算的分布式數據挖掘,數據挖掘的準確配準性能較好,系統的可靠性較好。
【關鍵詞】云計算 數據挖掘 系統設計
隨著網絡大數據信息處理技術的發展,對數據處理的規模不斷增大,對數據信息處理的精度要求不斷提升,采用云計算進行數據分布式網格計算,能提高數據的并行處理和調度性能,根本上提高數據的計算速度,因此,云計算成為未來大數據信息處理的主要趨勢。在云計算環境下進行數據挖掘,是進行大數據信息特征提取和數據開采的基本技術,相關的算法研究受到人們的重視。
文獻采用云計算環境下分布式數據模糊C均值聚類的挖掘算法,在受到較強的毗連特征干擾時,數據挖掘的精度不高。針對上述問題,本文提出一種基于分布式自適應特征調度和高階累積量后置聚焦的數據挖掘算法,并進行了仿真實驗性能分析,得出了較好的數據挖掘效果的結論。
1 基于云計算的分布式數據挖掘算法設計
為了實現對基于云計算的分布式數據挖掘系統設計,其中,數據挖掘算法設計是關鍵,本文提出一種基于分布式自適應特征調度和高階累積量后置聚焦的數據挖掘算法,假設數據信息流為,數據信息流通過噪聲濾波,得到數據流聚類相似性函數表示為,其是一組準平穩隨機的時間序列,對數據庫中的存儲信息流進行能量譜密度特征提取,得到輸出數據x(t)的第n個寬頻帶分量,分布式自適應特征調度模型表示為:
2 嵌入式Linux的內核下數據挖掘系統設計描述
在上述進行了算法設計的基礎上,進行數據挖掘系統的軟件開發設計,基于云計算的分布式數據挖掘系統總體模型中,采用ST 超低功耗 ARM CortexTM-M0 微控制器,系統建立在嵌入式Linux的內核平臺上,系統包括程序加載模塊、數據存儲模塊、數據緩存調度模塊和數據通信傳輸模塊等,通過配置CAN_IMASK寄存器,采用LabWindows/CVI進行數據遠程控制和信息通信,基于云計算的分布式數據挖掘系統給用戶提供一個簡單、統一的系統調用接口,系統可配置4路組聯合Cache,基于云計算的分布式數據挖掘系統的寄存器系統時鐘120 MHz。嵌入式Linux的內核下數據挖掘系統通過VISA軟件接口發送Flash設備上的文件系統內核到HP E1562D/E SCSI數據硬盤進行數據存儲,調用s3c2440_adc_read()函數,進行程序加載和基于云計算的分布式數據挖掘系統的嵌入式控制,使用Qt/Embedded作為GUI,利用開源Linux操作系統的豐富網絡資源,實現數據挖掘系統的遠程通信信息傳輸和控制。
3 仿真實驗
為了測試本文設計的基于云計算的分布式數據挖掘系統在實現數據挖掘中的優越性能,進行仿真實驗,分布式數據信息采樣的時寬為10 ms, 分布式數據的隨機采樣率為KHz,調控因子λ=0.25。根據上述仿真環境和參數設定,進行基于云計算的分布式數據挖掘系統的數據挖掘和處理性能分析,首先進行數據挖掘的輸出時域波形采樣,結果如圖1所示。
從圖可見,采用本文算法進行數據挖掘的準確度較高,為了對比性能,采用本文方法和傳統方法,以數據挖掘的準確配準性為測試指標,得到對比結果如圖2所示。
實驗結果表明,采用該方法進行基于云計算的分布式數據挖掘,數據挖掘的準確配準性能較好,系統的可靠性較好。
4 結束語
本文提出一種基于分布式自適應特征調度和高階累積量后置聚焦的數據挖掘算法,并進行了實驗分析。結果表明,采用該方法進行數據挖掘,數據挖掘的準確配準性能較好,系統的可靠性較好,具有較好的應用價值。
參考文獻
[1]陸興華,謝輝迪,許劍銳.基于近場通訊和物聯網的飯堂自動計價系統[J].智能計算機與應用,2015,5(06):18-21.
[2]童崢嶸,郭尊禮,曹曄,等.小波包變換對CO-OFDM系統高峰均比的抑制性能研究[J].光子學報,2015,44(12):1206001-1206001.
[3]譚營軍,王俊平.基于MEACO的無線傳感器網絡路由光通信算法研究[J].激光雜志,2016,37(02):131-133.
作者簡介
李穎(1977-),女,廣東省韶關市人。碩士研究生學歷。現為廣東科學技術職業學院講師。主要研究方向為虛擬化與云計算。
作者單位
廣東科學技術職業學院計算機工程技術學院 廣東省珠海市 519090