999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據的分類挖掘優化技術

2018-01-02 10:34:11覃兵文
現代電子技術 2017年24期
關鍵詞:特征提取大數據

覃兵文

摘 要: 為了提高大數據的分類識別和檢索性能,需要進行大數據優化挖掘,故提出一種基于弱關聯性指數特征分布提取的大數據分類挖掘方法。對大數據信息流采用稀疏性融合方法進行聚類空間劃分,通過自相關特征匹配方法進行大數據高維分形特征重組,采用向量量化方法進行大數據的基元分類的收斂性控制,提取大數據信息流的弱關聯性指數特征,實現大數據的優化分類和挖掘。仿真結果表明,采用該方法進行大數據分類挖掘,提高了大數據挖掘檢索的查準性和查全性,挖掘的準確性較高,抗干擾能力較好。

關鍵詞: 大數據; 信息融合; 分類挖掘; 聚類空間劃分; 特征提取

中圖分類號: TN911?34; TP311 文獻標識碼: A 文章編號: 1004?373X(2017)24?0034?03

Abstract: As big data optimization mining is needed to improve classification recognition and retrieval performance of big data, a big data classification mining method based on distributional extraction of weak correlation index features is proposed. The sparse fusion method is adopted to perform clustering space division for big data flow. The high?dimensional fractal features of big data are reorganized by using the self?correlation feature matching method. The vector quantification method is adopted for convergence control of base element classification of big data. The weak correlation index features of big data information flow are extracted to realize optimization classification and mining of big data. The simulation results show that the method for data classification and mining improves the precision and recall performance of big data mining and retrieval, and has high mining accuracy and good anti?interference capability.

Keywords: big data; information fusion; classification mining; clustering space division; feature extraction

0 引 言

隨著網絡空間的不斷擴容以及網絡信息技術的發展,在網絡云存儲數據庫中,大數據存在較大的差異性特征,需要對大數據進行分類挖掘,提高對大數據信息庫的檢索和分類識別能力,研究大數據分類挖掘技術,在提高大數據檢索、訪問、調度和特征提取能力方面具有重要意義,相關的數據分類挖掘方法研究受到人們的極大重視[1]。當前主要采用主成分挖掘方法、粒子群分布式挖掘方法以及統計特征提取的大數據挖掘方法[2]。通過自適應分布式學習算法實現大數據挖掘,把網絡分布式云存儲大數據時間序列解析模型分解為含有多個非線性成分的統計量,進行數據的分布式特征重構,提高數據挖掘的抗干擾能力。但是隨著數據規模的擴大,挖掘的準確性不好,提出基于弱關聯性指數特征分布提取的大數據分類挖掘方法,首先進行大數據分布的統計特征分析,然后進行特征提取和數據分類算法設計,最后進行數據挖掘仿真實驗,得出有效性結論。

1 大數據的統計性特征分析

1.1 大數據的稀疏性融合

為了實現對大數據的分類挖掘優化,首先采用統計特征分析方法進行大數據特征提取和信息重構,對大數據信息流采用稀疏性融合方法進行聚類空間劃分。本文研究的大數據對象為網絡分布式云存儲大數據。用圖表示網絡分布式云存儲大數據的輸入模型,統計特征分布的向量量化邊集為,單個存儲分布節點的信息覆蓋域為r,設,且,得到網絡分布式云存儲大數據的信息融合支持向量集為:

式中:和分別表示網絡分布式云存儲大數據的時域和頻域分布結構特征;和分別表示大數據的采樣時間間隔和波束分布間隔。采用觀測或實驗手段獲得網絡分布式云存儲采樣的先驗知識[3],通過對數據的多元信息融合處理得到網絡分布式云存儲并行調度和重構的特征分布向量定義為:

式中:為網絡分布式云存儲特征分布矩陣的對角元素值;為測量誤差。通過大數據的稀疏性融合,得到網絡分布式云存儲重構的約束指標分布向量集,以此為特征基礎進行向量量化分析和數據重構。

1.2 大數據分類挖掘的聚類空間劃分

基于奈奎斯特采樣定理[4],結合大數據稀疏性融合結果,進行大數據分類挖掘聚類空間劃分,對大數據信息流特征重組模型進行歸一化處理,得數據分類挖掘指向性維數滿足:

式中,為對取模。對大數據聚類空間劃分,進行大數據信息流時頻分解,得分解式為:

式中,表示數據弱關聯指向性分布函數,將提取指向性特征輸入到大數據分類挖掘傳輸信道中,進行向量量化分解。假設為時間窗函數,通過構建大數據分類挖掘知識庫模型,得到數據的副本信息融合嵌入維數m滿足:endprint

通過自相關特征匹配方法進行大數據高維分形特征重組,假設分類特征重組的傳遞函數,采用一個二維的連續函數進行大數據聚類的收斂性控制,得到大數據分類挖掘的極大熵的判決特征函數式為:

當網絡分布式云存儲數據是局部平穩的,通過構造數據集的規則向量集,得到大數據分類挖掘的聚類空間為:

結合訓練數據集的規則向量子集解向量分布融合結果[5],得到大數據分類挖掘聚類空間分布的指向性函數為:

2 大數據分類挖掘實現

在對大數據信息流采用稀疏性融合方法進行聚類空間劃分的基礎上,進行數據分類特征提取和挖掘過程優化,本文提出一種基于弱關聯性指數特征分布提取的大數據分類挖掘方法,采用向量量化方法進行大數據的基元分類的收斂性控制[6],向量量化的特征函數為:

式中:表示大數據特征序列的相關性指數系數;表示先驗點簇;表示信息融合的深度;為數據的關聯維。

利用數據集的相似性分布式重建方法,得到數據的時頻分解的變換定義為:

經自相關特征匹配,則數據聚類目標函數為:

式中,為數據特征分布子帶信息。采用向量量化方法進行大數據的基元分類的收斂性控制[7],提取數據的能量密度譜(Spectrogram,SPEC)為:

基于模糊聚類方法進行數據分類挖掘,數據分類挖掘的特征空間的維數滿足: (14)

網絡分布式云存儲重構的誤差項滿足高斯?馬爾科夫假設。將網絡分布式云存儲重構的約束指標矩陣改寫為邊緣分布矩陣為:

式中:為的關聯維向量;為的云數據的聚類指向性分布矩陣;為的參數向量;為的網絡分布式云存儲聚類的誤差向量。提取大數據信息流的弱關聯性指數特征,得到關聯數據的線性組合為:

利用IFFT變換進行大數據的弱關聯性特征估計,得到:

分析上述提取的特征估計結果得知,由于大數據分類挖掘的過程受到大數據的基元分類的收斂性控制,所以大數據分類挖掘的收斂性較好,準確性得以提高。

3 實驗分析

對大數據分類挖掘的仿真實驗建立在Matlab仿真環境基礎上,大數據為網絡分布式云存儲大數據,實驗仿真環境為:Intel Core3?530 1 GB內存,操作系統為Windows 7,大數據分布的陣元數目為64,初始采樣的信噪比定為8 dB,數據特征分布的隨機點個數為3,數據分布的頻帶為4~25 kHz。根據上述仿真設定,得大數據的原始分布時域波形如圖1所示。

以圖1給出的大數據為研究對象,進行分類挖掘,提取大數據信息流的弱關聯性指數特征,實現大數據分類挖掘。圖2給出了采用本文方法和傳統的統計特征分析方法進行數據分類挖掘的準確性對比。分析得知,采用本文方法進行大數據挖掘檢索的查準性和查全性較高,提高了大數據挖掘的準確性。

4 結 語

本文提出一種基于弱關聯性指數特征分布提取的大數據分類挖掘方法,對大數據信息流采用稀疏性融合方法進行聚類空間劃分。通過自相關特征匹配方法進行大數據高維分形特征重組,采用向量量化方法進行大數據的基元分類的收斂性控制,提取大數據信息流的弱關聯性指數特征,實現大數據的優化分類和挖掘。研究得知,采用該方法進行大數據分類挖掘,提高了大數據挖掘檢索的查準性和查全性,挖掘的準確性較高,抗干擾能力較好,具有很好的應用價值。

參考文獻

[1] 王變琴,余順爭.自適應網絡應用特征發現方法[J].通信學報,2013,34(4):127?137.

[2] 何力,丁兆云,賈焰,等.大規模層次分類中的候選類別搜索[J].計算機學報,2014,37(1):41?49.

[3] 李保利.基于類別層次結構的多層文本分類樣本擴展策略[J].北京大學學報(自然科學版),2015,51(2):357?366.

[4] HE Y, ZHANG C S, TANG X M, et al. Coherent integration loss due to pulses loss and phase modulation in passive bistatic radar [J]. Digital signal processing, 2013, 23(4): 1265?1276.

[5] HAO H. Multi component LFM signal detection and parameter estimation based on EEMD?FRFT [J]. International journal for light and electron optics, 2013, 124(23): 6093?6096.

[6] GOVONI M A, LI H, KOSINSKI J A. Range?doppler resolution of the linear?FM noise radar waveform [J]. IEEE transactions on aerospace and electronic systems, 2013, 49(1): 658?664.

[7] 狄嵐,于曉瞳,梁久禎.基于信息濃縮的隱私保護支持向量機分類算法[J].計算機應用,2016,36(2):392?396.endprint

猜你喜歡
特征提取大數據
特征提取和最小二乘支持向量機的水下目標識別
基于Gazebo仿真環境的ORB特征提取與比對的研究
電子制作(2019年15期)2019-08-27 01:12:00
基于Daubechies(dbN)的飛行器音頻特征提取
電子制作(2018年19期)2018-11-14 02:37:08
Bagging RCSP腦電特征提取算法
大數據環境下基于移動客戶端的傳統媒體轉型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數據+輿情:南方報業創新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
基于MED和循環域解調的多故障特征提取
Walsh變換在滾動軸承早期故障特征提取中的應用
軸承(2010年2期)2010-07-28 02:26:12
主站蜘蛛池模板: 成人福利在线看| 国产精品妖精视频| 亚洲精品日产精品乱码不卡| 国产综合欧美| 最新亚洲av女人的天堂| 欧美精品成人一区二区在线观看| 女人av社区男人的天堂| 国产视频 第一页| 九九香蕉视频| 国产99视频在线| 天天综合天天综合| 国产日韩精品一区在线不卡| 欧美a级完整在线观看| 日本在线视频免费| 19国产精品麻豆免费观看| 91精品免费高清在线| 无码专区在线观看| 在线99视频| 国产精品无码作爱| 久久精品亚洲专区| 亚洲日韩精品无码专区97| 日韩在线永久免费播放| 日韩东京热无码人妻| 中国精品自拍| 国产精品大白天新婚身材| 97国产精品视频人人做人人爱| 亚洲娇小与黑人巨大交| 波多野结衣中文字幕一区二区 | 色欲综合久久中文字幕网| 岛国精品一区免费视频在线观看| 中文字幕在线看视频一区二区三区| 毛片免费在线视频| 国产又色又爽又黄| 国产主播一区二区三区| 四虎影视永久在线精品| 在线观看精品国产入口| 成人日韩欧美| 日韩欧美中文在线| 亚洲无限乱码| 男女性午夜福利网站| 亚洲人成在线免费观看| 无码专区在线观看| 久久久久久国产精品mv| 欧美啪啪一区| 国产精品不卡永久免费| 伊人激情久久综合中文字幕| 国产免费看久久久| 亚洲精品无码在线播放网站| 狠狠做深爱婷婷综合一区| 最新国产成人剧情在线播放| 亚洲人成网站18禁动漫无码| 最新国产成人剧情在线播放| 亚洲第一成人在线| 四虎永久在线| 亚洲资源在线视频| 色丁丁毛片在线观看| 国产欧美日韩资源在线观看| 1769国产精品视频免费观看| 亚洲精品麻豆| 亚洲国产高清精品线久久| 呦视频在线一区二区三区| 思思热精品在线8| 欧美日本在线观看| 久久亚洲日本不卡一区二区| 国产亚洲高清视频| 99热亚洲精品6码| 国产视频 第一页| 国产一在线| 刘亦菲一区二区在线观看| 九九免费观看全部免费视频| 国产主播在线观看| 国产女人水多毛片18| 亚洲免费三区| 精品综合久久久久久97超人| 欧美激情第一区| 国产真实乱子伦视频播放| 国产老女人精品免费视频| 免费国产一级 片内射老| 国产成人午夜福利免费无码r| 国产精品七七在线播放| 欧美日韩国产精品综合| 国产在线视频欧美亚综合|