999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

試談大數(shù)據(jù)分析的方法與應用

2020-12-02 07:51:42水冰潔趙思思王碧華
數(shù)碼設計 2020年12期
關鍵詞:大數(shù)據(jù)分析方法

水冰潔 趙思思 王碧華

摘要:本文先從隨機做減法采樣、隨機做加法采樣、基于聚類的加法重采樣、合成少數(shù)類的加法采樣、優(yōu)化的合成少數(shù)類加法采樣方法等方面分析大數(shù)據(jù)分析采集不平衡樣本的方法,再分別闡述這些大數(shù)據(jù)分析采集不平衡樣本集在電力企業(yè)中的應用,為大數(shù)據(jù)分析人員提供參考。

關鍵詞:大數(shù)據(jù);分析;方法;應用手段

中圖分類號:TP311.13?? 文獻標識碼:A?? 文章編號:1672-9129(2020)12-0032-01

引言:大數(shù)據(jù)分析是互聯(lián)網(wǎng)時代行業(yè)經(jīng)常使用的技術,大數(shù)據(jù)分析的方法有很多,但是其原理均是通過大量數(shù)據(jù)的采樣得到數(shù)據(jù)的發(fā)展模型,最終為企業(yè)的發(fā)展方向或者危機預測提供參考。而大數(shù)據(jù)分析的第一步是數(shù)據(jù)采集工作,數(shù)據(jù)采樣的精確度會直接影響大數(shù)據(jù)分析的結果。

1 大數(shù)據(jù)分析采集不平衡樣本集的方法

1.1隨機做減法采樣方法。隨機做減法采樣方法的原理是通過減少較多類型的樣本,從而使不同類型樣本的數(shù)量達到平衡。該方法的優(yōu)點是可以降低采樣所需要的時間,因為總體的采樣數(shù)量減少了;該方法的缺點是在隨機減少樣本數(shù)量比較多的種類樣本時可能會丟失一些關鍵數(shù)據(jù),最后導致采樣結果不夠精準。

1.2隨機做加法采樣方法。隨機做加法采樣方法的原理是增加樣本數(shù)量比較少的種類樣本,最終使不同種類的樣本數(shù)量達到平衡。該方法的優(yōu)點是不會丟失某些樣本的關鍵信息,采樣結果相對比較精準;該方法的缺點是增加了采樣的總體數(shù)量,導致采樣過程所需要的時間大大增加,而且還會由隨機加樣本的原因造成過擬合風險增加。

1.3基于聚類的加法重采樣方法。基于聚類的加法重采樣方法的原理是將所有樣本按照數(shù)量的多少分為兩類,然后將樣本數(shù)量較多的一類聚集到一起、將樣本數(shù)量較少的另一類聚集到一起,最后再將隨機做加法采樣方法與樣本數(shù)量較少的聚集類結合,將所有樣本的數(shù)量增加到一致,即可得到較為精準的采樣結果。該方法的優(yōu)點為能夠克服樣本不平衡帶來的挑戰(zhàn);該方法的缺點與隨機做加法相同,即容易造成過擬合風險增加。

1.4合成少數(shù)類的加法采樣方法。合成少數(shù)類的加法采樣方法是原理是將樣本數(shù)量較少的一類選擇出來,然后選擇這類數(shù)據(jù)的一部分創(chuàng)建新的數(shù)據(jù)樣本,最終將新創(chuàng)建的樣本與原樣本集整合,即可解決原樣本種類數(shù)量不平衡的問題。該方法的優(yōu)點是不會丟失樣本中的關鍵數(shù)據(jù)導致樣本采樣精準度降低,而且相比隨機做加法采樣和聚類加法重采樣方法的過擬合風險降低;該方法的缺點是容易由于樣本數(shù)量的額外增加導致負類樣本的增加,所以該方法采集樣本的適用范圍有限。

1.5優(yōu)化的合成少數(shù)類加法采樣方法。優(yōu)化的合成少數(shù)類加法采樣的原理是將樣本數(shù)量較少的種類進行整合,然后按照樣本的不同特征將其分成不同組,最后在這些不同組的樣本數(shù)據(jù)中使用隨機做法采樣方法即可解決原樣本集中數(shù)量不平衡的問題。該方法的優(yōu)點為不會導致額外負類樣本的增加,而且樣本數(shù)據(jù)中的關鍵信息不會丟失,采樣精準度不會降低;該方法的缺點是大量的數(shù)據(jù)堆疊導致其適應范圍有限。

2 大數(shù)據(jù)分析采集不平衡樣本集的應用

假設電力企業(yè) 大數(shù)據(jù)樣本集中電力違章導致的安全事故樣本總數(shù)為10300個,而非電力違章導致的安全事故樣本數(shù)量為10000個、電力違章導致的安全事故樣本數(shù)量為300個,可知該電力企業(yè)電力違章導致安全事故發(fā)生的幾率為300/10300=2.9%。

2.1隨機做減法采樣在電力企業(yè)中的應用。隨機做減樣法在電力企業(yè)中采集安全事故樣本需要先從所有非事故樣本中選出1/10數(shù)量的樣本形成樣本集,然后可知樣本集的數(shù)量為10000×10%=1000個,最后結合電力違章導致的安全事故300個形成新的樣本集數(shù)量即1300個,該采樣方法計算出電力違章安全事故發(fā)生幾率為300/1300=23%。

2.2隨機做加法采樣在電力企業(yè)中的應用。隨機做加法采樣在電力企業(yè)中采集安全事故樣本需要先復制電力違章安全事故發(fā)生的樣本,假設復制15個電力違章安全事故樣本300次,則現(xiàn)在樣本集中數(shù)量總數(shù)為300×15+10000=14500個,該采樣方法計算出電力違章安全事故發(fā)生幾率為(300×15)/14500=31%。

2.3基于聚類的加法重采樣在電力企業(yè)中的應用。基于聚類的加法重采樣在電力企業(yè)中采集安全事故樣本需要先進行聚類,假設樣本數(shù)量較多的共分為8類且樣本數(shù)量依次為1250、240、980、1380、1520、1050、1230、1350個,而數(shù)量較少的樣本分4類依次為90、89、78、49個,根據(jù)隨機做加法采樣可以將樣本數(shù)量較多的8類處理為1250個樣本、樣本數(shù)量較少的樣本處理為750個樣本,該采樣方法計算出電力違章安全事故發(fā)生幾率為(750×4)/(1250×8+750×4)=23%。

2.4合成少數(shù)類的加法采樣方法在電力企業(yè)中的應用。合成少數(shù)類的加法采樣方法在電力企業(yè)中采集安全事故樣本假設隨機復制15個違章樣本共250次,該采樣方法計算出電力違章安全事故發(fā)生幾率為(15×250)/10000=27.3%。

2.5優(yōu)化的合成少數(shù)類加法采樣方法在電力企業(yè)中的應用。優(yōu)化的合成少數(shù)類加法采樣方法在電力企業(yè)中采集安全事故樣本將數(shù)量較少的電力違章事故樣本分為數(shù)量為210、60、30的三組,則隨機取樣本數(shù)量180個生成電力違章樣本220次,該采樣方法計算出電力違章安全事故發(fā)生幾率為(180×20)/(180×20+10000)=26%。

結論:綜上所述,大數(shù)據(jù)分析采集不平衡樣本集的方法有很多種,很多行業(yè)在數(shù)據(jù)采樣時都可以利用大數(shù)據(jù)分析方法,數(shù)據(jù)采集是大數(shù)據(jù)分析的基礎,數(shù)據(jù)采集得越全面,最后的預測結果就越精準。而計算機大數(shù)據(jù)分析方法中的運用可以顯著提高預測結果的準確率,因此大數(shù)據(jù)分析方法和應用無論在哪個行業(yè)都離不開計算機的使用。

參考文獻:

[1]黃淼. 公共交通運營大數(shù)據(jù)聚類分析方法及應用研究[D].武漢輕工大學,2018.

[2]汪海濤,余永奎,段春雨.基于大數(shù)據(jù)不平衡樣本集的重采樣方法及應用[J].現(xiàn)代計算機(專業(yè)版),2018(22):26-29.

猜你喜歡
大數(shù)據(jù)分析方法
隱蔽失效適航要求符合性驗證分析
電力系統(tǒng)不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
電力系統(tǒng)及其自動化發(fā)展趨勢分析
基于大數(shù)據(jù)背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
主站蜘蛛池模板: 亚洲一区毛片| 亚洲欧美自拍中文| 在线a网站| 国产欧美日韩综合在线第一| 高清亚洲欧美在线看| a级毛片网| 四虎影视库国产精品一区| 亚洲乱强伦| 中文字幕亚洲乱码熟女1区2区| 青青国产视频| 人妻丰满熟妇αv无码| 日韩大片免费观看视频播放| 久久夜色精品国产嚕嚕亚洲av| 成人在线不卡视频| 色综合a怡红院怡红院首页| 无码国产偷倩在线播放老年人| 日韩精品久久久久久久电影蜜臀| 夜夜操天天摸| 亚洲中文字幕在线精品一区| 亚洲AV电影不卡在线观看| jizz国产视频| 欧美成人综合视频| 亚洲一区色| 国产精品手机视频| 亚洲浓毛av| 亚洲码一区二区三区| 国产99久久亚洲综合精品西瓜tv| 天堂岛国av无码免费无禁网站| 日本三级欧美三级| 久久无码av三级| 亚洲制服丝袜第一页| 亚洲视频欧美不卡| 97视频在线精品国自产拍| 中文字幕日韩视频欧美一区| 欧美a√在线| 国产成人综合亚洲欧洲色就色| 日韩精品中文字幕一区三区| 国产成人精品2021欧美日韩| 久久国产精品麻豆系列| 国产剧情一区二区| 国产欧美专区在线观看| 欧美一区二区三区国产精品| 国产一区二区三区日韩精品| 亚洲 欧美 中文 AⅤ在线视频| 亚洲中文无码av永久伊人| 国产在线专区| 99资源在线| 高清国产在线| 69视频国产| 国产成人av大片在线播放| 国产精品私拍在线爆乳| 狠狠五月天中文字幕| 亚洲啪啪网| 久久精品亚洲热综合一区二区| 国产精品亚洲一区二区三区z| 538国产在线| 一区二区理伦视频| 在线看片免费人成视久网下载| 亚洲AⅤ永久无码精品毛片| 久久久久无码国产精品不卡| 在线观看免费国产| 国产av色站网站| 韩日午夜在线资源一区二区| 亚洲色图欧美一区| 青青操视频在线| 日韩免费成人| 欧美三级不卡在线观看视频| 国产一区二区三区在线观看视频 | 国产96在线 | 欧美日韩国产综合视频在线观看 | 成人一区专区在线观看| 欧美va亚洲va香蕉在线| 91小视频版在线观看www| 97亚洲色综久久精品| 97久久免费视频| 91美女视频在线| 欧美日韩精品一区二区在线线| 中文国产成人精品久久| 久久91精品牛牛| 欧美成一级| 有专无码视频| 亚洲成综合人影院在院播放|