999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

聚類回歸分析在降雨量統(tǒng)計(jì)數(shù)據(jù)中的應(yīng)用

2019-09-03 07:23:02劉賽娥
關(guān)鍵詞:分類分析方法

昌 霞 劉賽娥

(云南國(guó)土資源職業(yè)學(xué)院 昆明 650000)

1 引言

聚類分析是將物理或者抽象對(duì)象的集合分成相似的對(duì)象類的過(guò)程[1]。回歸分析根據(jù)研究對(duì)象和目的,確定哪個(gè)是自變量(解釋變量),哪個(gè)是因變量(被解釋變量)研究變量之間的依存關(guān)系,通過(guò)建立回歸模型和控制自變量來(lái)進(jìn)行估計(jì)和預(yù)測(cè)[2]。比如說(shuō),從相關(guān)分析中我們可以得知某些變量密切相關(guān),但是那幾個(gè)是最重要的,相互影響程度如何,則需要通過(guò)聚類回歸分析方法來(lái)確定[1]。在降雨量統(tǒng)計(jì)數(shù)據(jù)中,我們主要得到的是“時(shí)間”和“雨量”密切相關(guān),地理位置、人為因素、氣溫等因素也對(duì)降雨量有著一定影響,本文就昆明市西山區(qū)28個(gè)監(jiān)控點(diǎn)數(shù)年來(lái)降雨量統(tǒng)計(jì)數(shù)據(jù)來(lái)做分析。

2 研究區(qū)域概況

昆明市西山區(qū)地形地貌特殊,區(qū)境內(nèi)山戀起伏、山高谷深、岸懸流急、溪流切割強(qiáng)烈,共有14個(gè)小流域,其間分布著多個(gè)山洪危險(xiǎn)區(qū)及數(shù)量眾多的滑坡災(zāi)害點(diǎn)。根據(jù)西山區(qū)實(shí)測(cè)降水資料顯示,每年的雨季5月至10月降水量即占全年降水量的80%以上,再加上各小流域多為山區(qū)性特小流域,面積小、河長(zhǎng)短、河道比降大,洪水均由暴雨造成,具有陡漲陡落的山區(qū)河流的洪水特性,因此遇到較大降水,極易引發(fā)山洪、泥石流等山洪災(zāi)害。在統(tǒng)計(jì)數(shù)據(jù)中,樣本點(diǎn)的分布顯得尤為重要,本文就昆明市西山區(qū)近年來(lái)降雨統(tǒng)計(jì)數(shù)據(jù)進(jìn)行采樣、清洗及分析。

3 聚類回歸分析方法

定量分析是依據(jù)統(tǒng)計(jì)數(shù)據(jù),建立數(shù)學(xué)模型,并用數(shù)學(xué)模型計(jì)算出分析對(duì)象的各項(xiàng)指標(biāo)及其數(shù)值的一種方法[2]。它既保留重視觀察實(shí)驗(yàn)、收集經(jīng)驗(yàn)資料的特點(diǎn),又保留重視邏輯思維演繹推理的特點(diǎn),應(yīng)用假說(shuō)使得觀察實(shí)驗(yàn)方法和數(shù)學(xué)演繹形式結(jié)合起來(lái)[3]。正因?yàn)檫@樣,定量分析往往比較強(qiáng)調(diào)實(shí)物的客觀性及可觀察性,強(qiáng)調(diào)現(xiàn)象之間與各變量之間的相互關(guān)系和因果聯(lián)系[2]。

3.1 聚類分析

聚類是找出數(shù)據(jù)庫(kù)中的一組數(shù)據(jù)對(duì)象的共同特點(diǎn)并按照分類模式將其劃分為不同的類,其目的是通過(guò)分類模型,將數(shù)據(jù)庫(kù)中的數(shù)據(jù)項(xiàng)映射到摸個(gè)給定的類別中[4]。可以應(yīng)用到涉及到應(yīng)用分類、趨勢(shì)預(yù)測(cè)中,針對(duì)數(shù)據(jù)的相似性和差異性將一組數(shù)據(jù)分為幾個(gè)類別。屬于同一類別的數(shù)據(jù)間的相似性很大,但不同類別之間數(shù)據(jù)的相似性很小,跨類的數(shù)據(jù)關(guān)聯(lián)性很低。

系統(tǒng)聚類方法中比較典型的是Ward方法。Ward即離差平方和法。它主要體現(xiàn)在同類離差平方和較小,類間偏差平方和較大。

3.2 回歸分析

“回歸”(regression)是由英國(guó)著名生物學(xué)家兼統(tǒng)計(jì)學(xué)家高爾頓(Francis Galton)在研究人類遺傳問(wèn)題時(shí)提出來(lái)的[5]。回歸分析反映了數(shù)據(jù)庫(kù)中數(shù)據(jù)的屬性值的特性,通過(guò)函數(shù)表達(dá)數(shù)據(jù)映射的關(guān)系來(lái)發(fā)現(xiàn)屬性值之間的依賴關(guān)系[6]。它可以應(yīng)用到對(duì)數(shù)據(jù)序列的預(yù)測(cè)及相關(guān)關(guān)系的研究中去。設(shè)因變量y與自變量x1,x2,……,xk之間有關(guān)系式:

通過(guò)取樣得到n組觀測(cè)數(shù)據(jù):

其中xij是自變量xi的第j個(gè)觀測(cè)值,yj是因變量y的第j個(gè)值,代入上式得到模型的數(shù)據(jù)結(jié)構(gòu)式:

上述方程式為k元正態(tài)線性回歸模型,其中b0,b1,…,bk及σ2是未知待估的參數(shù)[7]。

4 數(shù)據(jù)分析

4.1 多元回歸模型的擬合

從相關(guān)分析角度來(lái)說(shuō),研究一個(gè)變量與多個(gè)變量的線性相關(guān)稱為復(fù)相關(guān)分析(analysis ofmultiple correlation)[5]。復(fù)相關(guān)中的變量沒(méi)有因變量與自變量之分,但是在實(shí)際應(yīng)用中,復(fù)相關(guān)分析經(jīng)常與多元線性回歸分析聯(lián)系在一起,因此,復(fù)相關(guān)分析一般指因變量y與 k個(gè)自變量x1、x2、…、xk的線性相關(guān)[8]。

多元線性回歸模型也需要符合多元回歸的高斯假設(shè)條件[8]。本文采用最小二乘法來(lái)估計(jì)回歸系數(shù) b0,b1,…,bk。

方程組有解,便可得b0,b1,…,bk的最小二乘估計(jì)。

計(jì)算所有已知站點(diǎn)間的距離,利用微積分知識(shí)使用SPSS工具來(lái)求解上式方程組,省略去隨機(jī)項(xiàng)即可得到多元線性回歸方程:Y=0.008+1.061x1+0.087x2+0.157x3-0.365x4-0.105x5-0.017x6。通過(guò)異常值檢驗(yàn)進(jìn)行殘差分析,實(shí)驗(yàn)點(diǎn)的標(biāo)準(zhǔn)化殘差都落在(-2,2)區(qū)間以內(nèi)。

4.2 W ard法聚類

Ward'smethod是凝聚法分層聚類中一種度量cluster之間距離的方法。按照這個(gè)方法,任意兩個(gè)cluster之間的距離就是這兩個(gè)cluster合并后新cluster的 ESS[9]。

Ward方法并類時(shí)總是能使得并類的類內(nèi)離差平方和增量最小[10]。對(duì)應(yīng)的公式為

遞推公式為

圖1給出采用Ward法聚類得到的各站點(diǎn)的降雨量信息樹(shù)狀圖。可以看到站點(diǎn)降雨量差異性分布。

圖1 Ward法聚類樹(shù)狀圖

4.3 K-mean聚類

K-mean聚類是用戶指定類別數(shù)的大樣本資料的逐步聚類分析[10]。所謂逐步聚類分析就是先把被聚對(duì)象進(jìn)行初始分類,然后逐步調(diào)整,得到最終K個(gè)分類[10]。該方法需要事先設(shè)定分類的個(gè)數(shù),并不適合沒(méi)有先驗(yàn)知識(shí)的條件下的數(shù)據(jù)聚類[11]。另外,K-mean法對(duì)離群點(diǎn)較為敏感,即采樣點(diǎn)離散度越高,聚攏性越弱;數(shù)據(jù)分布容易被扭曲[11]。

本文將數(shù)據(jù)導(dǎo)入SPSS中,根據(jù)系統(tǒng)聚類法的經(jīng)驗(yàn)將K選擇為5。迭代次數(shù)和系統(tǒng)聚類一樣選擇25次。表1是K-mean的迭代歷史記錄,可以看出由于聚類中心內(nèi)沒(méi)有改動(dòng)或改動(dòng)較小而達(dá)到收斂[12]。表2是隨機(jī)選取5個(gè)站點(diǎn)的數(shù)據(jù)來(lái)驗(yàn)證其有效性。每個(gè)聚類樣品數(shù)表。下面輸出和解釋K-mean聚類結(jié)果。

表1 迭代歷史記錄

表2 聚類樣品數(shù)

表3是K-mean聚類的各個(gè)類的具體成員,距離代表的是樣品與設(shè)定參考值的殘差比。最后看到分類結(jié)果與Ward法有所相似,但是組內(nèi)距離較大,實(shí)際效果不如Ward法。分類特征也不夠明顯,無(wú)法凸顯各個(gè)站點(diǎn)降雨量差異性的特點(diǎn)[12]。但是我們可以看到海口、石碼哨與其他站點(diǎn)的降雨量信息和其他站點(diǎn)有些不同,在其他方法中也顯現(xiàn)出來(lái)。

表3 聚類成員

5 結(jié)語(yǔ)

本文通過(guò)對(duì)西山區(qū)28個(gè)監(jiān)控點(diǎn)來(lái)實(shí)現(xiàn)回歸分析和聚類分析。回歸分析得到一個(gè)擬合度良好多元線性回歸方程,并進(jìn)行了殘差分析。聚類分析通過(guò)比較系統(tǒng)聚類方法——Ward法聚類和K-mean方法的不同。在處理該批數(shù)據(jù)的這兩種方法中,以Ward法更為理想。Ward法所做的聚類得到組間距離最大,組內(nèi)距離最小[13]。中部雨量站集中在第一聚類中,南部雨量站集中在第二聚類中,北部雨量站集中在第三聚類中。可以看出,得到的聚類結(jié)果有明顯的地理位置聚攏性,十分符合實(shí)際情況,即地理位置較近的地方,降雨量差異性較小。

猜你喜歡
分類分析方法
分類算一算
隱蔽失效適航要求符合性驗(yàn)證分析
分類討論求坐標(biāo)
電力系統(tǒng)不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
電力系統(tǒng)及其自動(dòng)化發(fā)展趨勢(shì)分析
用對(duì)方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚(yú)
主站蜘蛛池模板: 久久影院一区二区h| 欧美精品伊人久久| 992Tv视频国产精品| 亚洲欧美在线精品一区二区| 亚洲第一黄色网| 国产女人水多毛片18| av一区二区三区在线观看| 国产欧美在线视频免费| 亚洲免费三区| 四虎在线高清无码| 另类专区亚洲| 欧美成a人片在线观看| 99人体免费视频| 2021最新国产精品网站| 国产美女精品人人做人人爽| 日韩无码一二三区| 精品第一国产综合精品Aⅴ| 中文字幕乱码中文乱码51精品| 国产在线一二三区| 免费一级无码在线网站| 国产在线啪| 91久久国产热精品免费| 91探花国产综合在线精品| 成人亚洲天堂| 香蕉伊思人视频| 亚洲IV视频免费在线光看| 欧美国产成人在线| 久草国产在线观看| 国产精品无码久久久久久| 美女视频黄又黄又免费高清| 97一区二区在线播放| 91热爆在线| 久久99蜜桃精品久久久久小说| 国产成人精品一区二区免费看京| 久久99蜜桃精品久久久久小说| a色毛片免费视频| 全部毛片免费看| 日韩精品免费在线视频| 99久久国产精品无码| 看av免费毛片手机播放| 四虎成人免费毛片| 无码中文字幕精品推荐| 精品天海翼一区二区| 波多野结衣中文字幕一区二区| 色偷偷一区二区三区| 一级毛片在线播放免费观看 | 成人毛片免费观看| 亚洲欧美不卡中文字幕| 免费av一区二区三区在线| 九九热视频精品在线| 成人无码区免费视频网站蜜臀| 免费一级毛片| 国产成人久久777777| 综合五月天网| 欧美国产日韩在线| 久久网欧美| 欧美成人手机在线视频| 午夜福利在线观看入口| 久久人人妻人人爽人人卡片av| 秘书高跟黑色丝袜国产91在线| 亚洲国产中文在线二区三区免| 五月天婷婷网亚洲综合在线| 奇米影视狠狠精品7777| 国产精品开放后亚洲| 国产熟睡乱子伦视频网站| 亚洲视频免费播放| 国产精品自拍露脸视频| 伦精品一区二区三区视频| 亚州AV秘 一区二区三区| 国产毛片不卡| 啊嗯不日本网站| 欧美国产精品拍自| 伊人久久精品无码麻豆精品| 亚洲激情区| 亚洲制服中文字幕一区二区| a级毛片免费网站| 天天综合色天天综合网| 久久综合色天堂av| 国产欧美日韩精品综合在线| 国产伦精品一区二区三区视频优播| 日韩精品亚洲一区中文字幕| 五月激情综合网|