999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

概率神經網絡在判別分析中的比較優勢

2010-07-23 07:14:04米帥軍
統計與決策 2010年2期

米帥軍,習 勤

(華東交通大學 經濟管理學院,南昌 310003)

判別分析是用于判斷樣品或個體所屬類型的一種統計分析方法。采用這種分析隱含的一個最為基本的假設是:已知總體按著某些特征或指標分為兩個或兩個以上的類型。從這個基本假定可以看出:一是總體劃分類型的特征或指標必須為兩個以上,如果只有一個指標,則很容易根據新抽取樣品的指標值判斷該樣品屬于哪一類;二是所分的類型中都必須包含一個或以上的個體,否則該類型是不可識別的[1]。在生產、科研和日常生活中就是根據總體的經驗分類,結合樣品調查的數據來對樣品進行歸類的。如根據客戶的信用指標(房產、年齡、收入、職業、婚否等)來對信用卡客戶進行信用評級,根據上市公司業績表現等財務指標判別一個上市公司股股票類型。當然這里隱含了一個假設是:已知各類型客戶或公司的評價指標值。從上述分析可以看出,判別分析適用于被解釋變量為屬性變量(如類型、等級、規格等),解釋變量為可測量或可量化的統計分析。

1 問題的提出

常用的判別分析方法有距離判別法、貝葉斯判別法、費希爾判別法、逐步判別法,序貫判別等。這些判別分析方法都基于一定的假設條件。當假設條件與實際情況相差較大時,就會導致較高的誤判率,尤其是類與類之間的特征(如均值)在統計上顯著性不高時,誤判率將急劇上升。

現以距離判別法、貝葉斯判別法、費希爾判別法為例來說明其應用的假設條件與基本思想。

1.1 距離判別法

距離判別法的基本思想是:樣品和哪個類型的距離最近,就判斷它屬于哪個類,因而距離判別法又稱直觀判別法[2]。距離判別法分為歐氏距離判別與馬氏距離判別,其差別是馬氏距離采用了協方差陣來對距離進行校正。現以馬氏距離判別法來說明其應用條件。為敘述方便,以總體分為兩個類型為例。

馬氏距離定義:設總體G有m個評價指標,均值向量為u=(u1,u2,…,um)',協方差陣為∑=(aij)m×m,則新抽取的樣品 X=(x1,x2,…,xm)'與總體G的馬氏距離為:

如有兩個總體被分為兩類G1、G2,則樣品X=(x1,x2,…,xm)'與G1、G2的距離分別為:

u1,u2,∑1,∑2分別為類 G1、G2的均值向量與協方差陣。

馬氏距離的判別規則為:

(1)如果 W(X)>0,則 X 屬于類 G2;

(2)如果 W(X)<0,則 X 屬于類 G1;

(3)如果W(X)=0,則有待用其它方法判定。

從馬氏距離的判別函數可以發現,當類G1、G2的均值向量u1,u2,有顯著性差別時,判別效率將較高;反之,則效率較低。事實上,由于u1,u2是m維向量,直觀上很難判斷u1,u2是否有明顯差別。如果u1,u2并沒有顯著性差別而采用距離判別法將導致誤判。

1.2 貝葉斯判別法

貝葉斯(Bayes)判別法的基本思想是:假定對研究的對象已有一定的認識,常用先驗概率分布來描述這種認識;然后抽取一個樣本,用樣本來修正已有的先驗概率分布,得到后驗概率分布,再結合誤判損失函數,可以得出期望誤判損失,使平均損失 ECM(expected cost of misclassification)最小的判別方法稱為貝葉期判別法。

設總體G被分為G1、G2兩類,密度函數分別為p1(x)、p2(x),先驗概率分布分別為 q1(x)、q2(x),誤判損失函數分別為c1(G2|G1)、c2(G1|G2),誤判概率分別為 p1(G2|G1)、p2(G1,G2),則樣品 X誤判的平均損失為:

貝葉斯判別規則:如果把X判入G1的損失為ECM1,把X判入G2的損失為ECM2,則

(1)當 ECM1<ECM2時,X 應屬于 G1;

(2)當ECM1>ECM2時,X應屬于G2;

(3)當ECM1=ECM2時,有待用其它方法判定。

從理論上來講,貝葉斯判別很完善。與距離判別法相比,貝葉斯判別法克服了其兩個不足:一是距離判別法沒有考慮G1、G2出現的機會大小,即先驗概率,這在進行異常類判斷時很不合理,如信用卡惡意透支分析中將產生很大的偏差,因為惡意透支的概率相對較小;二是沒有考慮誤判的損失。

但是,貝葉斯判別法在實際應用中可操性不強。在實踐中,除了能獲得誤判損失函數外,其它的參數與概率分布都是難以獲得。通常的解決辦法是假定總體的各類服從某一分布,一般取正態分布。事實上,在統計分析時假定正態分布前提是基于大樣本。然而,大樣本不僅與研究問題有關,且由于條件限制一般也難以取得足夠大的樣本。因此,如果概率分布假定與實際總體情況不一致將產生誤判,誤判率與分布概率偏差有正向關系。

1.3 費希爾判別法

費希爾判別的基本思想是投影,將總體G的G1、G2兩類中的m維數據往某一方向投影,使得投影后G1與G2盡可能地分開。衡量投影后G1與G2是否明顯地分開,采用一元方差分析[1]。

費希爾判別法很實用,與距離判別法一樣,沒有總體分布的假定。但是,與距離判別法相比,費希爾是基于協方差陣的矩陣線性變換,使兩組G1、G2投影后盡可能地分開。

采用費希爾判別法也存在較高的誤判率問題。事實上,在空間上分散的點,在投影后可能很靠近。因此,就一般的總體G而言,很難找到一個合適的投影方向使兩組G1、G2投影后完全分開,即采用費希爾判別法易導致較高的誤判率。

2 概率神經網絡

人工神經網絡是對生物神經網絡進行仿真研究的結果。它通過采集樣本數據進行學習的方法來建立數據模型,系統通過樣本不斷學習,在此基礎上建立計算模型,從而建立神經網絡結構[4]。神經網絡通過訓練后可以執行復雜函數的功能,能對所有函數進行逼近,即Universal Approximation Theorem[7]。這就是說,如果一個網絡通過訓練后呈穩定狀態,那么神經網絡就具備了執行輸入到輸出這種線性或非線性的函數功能。當然,這種函數不是基于理論或經驗的假設,而是基于對樣本的有監督的訓練,使神經網絡具備了模擬復雜系統的功能。概率神經網絡是神經網絡模型的一種,其網絡模型結構圖略。

概率神經網絡(簡稱PNN)模型分為三層,第一層為輸入層,第二層為Radial Basis Layer,第三層為Competitive Layer。輸入向量為R,訓練的樣本數為Q(也即,共輸入Q個向量R),每個目標向量有K個元素,因此,每個輸入向量對應著K個元素中的一個。IW1,1是第一層的權重,是一個Q×R矩陣。

PNN的基本工作過程為:第一層計算輸入向量與目標向量的距離,并形成一個新的向量,這個新向量顯示了輸入與目標輸出之間的差別。第二層對每一個輸入加權求和,并求每一個輸入的貢獻,并輸出一個概率向量。第三層中的競爭轉換函數從第二層的輸出概率向量中挑出最大的概率值,使最大的概率對應某一類別[6]。

PNN適合于解決分類判別問題,可應用的領域相當廣泛。只要有一定的樣本量,PNN一定會收斂到一個貝葉斯分類[6]。但是PNN需要較多時間來計算分類,這是其一個不足之處。當然,如果PNN是用于經濟分析而不是硬件產品設計,計算時間不足為慮,重要是它能得出更為準確的結果。采用PNN的另一個不足是研究者不能得到一個基于樣本訓練出來的分類判別函數,也即不能對輸入輸出進行結構分析,這也是所有神經網絡模型的一大缺憾。

3 判別效率的比較與分析

表1 家庭除草機數據的不同判別方法效率比較

表2 巖石化學成分的含量數據的不同判別方法效率比較

本文用兩個案例來比較上述判別方法的效率。采用的分析軟件是SAS9與MatLab7(數據來源于參考文獻[1]與[2])。

案例一說明:有一個關于家庭擁有除草機與家庭收入、草坪面積的調查表,如表1所示。第H1至H24為調查數據,第H25至H30為預測對象,即通過判別分析,推測家庭H25至H30是否將購買除草機或已擁有除草機。分別采用距離判別法、貝葉斯判別法、費希爾判別法與PNN判別法。分析結果如表1所示。

從分析的結果來看,采用距離判別分析、貝葉斯判別分析、費希爾判別分析,對家庭H1、H13、H17是否擁有除草機產生了誤判,誤判率為12.5%,而采用PNN判別法誤判率為0.00%。同時,對家庭H25、H27、H29的是否準備購買或擁有除草機的預測上也不同。

為了顯示PNN的判別分析的優勢,再列出一判別分析案例(僅給出判別分析結果,見表2)。

4 結束語

本文通過對PNN在判別分析中的比較優勢進行簡單地對比發現,對大樣本的判別分析時,采用PNN優勢更加明顯,尤其是對于評價指標有幾十個以上時,PNN更加凸顯其模式識別的特有優勢。如對基金評級、信用卡評級、上市公司業績評級等可以采用更多的相關指標,以便從不同的側面與角度來給出綜合評價。同時,采用PNN評級可以有效地避開采用主成分分析等多元統計手法,因為在采用多元統計分析方法時,對指標進行壓縮或組合會導致總體信息的損失。因此,如果只考慮類型的判別,而不進行結構分析,即不需要分析各個指標對評價目標的影響程度或權重時,采用PNN判別分析是完全合理的。由于PNN能對所有線性或非線性動態系統進行模擬,采用PNN進行判別分析的準確度相比而言是很高的。由于PNN是一個類似于黑夾子的模型,導致其對經濟結構的解釋不足。

[1]何曉群.多元統計分析[M].北京:中國人民大學出版社,2004.

[2]高惠璇.應用多元統計分析[M].北京:北京大學出版社,2005.

[3]叢爽.面向MATLAB工具箱的神經網絡理論與應用[M].北京:中國科學技術大學出版社,1998.

[4]張云濤,龔玲.數據挖掘[M].北京:電子工業出版社,2004.

[5]岳朝龍,黃永興,嚴忠.SAS系統與經濟統計分析[M].北京:中國科學技術大學出版社,2003.

[6]H Demuth.MATLAB Neural Networks Toolbox,Probabilistic Neural Networks[M].Mathworks Inc,1993.

[7]Simon Haykin.Neural Networks:A Comprehensive Foundation(2ndEdition)[M].北京:清華大學出版社,2001.

主站蜘蛛池模板: 国产网站免费| 午夜性刺激在线观看免费| 亚洲人妖在线| 久久久精品国产SM调教网站| 欧美国产综合色视频| 国产地址二永久伊甸园| 亚洲成在人线av品善网好看| 99在线视频免费观看| 国产极品美女在线观看| 99在线视频免费| 亚洲成综合人影院在院播放| 婷婷中文在线| 欧美成人日韩| 亚洲成aⅴ人在线观看| 日本三级黄在线观看| 久久久久国产一区二区| 亚洲日韩精品无码专区97| 国产一在线观看| 澳门av无码| 久无码久无码av无码| 色首页AV在线| 黄色网页在线观看| 波多野一区| 福利小视频在线播放| 国产美女精品一区二区| 欧美一区二区三区欧美日韩亚洲| 黄网站欧美内射| 国产精品毛片一区| 免费一级毛片| 女人一级毛片| 又爽又黄又无遮挡网站| 国产精品极品美女自在线看免费一区二区| 四虎成人精品| 99热这里只有精品免费| 色婷婷在线影院| 国产成人综合亚洲欧洲色就色| 亚洲人人视频| 国产白浆视频| 亚洲丝袜第一页| 亚洲第一色视频| 欧美精品1区2区| 亚洲精品无码不卡在线播放| 97综合久久| 免费不卡视频| 国内精品久久久久鸭| 2024av在线无码中文最新| 色哟哟国产精品一区二区| 四虎永久免费地址| 一级香蕉人体视频| 国产成人精品一区二区免费看京| 国产日韩丝袜一二三区| 久久国产精品影院| 99国产精品国产高清一区二区| 国产丝袜第一页| 四虎影院国产| 亚洲h视频在线| 美女裸体18禁网站| 免费在线视频a| 久久精品中文字幕少妇| 国产综合在线观看视频| 国产玖玖玖精品视频| 国产精选自拍| 思思热在线视频精品| 亚洲天堂高清| 国产午夜一级毛片| 日本一本正道综合久久dvd| 波多野结衣第一页| 国产白浆在线| 国产成人一区二区| 国产成人区在线观看视频| 中文字幕在线欧美| 怡红院美国分院一区二区| 国产精品视频久| 精品少妇人妻av无码久久| 天天综合网色中文字幕| 欧美人与牲动交a欧美精品| jizz在线观看| 亚洲乱伦视频| 久久这里只有精品免费| 蜜芽一区二区国产精品| 国产系列在线| 在线观看欧美国产|