999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

名義變量的關聯強度分析

2017-08-11 10:48:45戴建國
商丘師范學院學報 2017年9期
關鍵詞:關聯

戴建國

(廣州大學 數學與信息科學學院,廣東 廣州 510006)

?

名義變量的關聯強度分析

戴建國

(廣州大學 數學與信息科學學院,廣東 廣州 510006)

針對獨立性檢驗統計量不能度量關聯性強弱和一些關聯測度不具解釋性的問題,首先介紹了Goodman—Kruskal提出的兩種度量名義變量間關聯性強弱的指標,然后將其拓展到多變量的情況,并給出了實例進行分析,結果表明其對實際情況的確有更好更合理的解釋意義.

名義變量;關聯測度;可解釋性

0 引 言

隨著大數據時代的興起,在數據分析工作中經常會遇到離散變量數據的情況,在醫學和社會學統計工作中尤為普遍,而其也通常是通過列聯表的形式來分析.在對于最簡單的二維名義變量列聯表(即兩個變量都不存在自然序)分析時,通常只對兩個名義型變量進行獨立性檢驗,涉及到的檢驗統計量有皮爾遜卡方統計量,Yate’s連續修正卡方統計量,似然比等檢驗統計量.但對于獨立性檢驗統計量來說,它們只能驗證變量間有沒有關聯,而不能給出一個度量關聯的指標,當然也存在一些度量列聯表中變量關系強弱的指標,比如Phi系數,列聯系數,Cramer’s系數[1]等一些度量指標,而他們依然存在局限性,首先它們作為一個度量指標沒有給出合理的解釋,其次是比較難用于高維列聯表的情況.而本文介紹的測度λGK,τGK克服了這些局限性,它們是Goodman—Kruskal在1954年提出來的[2],其都是以引入某變量后而減少預測誤差比例為基礎來構造的統計量.目前對于這兩個關聯測度的研究與應用的文獻有[3-6],尤其在文獻[3]中從不同的角度給出了τGK的更為一般的形式和深入的研究.

1 列聯表的概念與結構

設一個二維列聯表,其行為名義變量A有r個類別,列為名義變量B有c個類別,如表1所示,

表1 二維列聯表的一般結構

2 關聯測度λGK,τGK的定義與解釋

2.1 關聯測度λGK

當有兩個名義變量X,Y時,分別視為自變量和因變量,設它們的類別數分別為I,J,則有一個二維列聯表與之對應,其主要過程是基于最佳預測,當不知道X信息時,自然而然會將Y預測為其邊緣概率最大的一類;知道X信息時,則在X的每一個類別下預測Y類別中最大的那一類,其相對減小即為:

當可拓展到有n個名義變量的情況,設其中一個因變量為Y,其他n-1個為自變量記為X1,……X(n-1),對應的類別數分別為N1,……,N(n-1),則對應的關聯測度為:

2.2 關聯測度τGK

3 實例分析

表2 有關黨派認同的數據

4 結束語

對于以上給出的關聯測度,其與一些檢驗統計量和關聯指標相比,不僅能度量關聯性的強弱,而且具有可解釋性,在國外已被廣泛討論與應用,但在國內比較少人關注這兩個關聯測度,而且隨著R軟件的普及,也有專家給出計算相關指標的函數包,并命名為Goodman-Kruskal以方便被更多人使用,但該包中只給出兩個名義變量的計算函數,并沒有給出多變量的情況,所以有待進一步去研究.

[1]薛允蓮,姜世強,劉貴浩,等.列聯表資料的關聯強度[J].中國衛生統計,2011,28(3):244-246.

[2]GoodmanLA,KruskalWH.MeasuresofAssociationforCrossClassifications[J].Springer-Verlag,1979,31(49):20-30.

[3]HuangW,ShiY,WangX.Anominalassociationmatrixwithfeatureselectionforcategoricaldata[J].Statistics,2013,25(25):58-65.

[4]BiswasA,ParkE.Measuresofassociationfornominalcategoricalvariables☆[J].JournaloftheKoreanStatisticalSociety,2009,38(3):247-258.

[5]TahaA,HadiAS.Pair-wiseassociationmeasuresforcategoricalandmixeddata[J].InformationSciences,2016,s346-347:73-89.

[6]LeeAJ.Somesimplemethodsforgeneratingcorrelatedcategoricalvariates[J].ComputationalStatistics&DataAnalysis,1997,26(2):133-148.

[責任編輯:王 軍]

Nominal variable correlation strength analysis

DAI Jianguo

(School of Mathematics and Information Science,Guangzhou University,Guangzhou 510006,China)

in view of the independence test statistics can’t measure strength of correlation and some associated measures can’t be interpreted,first introduced the Goodman-Kruskal correlations strength index between two nominal variables i,then extended to multivariable case,and gives the examples were analyzed,and the results show that the fact there are better and reasonable explanation.

nominal variables;correlation measure;interpretability

2017-02-21

戴建國(1992—),男,江西撫州人,廣州大學碩士研究生,主要從事概率統計,數據挖掘的研究.

O211

A

1672-3600(2017)09-0011-03

猜你喜歡
關聯
不懼于新,不困于形——一道函數“關聯”題的剖析與拓展
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
船山與宋學關聯的再探討
原道(2020年2期)2020-12-21 05:47:06
“一帶一路”遞進,關聯民生更緊
當代陜西(2019年15期)2019-09-02 01:52:00
新制度關聯、組織控制與社會組織的倡導行為
奇趣搭配
基于廣義關聯聚類圖的分層關聯多目標跟蹤
自動化學報(2017年1期)2017-03-11 17:31:17
智趣
讀者(2017年5期)2017-02-15 18:04:18
探討藏醫學與因明學之間的關聯
西藏科技(2016年5期)2016-09-26 12:16:39
GPS異常監測數據的關聯負選擇分步識別算法
主站蜘蛛池模板: 国产精品成人观看视频国产| 久久综合丝袜长腿丝袜| 色婷婷成人| 91久久国产综合精品女同我| 国产精品人成在线播放| 666精品国产精品亚洲| 无码免费视频| 黄色福利在线| 99re热精品视频国产免费| 婷婷开心中文字幕| 伊人无码视屏| 一区二区日韩国产精久久| 强奷白丝美女在线观看| 中文字幕欧美日韩| yjizz国产在线视频网| 国产国产人在线成免费视频狼人色| 爱爱影院18禁免费| 国产丝袜第一页| 色综合国产| 国产成人精品一区二区秒拍1o| 国产经典三级在线| 极品av一区二区| 波多野结衣中文字幕一区| 久草中文网| 成人在线欧美| 免费一级大毛片a一观看不卡| 日韩国产综合精选| 亚洲日韩高清无码| 一级毛片在线播放免费| 午夜视频www| 欧美一级特黄aaaaaa在线看片| 综合色88| 无码丝袜人妻| 久久大香伊蕉在人线观看热2| 日韩在线2020专区| 日韩av在线直播| 日韩中文无码av超清| 国产免费网址| 真人免费一级毛片一区二区| 久久国产精品影院| 高清乱码精品福利在线视频| 国产综合网站| 直接黄91麻豆网站| 在线另类稀缺国产呦| 在线观看亚洲人成网站| 精品一区二区无码av| 在线观看国产精品一区| 2021最新国产精品网站| 天堂成人在线视频| av手机版在线播放| 亚洲一级毛片在线观| 午夜成人在线视频| 亚洲精品综合一二三区在线| 日韩视频免费| 国产一区二区网站| 免费一级大毛片a一观看不卡 | 91视频国产高清| 色视频国产| 日韩高清成人| 国内精自视频品线一二区| 四虎AV麻豆| 欧美精品aⅴ在线视频| 国产精品无码久久久久久| 国产自在自线午夜精品视频| 亚洲午夜综合网| 国产精品午夜电影| 国产成人精品无码一区二| 日韩国产亚洲一区二区在线观看| 国产亚洲成AⅤ人片在线观看| 国产乱人伦精品一区二区| 国产精品乱偷免费视频| 国产自视频| 在线观看国产精品一区| 午夜激情婷婷| 国产91熟女高潮一区二区| 亚洲精品免费网站| 99青青青精品视频在线| 日韩福利在线观看| 国模极品一区二区三区| 亚洲高清无在码在线无弹窗| 日本高清免费不卡视频| 丁香婷婷综合激情|