肖明魁



摘要:隨著大數(shù)據(jù)時(shí)代的來(lái)臨,計(jì)算機(jī)及相關(guān)數(shù)據(jù)分析專業(yè)軟件被廣泛運(yùn)用于數(shù)據(jù)分析,建模及數(shù)據(jù)挖掘等領(lǐng)域。在當(dāng)今社會(huì)生產(chǎn)經(jīng)營(yíng)活動(dòng)中,對(duì)于諸如產(chǎn)品定位,客戶細(xì)分,社會(huì)調(diào)研,工程管理等各行業(yè)研究,經(jīng)常會(huì)采用多重對(duì)應(yīng)分析法,用于揭示同一變量的各個(gè)類別之間的差異,以及不同變量各個(gè)類別之間的對(duì)應(yīng)關(guān)系。本文以某高校大學(xué)生心理調(diào)查數(shù)據(jù)作為依據(jù),研究和分析多重對(duì)應(yīng)法在現(xiàn)實(shí)中的具體應(yīng)用,對(duì)于開(kāi)展大學(xué)生心理指導(dǎo)和教育工作具有一定借鑒意義。
關(guān)鍵詞:大數(shù)據(jù);SPSS;對(duì)應(yīng)分析
中圖分類號(hào):TP311? ? ?文獻(xiàn)標(biāo)識(shí)碼: A
文章編號(hào):1009-3044(2021)02-0202-02
1 基本概念介紹
對(duì)應(yīng)分析法又稱關(guān)聯(lián)分析,R-Q因子分析,對(duì)應(yīng)分析是在傳統(tǒng)因子分析基礎(chǔ)上發(fā)展起來(lái)的一種新型多元統(tǒng)計(jì)分析法,相對(duì)于傳統(tǒng)因子分析,對(duì)應(yīng)分析可將研究對(duì)象的樣本和變量聯(lián)系在一起,綜合處理,不僅降低了因子選擇和因子旋轉(zhuǎn)等計(jì)算過(guò)程的復(fù)雜度,而且便于直觀,高效,簡(jiǎn)單地展示分析結(jié)果,適合于多分類變量數(shù)據(jù)研究。
對(duì)應(yīng)分析可分為簡(jiǎn)單對(duì)應(yīng)分析(只有兩個(gè)分類變量)和多重對(duì)應(yīng)分析(樣本多于兩個(gè)變量),簡(jiǎn)單對(duì)應(yīng)分析是分析兩個(gè)分類變量間的關(guān)系,而多重對(duì)應(yīng)分析則是分析一組屬性變量之間的相關(guān)性,二者均是以散點(diǎn)在低維空間中的行列位置表示相關(guān)強(qiáng)度。簡(jiǎn)單對(duì)應(yīng)分析中的變量通常為分類頻數(shù),而多重對(duì)應(yīng)分析中變量除分類變量外還可使用數(shù)值型變量。
2 多重對(duì)應(yīng)分析的條件和步驟
2.1 多重對(duì)應(yīng)分析的條件
首先,多重對(duì)應(yīng)分析法不能自動(dòng)篩選變量,需要用戶手動(dòng)操作;其次,該方法對(duì)于數(shù)據(jù)樣本量要求較大,尤其對(duì)少數(shù)極端值變化較為敏感;再次,其分析結(jié)果通常以圖形方式展現(xiàn),對(duì)缺乏經(jīng)驗(yàn)的用戶而言容易造成誤判;最后,當(dāng)數(shù)據(jù)樣本變量增減變換后,處理結(jié)果會(huì)產(chǎn)生很大差異。
2.2 多重對(duì)應(yīng)分析的步驟
1)將原始數(shù)據(jù)樣本經(jīng)規(guī)格化和最優(yōu)尺度變換處理后,得到樣本概率列聯(lián)表。
2)計(jì)算Z矩陣。
3)根據(jù)變量相關(guān)系數(shù)矩陣Σr和樣本斜方差矩陣Σc進(jìn)行多維變量因子分析和樣本因子分析,并推導(dǎo)出結(jié)果。
4)以散點(diǎn)或線條在二維圖上展示樣本變量狀態(tài)并分析其相關(guān)性。
3 具體案例分析
這里以某高校大學(xué)生心理調(diào)查問(wèn)卷數(shù)據(jù)為例,共計(jì)555個(gè)有效樣本,從中提取九個(gè)變量,分別從九個(gè)方面表示大學(xué)生不同的心理狀態(tài)和興趣愛(ài)好,如幸福度,自我感覺(jué),精力水平,孤獨(dú)感,情緒控制力,易怒性,戶外活動(dòng),體育活動(dòng),交友等,每個(gè)變量依據(jù)程度,由低到高分為五級(jí)。案例研究的目標(biāo)是探索大學(xué)生心理狀態(tài)和興趣愛(ài)好之間的相關(guān)性,分析軟件采用IBM SPSS statistics,分析結(jié)果以圖表方式展現(xiàn),結(jié)果如下。
首先需要對(duì)原始數(shù)據(jù)九個(gè)變量作相關(guān)分析,如表1和表2的行列陣所示,經(jīng)過(guò)軟的后的不同變量之間相關(guān)度也有所不同,數(shù)值越大,相關(guān)度越高。表3是數(shù)據(jù)模型摘要表,反映了樣本變量的信度系數(shù),特征值及慣量等統(tǒng)計(jì)信息,多重對(duì)應(yīng)分析將原始數(shù)據(jù)九個(gè)變量經(jīng)過(guò)最優(yōu)尺度變換后,得到兩個(gè)維度,信度系數(shù)分別為0.718和0.591,慣量即方差貢獻(xiàn)率分別為0.307和0.234。表3展示了各變量區(qū)分測(cè)量的結(jié)果,以坐標(biāo)軸分別代表兩個(gè)不同維度, 原始變量在圖中不同的位置反映出該變量在不同維度上所攜帶的信息量,變量的某個(gè)坐標(biāo)值越高,說(shuō)明該變量在某個(gè)維度上關(guān)聯(lián)度越強(qiáng),如果變量的兩個(gè)坐標(biāo)值都很高,說(shuō)明該變量和兩個(gè)維度均有強(qiáng)相關(guān)性。如圖中所示,變量“energylevels”和“happiness”和兩個(gè)維度都有很強(qiáng)的相關(guān)性,而變量“l(fā)oneliness”和維度1相關(guān)性較強(qiáng),“moodswings”則和維度2相關(guān)度更強(qiáng),至于“countrysideoutdoors”“funwithfriends”“activesport”三個(gè)變量在兩個(gè)維度上的相關(guān)性均相對(duì)較弱。
圖2是類別點(diǎn)聯(lián)合圖,以散點(diǎn)圖的形式向用戶展示數(shù)據(jù)樣本各變量之間的相關(guān)性強(qiáng)弱,聯(lián)合圖用不同顏色的散點(diǎn)代表不同原始變量,標(biāo)簽則標(biāo)注了變量頻數(shù)和數(shù)值等信息,和區(qū)分測(cè)量圖一樣,以坐標(biāo)軸表示兩個(gè)不同維度,用戶通過(guò)觀察各個(gè)散點(diǎn)的坐標(biāo)分布,可以分析出數(shù)據(jù)變量之間相關(guān)性。本圖中增加了兩根十字交叉的輔助線,將聯(lián)合圖分為四個(gè)象限,有助于更清楚地觀察分析統(tǒng)計(jì)結(jié)果。首先,在第一象限中,有一些散點(diǎn)大體沿相同方向有規(guī)律地分布,說(shuō)明這些散點(diǎn)所代表的變量具有較強(qiáng)的相關(guān)性,因而可以認(rèn)為這些變量代表了一部分特征人群,尤其是“happiness”“personality”這兩個(gè)變量的維度坐標(biāo)值都相對(duì)較高,說(shuō)明這些變量所代表的屬性在相關(guān)特征人群中表現(xiàn)更為明顯。此外,這兩個(gè)變量在四個(gè)象限中的坐標(biāo)分布又相當(dāng)分散,則說(shuō)明這兩種屬性在不同特征人群中區(qū)別較為明顯。在第二象限中,發(fā)現(xiàn)另一些散點(diǎn)沿某個(gè)方向呈現(xiàn)類似規(guī)律的分布狀態(tài),同樣可以理解為這部分變量代表了另一部分特征人群,并且通過(guò)進(jìn)一步觀察,發(fā)現(xiàn)這些散點(diǎn)變量的頻數(shù)值與第一象限變量值成反比,由此說(shuō)明,這兩種特征人群屬于截然不同的類型。第三和第四象限中,各個(gè)散點(diǎn)距離原點(diǎn)較近,并且分布較為集中,變量值也較為居中,可以認(rèn)為,這部分人群屬于差異相對(duì)較小,沒(méi)有明顯的特征屬性,并且在各個(gè)方面表現(xiàn)較為“平均”的類型。
4 案例分析總結(jié)
通過(guò)以上多重對(duì)應(yīng)分析法對(duì)高校大學(xué)生調(diào)研問(wèn)卷的分析和理解,可以得出以下幾個(gè)判斷和結(jié)論:
1) 被調(diào)查樣本依據(jù)性格愛(ài)好大體可分為三類:自信開(kāi)朗型,消極自卑型,“平均”型;
2)自信開(kāi)朗型人群的性格特征表現(xiàn)為以下幾個(gè)特點(diǎn):自信心十足,情緒控制力強(qiáng),積極開(kāi)朗,精力旺盛,樂(lè)善合群等;
3)與之對(duì)應(yīng),消極自卑型人群則表現(xiàn)出:自信心不足,悲觀消極,性格孤僻,精神不振,易怒易躁等特點(diǎn);
4)自信開(kāi)朗型人群更愛(ài)好戶外運(yùn)動(dòng)、社交、體育活動(dòng)等,消極自卑型人群則正好相反;
5) 大多數(shù)“平均”型人群性格愛(ài)好位于二者之間;
6)社交,體育活動(dòng)及戶外運(yùn)動(dòng)等興趣愛(ài)好與學(xué)生性格塑造和完善有著較強(qiáng)的相關(guān)性,因而在學(xué)生培養(yǎng)過(guò)程中應(yīng)當(dāng)予以重視和引導(dǎo)。
參考文獻(xiàn):
[1] 關(guān)炯暉,楊振杰.偏最小二乘回歸法在海洋初級(jí)生產(chǎn)力影響因子分析中的應(yīng)用[J].漁業(yè)科學(xué)進(jìn)展,2014,35(5):19-25.
[2] 閻麗萍,余姝緯,崔超英.基于因子分析法的二級(jí)學(xué)院績(jī)效考評(píng)研究[J].商業(yè)會(huì)計(jì),2014(18).
[3] 李燕華,路立敏.基于因子分析的水泥行業(yè)上市公司財(cái)務(wù)績(jī)效研究[J].現(xiàn)代商貿(mào)工業(yè),2020(26).
[4] 陳媛媛.基于解釋結(jié)構(gòu)模型的高校輔導(dǎo)員職業(yè)能力因子分析[J].兵團(tuán)教育學(xué)院學(xué)報(bào),2020,30(4):30-34.
[5] 李麗媚.基于因子分析的高校閱讀推廣之影響因子實(shí)證研究[J].科技視界,2020(21):107-110.
【通聯(lián)編輯:梁書(shū)】