戴猷娟+劉文妮+王訪+陳鑰圍



摘 要:結合主成分分析、因子分析與聚類分析的思想,利用SPSS軟件對大學生信用評估問題進行研究。利用網上問卷調查得到的126名本科生反饋信息,對大學生的信用度進行評估,建立大學生信用評估體系,得到大學生群體中女性的誠信度要高于男性,并且隨著年級升高大學生的誠信度也逐漸增高的結論。
關鍵詞:大學生;信用評估;主成分分析;因子分析;聚類分析法
引言
本文在國內外個人信用評價相關理論和生活經驗的基礎上,結合大學生相關特質,確定各指標的重要程度,并用層次分析方法確定各指標的評分值,構建大學生信用評價指標體系,通過對湖南農業大學本科生進行問卷調查,獲得客觀的原始數據;將多元統計分析中的主成分分析、因子分析和聚類分析作為主要研究方法,構建大學生信用評估模型,運用SPSS統計軟件進行相關操作來評估大學生信用好壞情況,并驗證所建指標體系的可行性。
一、研究方法
1.主成分分析。主成分方法由Hotelling于1933年提出,是利用降維的思想將多指標轉化為少數幾個綜合指標的多元統計分析方法。主成分分析是對原有所有變量進行簡化,建立盡可能少的新變量,使得這些新變量兩兩不相關,并在反映研究的信息方面盡可能保持原有的信息。
2.因子分析。因子分析是用于數據化簡和降維的多元統計分析方法,是在主成分分析的基礎上構筑若干意義較為明確的公因子,以它們為框架分解原變量,以此考察原變量間的聯系與區別,主要研究的是相關陣或協方差陣內部依賴關系。
3.聚類分析。聚類分析指將物理或抽象對象的集合分組為由類似的對象組成的多個類的分析過程。目標是在相似的基礎上對收集的數據進行分類。
利用系統聚類與主成分分析和因子分析相結合的思想,分別將通過主成分分析和因子分析得到的各位同學的最終得分進行聚類,將聚類結果進行比較分析,得到大學生中信用度的集中趨勢并進行深入研究。
二、大學生信用評估體系的建立
1.數據選取與處理。本文數據通過網上調查的方法獲得,對湖南農業大學各年級本科生進行《大學生誠信情況調查問卷》隨機問卷調查,共發放問卷126份,收回有效問卷126份,有效回收率達100%。通過調查問卷收集了大學生學習、經濟、社會實踐、生活、就業等六大方面誠信情況的數據。
將研究的六大因素作為一級指標、并設置具體問題作為二級指標,建立大學生信用評估體系,在此基礎上借鑒國內外個人信用評價指標體系的研究成果和專家評分,同時根據生活實際,對各級指標的重要程度以0~10(分值越高,表示該因素對誠信更重要)進行評分,并賦予相應分值。
2.實證研究過程。首先用主成分分析法對19個變量信息提取主成分解釋總方差百分比達到90%的前n個主成分,在操作過程中,發現抽取特征值大于0.6時,主成分解釋總方差百分比達90.964%,滿足原定的期望值,此時共提取了15個主成分,將得到的因子載荷矩陣復制到數據庫中,用依次命名,再將ai對應的特征向量zi計算出來,從而計算各主成分yi,最后計算得到每位同學的綜合得分y。再用因子分析來對數據進行處理。選擇降維——因子分析,同樣抽取特征值為0.6,得到90.964%的方差累積貢獻率。
在運行后得到15個公共因子的得分,最后通過公式:
F=(8.359*FAC1_1+6.708*FAC2_1+6.459*FAC3_1+6.41*
FAC4_1+6.363*FAC5_1+6.246*FAC6_1+5.973*FAC7_1+5.777*
FAC8_1+5.725*FAC9_1+5.72*FAC10_1+5.503*FAC11_1+5.472*
FAC12_1+5.422*FAC13_1+5.414*FAC14_1+5.413*FAC15_1)/90.964
計算得到每位同學的因子得分F。用系統聚類法分別將主成分分析法和因子分析法得到的每位同學的因子分F分成三類:第一類,信用度高;第二類,信用度中等;第三類,信用度偏低。再對各類別中男女組成及年級組成進行分析,得到相關結論。
三、結果分析
模型的調試:
考慮到問卷調查是隨機的,在男女及各年級的比例上存在較大的差距,得出的結果可能與實際情況不相符,因此,對實驗結果進行進一步分析前,先要使這兩組定性變量構成比例各自相同。
在調查的126份問卷中,參與調查的性別組成為男生57人、女生69人。因此,在調試時需將實驗結果性別組成中的男生乘上126/114、女生乘上126/138,使男女總比例為1∶1,得到最終結果。
參與調查的年級組成為大一21人、大二39人、大三57人、大四9人。因此,需將實驗得出的各類別在大一、大二、大三、大四數分別乘上126/84、126/156、126/228、126/36進行調整,得到最后的結果。
四、結果分析與討論
表1 ? ? ? ? ? ? ? ?主成分分析調試后性別分析的結果
由表1可得,類別1是誠信度高的,有40人,類別2是誠信度中等的,有51人,類別3是誠信度較差的,有35人。其中,類別1和2共91人,占總體的70%,可見大學生中誠信度較高的人還是居多。在誠信度較高的人群里,男性占43人,女性占48人,可見女性誠信度要高于男性。
根據表2計算得,大一中類別1和2占大一總體的62.5%,大二中的類別1和2占大二總體的77.4%,大三中的類別1和2占大三總體的74.2%,大四中的類別1和2占大四總體的78.1%。可見,大學生的誠信水平是普遍較高的,誠信水平大致上隨著年級的升高而增加,且大四學生的誠信水平最高。
因子分析法的結果研究的實驗結果:
表3 ? ? ? ? ? ? ? ? ? ? ? ? ?不同分類下的人數
由表3可知,第三類為誠信度最低的,占總人數的80.2%;第二類為誠信度中等的,占總人數的9.5%;第一類為誠信度最高的人,僅占總人數的10.3%。運用因子分析得到的結果與主成分分析結果差異較大,且與現實不符,因此舍棄運用因子分析得到的結果。
結語
本文根據主成分分析與因子分析兩種方法對大學生的誠信調查問卷進行分析,經對比可知,主成分分析的新變量是原始變量的線性組合,每個主成分都是由原有所有變量線性組合得到,但是因子分析不是對原始變量的重新組合,而是對原始變量進行分解,利用少數幾個公共因子去解釋較多個案觀測變量中存在的復雜關系。最終發現主成分分析的結果更符合實際情況,從而剔除因子分析的結果,保留主成分分析計算的結果,得到大學生群體中女性的誠信度要高于男性,同時隨著年級升高大學生的誠信度也逐漸增高的結論,這一結論與事實吻合,一般來說,女性比男性更有還貸意識,而且隨著年級的升高學生的閱歷也逐漸增加,使他們更有責任感。最后給銀行發卡部門提出了有建設性的建議,即銀行發卡時可注重向女性或者高年級學生多發卡,可減少男性或低年級學生的發卡數。
參考文獻:
[1] ?王莉.基于SOM自組織神經網絡的企業信用評估模型[D].太原:太原理工大學計算機應用技術學院碩士學位論文,2005.
[2] ?趙靜嫻,楊寶臣.一種基于神經網絡和決策樹的信用評估新方法[J].武漢科技大學學報:社會科學版,2005,(7).
[3] ?牟太勇.商業銀行客戶信用評估方法及其應用研究[D].成都:電子科技大學數量經濟學院碩士學位論文,2004.endprint