繆盾
【摘 要】考試是一種重要的、常用的教育測量手段,在高校中被廣泛使用。如何合理的看待學生考試成績與能力的關系,是幫助學生了解自己不足,明確努力方向的關鍵,也是學生就業方向選擇和創業的判別依據。通過主成分分析的方法對大量考試數據進行數據挖掘,找出評價的綜合指標,保留原始變量的主要信息,使我們在評價學生的能力時能夠抓住主要方面。
【關鍵詞】考試成績;主成分分析;相關性
中圖分類號: R95 文獻標識碼: A 文章編號:2095-2457(2018)04-0011-003
Research on Correlation between Test Score and Ability Based on Principal Component Analysis
MIAO Dun
(Zhejiang University, Tongji University, Jiaxing, Zhejiang 314051, China)
【Abstract】Examination is an important and commonly used measure of education and is widely used in colleges and universities. How to reasonably treat the relationship between students test scores and abilities is the key to help students understand their own shortcomings and make clear the direction of their efforts. It is also the basis for the selection of students employment orientation and entrepreneurial basis. Through the method of principal component analysis, data mining is performed on a large number of test data to find comprehensive indicators for evaluation, and the main information of the original variables is preserved, so that we can grasp the main aspects when evaluating students abilities.
【Key words】Test scores; Principal component analysis; Correlation
0 引言
考試作為一種常規性的評價手段,是用來評估教與學質量和水平的重要方法,且貫穿于學生求學的各個階段節點上。尤其在高校,一門課程的考試就意味著這門課程的終結,考試成績與學生能力的關系被簡單的賦予正相關的關系,即考試成績高,則認為學生能力高,導致學生、家長甚至是教師都一味的追求高分,卻忽略了高分背后是否真正體現了高能。考試能力不代表學生真正的專業能力和學業能力,因此如何合理看待學生考試成績與能力的關系,是學生明晰自身能力偏向,擇業方向的關鍵,也是教師綜合評價學生能力,潛力和個性化教學的判別依據。
1 主成分分析法
高校學生的考試成績數據量龐大,每個個體又由很多元數據組成,個體數據和群體數據又存在復雜的聯系,給分析帶來了很大的不便。采用目前主流的統計分析方法—主成分分析法,借助計算機快速處理信息數據,能較為客觀地透過數據表象看到數據背后的內容。
1.1 方法概述
主成分分析法(Principal component analysis,簡稱PCA)首先是Hotelling在1933年提出的。主成分分析法是一種利用數學思想達到降低維數的統計方法[1],即把多指標轉化為少數幾個綜合指標(即主成分),使每個主成分能夠反映原始變量的大部分信息,這種方法在引進多方面變量的同時將復雜因素歸結為幾個主成分,使問題簡單化,同時得到的結果更加科學有效反映全部數據的信息[2]。
1.2 主成分分析步驟
設研究某一事物涉及到p個分量,每個變量都有n個數據,可以得到一個n×p階的矩陣,將其記為公式(1)[3]:X=[x(1)
其中i=1,2,…,n;j=1,2,…,p。
(1)對矩陣進行標準化處理,見公式(2)[3]:
其中xj=,則原始矩陣計算后得到的標準化矩陣為:
(2)求得標準化后矩陣的相關系數矩陣,見公式(4):rij=,j,k=1,2,…,p(4)
(3)求得相關系數矩陣R的特征值[λi]和相應的特征向量。
2 考試成績主成分分析
選取某大學2013級土木工程專業122名學生的15門專業課考試成績為分析樣本,將其各科成績作為變量,生成122*15的矩陣,部分數據如圖1所示:
將課程變量用代碼表示,如表1所示:
每位學生的學業成績為mi=[X1i,X2i,…,X15i],其中i∈[1,122]。得到考試成績原始矩陣X=,通過對樣本相關陣的內部結構關系的研究,找出影響學生成績的綜合指標,使綜合指標為原變量的線形組合。綜合指標不僅保留了原始變量的主要信息,彼此之間又不相關,比原始變量具有一些更優越的性質,使我們在評價學生的能力時能夠抓住主要方面。標準化矩陣并計算樣本相關系數,求得矩陣的特征值和貢獻率,如表2所示:
通過表2可以發現前四個主成分的貢獻值對最終結果的影響較大,因此本文選取累計貢獻率達到70%為閾值,選擇前四個主成分變量代替原始的15個變量。求得前四個主成分對應的特征向量如下表3所示:
將每個學生的相應科目成績代入上式,可以計算得到四個主成分值,第一主成分各個變量的系數均為正值,且相差不大,可以認為第一主成分值代表了學生的綜合實力。
第二主成分中,在X7,X9-X13,X15幾個變量的系數出現負數,即變量所代表的課程建筑施工,混凝土結構設計原理,基礎工程設計等課程的成績低,則F2值高,這些課程均為專業課,因此可以認為F2值高代表了學生的專業基礎扎實,但是專業能力還比較弱。
第三主成分F3中,工程制圖,結構力學,氣體結構,建筑施工,建筑設備五門課程變量的系數為負值,成績越低,此分量的值越高,而混凝土結構設計,基礎工程設計和鋼結構設計三個變量與F3是正相關的,說明得分高的學生能力偏重設計,而施工能力偏弱。
第四主成分F4中,結構力學,砌體結構,混凝土結構設計基本原理,建筑設備,地下工程,基礎工程設計,建筑鋼結構設計七門課程變量的系數為負值,當學生這七門課程成績偏低,F4值則高,第四主成分中系數為正的系數較高的變量有工程制圖,建筑施工和建筑工程法規,說明F4主成分的值主要體現了學生的識圖施工實操能力,但所體現的設計計算能力偏弱,所以通過F4主成分排序后可建議得分高的學生往施工方向就業。
3 結論
在高校,學生和教師都要理性的看待考試成績,通過先進的統計方法,挖掘考試成績[5]中隱含的意思。本文采用了主成分分析的方法,評價了畢業班學生的綜合能力,從第二、第三、第四主成分計算值中可以了解到學生在專業能力上的偏向,對學生擇業或創業,繼續深造中的方向選擇,發揮優勢,彌補劣勢提供了判別的依據,為教師開展針對性的教學改革,課程改革和分層教育提供了依據。
【參考文獻】
[1]劉佳佳,劉志杰.基于MATLAB的考試數據主成分分析[J].電腦知識與技術,2015,11(1):10-14.
[2]劉天華.技術視角下的高校考試改革探析[J].教育探索,2016,23(12):69-71.
[3]張超,彭道黎.基于PCA-RBF神經網絡的森林碳儲量遙感反演模型研究[J].中國農業大學學報,2012.57(4):148-153.
[4]李瑞琴.主成分分析在學生成績綜合評定中的應用[J].開放教育研究,2003,44(4):49-51.
[5]李真,廖興.基于大學生考試成績相關性分析-以四川大學錦城學院工業工程專業為例[J].技術與市場,2017,24(4):260-261+262.