何琳 張良軍
摘要文章運用SPSS軟件對高職學生學業成績進行分析研究,探索了題型結構、效度、信度、難度、區分度方面的問題,分析了班級、文理科、民族、性別等成績的差異性,提出了適當的評價反饋和改進教學的建議,以促進教學質量的提高。
關鍵詞SPSS軟件學業成績高職學生
隨著我國高等職業教育的發展,為了保證高等職業教育的質量,有必要對高等職業院校的教學工作進行全面評估。其中,學生學業成績的評價是教學質量評價的一項主要內容。本文結合高職學生學業成績的評估工作,應用SPSS軟件進行分析,得出學生學業成績總體情況,得到試題的難度、區分度、信度等,還有學業成績的差異性與相關性,使教師、高職學生得到學生學業成績的評價反饋,在某種程度上促進教學質量的提高。
1 研究對象與方法
隨機選取某高職院校學生100名,其中,男生73名,女生27名。試卷來源GXGZY高職學生電工應用技術考試。數據管理與分析采用SPSS軟件。通過軟件測量得出學業成績的一般信息,進一步對試題的效度、信度、難度、區分度等進行分析,對不同班級、性別、民族等的考生成績進行差異性檢驗。
2 研究結果
2.1 考試題目的題型結構及分值分布
試題共四大題。第一大題為判斷題,共10小題,共20分。第二大題為填空題,共6小題,共30分。第三大題是選擇題,共四小題,共12分。第四大題是計算題,共3小題,共38分。
2.2 學業成績描述統計
學業成績的基本描述統計量包括極小值、極大值、均值、標準差、偏度和峰度等。均值代表數據的集中趨勢。數據的離散程度可用標準差描述,標準差越大說明數據間的差異越大。偏度和峰度用來描述數據分布是否對稱,偏斜程度如何,分布陡緩程度等。①
在SPSS中可以進行以下操作:分析→描述統計→描述→總體考試成績→選擇到變量框中→單擊選項→選擇描述統計量→確定。統計結果輸出,統計量100,極小值19,極大值97,均值59.98,標準差18.419,偏度-0.005,峰度-0.880。同時可以輸出頻數分布圖,看看成績分布情況。操作步驟:分析→描述統計→頻率→成績→選擇到變量框中→單擊圖表→選擇直方圖,帶正態曲線→繼續→確定。從偏度、峰度以及頻數分布圖可得,總體成績基本符合正態分布,說明這份試卷達到了檢測學生學習水平的目的。
2.3 考題的難度
難度是指全體被測對象對該題目的失分率。計算公式:難度系數P=1-(考生在該題目所得分數的平均值/該題目滿分值)。樣本總體平均值59.98,各大題難度系數分別為:0.24、0.42、0.37、0.48;標準差分別為:2.953、7.319、2.677、10.854。一般認為難度范圍應在0.3-0.8之間比較恰當,僅有第一題難度小于0.3,為判斷題,題目都比較簡單,只要學生掌握基本知識,仔細判斷就可以得高分。計算題最難,排在最后合適。選擇題難度排第二,應該排第二,讓試卷題目的難度成遞增趨勢較好。從試卷總體來看,總分難度系數為0.4,難度略偏容易。
2.4 考題的區分度
區分度是指考題對考生實際水平的鑒別能力,是把考生區別開來的統計量。在SPSS中可以進行以下操作:分析→相關→雙變量→把學生某題成績與總分選擇入變量框中→選擇相關系數→Pearson→確定。得到各大題的區分度分別為:0.468、0.811、0.543、0.889。一般來說,難度大的題目,區分度較高;難度低的題目,很多學生做對,區分度必然低。從以上可以看出。
每大題與總分的相關系數較高,在0.01的顯著性水平上相關。從上述數據分析可見,試題的區分度比較理想,且主觀題的區分度優于客觀題,這與主觀題靈活的評分方式有關。
3 研究討論與發現
3.1 考試的效度
效度是指考試的有效程度。把學生的平時成績作為效度分析的效標,利用積差相關法求效標效度(Pearson法)。在SPSS中可以進行以下操作:分析→相關→雙變量→把學生平時成績與考試總分選擇入變量框中→選擇相關系數→Pearson→確定。得到本次考試總分與平時成績的相關系數為0.966。說明平時成績好的學生這次考試也好,平時成績差的學生這次考試成績也差,因此本次考試反映了學生的真實能力,符合要求。這與考題的區分度較高的測量結果一致,表明試題的質量較好。
3.2 考試的信度
信度是衡量一次考試的可靠性、穩定性的統計指標。在SPSS中可以進行以下操作:分析→度量→可靠性分析→把分析量選入框中→統計量→選擇→同類相關系數→確定。結果本次考試的信度為:0.765。一般來說,學校教師自編試卷的信度要求0.6以上,則本次考試卷子符合要求。這與考題的區分度較高的測量結果一致,表明試題的質量較高。但是信度沒有達到0.8,影響信度的因素可能和評分、題量等有關。
從試卷的題型和分值比例可見,客觀題分值不到主觀題的一半,可能影響試卷的信度。從以上統計結果表明,主觀題的區分度比客觀題的高,證明高職電工應用技術考試中主觀題的命題效果較好。另外,這次題目量較少,不少考生提前交卷,這也是影響信度的原因。再有,題目的知識覆蓋面不夠寬,這也是影響信度的原因。
3.3 班級差異性
在不很了解兩個樣本總體分布的情況下,一般用兩個獨立樣本非參數檢驗,樣本數大于30為大樣本,用Kolmogorov-Smirnov 檢驗。用SPSS進行1班、2班學業成績間均值的差異性檢驗。基本步驟:分析→非參數檢驗→兩獨立樣本→總分→選擇到檢驗變量列表中→班級→選擇到分組變量框中→定義組→輸入1與2→繼續→選擇檢驗類型→確定。分析結果,1班46人,2班54人;K-S Z值為2.022,相伴概率為0.001<%Z=0.05,可以認為應該拒絕零假設H0,認為1班與2班學生的學業成績均值存在顯著差異。另外,在描述統計表明,1班的均值明顯比2班高,差異顯著,有高度的統計價值。
3.4 文理科學生成績差異性
用以上方法可得到,高考文科考生與理科考生的差異性。分析結果:理科63人,文科37人;K-S Z值為1.914,相伴概率為0.001<%Z=0.05,認為高考理科與文科學生的學業成績均值存在顯著差異。另外,在描述統計表明,理科的均值明顯比文科的高,差異顯著,有較高的統計價值。
3.5 漢族與少數民族學生成績差異性
用Kolmogorov-Smirnov 檢驗,基本步驟同上。分析結果:漢族60人,少數民族40人;最大絕對值差為0.100,最大正差為0.100,最大負差為-0.092,得到的K-S Z值為0.490,相伴概率為0.970>%Z=0.05,則不能拒絕零假設H0,認為漢族與少數民族學生的學業成績均值無顯著差異。
3.6 男女差異性檢驗
樣本數小于30為小樣本,用Mann-Whitney 檢驗。②分析結果:男生73人,女生27人;Z值為-0.074,相伴概率為0.941>%Z=0.05,則不能拒絕零假設H0,認為男女學生的學業成績總體分布無顯著差異。
4 結束語
4.1 試題方面
試卷的區分度、效度、信度較高,成績頻數基本趨于正態分布。題型多樣,客觀題與主觀題比例基本合理;題量還可以加大一些,特別是加大主觀題的量;知識覆蓋面還可以加寬一些;今后按照題目的難度逐漸遞增排列,以增加試卷的科學性;大多數學生兩個小時完成為合適,重點考核學生基礎知識、分析問題和解決問題的能力。
4.2 差異性檢驗
由班級差異性檢驗,推論1班、2班成績存在顯著性差異。產生原因可能與學習風氣、試題難易等有關,還有待進一步研究。由高考文理科學生成績差異性檢驗,推論文科生與理科生成績存在顯著性差異,產生原因可能與學生的數理基礎有關。由不同民族學生成績差異性檢驗無差異性,說明考試成績與民族無關。由男女學生差異性檢驗無差異性,說明學生考試成績與性別無關。
4.3 相關性分析
通過效度分析發現,學生學業成績與平時成績正相關。說明平時成績的好壞直接影響學生的學業成績。可能學生的學業成績還與其它因素有關,如學習策略、生源地、家庭情況等,還有待進一步研究。
學生的學業成績評價與平時成績、實驗操作成績,以及期末考試成績相關聯。而平時成績與考勤、作業、實驗報告相關。教師向學生提供學業成績的評價反饋,能促進高職學生主動去學習。
今后的教學重點改進教學方法,注重提高學生能力。根據高職生的特點,教學團隊制訂課程標準和課程改革設計方案;任課教師要制定每次課的教學目標,含能力目標、知識目標和素質目標;逐步采用教學做一體化教學,讓學生在做中學,學中做。采用項目式教學,利用了視屏、PPT、投影等多媒體,同時使用講授、啟發和小組討論合作實驗等教學方法;在教學活動中,確立學生的主體地位,教師作為引導,注重“教”與“學”的互動,使學生在項目活動中掌握相關的知識和技能,提高教學質量,培養高端技能型專門人才。