王曉丹,王 正,懷麗波
(延邊大學 計算機科學與技術專業,吉林 延吉 133002)
計算機程序設計課程不僅是培養學生編程能力的重要課程,也是養成學生計算思維的重要手段,一直被廣泛關注。近年來,有關計算機程序設計課程的教學研究成果甚多,有基于教學模式[1-2]或提升學生主觀意識方面的改革[3-4],有基于特定人群的課程培養研究成果[5],也有基于統計學檢驗方法在教學、科研領域的應用。但其中很多研究已暴露了明顯不足:有些研究忽視了客觀因素的現實存在及其影響,有些對客觀因素缺乏科學的、深層的挖掘,甚至有檢驗方法的濫用、誤用現象存在[6-7]。
本研究以少數民族地方性綜合大學——延邊大學為研究對象,該校農、醫、文、史、經、法等18個學院將計算機程序設計設為公共必修課。本研究收集了2013—2017年共15 000多個觀測,考生涵蓋了30個省份和2個直轄市,共31個民族的學生,每屆學生打亂專業隨機分班,每屆教師與專業班級不固定分配,既避免了數據抽樣產生的誤差問題,又排除了教師水平差異或班級學習氛圍等主觀因素對觀測值的影響。
對數據分類或分組之前,數據的預處理是保證結論準確的必要環節。本研究首先通過數據審核,將缺考生、補考生及轉專業學生的重復考試成績等臟數據刪除,以學號為唯一標識,保證僅取每名學生的第一次非零成績為有效觀測。通過對5屆學生計算機程序設計成績的數據清洗,共得到13 035個有效觀測。程序設計的百分制成績依照以下統計方法的需要將被分為優、良、中、及、差5個等級,或者及格、不及格2個等級。學生按照性別、考生類別、省份、民族4種方式分類后,可得到聯合分布頻數(見表1—表4)。
但聯表中的數據是樣本數據,它只是總體的代表,具有隨機性,故需要用獨立性檢驗的方法確認所得結論在多大程度上適用于總體。由于獨立性檢驗有兩條準則[8]:一是,如果只有兩個單元,每個單元的期望頻數必須是5或5以上;二是,對于兩個以上的單元,必須滿足20%以上的單元期望頻數大于5。頻數期望值公式如式1所示:

RT為給定單元所在行的合計;CT為給定單元所在列的合計;n為觀測總數。為保證單元期望頻數大于5,單元所在列的合計最小值可由式(2)得出:


表2 考生類別與成績聯合分布頻數

表3 省份與成績聯合分布頻數

表4 民族與成績聯合分布頻數
因此,本研究在做民族與成績的x2獨立檢驗時,只保留人數最多的7個民族;相應的省份分類也保留了人數最多的7個,以保證相關系數比較分析結果的準確性。
本研究采用獨立性檢驗,通過列聯表方式呈現及量化計算兩個分類變量是否存在聯系。僅以考生類別分類成績與計算機程序設計成績的相關性判定為例,說明x2檢驗的過程。
設H0:考生類別和計算機程序設計成績之間是獨立的(不存在依賴關系);H1:考生類別和計算機程序設計成績之間不獨立(存在依賴關系)。通過頻數期望計算公式(式1)及x2計算公式(式3),可列出考生類別與成績統計量計算表(見表5)。


表5 統計量計算表
x2自由度=(R-1)(C-1)=4,為降低犯第二類錯誤的風險,即降低“零假設為假卻被接受”的概率,可適當提高犯第一類錯誤的概率,故將a水平定的高一些[7],可令a=0.1,查詢《x2分布臨界值表》可知:x20.1(4)=7.779。由于x2 2(4),故接受H0,拒絕H1,即考生類別與計算機程序設計成績之間不存在依賴關系,故我們不會對文理科類別繼續進行相關系數的分析。 同樣的方法可求得性別、省份、民族3個類別的x2值分別為 367.770,806.765,1 699.023。為降低犯第一類錯誤的風險,即降低“零假設為真卻被錯誤拒絕”的概率[7],可將a的值定得低一些。由《x2分布臨界值表》顯示,即使a取0.01,上述結果也遠遠大于中相應的x0.012(4)=13.277,x0.012(24)=42.980,x0.012(24)=42.980。 在很多研究中發現,x2檢驗的前提條件和應用局限性往往被忽視了,為避免夸大該方法的功能,我們對結果進行了兩方面的修正:一是要避免樣本過大對檢驗結果的影響;二是通過不同分組的重復性試驗,驗證結論準確度。 有研究表明當x2值達到顯著程度而且樣本含量又很大時, 需要參照Pearson 列聯系數 C 值的大小, 如果C值也很大, 才可以拒絕零假設[6]。 公式(4)中x2由上一步的獨立性檢驗得出,n為樣本總數,因此C值的區間為0≤C<1。但只有相同行數和列數的聯合分布頻數表才可以比較。因此通過Pearson列聯系數,首先可計算出省份、民族這兩個類別的C相關系數值分別為0.2615、0.3410,從而確定了民族這一因素,與省份相比,與計算機程序設計課程成績的相關程度更高。而且,省份與成績的相關系數小于0.3,被認為是弱相關或不相關;民族因素結果所處范圍是[0.3,0.5],被認為是低度相關。 根據民族的箱線圖(圖1)顯示:朝鮮族學生成績的中位數(箱體中的橫線)、上下四分位數(箱體上、下沿)以及最低成績(最下方短線)均明顯低于其他民族;而且有些民族的箱線尾部存在異常值,說明此民族僅有極個別學生的成績異常低(一般認為超出箱體1.5倍距離的值為異常值),相反有25%的朝鮮族學生成績較均勻地分布在(0,42)分之間,而非極偶然現象。 因此表6將學生分為朝鮮族和非朝鮮族兩組,使其與性別分類的頻數表(表1)行列數相等。再分別計算x2值,通過φ相關系數繼續深入比較性別因素與民族因素對于成績的影響程度。由計算得到性別與成績的φ相關系數為0.18,而是否為朝鮮族的分類與成績的φ相關系數為0.31。 綜合兩種檢驗方法,我們得出相同的檢驗結果:少數民族地區高校范圍內,民族因素對計算機程序設計成績影響最為顯著;而且延邊地區高校中朝鮮族學生的程序設計成績明顯低于其他民族學生的成績。 圖1 各民族學生成績的圖形比較 表6 民族與成績的聯合分布頻數 對以上實驗過程繼續深入分析,可得出以下幾點結論: (1)本研究選取的各個客觀因素是教學過程及相關研究中涉及的,被認為會影響計算機程序設計成績的幾項因素。但統計結果表明,僅有民族這一因素與計算機程序設計成績低度相關,省份與性別呈現弱相關或不相關性。由此可見:一是結論符合主觀因素起決定作用的矛盾論觀點;二是不排除其他客觀因素對成績的影響。 (2)本研究和同類研究相比,樣本量較大,一方面最大限度地減小了隨機抽樣誤差,但另一方面有可能引起x2值過大,因此驗證零假設成立的準確性更高,即可以確定考生類別與計算機程序設計成績之間不存在依賴關系。進而說明部分高校取消該課程的文、理科區別教育是明智之舉。教師在教學過程中應充分相信文科生可以掌握該難度的程序設計,文科學生也應有信心掌握好該課程。 (3)研究中發現來自吉林省的學生成績在省份分類中處于最低,有可能因為吉林省有42.3%的考生是朝鮮族,朝鮮族學生中85.7%來自吉林省,這種樣本可能影響吉林省考生成績的相關分析結論。但是研究中的樣本雖不能保證各客觀因素之間的影響完全分離,但實驗數據在很大程度上能夠體現民族、省份、性別因素的客觀存在性。 (4)7個民族與7個省份之間的比較,是否為朝鮮族與性別之間的比較分析結果同時顯示:少數民族地區的民族因素對計算機程序課程成績的客觀影響最為顯著,尤其突出暴露了朝鮮族學生成績落后的嚴重性,這也與教學過程中多數人的體驗相吻合。筆者分析認為這與朝鮮族學生的自身特點及畢業去向有關。 第一,朝鮮族學校一直采用全朝鮮語授課,學習資料及高考試卷全部是朝文,因此朝鮮族學生對漢語課堂難免有不適應的情況;還有部分學生是日語考生,面對全英文的程序表現出了陌生感或是排斥感。第二,延邊大學的學生會與社團中的多數主力,由謙恭有禮、能歌善舞的朝鮮族學生擔任,豐富的活動練就了他們的綜合素質,但也分散了很多學習精力,從而對成績造成負面影響。第三,朝鮮語和韓國語的相通,使朝鮮族學生在韓企就業、赴韓留學時具有得天獨厚的優勢,也就使其在學習過程中感受到的壓力明顯小于其他民族的學生。 我們以較大的樣本量、嚴謹的實驗過程得出,影響計算機程序設計課程成績的客觀因素包括:民族、省份和性別,而考生類別與該課程成績不相關。這一理論成果將為區別教育、輔助教學及其他教學方法的研究提供最可靠的理論依據,可作為該領域未來相關工作的基礎。其中朝鮮族學生所代表的少數民族地區高校中,民族因素對成績的客觀影響最為顯著,已由統計學方法多角度、科學地證實,值得后續研究更加深入地剖析其成因與機制。 [1] 鐘玉峰, 運海紅, 葛冬梅. 高校VB程序設計課程教學改革研究[J].黑龍江教育(高教研究與評估),2013(5): 26-2. [2] 李媛媛, 李艷輝, 沙繼東. 高職自主學習型課堂教學模式的構建與實施——以程序設計課為例[J]. 中國成人教育, 2014(10):112-113. [3] 康桂珍. 程序設計課程教學探析[J].中國教育信息化, 2012(19): 61-63. [4] 田希山. 民族預科“程序設計語言”課教學探討[J]. 寧夏大學學報, 2004(5): 6-8. [5] 賈力, 王良, 楊智, 等. 文科學生程序設計課程的教學探討[J].云南財貿學院學報, 2000(4): 93-96. [6] 鄭兵云. 非參數x2檢驗的兩個局限性問題[J]. 統計教育, 2007(6): 8-9. [7] 鮑貴, 席雁. 統計顯著性檢驗: 問題與思考[J]. 南京工程學院學報(社會科學版)2010, 4(10): 27-32. [8] 賈俊平, 何曉群, 金勇進. 統計學[M]. 6版. 北京: 中國人民大學出版社, 2015: 216-395.3 列聯表的相關測量與因素的比較分析
3.1 相關系數檢驗

3.2 重分組檢驗


4 實驗結果分析
5 結 語