李小雪 史小茹
摘? 要:該文以西安航空學院理學院數據挖掘導論課程為例,采用問卷調查及統計方法,對影響學生混合式學習效果的16個最主要因素進行實證分析,得到學習環境、教學、個人和平臺網絡因子4個主成分,根據這4個主成分建立混合式學習效果的多元有序Logistic回歸模型,研究表明環境因子、教學因子和個人因子這3個主成分對課程的混合式學習效果產生顯著正向影響關系,并依此給出相關建議。
關鍵詞:Logistic回歸模型;混合式學習;影響因素;SPSS;數據挖掘導論
中圖分類號:G642.4? ? ? 文獻標志碼:A? ? ? ? ? 文章編號:2096-000X(2023)31-0019-04
Abstract: This paper takes the course Introduction to Data Mining of School of Science of Xi'an Aeronautical Institute as an example, using questionnaire survey and statistical methods to analyze 16 factors affecting students' blended learning effect, and four principal components are obtained: learning environment, teaching, personal and platform network factors. Based on the four principal components, a multiple ordered Logistic regression model of mixed learning effect is established, and relevant suggestions are given.
Keywords: logistic regression model; blended learning; influencing factors; SPSS; Introduction to Data Mining
線上線下相結合的混合教學模式使學習不再局限于傳統的課堂教學,網絡與多媒體為學習者創造了更加生動、立體的學習環境,使學習者從單一的標準化知識變成了個性化的差異化學習。2018年,教育部發布《關于加快建設高水平本科教育全面提高人才培養能力的意見》指出,通過教學改革促進學習革命,積極推廣小班化教學、混合學習、翻轉課堂,大力推進智慧教室建設,構建線上線下相結合的教學模式[1]。混合式學習結合了在線教學和傳統就教學的優勢,能夠為學生提供豐富的教學資源和更加高效自由的交流方式[2]。2019年,英聯邦學習共同體發布了混合學習的質量評估標準,該標準從質量保障的角度對高校實施混合學習的實踐過程進行了評估,旨在指導與協助東非地區各大學自主開發并共享混合學習的教學資源,以提高混合學習質量[3]。2022年,《教育部2022年工作要點》提出實施教育數字化戰略行動,積極發展“互聯網+教育”,加快推進教育數字轉型和智能升級,改進課堂教學模式和學生評價方式[4]。這也說明,實施教育數字化成為教育部工作之一。通過梳理可發現,盡管各學者在定義混合式學習時有著不同的角度和側重,但混合式學習的含義大致相同,其核心都是根據學習者不同的學習能力,線上線下相結合來提高學習效率。
數據挖掘導論是一門算法較多、理論較強的課程。本文利用調查問卷,基于Logistic回歸模型對影響學生學習效果的影響因素進行調查分析,利用相關結果剖析課程學習存在的問題,同時給出混合式學習的建議。
一? 多元有序Logistic回歸模型的建立與求解
(一)? 數據采集
通過前期對課程教學的分析,學生課堂注意力集中情況、課程知識點掌握情況、課程內容的難易度和課程線上學習平臺等因素都會在不同程度上影響學生混合學習效果。本次調查面向西安航空學院理學院學習數據挖掘導論課程的141名學生,調查問卷選取了17個問題,共發放141份,回收134份,問卷回收有效率95.04%。
(二)? 因子分析
本文利用SPSS,選取KMO統計和巴特利球形檢驗法來檢驗相關性。通過對134份有效問卷數據進行分析,數據信度檢驗KMO為0.848,顯著性為0.000,說明變量之間可以做因子分析。
本文采用主成分分析法做因子提取,通過累計貢獻率來確定公共因子。一般,累計貢獻率達到75%以上就說明有公共因子。但在實際中,由于一些不可控因素,累計貢獻率在60%以上就可以接受。
為研究影響混合學習效果的因素,本文選取課程學習效果為因變量,自變量分別為學生課堂注意力集中程度、教師教學組織合理情況、線上資源需求情況和班級學習氛圍情況等,具體變量及賦值情況見表1。
利用SPSS進行因子分析,提取方法為主成分分析法,結果表明,4個因子變量累積的總方差在60%以上,達到要求,可以用來解釋大部分的因子成分。其中,第1、2、3、4個因子可以解釋總方差的39.184%、49.295%、57.085%和64.138%。為保證提取因子的準確性,結合SPSS碎石圖加以驗證,由圖1可知,拐點在5附近出現,5之后圖像變得平緩。同時結合主成分分析結果,可以得到最后的4個公共因子,得到旋轉后的成分矩陣見表2。
根據旋轉后的成分矩陣可得出以下結論。
1)第1個因子包括變量x13、x14、x15和x16所對應的內容,主要與學習環境相關,因此該因子命名為學習環境因子F1。
2)第2個因子包括變量x3、x6、x7、x8、x10和x11所對應的內容,主要與教學相關,因此該因子命名為教學因子F2。
3)第3個因子包括變量x1、x2、x4和x5所對應的內容,主要與個人因素相關,因此該因子命名為個人因子F3。
4)第4個因子包括變量x9和x12所對應的內容,主要與平臺網絡有關,因此該因子命名為平臺網絡因子F4。
同時,根據表3得到的成分得分系數矩陣。
(三)? 多元有序Logistic回歸模型的建立
由于因變量學習效果(y)的水平存在序次關系,因此本文采用累積Logistic回歸模型,該模型是針對多分類變量而構建的回歸模型,基本形式為
式中:P(y≤j)表示y落在或小于某一特定j的概率,即y的累積概率。xi(i=1,2,…,n)為自變量組,βi(i=1,2,…,n)表示xi對因變量y落在類或小于的類別的對數優勢的效應[5-6]。
本文因變量為混合式學習效果,共有3個等級,其中y=1表示“無效果”,y=2表示“有一定效果”,y=3表示“效果較好”,y=3是參照項。自變量為主成分F1,F2,F3和F4,建立的有序多分類Logistic回歸模型為
式中:α1,α2,βi為Fi(i=1,2,3,4)對應的待估計回歸系數。
通過對4個因子進行平行線檢驗,檢驗結果P=1.000>0.1,說明各回歸方程互相平行,本文選擇有序多分類Logistic回歸模型是合適的。
(四)? 多元有序Logistic回歸模型的求解與分析
利用SPSS,輸入因變量及4個因子,得到結果見表4。
為解釋模型的意義,利用式(5)可推出變量xi在xi=a與xi=b 2點累積概率的優勢比
式中:xi為式(5)中的自變量,βi為xi對應的參數估計值[7]。
結合表4和式(10),對于課程學習效果的類別j=1、2來說,分析結果如下。
第1個主成分學習環境因子的回歸系數的值為2.131,說明學習環境因子會對學習效果產生顯著的正向影響關系。優勢比為8.423,意味著學習環境因子增加一個單位時,學習效果增加幅度為8.423倍。
第2個主成分教學因子的回歸系數的值為1.364,說明教學因子會對學習效果產生顯著的正向影響關系。優勢比為3.912,意味著教學因子增加一個單位時,學習效果增加幅度為3.912倍。
第3個主成分個人因子的回歸系數的值為1.317,說明個人因子會對學習效果產生顯著的正向影響關系。優勢比為3.732,意味著教學因子增加一個單位時,學習效果增加幅度為3.732倍。
第4個主成分平臺網絡因子的顯著性大于0.01,說明平臺網絡因子對學習效果沒有顯著影響,也就說該課程的網絡學習平臺對學生的學習效果沒有顯著影響。
綜上所述,環境因子、教學因子、個人因子對數據挖掘導論課程的混合式學習效果產生顯著正向影響關系。
二? 結論
本文采用多元有序Logistic回歸模型對數據挖掘導論課程混合式學習效果的影響因素進行了分析。根據分析結果,環境、教學和個人因子對數據挖掘導論課程的混合式學習效果產生顯著正向影響關系,網絡學習平臺對學生的學習效果沒有顯著影響。因此,在今后課程的教學中,教師應理論與實踐相結合,多學科結合,合理安排課程內容、優化教學手段、營造良好學習氛圍及嚴格要求學生等,以達到最佳學習效果。
另外,本文在調查研究時,選出了影響混合式學習效果的16個因素,影響因素的篩選還不夠全面,可能還存在其他因素如心理因素等未被列入,后續還將根據教學運行情況等繼續進行研究并完善。
參考文獻:
[1] 教育部關于加快建設高水平本科教育全面提高人才培養能力的意見[EB/OL].http://www.moe.gov.cn/srcsite/A08/s7056/201810 /t20181017_351887.html.
[2] 張玉辛.混合學習環境下教師教學行為對大學生學習投入的影響研究[D].大連:遼寧師范大學,2022.
[3] 許冬平,顧鑫城,陳勇.英聯邦混合學習質量評估標準探析[J].上海教育評估研究,2022,11(4):57-61.
[4] 教育部2022年工作要點[EB/OL].http://www.moe.gov.cn/jyb_sjzl /moe_164/202202/t20220208_597666.html.
[5] 王濟川.Logistic回歸模型方法與應用[M].北京:高等教育出版社,2001:91-171.
[6] [美]弗雷德·C.潘佩爾.Logistic回歸入門[M].周穆之,譯.上海:格致出版社,2015.
[7] 趙國瑞,崔慶岳,田振明.高職學生數學學習興趣影響因素研究——基于決策樹和累積Logistic回歸模型[J].數學的實踐與認識,2018,48(24):304-310.
基金項目:2021年教育部高等教育司產學合作協同育人項目“應用型本科院校《機器學習與數據挖掘導論》課程的教學改革研究——以西安航空學院為例”(202102211120);2021年度西安航空學院高等教育教學改革項目“大數據背景下的《機器學習與數據挖掘導論》課程教學改革研究”(21JXGG2022);2022年校級課程思政示范課程建設項目“《數據挖掘導論》”(22KCSZ07);2019年西安航空學院教學質量工程資助項目“信息與計算科學專業導論”(19ZLGC5023)
第一作者簡介:李小雪(1988-),女,漢族,陜西合陽人,博士,副教授,碩士研究生導師。研究方向為數據分析、數論及其應用。