999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習的學生學情預警方法研究

2023-11-22 06:03:25曹夢川歐陽儀伍丹杜朋軒
現(xiàn)代信息科技 2023年19期
關(guān)鍵詞:機器學習

曹夢川 歐陽儀 伍丹 杜朋軒

摘? 要:對學生的學習成績進行預測分析,提前預警學生可能存在的掛科或成績下降風險,從而幫助學生和教師更好地制定學習計劃和提高教學效率。采集了包括學生的平時成績、考勤、性別和期末成績等多種因素的數(shù)據(jù),使用線性回歸模型進行數(shù)據(jù)建模和預測分析。研究結(jié)果表明,該模型預測誤差小,具有實際應用價值。研究成果可為學生和教師提供有益的參考,以便更好地實現(xiàn)教育教學目標。

關(guān)鍵詞:機器學習;數(shù)據(jù)建模;預測分析;線性回歸

中圖分類號:TP181;TP39? 文獻標識碼:A? 文章編號:2096-4706(2023)19-0142-04

Research on Student Learning Situation Early Warning Method Based on Machine Learning

CAO Mengchuan, OU Yangyi, WU Dan, DU Pengxuan

(Ningxia Polytechnic, Ningxia? 750021, China)

Abstract: This research focuses on predicting and analyzing students' academic performance, gives an early warning of possible risk of failing or declining grades in advance, and helps students and teachers better plan their studies and improve teaching efficiency. The research collects data on various factors including students' regular grades, attendance, gender, and final grades, and uses linear regression models for data modeling and prediction analysis. The results show that the model has small prediction errors and practical application value. The results of this research can provide useful references for students and teachers to better achieve educational and teaching goals.

Keywords: Machine Learning; data modeling; prediction analysis; linear regression

0? 引? 言

學生成績是評價學生學習成果的重要指標之一。然而,現(xiàn)今本科、大專的教育模式與高中、初中的截然不同,因每學期代課的班級、院系、年級不同,教師很難及時關(guān)注所有學生的學習情況。當學生在學習過程中出現(xiàn)學習狀態(tài)下滑、成績掉落、有期末掛科風險等情況,教師無法及時幫助學生調(diào)整學習狀態(tài),學生也會因此產(chǎn)生消極的學習態(tài)度。因此,如何對學生學習情況進行監(jiān)控預警,及時發(fā)現(xiàn)學生在學習過程中的問題并提供對應的幫助,是教育工作者和家長們一直關(guān)注的問題。在這樣的背景下,本文提出了一種使用機器學習對學生平時成績進行數(shù)據(jù)建模以預警學生學習情況的方法。

1? 實現(xiàn)方法

本次研究采用Python為主要開發(fā)語言,Python擁有眾多可用于數(shù)據(jù)科學、人工智能、機器學習等領(lǐng)域的開發(fā)庫,可以幫助開發(fā)者更加高效地編寫和構(gòu)建程序,大幅簡化代碼編寫,將重心更多地放在科研中。開發(fā)工具采用Jupyter Notebook;使用Pandas開發(fā)庫進行數(shù)據(jù)前期數(shù)據(jù)清洗、特征處理;采用的機器學習算法、二值化、特征縮放、模型構(gòu)建、模型評分、數(shù)據(jù)集劃分等方法來自scikit-learn開發(fā)庫。

1.1? 流程設計

圖1為學生平時成績預測模型的實現(xiàn)流程圖。

1.2? 原始數(shù)據(jù)集建立

本文以寧夏職業(yè)技術(shù)學院軟件學院2021級100位學生在2021—2022年第二學期所學“數(shù)據(jù)分析與應用”課程的歷史數(shù)據(jù)作為原始數(shù)據(jù),采集特征包括學生的姓名、學號、性別、年級、期中成績、平時成績、考勤、期末成績、課堂作業(yè)成績。

1.3? 特征工程

特征工程是對學生學情預警數(shù)據(jù)建模的第二步,也是最重要的一步,它是指對原始數(shù)據(jù)進行特征提取、特征轉(zhuǎn)換和特征選擇等操作,以獲得對建模有用的特征(圖2)。特征工程是建立學生學習成績模型的關(guān)鍵環(huán)節(jié),直接影響模型的準確性和實用性。將經(jīng)過特征工程處理后的數(shù)據(jù)集劃分為訓練集和測試集,其中訓練集占80%,測試集占20%,便于后續(xù)的測試與驗證。

1.3.1? 數(shù)據(jù)清洗

數(shù)據(jù)清洗是指在對原始數(shù)據(jù)進行處理之前,對數(shù)據(jù)進行檢查、修改和刪除,以確保數(shù)據(jù)質(zhì)量和準確性的過程。在本次研究中,首先要檢查學生信息是否存在缺失值和異常值,如果存在缺失值,需要采用合適的方式對數(shù)據(jù)進行處理,例如當該學生的成績出現(xiàn)了空缺值,可采用該名學生的平均值填充;如果存在異常值,則刪除該數(shù)據(jù)。

1.3.2? 特征提取

特征提取是機器學習中的一個重要步驟,其目的是將原始數(shù)據(jù)轉(zhuǎn)換為更具有代表性的特征。在機器學習中,特征是指用于描述數(shù)據(jù)的屬性或特性。良好的特征提取可以幫助機器學習算法更準確地建立模型,提高預測和分類的準確性。本次實驗所收集到的學生數(shù)據(jù)特征不是全部都可用于訓練模型,需要從學生數(shù)據(jù)中提取有用的特征,將無用特征刪除。實驗進行了以下的特征提取:

刪除無用特征:在本次研究中,學生的姓名、學號、年級對于成績預警來說沒有任何幫助,需要將其刪除。刪除后特征如表1所示。

合并特征:將每個學生的平時成績和課堂作業(yè)成績特征合并為一個平時成績特征,合并比例為平時成績占比60%,課堂作業(yè)成績占比40%;將期中成績和期末成績特征合并成為期末成績特征,合并比例為期中成績占比40%,期末成績占比60%。合并后將原始成績特征刪除。合并后如表2所示。

1.3.3? 特征編碼

特征編碼是將數(shù)據(jù)集中的特征轉(zhuǎn)換為機器學習算法可以理解和處理的形式的過程。在機器學習中,算法只能處理數(shù)字化的特征,因此需要將非數(shù)字化的特征轉(zhuǎn)換為數(shù)字化的形式。特征編碼的作用是將非數(shù)字化的特征轉(zhuǎn)換為數(shù)字化的形式,以便機器學習算法可以對其進行處理和分析,提高模型的準確性和效率,從而提高模型的預測能力。由于學生的性別特征無法直接被用于模型訓練,所以需要將特征二值化,男轉(zhuǎn)換為1,女轉(zhuǎn)換為0。本次研究采用Scikit-learn庫中的Binarizer類對數(shù)據(jù)進行二值化。

1.3.4? 特征縮放

特征縮放是指將不同特征的取值范圍縮放到相同的區(qū)間內(nèi),常見的縮放方式包括標準化和歸一化。特征縮放提高了模型訓練的速度和精度,避免異常值對模型的影響,使模型更容易理解。在本次實驗中各項數(shù)據(jù)之間的差距較大,需要對數(shù)據(jù)進行特征縮放,以保證數(shù)據(jù)具有可比性。經(jīng)過多次實驗表明,對特征使用標準化縮放所達到的模型效果更適用于本次的研究。

1.3.5? 數(shù)據(jù)集劃分

由于在模型構(gòu)建的過程中需要不斷地檢驗模型的準確率、檢驗模型的配置及訓練程度、過擬合還是欠擬合等,所以需要將訓練數(shù)據(jù)再劃分為兩個部分,一部分用于訓練的訓練集,另一部分是進行檢驗的驗證集。驗證集可以重復使用,主要用于輔助構(gòu)建模型,調(diào)整模型。在本次實驗中,將處理后的數(shù)據(jù)以8:2的比例劃分訓練集和測試集。

1.4? 模型選擇和構(gòu)建

模型選擇和構(gòu)建是建模的核心環(huán)節(jié),該環(huán)節(jié)的主要任務是選擇適合學生數(shù)據(jù)建模的機器學習模型,不同的模型有不同的假設和約束條件,可以適用于不同的問題和數(shù)據(jù)集。選擇一個合適的模型可以提高預測的準確性和泛化能力,避免過擬合或欠擬合的問題。因此在模型選擇和構(gòu)建過程中,需要考慮模型的準確性、可解釋性、泛化能力等因素。

在學生平時成績數(shù)據(jù)建模中,常用的機器學習模型包括線性回歸模型、決策樹模型、支持向量機模型和神經(jīng)網(wǎng)絡模型等。本次研究采用線性回歸模型,下面是模型選擇和構(gòu)建的具體步驟。

1.4.1? 模型選擇

線性回歸是一種用于建立變量之間線性關(guān)系的模型,該模型假設自變量與因變量之間存在線性關(guān)系,即自變量的每一個單位變化都會導致因變量發(fā)生相同的單位變化,同時它的系數(shù)具有可解釋性,可以通過系數(shù)的大小和符號來解釋不同自變量對因變量的影響程度和方向。在學生成績預警建模中,因為學生平時各項學習指標會影響學生的期末成績,所以可以使用線性回歸模型來預測學生的學情。線性回歸模型的公式如下:

y = β0 + β1 x1 + β2 x2 + … + βn xn

其中,y為因變量,x1、x2、xn為自變量,β0、β2、βn為模型的參數(shù)。

在本次研究中,模型的線性回歸公式為:

y = θ0 + θ1 x1 + θ2 x2 + θ3 x3

其中,x1為平時成績,x2為考勤,x3為性別(0或1),θ0、θ1、θ2、θ3為模型參數(shù),y為期末成績。

1.4.2? 模型的構(gòu)建

模型的構(gòu)建分為三個步驟:模型擬合、模型評估和模型應用。其中模型擬合的本質(zhì)是求解上述公式的參數(shù)θ0、θ1、θ2、θ3,使用最小二乘法計算預測值與真實值的平方差,即可求解模型的參數(shù),公式如下:

其中,yi為真實值, 為預測值。將模型代入上式,得到:

將上式關(guān)于模型參數(shù)求導,得到模型參數(shù)的最優(yōu)解:

其中, 為模型參數(shù)的最優(yōu)解,x為數(shù)據(jù)集的自變量(考勤、性別、平時成績),y為數(shù)據(jù)集的因變量(期末成績)。將? 帶入公式內(nèi),即可實現(xiàn)模型擬合。

在模型擬合之后,需要對模型進行評估,以確定模型的準確性和泛化能力。為了保證實驗的嚴謹,本次研究選擇了選擇3種評估方式對模型進行評估,包括均方誤差(Mean Squared Error, MSE)、均方根誤差(Root Mean Squared Error, RMSE)和決定系數(shù)(Coefficient of Determination, R2)。

均方誤差(MSE)是評估線性回歸模型預測效果的常用指標。它計算的是預測值與真實值之間差的平方的平均值。其公式如下:

其中,yi為第i個樣本的真實值, 為該樣本的預測值,m為樣本數(shù)。

均方根誤差(RMSE)是MSE的平方根,它更直觀地反映了預測值與真實值之間的差距。其公式如下:

決定系數(shù)(R2)是評估線性回歸模型擬合優(yōu)度的指標,它表示模型能夠解釋樣本數(shù)據(jù)變異性的比例。其取值范圍在0到1之間,越接近1表示模型的擬合效果越好。R2的公式如下:

其中, 為所有樣本數(shù)據(jù)的平均值。

表3是采用MSE、RMSE、R2三種評估方式的結(jié)果。

從表中可以看出,該線性回歸模型在測試集上的MSE為8.48,RMSE為2.91,R2為0.87,說明該模型具有較高的預測準確性,可以滿足實驗的初步要求。

在模型評估之后,即模型應用階段,可將學生平時成績信息帶入模型,模型將預測學生的成績通過接口傳入預警方法中。預警方法通過對預測成績進行分級,60以下為紅色預警,70~79為黃色預警,80~100為綠色預警,當學生預測成績處于黃色和紅色預警階段,證明該名學生有成績下降和掛科的風險。

綜上所述,模型選擇和構(gòu)建是學生平時成績數(shù)據(jù)建模的關(guān)鍵環(huán)節(jié)。在選擇模型時,需要考慮模型的準確性、可解釋性、泛化能力等因素,并根據(jù)實際需求選擇最合適的模型。在構(gòu)建模型時,需要進行模型擬合、模型評估和模型應用等步驟,以獲得準確、穩(wěn)定和可靠的預測結(jié)果。

2? 結(jié)果驗證分析

本次結(jié)果驗證使用2022級人工智能技術(shù)與應用班級28位同學在2022—2023學年第一學期“數(shù)據(jù)分析”課程數(shù)據(jù)進行結(jié)果驗證,并使用預測結(jié)果和真實結(jié)果進行對比,以下是其中5位學生的預測成績和實際成績的數(shù)據(jù)對比,結(jié)果如表4所示。

由表4可得出,學生的期末成績預測值與實際期末成績進行對比,預測的成績與實際的成績之間的誤差較小,預測值可有效地反映學生在學習過程中的成績情況,說明該模型具有實際的應用價值,可以為學生和老師提供有效的成績預警。通過分析該模型參數(shù)的權(quán)重,發(fā)現(xiàn)學生的平時成績對于預測模型的影響最大,考勤和性別的影響相對較小。這也說明了學生的平時成績是影響學生成績的重要因素,需要在教學中重點關(guān)注和提升。

3? 結(jié)? 論

通過上述實驗可以看出,基于線性回歸算法構(gòu)建的學生平時成績預測模型的預測準確率是可以初步滿足學生學情預警的。雖然預測結(jié)果存在一定的誤差,但整體上預測結(jié)果與實際成績的差距較小。在實際應用中,可以使用該模型來進行學生的成績預警,及時發(fā)現(xiàn)學生的學情問題,提供個性化的學習建議,及時調(diào)整學習態(tài)度,在一定程度上改善學習狀態(tài),從而實現(xiàn)對學生學情的監(jiān)測和預警。未來,可以進一步改進模型,采用更加復雜的機器學習算法,如決策樹、隨機森林等,以提高預測的準確性。

參考文獻:

[1] 王琪,靳瑩.中等教育學段學情分析研究述評 [J].教育理論與實踐,2023,43(2):54-57.

[2] 魏超.機器學習算法在大學生綜合素質(zhì)測評預警中的對比研究 [J].電腦編程技巧與維護,2022(12):127-129.

[3] 崔爭艷,劉晨晨,孫濱.基于機器學習的MOOC學習者棄學預測與預警系統(tǒng)實現(xiàn) [J].信息與電腦:理論版,2022,34(1):65-67.

[4] 徐彩鳳.依托TPACK理論,推進統(tǒng)計信息化教學——以“一元線性回歸模型的應用”為例 [J].中學數(shù)學月刊,2023(3):48-50+63.

[5] 李治軍,姚蓉.基于主成分分析和多元線性回歸的黑龍江省用水效率研究 [J].水利科技與經(jīng)濟,2023,29(2):60-64.

[6] 李非.案例分析在統(tǒng)計多元線性回歸預測模型教學中的應用研究 [J].現(xiàn)代職業(yè)教育,2019(8):86-87.

[7] 劉學彥,趙建立,相文楠,等.擬線性回歸預測模型的穩(wěn)定最小二乘解 [J].數(shù)學的實踐與認識,2011,41(20):92-97.

作者簡介:曹夢川(1990—),男,漢族,寧夏銀川人,助教,碩士,研究方向:數(shù)據(jù)分析、人工智能。

收稿日期:2023-04-09

基金項目:2022年度職業(yè)教育研究和開放教育綜合改革研究專項課題(XJ202207);2020年寧夏回族自治區(qū)科學技術(shù)學會第五批自治區(qū)青年科技人才托舉工程

猜你喜歡
機器學習
基于詞典與機器學習的中文微博情感分析
基于網(wǎng)絡搜索數(shù)據(jù)的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
下一代廣播電視網(wǎng)中“人工智能”的應用
活力(2016年8期)2016-11-12 17:30:08
基于支持向量機的金融數(shù)據(jù)分析研究
基于Spark的大數(shù)據(jù)計算模型
基于樸素貝葉斯算法的垃圾短信智能識別系統(tǒng)
基于圖的半監(jiān)督學習方法綜述
機器學習理論在高中自主學習中的應用
極限學習機在圖像分割中的應用
主站蜘蛛池模板: 青青操国产| 久久精品国产精品一区二区| 国产午夜精品一区二区三区软件| 久久久久无码精品国产免费| 福利视频一区| 国产成人精品日本亚洲77美色| 欧美成人午夜影院| 国产欧美精品一区二区| 国产午夜无码专区喷水| 欧美区日韩区| 日韩在线永久免费播放| 国产精品久久精品| 亚洲国产亚洲综合在线尤物| 精品一区二区三区视频免费观看| 日本一区高清| 四虎AV麻豆| 婷婷综合缴情亚洲五月伊| 五月激情婷婷综合| 成人综合久久综合| 精品精品国产高清A毛片| 青青国产成人免费精品视频| 欧美一区二区三区不卡免费| 久久亚洲国产一区二区| 免费啪啪网址| 亚洲精品福利视频| 91精品伊人久久大香线蕉| 精品夜恋影院亚洲欧洲| 国产成人精品亚洲77美色| 国产aⅴ无码专区亚洲av综合网| 看av免费毛片手机播放| 亚洲AV无码乱码在线观看裸奔 | 亚洲欧美精品一中文字幕| 欧美激情第一区| 日本日韩欧美| 最新国产麻豆aⅴ精品无| 无码日韩人妻精品久久蜜桃| 中文字幕66页| 国产精品手机视频| 美女无遮挡被啪啪到高潮免费| 最新国产高清在线| 激情六月丁香婷婷四房播| 亚洲无限乱码一二三四区| 国产欧美日韩18| 国产农村精品一级毛片视频| 精品精品国产高清A毛片| 亚洲综合精品第一页| 福利一区在线| 亚洲国产成熟视频在线多多| 国产9191精品免费观看| 午夜天堂视频| 亚洲女同一区二区| 亚洲清纯自偷自拍另类专区| 欧美成人手机在线观看网址| 99中文字幕亚洲一区二区| 亚洲欧美在线精品一区二区| 亚洲v日韩v欧美在线观看| 国产视频自拍一区| 天堂网亚洲系列亚洲系列| 国产粉嫩粉嫩的18在线播放91| 国产精女同一区二区三区久| 无码中文字幕精品推荐| 国产黄色片在线看| 无码专区国产精品第一页| 色精品视频| 无码内射中文字幕岛国片 | 成人福利在线视频| 亚洲一级无毛片无码在线免费视频| 国产精品极品美女自在线看免费一区二区| 日韩国产黄色网站| 97在线免费视频| 红杏AV在线无码| 久久99热这里只有精品免费看| 国产又色又爽又黄| 毛片视频网| 综1合AV在线播放| 亚洲天堂久久久| 欧美有码在线| 女人18毛片一级毛片在线 | 久久精品午夜视频| 久久这里只有精品8| 操国产美女| 亚洲三级电影在线播放|