文孟飛,彭軍,張曉勇,蔣富
(1.湖南省教育科學研究院,湖南長沙410005;2.中南大學信息科學與工程學院,湖南長沙410075)
?
基于馬爾科夫模型的大學生創新訓練活動成效評價
文孟飛1,2,彭軍2,張曉勇2,蔣富2
(1.湖南省教育科學研究院,湖南長沙410005;2.中南大學信息科學與工程學院,湖南長沙410075)
摘 要:活動成效評價是網絡交互教學中需要解決的重要問題。結合馬爾科夫模型,運用轉移概率矩陣對學生等級進行趨勢分析,通過概率的方式推導出學生當前的掌握程度,并最終確定創新訓練活動的成效,能及時發現學生的真實認知水平,減少不確定因素的干擾,對學生學習認知水平進行較為準確的評價。
關鍵詞:創新訓練平臺;網絡交互教學;馬爾科夫模型
近年來,計算機網絡技術與多媒體技術迅猛發展,網絡教學也隨之成為教育中必不可少的一部分。網絡教學是一種以計算機網絡為主要媒介的教學活動,教學中主要以網絡交互為信息交流手段,通過反饋、交流和溝通,不斷的交互,真正形成知識的構建[1]。隨著網絡技術、多媒體技術、計算機技術的不斷發展,網絡教育工作者開發了很多適合交互教學的網絡平臺、論壇、網絡課程等,在網絡虛擬空間中開展了各種形式、不同層次的交互教學。正因為如此,網絡教學成效問題也一直受到社會各界的廣泛關注,如何客觀、正確地評價網絡教學成效,就需要更多的學者進行探索和挖掘。
現階段,網絡交互教學在國內得到了快速的推廣和普及,在網絡教學過程中,教師與學生的互動質量對教學效果起著至關重要的作用[2]。然而與傳統教學相比,其評價體系還有待完善。許多網絡教學系統沒有教學評價功能,或只運用比較簡單的評價模型,維護性差且不具有通用性。隨著社會對學生和教師綜合素質的要求越來越多,傳統教學成效評價方法也出現了越來越多的問題。
從目前網絡教學平臺的教學內容組織即資源組織的角度看,其不足之處主要有:網絡教學系統的資源多以靜態網頁的形式呈現,簡單實現了教材的電子化;教學內容千篇一律,缺少必要的交互,不能充分調動學生的學習主動性;網絡教學系統缺少適應性和針對性,不能很好地實現個性化教學和因材施教的方針;網絡教學個性化研究的重點放在教學這個環節上,對提高教學系統的交互性、個性化生成學習路徑的研究也做了不少,但對教學資源的個性化組織的研究還不夠[3]。
最近幾年,我國也漸漸開始關注網絡教學的交互問題,對網絡教學互動模式、互動效果進行了一些探索,但對如何構建和利用良好的評價系統對網絡交互教學質量進行評估還沒有深入研究。針對網絡教學成效評價問題,本文通過對學生能力進行劃分,構建活動成效評價指標體系。首先確定出學生學習水平的基本狀況,再借助馬爾科夫模型[4-5],對教學成效分層次評價。以學生的進步情況作為評價標準,使得評價更加客觀,避免了單從學生的某一次成績就對學生學習狀況加以限定,這種評價方法和標準不僅可以對學生進行評價,同時可以針對不同教師、不同教學方法來評價教學效果,從而改善了當前
交互教學成效評價現狀。
2.1創新訓練活動中學生能力分析
在創新訓練活動中,我們將對學生進行全方位的評估,包括學習能力(活動執行進度以及完成情況)、表達能力(對問題的描述、解答的能力)、應用能力(對實際問題的解決能力)和創新能力(活動的創新點,包括觀點、方法等)等,同時如果還需要考察學生其他方面的能力,也可以對活動成效評價指標進行相應的修改。通過這幾個參數指標將學生的能力具體細分,并確定各能力之間的關系及比例,針對多個因素進行定量和綜合評價,從而達到了對學生認知能力的客觀了解,進一步確定學生在某項創新訓練中學到了多少。
根據以上評價指標對創新訓練活動成效進行測驗,首先系統自動對學生能力進行測驗,假定學生的某次測試驗成績如表1所示:

表1 學生某次測試成績
如果需要重點考察學生的學習能力,則假設學習能力占40%,表達能力占15%,應用能力占25%,創新能力占20%。用向量X表示各能力所占比,則X=(0.4,0.15,0.25,0.2),對其進行線性變換如下:

由線性變換可以得出:在變換之前,按照一般情況下計算出的測試成績為75分,即這幾種能力的總和。但如果考慮到該項活動注重的能力,則讓相對部分乘以各類能力的相應權值后,得到的測試成績為67.5分。因此,該學生在創新活動成效測驗中的綜合能力評價為67.5。同時,由表1可以看出,學生的學習能力、表達能力、應用能力及創新能力得分分別為80,66.7,70,80。這種方法更符合學生的真實水平。
2.2馬爾科夫模型的建立
在了解學生學習能力的基礎上,如果需要對某一個班級的學生或者教師前后2次創新訓練活動中的成效進行評價,則要將馬爾科夫模型應用到評價模型中。假設某個班級有n個學生參加創新訓練活動,首先,將這n個學生按能力劃分為優(90~100分)、良(80~89分)、中(70~79分)、差(60~69)、不及格(60分以下)5個等級。其次,建立概率空間,并定義隨機變量Xk(n),其取值范圍即為所劃分的等級,用I表示Xk(n)的值域:I={1,2,3,4,5},它表示編號為n的學生在第k次創新活動中所處的等級,其中k=1,2,……。
將第1次創新訓練活動后各等級學生數占總人數比作為狀態向量,則用M表示其狀態向量為:M=(,,,,),其中n為學生總人數,n為成績第i等級學生人數(其中優、良、中、差、不及格分別按順i序為一等到五等)。
第2次創新訓練活動測試后,用nij表示學生成績由i等轉移到j等的學生人數。應用馬爾科夫模型,求出轉移概率矩陣,用P表示:
經過一定時間創新訓練后,學生成績在各等級的狀態概率的變化也會越來越小,最終狀態概率也將趨于穩定,在此情況下,穩定分布π是一個對應于特征根為1的、該轉移矩陣的特征向量,同時稱為馬爾科夫鏈的極限分布。根據遍歷性可建立方程組,并得出π的極限分布。
從數據庫中選出A班級在某次創新訓練活動中的成績作為樣本,如表2所示,按照上述等級劃分,列出有限個狀態之間的轉移頻率以及各等級的總人數。分別計算出A班級兩次測驗成績的轉移概率矩陣,并用πa和πb表示第1次和第2次的特征向量。其中表3、表4表示A班級第1次和第2次測驗成績等級間轉移頻數。分別計算第1次測驗和第2次測驗的極限分布,并建立方程組:

由上式方程組解得πa=(0.13,0.4,0.27,0.2),同理πb=(0.24,0.35,0.24,0.176)。

表2 A班級創新訓練測試成績

表3 A班級第1次測驗成績等級之間轉移頻數

表4 A班級第2次測驗成績等級之間轉移頻數
從表2可以看出,A班級第1次測驗平均成績為78.06,第2次測驗平均成績為76.18,2次成績差
別不大,第1次平均成績略高。再由表3、表4可以得出,第1次測驗后,各等級水平學生人數為n1、n2、n3、n4、n5;第2次測驗后,原來成績為優的學生中,仍有n11人成績優等,n12個學生成績下降為良,n13個學生下降為中,n14個學生下降為差,n15個學生下降為不及格。根據兩次成績間的轉移頻數可知,由良→優、中→良、不及格→中的學生人數有所增加。因此第2次學生成績提升人數要比第1次有所增加。
為了更準確地評價該創新訓練活動的成效,我們將2次測驗成績的5個等級中各選一個值進行量化處理,分別將優、良、中、差、不及格取值為90、80、70、60、50作為評價指標。用S1和S2表示2次測試的綜合水平,計算得出S1=πa(90,80,70,60,50)T=74.6,同理可得S2=πb(90,80,70,60,50)T=7696。通過計算可以看到,雖然第1次平均成績略高于第2次,但如果單以平均成績判定2次測驗的總體水平,不具有充分性。通過建立馬爾科夫模型計算,2次測驗的綜合水平為S1<S2,在充分考慮了學生的基礎情況以及學生的學習能力基礎上,我們可以認為學生在原有基礎上取得了進步。
在學生方面,傳統的教學成效評價多是將平時的測驗成績作為最終考核;對于教師,除了所帶班級的整體成績外,一般以發放調查問卷的形式讓學生對老師進行評分。這種評價方式不僅帶有主觀臆斷性,而且學生的最終成績成了主要參考標準,這種成效評價考核方式不僅會打消部分學生的學習積極性,也忽略了學生進步的大小。將馬爾科夫鏈應用到教學成效評價中,有效地避免了這種狀況的發生。馬爾科夫模型考慮了學生的原始狀態,并消除學生的基礎差異,在同一標準下將學生最初成績分成幾個等級,確定出狀態空間,并建立轉移概率矩陣,最終給出較為科學的評價。在此基礎上,對于學生和教師有了一個相同的評價標準,即全面考慮學生的基礎掌握情況,根據學生進步狀況以及最終成績來作為評價的標準。這樣更能體現出學生獲取知識以及教師培養能力的強弱,也更具有說服力。
參考文獻:
[1]王珠珠,張偉遠.我國普通高校網上教學平臺及網站建設的現狀分析[J].中國遠程教育,2005(2):6-7.
[2]褚冠鵬.網絡教學平臺應用成效影響因素與提升策略研究[D].廣州:廣州大學,2012.
[3]余勝泉.基于互聯網絡的遠程教學評價模型[J].開放教育研究,2003(1):33-37.
[4]Norris J R.Markov Chains[M].Cambridge:Cambridge UniversityPress,1997.
[5]韓建玲.馬爾科夫鏈在教學質量評價中的應用[J].中國科教創新導刊,2001(1):135-136.
(責任校對 晏小敏)
作者簡介:文孟飛(1975-),男,湖南寧鄉人,副教授,博士,主要從事智能控制、網絡教學研究。
收稿日期:20150420
doi:10.13582/j.cnki.1674-5884.2015.11.050
中圖分類號:G434
文獻標志碼:A
文章編號:1674-5884(2015)11-0156-04