徐秀珍,張媛媛,盧安文
(重慶郵電大學經濟管理學院,重慶 400064)
由于留學生自身的文化背景和學習能力不同,導致留學生之間的學習成果也存在著巨大的差異,然而傳統的教學成果評價分析并沒有充分利用數據中隱含的更有價值的信息,因此想要真正地實現精準教學,必須從學生數據源著手進行數據挖掘,進而制定出更為完備的留學生分層教學策略。
數據挖掘領域的聚類分析已成為了學者廣泛關注的研究話題。高迎等以微博用戶為例,利用WeKa 工具構建出了用戶活躍度聚類模型,為提高用戶活躍度提供了依據;張建萍等通過闡述數據挖掘過程的實踐過程,論證了聚類分析在兒童生長發育時期的應用價值;羅平娟等利用K-means算法設計了物流配送方案,以就近原則分配車輛和人員,實現了資源的有效利用。
基于此,本文通過構建學生畫像和教學質量評價指標體系,實現對留學生學習需求和學習現狀的識別與分析。并運用K-means 聚類算法構建起合適的留學生群體聚類模型,針對不同的留學生類別提出相應的教學策略建議。
留學生用戶畫像的繪制是基于留學生各類相關數據建立起來的,且大多來源于教務考勤、學生管理等應用系統。將每項數據所代表的行為進行分類即構建起了用戶畫像標簽,進而可從不同維度對留學生進行描述刻畫,建立起生動、清晰的學生畫像。
在學生用戶畫像繪制過程中,本文選取了“國別”“語言(漢語水平)”“成績(專業課平均分)”“學習習慣”等9個就探究內容而言具有顯著甄選價值的標簽指標,并對部分主觀性高的數據進行標準化數字評估,最后輸出的某個可視化用戶畫像如表1,有助于更為直觀地探究該留學生的學習現狀和需求。

表1 某留學生學習畫像

續表1
通過對留學生教學的分析研究,本文梳理出了影響教學質量的諸多因素,并計算出各因素影響教學質量的權重,從而為優化課堂教學效果和質量提供可行性的決策依據。在教學質量評價層次結構中,確定了四個一級指標和十八個二級指標,并結合專家排序法的結果就指標重要程度進行指標權重的計算,結果如表2 所示。

表2 教學質量指標權重
從數據分析可見,計算的結果和實際認知較為一致。其中,學生的“學習興趣及動力”和“學習自發性及主動性”在教學效果中分別占比為8.12%和7.01%,且由于留學生群體的特殊性,在諸多指標中“課程難易程度”占比也較大,該指標的重要性與針對留學生群體所展開的調查問卷結果相吻合。如圖1的調查問卷結果顯示,當問到對于大學課堂若存在不滿意的原因相關問題時,52.38%的留學生表示“內容太難,理解不了”,28.57%的留學生表示“內容不感興趣”,說明這幾項指標在教學質量中起著非常重要的作用,學校管理者和教師都應予以高度重視。

圖1 調查問卷結果統計
從表2的結果中還可以看出,在判斷教學效果各因素的影響力時教師的作用最大,其次是學生,再者是課程設置和教學管理辦法,因此必須意識到教師在教學質量提高中扮演著不可或缺的角色,在分層教學過程中,還應關注“教師教學態度”“教學語言”等幾項指標以探究教學質量提升的有效路徑。
在描繪出學生個體畫像的基礎上,將進一步通過聚類建模劃分學生群體并分析特征,實現學生分層的群體畫像。本文在模型的分類上采用了K-means 聚類中的均值聚類算法,聚類分析的特點是計算簡單,呈現的結果比較直觀且易于理解。運用在教學領域時,可有效分析學生學習情況。K-means聚類分析是選定初始中心并進行多次迭代,計算每一個個體和聚類中心的距離大小,最終將樣本分成不同的類別的分析方法。其分析步驟如圖2所示。

圖2 K-means聚類分析步驟
數據準備階段的主要工作包括對原始數據的采集、提取和轉換。由于留學生的學習差異在不同程度上受到文化背景、語言基礎、學習動機、個體學能等內外部因素的影響,因此本文在學生用戶畫像中抽取了能體現該留學生漢語水平、學習意愿和學習能力的六個典型特征維度作為建模分層的標簽指標。
據此收集到的指標分別為“漢語水平”“專業課平均成績”“考勤次數”“學習目標是否明確”“學習習慣傾向”“一周課外學習時間”,從中可知該指標集存在多維度分類型問題,如“學習目標是否明確”可劃分為明確、較明確和不明確。為了實現分級度量,首先需要對字符串類型數據作相應的數值變換處理。即可將標簽指標“漢語水平”中“完全聽不懂”賦值為1,“能聽和簡單的說”賦值為2。具體可參照表1中“評估準則”欄,以此依次實現標簽數據預處理。
本次建模隨機抽取了50 位留學生近一年的信息數據作為樣本并導出至Excel 中保存,為避免因缺考或未準確收集從而導致的某些數據出現空值或重復的現象,及時剔除了存在缺失、重空值等情況的無效樣本數據。并且采用SPSS 軟件實現對數據的K-means 聚類分析,在完成數據導入后,為了解決量綱不一致等問題還需對數據進行標準化處理以弱化數量級上的差異,得到的部分數據描述性統計如圖3所示。

圖3 部分數據描述性統計
在完成數據預處理和聚類變量特征的確定后,指定聚類個數是進一步實現聚類分析的關鍵。在聚類個數的計算中,根據手肘法輸出的效果如圖4所示,橫坐標為聚類個數,縱坐標為誤差平方和數值。其中,是所有樣本的聚類誤差,代表了聚類效果的好壞。隨著聚類個數的不斷增大,樣本劃分會更加精細,每個簇的聚合程度會逐漸提高,從而導致誤差平方和SSE 逐漸變小。并且當達到真實聚類個數時,聚合程度也已實現飽和,所以的下降幅度會趨于平緩。顯然,當聚類個數為4 時折線出現了明顯的拐點,由此最終確定最佳聚類個數為4。

圖4 手肘法效果輸出
將值設置為4 并進行了3 次迭代后,聚類中心不存在變動或者僅有小幅變動,由此實現了收斂。輸出結果如圖5所示。

圖5 最終聚類中心之間的距離
由圖5 和圖6 可知,在該聚類模型中各類別的最終聚類中心之間的距離分明且適中,各個指標變量對應的顯著性=0.000,顯然<0.05,從而可得各類別在指標變量上的差異表現都十分顯著,也說明了該模型具有一定的合理性及有效性,可根據聚類結果進行下一步分析。

圖6 ANOVA單因素方差分析
同時根據ANOVA 表中的F 近似值可得出該指標變量在聚類分析中的作用影響程度,即在該模型中,各類指標變量對聚類結果的重要程度排序為:專業課平均成績>一周課外學習時間>考勤>學習習慣傾向>學習目標>漢語水平。該指標變量重要程度的排序情況也為分層教學策略提供了有效的依據,避免了因只考慮學習成績這一單項標準進行分層教學所產生的弊端,進而尊重學生的個體發展。
對聚類模型進行有效性檢驗后,即可根據各類成員數和各位同學的聚類結果(如圖7 和圖8 所示)對留學生聚類群體特征進行辨別分析。由此可以看出,50 個樣本數據經過多次迭代后已被分配到距離它最近的聚類中心所在的簇中。

圖7 部分聚類結果

圖8 每個聚類中的個案數目
在分析聚類群體特征時,可將聚類結果進行可視化處理。本文選擇以各類最終聚類中心數據為依據,建立起了各類特征可視化雷達圖如圖9,即可在此基礎上直觀、準確地觀察出聚類后各類留學生的群體特征,并為實施多維度分層教學提供了改進依據。

圖9 各類特征可視化呈現
基于圖9 留學生群體特征可視化呈現結果,并結合由標量特征所得到的留學生需求分析,本文提出了對應的分層教學策略如下。
(1)迷茫型留學生群體——實行留學生學習導師制,引導學生制定出明確的學習目標。第一類學生具備較好的學習自發性和主動性,常利用課余時間自主學習。但其可能存在缺乏明確的學習目標,在學習中遇到了問題未及時向老師請教和與同學討論的情況。針對該類學生群體,可安排專業導師引導學生樹立總體的奮斗目標和完善的各學科學習計劃,定期對留學生進行學習檢查和指導。在教學方法上重視教學的啟發性,引導學生獨立思考的同時注重課堂的合作討論學習,幫助他們養成良好的學習習慣。
(2)逃避型留學生群體——以教學內容和模式為依托,實行單獨授課和跟蹤指導制度。第二類學生在各類學習特征表現上均存在較大的問題,可能由于教學內容難度較大或趣味性較低使得學生缺乏對學習的興趣和信心,從而影響著該學生群體的學習特征和學習成果。針對該學生群體,應從教學內容安排和教師的教學方法上著手改進和提升。首先要適當充實教學內容,調整課程難度和提高課程的應用價值。同時教學語言應生動清晰,快慢適度,教學過程中注意重點突出和理論聯系實際。教學方法上可采用跟班學習和單獨授課相結合的方式,了解學生對教學效果的意見,幫助留學生解決思想上、心理上及生活上各方面的問題。
(3)內向型留學生群體——采取鼓勵型教學方法,主張進行合作探究式學習。第三類學生較第一類和第四類學生在特征表現上“學習習慣傾向”及“考勤”兩項指標差異明顯。探究原因可能由于文化背景差異等使得該學生群體在社交特征中表現較為內向,多傾向于采用自主式學習且獨立完成作業任務,使得該類學生在有較為明確的學習目標的基礎上同樣缺乏學習的主動性,未及時對所學內容查漏補缺。針對該類留學生群體,可通過舉辦文化體驗活動、聯誼會、團隊合作小組等,促進教師和學生以及學生和學生之間的溝通交流,鼓勵學生提問或發表意見,提高學生對學習環境的適應性,幫助學生建立學習信心。
(4)主動型留學生群體——注重培養學生獨立思考和創新的能力,制定優秀留學生評選辦法。第四類學生在語言基礎和學習習慣的養成上均呈現出了良好的態勢,其憑借著較好的漢語水平,結合自身學習興趣樹立了明確的學習目標并認真執行和實施,有較高的學習主動性和積極性,在學習習慣上多傾向于協同式學習和自主式學習相結合。因此,在對該類留學生實施分層教學時,可采取學生課前自學,在課堂上教師針對其所存在的疑難點引導學生進行小組合作式討論的教學策略。培養其獨立思考的能力和創新意識,發揮競爭和獎勵機制的正向作用力,確保該類留學生群體更為主動地加入到課堂中來,提高課堂出勤率。
基于不斷增長的留學生數量和高校教學資源有限的矛盾問題,本文首先對留學生用戶畫像進行了刻畫,并結合留學生教學質量評價指標體系分析了留學生學習現狀和學習需求。在此基礎上,通過SPSS 軟件對留學生群體建立起了K-means 聚類分析模型,將留學生群體劃分為了迷茫型留學生、逃避型留學生、內向型留學生、主動型留學生并對做出了相應的分層教學策略。深層次挖掘了學校教務系統中諸多有效數據的潛在應用價值,對教育教學活動有一定的指導意義,有利于更好地體現了以人為本的教育理念。