李寶霞



【摘要】聚類分析是一種按照中心點或分層的方式對樣本數據進行歸并的數學方法.本文在分析高職高專院校各專業招生計劃人數、錄取人數以及錄取分數的基礎上,結合K-Means聚類,從定量的角度對高職高專院校各專業如何科學制訂招生計劃進行綜合分析,進而改進招生策略,制訂更科學、合理的招生計劃,提升高職高專院校生源質量和錄取率.
【關鍵詞】K-Means聚類分析;招生計劃數;錄取分數
【中圖分類號】F222.33 F064.1 【文獻標識碼】A
高等學校的招生工作是高校發展的生命線.因此,我們應該把招生工作當作一項系統工程來對待,認真加以研究.在招生過程中,必須堅持公開、公平、公正的原則;必須堅持原則性與靈活性的結合.近年來,由于高考生源人數的變化及招生選拔標準提高,一些師范類高職高專院校招生計劃分配未能及時適應招生形勢,造成熱門專業過熱, 從而有一些優質生源流失;從專業學科來看,近年來藝術類考生報考人數雖有激增,但生源質量并未受其影響.這樣一類學科若繼續增加招生計劃,顯然不合理.因此,改進招生策略,制訂更科學、合理的招生計劃,這就顯得十分重要.
下面,筆者以山西省某師范類高職高專院校2019年的招生情況作為主要研究對象.
一、現狀分析
2019年某校高考招生總計劃數為1450人,實錄取1257人,計劃完成率為87%.從圖1、圖2中可以看出:小學教育專業和語文教育專業實錄取人數最多,分別為288人和286人,超出錄取計劃149人,占山西總錄取人數的46%,計劃完成率分別為180%和110%;數學教育專業和英語教育專業錄取人數較去年有所下滑,平均計劃完成率僅為56.6%;藝術類專業招生計劃過多,錄取率明顯下降;現代教育技術、文秘、旅游英語、國際標準舞四個專業實錄取人數最少,占山西總錄取人數的1.2%.這說明,2019年某校的招生計劃分配并不是很合理,致使在錄取過程中出現熱門專業過熱、冷門專業過冷的兩極分化現象.
從圖3中可以看出,2019年某校山西文史類最低分數線為257分,較2018年的159分,提高了61.6%;理工類最低分數線為130分,較2018年的152分,下降了14.5%;藝術類專業分數線較去年變動不是很大.整體來看,在總錄取1257人中,400分以上有24人,[300~400]分有547人,[250~300]分有467人, [200~250]分有160人,[150~200]分有51人,150分以下有8人.整個分數主要集中在[250~400]這段,共計1014人,占總錄取人數的80.7%.這說明某校2019年高考各專業錄取分數整體情況較2018年雖有所提高,但增幅不是很明顯.
二、數據分析
本次聚類分析的樣本數據選取山西省某師范類高職高專院校2019年各專業招生計劃數、錄取人數、文化分數線、專業分數線4個指標為主要研究對象.本次聚類分析對數據相關性、缺失值、異常值要求比較高,同時,數據單位和不同的量級在分析時是無法進行比較的.所以,在聚類分析之前,我們先要對原始數據進行標準化處理,并對處理后的數據進行系數相關性檢驗、異常值檢驗.
(一)系數相關性檢驗
對標準化后的數據進行相關性檢驗,從表1可以看出,數據間相關系數最高為0.82036,這個值并不是很大,因此,其在進行數據分析時可不做處理.
(二)異常值檢驗及箱線圖
從表2的數據異常值和圖4的箱線圖檢驗結果中可以看出,數據中異常值的個數并不是很多,其可能是由于各指標所代表的含義不同造成的(即計劃數與錄取數代表人數,文化線和專業線代表錄取分數),因此,其在進行數據分析時可不做處理.
(三)聚類分析
本次聚類分析采取K-Means均值聚類的方法對樣本的最終分類結果進行綜合評估.從表3中可以看出,樣本數據的最佳聚類結果為5類,平均輪廓系數為0.672998554.結合圖5的分析可以發現,當簇的個數分別為2、3、4、5時,輪廓系數的數值不斷升高,特別是當簇的個數為5時,輪廓系數的數值最高,為0.672998554;而后,輪廓系數的數值隨著簇個數的增加越來越低.從圖6中簇數量與簇內誤方差相關分析也可以看出,隨著簇數量不斷增加,簇內誤方差的數值越來越小,特別是當簇數量在[2~5]這個區間時,簇內誤方差大幅下降;而在[5~10]這個區間內,簇內誤方差雖有下降,但降幅不是很明顯.因此,將樣本數據的最佳聚類結果定為5類是合理的.
(四)結果分析
從表4的數據透視表分析結果中可以看出,整個樣本數據的聚類結果分為5類.
0類專業的文化分數線最高,但專業計劃數與錄取人數最不理想.這類專業主要包括文秘、空中乘務、物聯網工程技術、高鐵乘務等.對于以師范教育為主的高職高專院校來說, 這些專業都屬于非師范專業,其優勢遠不如師范類專業,因此,在今后的招生中,高職高專院校應適度降低這些專業的計劃招生數,以保證錄取率.
1類和4類專業雖然專業分數線比較高,但招生計劃人數和錄取人數并不突出.這類專業主要指一些藝術類專業,包括美術教育、舞蹈教育、音樂教育、體育教育等.雖然,近年來,藝術類考生在高考中報考人數有所增加,但高校對藝術專業線和文化線的要求標準并沒有降低.因此,在今后的招生中,高職高專院校應依據當年的形勢,適度控制各專業的招生計劃人數,必要時可在不同的藝術類專業中做適度調整.
2類專業雖然招生計劃人數比較多,但錄取人數并不理想,文化分數線居中.這類專業主要指數學教育和英語教育.對一些??粕?,在高考時,其文化課成績不理想,因此在專業選擇上,他們更傾向于那些輕松易懂的專業.所以,在今后的招生中,高職高專院校應依據當年的高考形勢,適當調整或降低這兩個專業的招生計劃人數.
3類專業在招生計劃人數和錄取人數方面都特別占優勢,這類專業主要指小學教育和語文教育.這兩個專業均屬于師范類特色專業,近年來受國家教育政策和就業形勢影響,當下的小學教育要求必須是全科教學,憑借專業優勢和就業優勢,這兩個專業的報考人數近年來不斷增加,因此,在今后的招生中,高職高專院校應適當增加這兩個專業的招生計劃人數,以吸引更多優秀考生報考,進而提高招生錄取率和就業率.
【參考文獻】
[1]崔紅芳. 模糊聚類分析在高校招生中的應用[J].數學學習與研究,2019(14):115-116.
[2]羅璐. 湖南省碩士研究生生源質量研究[D]. 長沙:湖南師范大學,2018.