鄧 凱,趙振勇,劉浩博
職業教育
基于大數據分析的高職院校專業評價神經網絡模型研究
鄧凱,趙振勇,劉浩博
近十幾年來,隨著我國職業教育的快速發展,高職院校專業設置與結構調整已成為高職教育領域非常關注的熱點問題。本文是基于大數據分析的高職院校專業評價神經網絡模型研究,深入分析高職院校專業設置重要影響因素,通過對部分職教領域專家、教師及企業人員的詳細調查與咨詢,結合教育部有關專業設置相關管理文件的要求,構建科學的專業設置與調整評價指標體系,并根據指標體系采集大批量專業樣本數據進行仿真實驗。結果表明,運用BP神經網絡模型對專業設置與調整進行評價,排除了對專業設置與調整的主觀因素影響,能夠獲得客觀滿意的評價結果,具有廣泛的適用性與科學性。
高職院校;BP神經網絡;專業設置與調整;評價指標體系
隨著改革的不斷深化,更好適應經濟發展的新常態和技術技能人才成長成才需要,高職院校必須根據市場的導向和社會經濟發展需求進行人才培養。專業作為高校實現人才培養、科學研究和社會服務功能的載體,其重要性不言而喻。在我國,關于專業設置與調整集中研究起始于20世紀80年代以后,并且也是高等教育界關注的熱點問題之一。專業設置與調整的速度直接反映適應社會需求的程度,起到橋梁紐帶作用;專業設置與調整更是直接影響人才培養質量、辦學效益與就業質量。筆者通過查閱大量與此相關文獻發現,研究領域主要涉及專業設置與調整中存在的問題與解決辦法、影響專業設置的相關因素分析與策略以及專業設置與調整的機制研究等,多數從宏觀層面侃侃而談,結合經濟發展做重要分析,從存在問題、設置原則以及優化對策等方面提出一些建設性意見與建議。然而在大量的文獻著作等資料中,實證研究數量很少,采用量化或質性方法來研究專業設置問題的個案材料始終沒有[1]。
2004年,教育部頒布了《普通高等學校高職高專教育指導性專業目錄》和《普通高等學校高職高專教育專業設置管理辦法》兩個重要文件,在專業管理方面具有重要的現實與指導意義,但由于審核和監管等機制不夠健全,很多高職院校在專業設置與調整過程中隨意、盲目的現象,以及與區域經濟發展脫節、專業結構失衡、同質化現象依然存在。影響專業設置與調整的因素有很多,現實中難以用線性的數學公式來表達或歸納,顯而易見,這是一個典型的非線性幾何問題。因此,找到一個科學、客觀的評價方法非常重要。本文提出一種基于大數據分析的高職院校專業評價神經網絡模型,深入分析高職院校專業設置重要影響因素,通過對部分職教領域專家、教師及企業人員的詳細調查與咨詢,結合教育部有關專業設置相關管理文件的要求,構建科學的專業設置與調整評價指標體系,并根據指標體系采集大批量專業樣本數據進行仿真實驗。結果表明,運用BP(Back-Propagation Network)神經網絡模型對專業設置與調整進行評價,排除了對專業設置與調整的主觀因素影響,能夠獲得客觀滿意的評價結果,具有廣泛的適用性與科學性。
(一)構建高職院校專業設置評價指標體系
筆者通過對影響高職院校專業設置與調整的相關重要因素進行科學分析與總結,對部分職教領域專家、有關教師代表及企業相關人員的詳細調查與咨詢,對教育部有關專業設置等管理文件要求深入研究,并結合目前高職院校以“就業為導向”的辦學實際和社會實際需求,以努力避免粗放與盲目性為宗旨,確定了高職院校專業設置評價指標體系為10個一級指標。分別是:1.社會發展;2.校外專業;3.校內專業結構與專業布局;4.相關專業辦學經驗;5.專業設置硬件條件;6.師資隊伍條件;7.專業人才培養方案;8.專業人才需求調研論證;9.教學管理與教學研究;10.其他。在此一級指標的基礎上,又分解出43個二級指標、82個三級指標和188個四級指標。根據對一流權威的專家、相關專業教師、企業代表進行詳細調查與咨詢,對各級指標確定了相應的權重,構成專業設置評價指標體系。
(二)構建BP(Back-Propagation Network)神經網絡模型
BP神經網絡,是一種多層前饋神經網絡,是由信息的前向傳遞與誤差反向傳播修正兩個過程組成,拓撲結構分為輸入層、隱含層和輸出層。在信息前向傳播時,信號就會從輸入層經過隱含層逐層計算處理后最終到達輸出層,輸出層輸出信息并處理結果,這樣就完成了一次學習的正向傳播處理過程。當輸出層輸出的數值或結果得不到預定的目標值時,則啟動誤差的反向傳播,即根據誤差值設定情況主動調整網絡的權值和閾值,并反復訓練修正,從而使BP神經網絡的預測輸出值不斷逼近目標值,最終達到預期的輸出目標,完成整體建模效果[2][3]。
能否構建一個科學合適的神經網絡模型,其結構參數的設定非常重要。
1.輸入層神經元個數的選取。通過構建的評價指標體系可知,文中輸入層神經元個數設定為188(即為四級指標的個數)。
2.輸出層神經元個數的選取。文中的評價結果即為網絡的輸出情況,為突出以“就業為導向”的宗旨以及學生和用人單位對學校辦學水平的評價,文中選擇了各專業的招生人數和就業人數指標為網絡的輸出,設定輸出層個數m=2。
3.神經網絡層數的選取。實踐上表明,在神經網絡訓練和評價過程中,依靠單純地增加神經層數未必都能達到降低誤差或提高精度的效果,并且還將網絡變得更加復雜,網絡訓練時間以及需要的內存空間都大大增加。然而很多實驗表明,利用調節隱含層中間的神經元節點數目的方式可以提高誤差精度,取得滿意的訓練效果。因此,在實踐運用中將采用相對簡單的三層BP網絡比較理想。
4.隱含層神經元個數。在BP算法的神經網絡中,各層神經元節點數目的選擇對于網絡的性能影響比較大,實踐表明,當輸入層神經元個數多,樣本數據大,此時隱含層節點數過多,在一般的PC機上計算時則會產生內存溢出,那么對網絡的概括推理能力將產生不利影響。另外,當隱含層節點數目過少時不僅導致網絡學習會出現局部極小值現象,而且精度也會受到嚴重影響,查閱大量書籍和資料,對于隱含層神經元節點數目選取的問題也有一些方法,但至今沒有統一起來,基本都是以經驗或實驗為主。根據經驗公式,本文隱含層神經元個數確定為10較為理想。
5.合理確定神經元轉換函數。一般均采用S型函數作為BP神經網絡神經元轉換函數,其具體函數形式為[2]
根據BP(Back-Propagation Network)神經網絡模型原理,不難理解在網絡訓練的過程中,要想達到一定的誤差精度和取得滿意的訓練效果,對樣本數據的數量要求非常高,樣本數據越多,建模效果就越好,泛化能力就越強,評價的結果就越準確。因此,我們選了取76所某高職院校2012、2013年所開設的專業為代表,共1889個不同地區的不同或相同專業作為大樣本數據。
根據前面構建的BP(Back-Propagation Network)神經網絡模型及相關參數要求,本文建立一個三層的BP神經網絡,選用高性能的數值計算可視化軟件MATLAB作為仿真實現工具,輸入層神經元個數為188,隱含層神經元個數為10,輸出層神經元個數為2,學習率1r=0.08,訓練函數選擇為trainlm,訓練目標誤差err-goal=1e-7,誤差精度設為1e-10(誤差平方和),最大迭代次數max_epoch=2000。(如圖1,2所示)同時對1889組樣本數據做歸一化處理,首先選擇其中1859組樣本數據進行學習訓練,樣本數據經過2000次反復迭代訓練后,各專業招生的實際輸出人數與目標人數非常接近,擬合度特別高(如圖3),誤差平方和SSE=0.0052,由綠色小圓圈構成的連線都在0附近徘徊,各專業就業實際輸出人數與目標人數也非常接近,擬合度特別高 (如圖4),誤差平方和為SSE=0.00000074,由綠色小圓圈構成的連線都在0附近徘徊。

圖1 BP神經網絡訓練模型
為證明所構建的基于大數據分析的高職院校專業評價神經網絡模型泛化能力和普適性強,我們又選取了剩余的30組樣本數據進行測試對比,結果如圖5、圖6所示,其中圖5誤差平方和SSE=0.00006,圖6誤差平方和SSE=0.000000006,都達到了預期的效果。顯然,表明此網絡模型的泛化能力強,所構建的專業評價神經網絡模型是成功的,同時也印證了此模型在高職院校專業設置與調整評價指標體系中應用的普適性與科學性。

圖2 BP神經網絡訓練過程

圖3 專業招生人數實際與預測樣本情況

圖4 專業就業人數實際與預測樣本情況

圖5 專業招生人數實際與預測樣本情況

圖6 專業就業人數實際與預測樣本情況
四、結論
筆者通過集合多方力量共同探討,保證了評價指標體系的全面科學性;在采集樣本數據過程中,選擇了大批量專業數據作為保障,保證了數據的可靠、可行性;由于影響專業設置因素之間的聯系復雜且具有非線性特征,在定量分析方法選擇時,利用神經網絡模型保證了科學性。因此,通過仿真實驗,結果證明,運用BP神經網絡模型對專業設置與調整進行評價,真正排除了對專業設置與調整的主觀因素影響,并能夠獲得較為客觀滿意的評價結果,具有廣泛的適用性。
[1]杜才平.近十年國內高校專業設置與結構調整研究文獻綜述[J].內蒙古師范大學學報(教育科學版),2011 (3).
[2]趙振勇,張平澤.基于BP神經網絡的高職學生評價模型構建與實現[J].湖北第二師范學院學報,2013(8):75-76.
[3]從爽.面向Mauab工具箱的神經網絡理論與應用[M].安徽:中國科學技術大學出版社,1998.
責任編輯:賀春健
G642
A
1671-6531(2015)19-0122-03
鄧凱/常州紡織服裝職業技術學院教授,研究員級高級工程師(江蘇常州213164);趙振勇/常州紡織服裝職業技術學院副研究員,碩士(江蘇常州213164);劉浩博/常州紡織服裝職業技術學院講師(江蘇常州213164)。