李冬
數(shù)據(jù)挖掘技術在高職計算機應用專業(yè)人才培養(yǎng)中的應用
李冬
利用數(shù)據(jù)挖掘技術對商丘職業(yè)技術學院計算機應用專業(yè)學生評價數(shù)據(jù)進行挖掘分析,應用AprioriTid算法獲得學生評價結(jié)果之間的關聯(lián)規(guī)則。該規(guī)則表明在綜合實訓評價中智力評價80-89分,非智力評價為優(yōu)秀,自主學習能力強的學生在企業(yè)中能夠很好的勝任崗位需求,能夠得到企業(yè)“良好勝任”的評價反饋,實踐證明該關聯(lián)規(guī)則對下一步專業(yè)教學改革具有指導意義。
數(shù)據(jù)挖掘;計算機應用;人才培養(yǎng)
人才培養(yǎng)是否符合用人單位的需求,畢業(yè)生的就業(yè)情況及就業(yè)質(zhì)量是人才培養(yǎng)改革成功與否的重要考量標準。近年來,商丘職業(yè)技術學院計算機應用專業(yè)教學團隊在這方面做了大量的工作,對畢業(yè)生就業(yè)情況進行持續(xù)追蹤并對用人單位進行了調(diào)查,得到大量有益人才培養(yǎng)的數(shù)據(jù)信息。
在計算機應用專業(yè)人才培養(yǎng)過程中,大三年級進行的綜合實訓環(huán)節(jié)是最貼近企業(yè)實際工作環(huán)境,能夠從各方面展現(xiàn)學生的綜合能力,也是畢業(yè)生是否符合企業(yè)需求體現(xiàn)最為直接的一環(huán)。因此,大量的信息隱藏在學生綜合實訓評價結(jié)果與企業(yè)對畢業(yè)生評價反饋的結(jié)果之中。通過數(shù)據(jù)挖掘的方式對相關數(shù)據(jù)信息進行深層次挖掘、分析各項數(shù)據(jù)之間的內(nèi)在關系,將企業(yè)對畢業(yè)生就業(yè)反饋作為人才培養(yǎng)改革的基本依據(jù),有利于更加客觀的分析人才培養(yǎng)的關鍵性問題,為下一步專業(yè)教學改革提供更為科學有效的理論基礎。
在商丘職業(yè)技術學院計算機應用專業(yè)進行的一系列教學改革中,大三年級進行的綜合實訓環(huán)節(jié)在專業(yè)教學中的地位日益突出,學生各方面綜合能力的展現(xiàn)與提高在此階段十分顯著。專業(yè)教學團隊對學生綜合能力的評估進行了改革,評估重點從3個方面進行展開:智力因素、非智力因素及自主學習能力。
學生評價中的智力因素可以理解為學生運用本身所具有的知識、能力、經(jīng)驗等解決實訓過程中遇到實際問題的能力,包括記憶、觀察、想象、思考、判斷等[1]。
非智力因素一般泛指智力因素以外的一切心理因素,包括情感和意志,個性心理傾向如動機、興趣、信念、價值觀等,個性心理特征如性格和氣質(zhì),自我意識如自尊心、自信心、自制力等[2]。
自主學習能力指的是學習者在己有知識、技能的基礎上,自覺地、獨立地、正確地運用一定的學習方法,獲取知識、發(fā)現(xiàn)問題、解決問題的學習能力[3]。
2.1 數(shù)據(jù)挖掘與關聯(lián)規(guī)則
數(shù)據(jù)挖掘就是從海量的、模糊的、有雜質(zhì)的、不完全的、隨機的從實際現(xiàn)有數(shù)據(jù)中,提取隱含在其中的、人們事先無法預測的、但又隱含潛在有價值的知識和信息的過程[4]。
關聯(lián)規(guī)則是數(shù)據(jù)挖掘的重要方法之一,關聯(lián)規(guī)則挖掘的目的就是通過分析數(shù)據(jù)間的聯(lián)系或關系發(fā)現(xiàn)給定數(shù)據(jù)集中項之間的有趣聯(lián)系,從而確定不同數(shù)據(jù)之間的關聯(lián)規(guī)則[5]。
設I={ i1,i2,i3,…,im}是項的集合。學生評價相關的數(shù)據(jù)D是學生評價數(shù)據(jù)庫的集合,其中每個學生評價綜合結(jié)果T是項的集合,使得每個學生評價結(jié)果使用一個標識符,記為TID設A是一個項集,學生評價綜合結(jié)果T包含A當且僅當
2.2 AprioriTid算法
AprioriTid算法是在Apriori算法基礎上改進的關聯(lián)規(guī)則挖掘的經(jīng)典算法。AprioriTid算法是在Apriori算法基礎上通過一次遍歷數(shù)據(jù)庫D之后,產(chǎn)生數(shù)據(jù)集ˉC1,在后續(xù)歷次掃描數(shù)據(jù)集中使用數(shù)據(jù)集合ˉCk (k>1)代替數(shù)據(jù)庫D,在ˉCk中的元素表示采用元素組(TID,{Xk})表示,其中{Xk}是用TID唯一標識的事務包含的k維頻繁項目集的集合。
利用AprioriTid算法挖掘?qū)W生綜合實訓評價結(jié)果與企業(yè)對畢業(yè)生評價反饋之間的關聯(lián)規(guī)則,需要首先建立進行數(shù)據(jù)挖掘的學生評價系統(tǒng)數(shù)據(jù)庫,并根據(jù)評價數(shù)據(jù)是否有效進行清理和轉(zhuǎn)換,然后才能對數(shù)據(jù)進行挖掘,找出其關聯(lián)規(guī)則。
3.1 學生評價數(shù)據(jù)庫的處理
對計算機應用專業(yè)人才培養(yǎng)進行分析的主要數(shù)據(jù)來源有:學生在校綜合實訓中掌握知識、運用技術解決問題評價,即智力因素評價,分為90分以上、80-89分、60-79分、60分以下4個等級;學生在綜合實訓中態(tài)度、情感、意志等方面的非智力因素,分為優(yōu)、良、中、差4個等級;學生在實訓中遇到陌生問題,通過進一步學習,從而解決問題的能力,即學生的自主學習能力的評價,分為強、較強、一般、差4個等級;以及畢業(yè)生勝任工作情況的調(diào)查反饋,分為良好勝任、勝任、基本勝任、難以勝任四個等級。
根據(jù)對計算機應用專業(yè)學生綜合實訓評價的相關指標以及對畢業(yè)生調(diào)查的數(shù)據(jù)進行量化,采用布爾量化的方法,智力因素評價分為90分以上、80-89分、60-79分、60分以下4個等級分別標記為i1,i2,i3,i4;非智力因素評價分為優(yōu)、良、中、差4個等級,分別標記為i5,i6,i7,i8;學生自主學習能力分為強、較強、一般、差四個等級,分別標記為:i9,i10,i11,i12;企業(yè)評價分為良好勝任、勝任、基本勝任、難以勝任四個等級分別標記為i13,i14,i15,i16;以近三年商丘職業(yè)技術學院計算機應用專業(yè)人才培養(yǎng)的數(shù)據(jù)為例,從學生評價系統(tǒng)數(shù)據(jù)庫中隨機任意選取10條學生評價結(jié)果,進行布爾量化,得到的學生評價數(shù)據(jù)庫如表1所示:

表1 學生綜合評價數(shù)據(jù)庫
3.2 數(shù)據(jù)挖掘過程
應用AprioriTid算法進行數(shù)據(jù)挖掘的過程,就是不斷地連接和剪枝的過程,最后形成滿足要求的最大頻繁項集,設置最小支持數(shù)為2,最小置信度為80%。具體操作步驟如下:
初次掃描學生評價數(shù)據(jù)庫,統(tǒng)計出評價非零的項目,得到評價表E,如表2所示:

表2 學生評價數(shù)據(jù)表E

掃描表E,得到候選學生評價項目集C1,如表3所示:
Application of Data Mining in Talent Training of Computer Application Major
Li Dong
(Computer Department of Shangqiu Polytechnic, Shangqiu 476001, China)
Use data mining technology to analyze the evaluation data of students majoring in Computer Application in Shangqiu Polytechnic, and obtain the association rules between the student evaluation results by applying the AprioriTid algorithm. This rule indicates that students get intelligence evaluation 80-90 scores, and non-intelligence evaluation is excellent. The students with good ability of self-learning can meet the needs of job well, and obtain good enterprise evaluation. Practice has proved that association rule has guiding significance in next professional teaching reforms.
Date Mining; Computer Application; Talent Training

TP301.6
A
1007-757X(2016)08-0024-03
河南省教育廳基金支持項目(2014-ZC-074)
李 冬(1982-),男,河南商丘人,商丘職業(yè)技術學院講師,碩士,研究方向:計算機應用技術,商丘,476001