999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數據挖掘分類技術在高校教學中的應用

2009-04-29 00:00:00
電腦知識與技術 2009年24期

摘要:隨著高校的擴招,高校教學工作出現了不少問題。該文在明確了數據挖掘技術在高校教學研究中應用意義的基礎上,分析了高校教學目前的現狀,提出了一種數據挖掘分類技術在高校教學中的應用方案,從而提高高校的教學質量。

關鍵詞:數據挖掘;分類挖掘;高校教學

中圖分類號:G424文獻標識碼:A文章編號:1009-3044(2009)24-6604-02

The Apply of Data Mining Classification Techniques in University Teaching

ZHANG Chun

(Fujian Vocational College of Children Education,Fuzhou 350000,China)

Abstract: With the surge in the number of university students,that brought about many problems to the teaching work.This paper has firstly cleared the Significance of data mining technology in University teaching and research.Then has Analysis the current status of college teaching.This paper has mainly improved the data mining classification techniques in University Education applications for improving the quality of teaching as a fundamental goal.

Key words: data mining; classification mining; university teaching

數據挖掘技術在商業、金融業以及企業的生產、市場營銷等方面都得到了廣泛的應用,而在教育領域應用相對較少,高校中對學生信息、成績等數據的處理還一般停留在簡單的數據的備份和查詢階段。近年來隨著高校的不斷擴招,學生人數大幅度增加,給高校學生教學工作帶來了嚴峻考驗,傳統的教學管理手段已逐漸不能適應社會的發展。隨著數據挖掘技術的成熟及應用領域的不斷擴展,不少高校研究人員已開始研究將數據挖掘技術應用于高校的教學中。例如,將數據挖掘技術應用于學生信息管理、高校的教學評估、學生成績分析及考試系統中,對提高學校教學管理水平起到了很好的指導作用。本文主要探索在高校教學中數據挖掘分類技術的應用。

1 高校教學現狀的剖析

目前,在高校教學中,特別是高校的基礎課教學中,普遍存在著的問題是:

首先,師資力量嚴重不足、生師比過高。由于高校連年擴招,而教師數量卻不能及時增加,使教師在教學過程中對學生學習情況難以做到跟蹤了解,同時在對學生的輔導及批改作業等方面也顯得力不從心,這勢必對教學質量會產生影響。

其次,許多基礎課的教學學時普遍較低。當今社會是個競爭激烈的社會,掌握越多的知識技能,就越能夠被社會接受。為了讓學生在校期間能夠學到更多的學科知識,學校對許多基礎課程的教學學時都進行了壓縮,如何在有限的時間完成教學任務并使學生掌握更多的知識是所有教師、學生共同關心的問題。

另外,高校學生的基礎有差異。由于學生來自不同地區,各地的基礎教育水平有差異,這造成了同一個班上的學生基礎的參差不齊,給教師的教學工作帶來了影響。如計算機基礎課程,學生入學時的計算機基礎參差不齊,如何平衡這些差異、體現素質教育、因材施教是擺在教師們面前的一個重大難題[1]。

針對以上這些問題,許多教師都在探討著在當前的教學條件下如何提高教學質量。一般來說,教師在教學實施過程中往往積累了大量的數據,但目前對這些數據的處理還停留在初級的數據備份、查詢及簡單統計階段,使得這些數據還不能發揮它應有的作用。如何開發這些“寶藏”,利用這些數據理性地分析教學中的各方面的成效得失是廣大教師們都共同關心的問題。

2 數據挖掘分類技術在高校教學中的應用方案

2.1 高校教學挖掘的目標

本文研究的數據挖掘分類技術在高校教學中的應用方案,首先要明確挖掘對象的目標。由于高校教師面對著的學生數量眾多,本文的研究目標希望能夠根據學生的平時基本學習情況(如知識基礎、課堂學習效果、學生對課程的感興趣程度、作業完成情況、課后所花費的時間、所使用的學習方法等)探討出哪些因素對學習成績是有影響的,學生的學習成績為優良或學習成績為不及格有那些方面的原因。并期望用所獲得的分析結果指導今后的高校教學工作。

2.2 學生及成績信息的收集

數據收集是為后續的分析,為發現兩個或者多個屬性之間的函數關系奠定基礎。要分析高校教學的效果成因,需要有這樣幾個方面的數據:

1) 學生基本信息

數據結構如下:學號、姓名、性別、籍貫、所屬院系、專業、班別。這些信息可以通過高校的教務管理系統獲得。

2) 學生調查信息

學生調查信息包括對專業、課程的熱愛程度、學前知識的掌握程度、課堂學習的效果、學習方法等。這些信息主要通過調查,由學生填寫產生。過去,這些工作通常是需要制作調查表,我們為了解決大工作量的數據統計問題,通過網上教學在線調查系統來完成學生調查信息的采集。同時,為了避免一人填寫多份表格導致數據偏差,系統登錄時要求使用學號和學生姓名,并限制一人只能提交一次。

由于這些信息由學生填寫,不可避免地產生不夠真實的數據,為避免這類數據的產品,在調查系統中還包含著學生的自我評價和教師教學方法的意見等,根據這些信息可以基本判定調查結果的可信程度。

3) 成績數據庫

高校教務管理系統中可獲取最近五個學年的學生各科成績。如果是本學期的學生成績則是由教師在教學過程中產生,包括了學生的平時作業成績及課程的考試成績。由于學生人數眾多,對學生平時作業的批改成了教師們頭疼的問題,本文采用的方法是:將所有的作業要求學生按規定的格式、規定的文件名以電子文檔的形式上傳至提交作業系統中。通過改作業程序,對學生上交的作業自動批改,并登記成績,從而大大減輕改作業的工作量。

2.3 數據的清理、轉換及消減

在本文研究的學生成績分析基本數據庫中,我們采用忽略元組的方法刪除沒有參加考試或者學生填寫的在線調查數據中有大量的空缺項的記錄。對于其他個別空缺,可以采用人工填充的方法,填充原則是以該記錄的其他屬性值作為篩選條件,在數據庫中進行篩選,并使用多數屬性值填充該空缺[2]。

數據轉換主要是對數據進行規格化操作。本文將學生平時成績屬性的所有值分為三類:成績從0-65分是較差級別,65-80分是一般級別,80分以上是較好級別。另外,對于一些屬性值較多的屬性,使用概念分層,用高層次概念替換低層次概念,可以減少屬性值的數目。此外,數據消減的目的是縮小所挖掘數據的規模,本文采用消減維數的方法,生成新的學生成績分析基本數據表。

2.4 數據分類挖掘的流程

分類挖掘的目的是為了建立成績分析決策樹模型。本文采用的算法描述如下:

Step1:創建一個節點N;

Step2:若該節點中的所有樣本均為同一類別C,則返回N作為一個葉節點并標志為類別C;

Step3:若attribute_list為空,則返回N作為一個葉節點,并標記為訓練樣本集中最普遍的類別;從attribute_list選擇一個信息增益最大的屬性test_attribute;并將節點N標記為test_attribute;

Step4:對于test_attribute中的每一個已知取值ai,準備劃分節點N所包含的樣本集;

Step5:根據test_attribute=ai條件,從節點N產生相應的一個分支,以表示該測試條件;

Step6:設Si為test_attribute=ai條件所獲得的樣本集合;

Step7:若Si為空,則將相應葉節點標記為該樣本集合中類別個數最多的類別;否則將相應葉節點標志為Generate_decision_tree (Si,attribute_list-test_attribute)的返回值。

由于學生信息表中的屬性字段很多,在建立成績是否優良決策樹模型時,本文選擇了其中與成績屬性相關性較大的課后上機時間、學習前對課程的了解程度、課堂學習情況、平時作業情況屬性字段,是否優良屬性作為類別屬性。建立成績是否不及格決策樹模型時,以是否不及格屬性作為類別屬性。

在一個決策樹剛剛建立起來的時候,需要進行必要的決策樹修剪。本文采用事后修剪 (post pruning)的方法[3]。剪枝后的不及格成績分類決策樹如圖1所示。

下面以訓練集為例說明高校學生成績是否優良決策模型的生成。

首先計算出一個充分生長的決策樹的錯誤率,由用戶指定一個最大的允許錯誤率。當剪枝達到某個深度時,計算出的錯誤率高于允許的最大值時,立即停止剪枝,否則可以繼續剪枝。其次計算對給定樣本分類所需的信息熵,并計算每個屬性的熵。再次對于“課后上機時間”類的不同樣本,計算出劃分的信息增益。由于“平均成績”屬性具有最高增益信息,它可以被選作測試屬性。創建一個節點,用“平時成績”作標記,并對每個屬性值,引出一個分支,樣本以此劃分,其它分支節點的劃分也按此方法進行。返回的決策樹如圖2所示。

3 小結

本文利用數據挖掘分類技術實現了在高校教學研究中有關學生成績的分析。在數據采集方面,設計了在線調查系統,提出了利用網絡實現學生在線調查,獲取有關學生的學習方法、學習興趣等調查數據,并整合學生基本信息、學生成績等數據,形成一個包含多種屬性字段的學生學習情況基本信息庫的方法。在分類之前,對數據庫進行了數據清理、數據轉換、數據消減等數據預處理,處理了空缺數據、將連續值屬性離散化,為進一步挖掘打好基礎。分類的實施算法選擇具有最大信息增益的屬性作為測試屬性,使得所生成的決策樹最簡單。在決策樹修剪方面,本文使用了限定允許最大誤差率的決策樹事后修剪法,使產生的分類規則更實用更易于理解。

參考文獻:

[1] 姜洪臣,趙強.數據挖掘技術在高校教學中的應用研究[J].中國科技財富,2009,(2).

[2] 劉曉霞.數據挖掘技術在高校教學中的應用[J].現代計算機(專業版),2008,(6).

[3] 朱倩.略論高校教學管理中數據挖掘技術的應用[J].硅谷,2009,(4).

主站蜘蛛池模板: 秋霞午夜国产精品成人片| 亚洲狼网站狼狼鲁亚洲下载| 欧美一级高清片久久99| 国产精品刺激对白在线| 婷婷色一二三区波多野衣| 婷婷六月天激情| 波多野结衣在线一区二区| 亚洲中文字幕在线一区播放| 欧美一区精品| 国产1区2区在线观看| 在线亚洲精品自拍| 国产一区亚洲一区| 伊人查蕉在线观看国产精品| 日本国产精品一区久久久| 亚洲毛片一级带毛片基地| 91欧美在线| 99视频在线观看免费| 女人爽到高潮免费视频大全| 国产大全韩国亚洲一区二区三区| 国产色网站| 日本午夜三级| 成人在线欧美| 在线国产综合一区二区三区 | 人人91人人澡人人妻人人爽| 亚洲中文字幕久久无码精品A| 91成人免费观看在线观看| 国产在线一二三区| 国产熟女一级毛片| 亚洲制服丝袜第一页| 一级毛片免费的| 欧美日韩亚洲国产主播第一区| 美女扒开下面流白浆在线试听 | 久久人妻系列无码一区| 国产精品福利尤物youwu| a国产精品| 日本道中文字幕久久一区| 精品国产免费观看| 色吊丝av中文字幕| 中文字幕在线不卡视频| 日本精品视频| 精品无码一区二区三区电影 | 国产小视频免费观看| 国产精品成人一区二区不卡| jizz国产在线| 91视频精品| 亚洲h视频在线| 高清免费毛片| 久久国产高清视频| 国产99在线观看| 亚洲av日韩综合一区尤物| 无码中文AⅤ在线观看| 国产丝袜无码精品| 好吊色妇女免费视频免费| 色网站在线免费观看| 99re精彩视频| 欧美亚洲一区二区三区在线| 精品国产三级在线观看| 亚洲精品在线观看91| 国产一级特黄aa级特黄裸毛片| 538精品在线观看| 免费人成又黄又爽的视频网站| 国精品91人妻无码一区二区三区| 国产丝袜啪啪| 中文无码日韩精品| 国产97公开成人免费视频| 2020国产免费久久精品99| 欧美日韩资源| 无码粉嫩虎白一线天在线观看| 国产欧美中文字幕| 欧美精品色视频| 日韩精品中文字幕一区三区| 国产成人亚洲无吗淙合青草| 午夜国产小视频| 亚洲爱婷婷色69堂| 欧美日韩福利| 噜噜噜久久| 青草娱乐极品免费视频| 亚洲欧美一区二区三区图片| 久久久久久国产精品mv| 狠狠干欧美| 国产精品综合色区在线观看| 精品一区二区三区波多野结衣|