999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

關(guān)聯(lián)規(guī)則挖掘算法在選課系統(tǒng)中的應(yīng)用研究

2011-12-31 00:00:00霍云艷
中國管理信息化 2011年12期

[摘要] 本文針對高校網(wǎng)上選課工作中遇到的一些實際矛盾,將關(guān)聯(lián)規(guī)則挖掘算法應(yīng)用于選課指導(dǎo)系統(tǒng)中,對系統(tǒng)中存儲的大量數(shù)據(jù)進行挖掘,從中提取出潛在的有用的信息,為高校選修課的開設(shè)及學(xué)生選課行為提供決策支持。

[關(guān)鍵詞] 數(shù)據(jù)挖掘; 關(guān)聯(lián)規(guī)則挖掘; 選課系統(tǒng); FP-growth算法

doi : 10 . 3969 / j . issn . 1673 - 0194 . 2011 . 12. 033

[中圖分類號]G473.4;TP311.13 [文獻標識碼]A [文章編號]1673 - 0194(2011)12- 0050- 02

1引言

目前,普通高校已廣泛采用計算機信息系統(tǒng)對學(xué)生選課活動進行管理,學(xué)生可根據(jù)自己專業(yè)特點、興趣愛好以及未來的職業(yè)規(guī)劃,在網(wǎng)上進行選修課的選擇。在選課過程中,經(jīng)常出現(xiàn)選課不均衡現(xiàn)象,即一些課程的選擇人數(shù)過多,而另一些課程無人選擇。

選課系統(tǒng)在運行中積累了大量的數(shù)據(jù),這些數(shù)據(jù)中隱含著一些無法辨識的信息,利用數(shù)據(jù)挖掘技術(shù),挖掘選課系統(tǒng)中積累的、潛在的、有用的信息,可以指導(dǎo)教務(wù)部門調(diào)整熱門課程和冷門課程的數(shù)量和學(xué)分設(shè)置,從而提高教學(xué)管理水平,使教學(xué)資源得到合理分配,滿足學(xué)生的個性化選課需求。

2關(guān)聯(lián)規(guī)則及其算法分析

2.1數(shù)據(jù)挖掘定義

數(shù)據(jù)挖掘[1]是從數(shù)據(jù)中識別出有效的、新穎的、潛在有用的、以及最終可理解的模式的高級過程。簡單地說,數(shù)據(jù)挖掘是從大量數(shù)據(jù)中提取或“挖掘”知識。它是一個融合多種技術(shù)的交叉學(xué)科,包括數(shù)據(jù)庫技術(shù)、統(tǒng)計學(xué)、機器學(xué)習(xí)、可視化和信息科學(xué)等學(xué)科。

2.2關(guān)聯(lián)規(guī)則算法分析

關(guān)聯(lián)規(guī)則(Association Rule)挖掘就是從大量的數(shù)據(jù)集中去尋找數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,為決策系統(tǒng)服務(wù)。人們可以利用手中沒有規(guī)律的數(shù)據(jù),找出物與物之間的規(guī)律,利用這些規(guī)律也給商業(yè)界帶來了驚人的利潤。目前,關(guān)聯(lián)規(guī)則挖掘已經(jīng)成為數(shù)據(jù)挖掘領(lǐng)域中的重要研究方向。

關(guān)聯(lián)規(guī)則的挖掘算法主要有循環(huán)式掃描算法、增量式更新算法、并行挖掘算法、元模式制導(dǎo)、基于約束挖掘等。其中比較典型的有Apriori算法和FP-growth算法。楊克松[2]用Apriori算法對選課系統(tǒng)進行數(shù)據(jù)挖掘,但由于Apriori算法在每次尋找頻繁項集的時候,都需要掃描數(shù)據(jù)庫一次,因此隨著數(shù)據(jù)庫的增大,尋找頻繁項集的時間會越長,系統(tǒng)的效率受到很大的影響。針對Apriori算法框架的缺陷,Han.JW(韓家煒)[1]等人提出了FP-tree結(jié)構(gòu)和相應(yīng)的FP-growth算法。實驗表明,FP-growth對不同長度的規(guī)則都有很好的適應(yīng)性,同時在效率上較之Apriori算法有巨大的提高。由于高校多年來存儲的選課數(shù)據(jù)量較大,故選用FP-growth方法實現(xiàn)高校選課系統(tǒng)的關(guān)聯(lián)規(guī)則挖掘較為合適。

3關(guān)聯(lián)規(guī)則挖掘在選課指導(dǎo)系統(tǒng)中的應(yīng)用

數(shù)據(jù)挖掘過程可以分為3個步驟:數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘、挖掘結(jié)果的解釋與評估。

3.1數(shù)據(jù)預(yù)處理

數(shù)據(jù)預(yù)處理是指對數(shù)據(jù)進行清洗、集成、轉(zhuǎn)換和消減。清除冗余數(shù)據(jù),降噪,填充缺失的數(shù)據(jù),消除重復(fù)記錄,從而提高數(shù)據(jù)挖掘?qū)ο蟮馁|(zhì)量,達到提高數(shù)據(jù)挖掘所獲知識質(zhì)量的目的。本文結(jié)合選課系統(tǒng)的應(yīng)用來研究數(shù)據(jù)預(yù)處理的4個步驟:

(1) 數(shù)據(jù)清洗。現(xiàn)實世界的數(shù)據(jù)常常是有噪聲的、不完全的和不一致的。數(shù)據(jù)清洗過程一般包括平滑噪聲數(shù)據(jù)、補充缺失數(shù)據(jù)、消除異常數(shù)據(jù),以及糾正不一致的數(shù)據(jù)。在系統(tǒng)中,對數(shù)據(jù)庫中空缺的數(shù)據(jù)項進行關(guān)聯(lián)查找對照,用最“近似”的數(shù)據(jù)填充。對于冗余數(shù)據(jù)(如同時選取兩門同樣課程的學(xué)生數(shù)據(jù))進行刪除。

(2) 數(shù)據(jù)集成。將來自多個數(shù)據(jù)源的數(shù)據(jù),如數(shù)據(jù)庫、數(shù)據(jù)立方、普通文件等結(jié)合在一起并形成一個統(tǒng)一數(shù)據(jù)集合,以便為數(shù)據(jù)挖掘工作的順利完成提供完整的數(shù)據(jù)基礎(chǔ)[1]。在選課系統(tǒng)的存儲設(shè)計中,要為將來的數(shù)據(jù)挖掘做準備,同時考慮不同專業(yè)的偏好程度、課程的冷熱程度、學(xué)生對教師的要求等因素,將數(shù)據(jù)存儲在SQL Server 2000中。

(3) 數(shù)據(jù)轉(zhuǎn)換。將數(shù)據(jù)按劃分的主題進行轉(zhuǎn)換,同時使數(shù)據(jù)離散化。例如:將“網(wǎng)絡(luò)2009-01”分解成“網(wǎng)絡(luò)”專業(yè)、“2009”級、“01”班,為數(shù)據(jù)挖掘作準備。

(4) 數(shù)據(jù)消減。數(shù)據(jù)消減是使原來龐大復(fù)雜的數(shù)據(jù)精簡化,去除挖掘工作不需要的屬性,同時保證數(shù)據(jù)的完整性。例如:去除課程信息中的學(xué)期、課程序號等;去除教師信息中的年齡、性別等;學(xué)生信息中只保留學(xué)號、姓名、專業(yè)、院系、年級,其他信息去除;成績信息中只保留課程編號、學(xué)號、成績。

3.2數(shù)據(jù)挖掘

本文選擇關(guān)聯(lián)規(guī)則挖掘方法來研究課程、學(xué)生、教師之間的相關(guān)聯(lián)系,在關(guān)聯(lián)規(guī)則挖掘的各種算法中,經(jīng)過比較,我們選用效率較高的FP-tree增量模式算法,具體算法如下。

表1中數(shù)據(jù)是部分選課情況,以該數(shù)據(jù)為例,可以挖掘出若干關(guān)聯(lián)規(guī)則,下面僅從技術(shù)角度討論3條選擇關(guān)聯(lián)規(guī)則的標準:支持度(也稱廣泛度、普遍度)、置信度(也稱預(yù)測度)和增益。

3.2.1支持度sup()

表示在選課系統(tǒng)中同時包含關(guān)聯(lián)規(guī)則左右兩邊教師職稱和課程科目的選擇次數(shù)百分比。即支持這個選擇的次數(shù)百分比,相當于聯(lián)合概率。

sup(X22 → Y11) = P(X22Y11) = 400 / 1 000 = 40%

3.2.2置信度con()

是指所有的選擇了左邊的教師,同時又選擇了右邊的課程的選擇概率,是一個條件概率。

con(X22 → Y11) = P(Y11 | X22) = P(X22Y11) / P(X22) = 400 / 540 = 74.1%

3.2.3增益lif()

增益是兩種可能性的比較。一種是在已知選擇了左邊教師的情況下選擇右邊課程的可能性,另一種是在任意情況下選擇右邊課程的可能性。

lif(X22 → Y11) = P(Y11 | X22) - P(Y11) = 74.1% - 50% = 24.1%

這個標準和數(shù)據(jù)挖掘中其他模型的選擇標準一樣,通過與“原有”規(guī)則的比較,來測量該規(guī)則提高預(yù)測準確性的程度。指定標準的最小值,min_sup=10%,min_con=40%,min_lif=10%。取值都大于標準臨界值的關(guān)聯(lián)規(guī)則被列出。

3.3對結(jié)果的評估

從表2的挖掘有效規(guī)則可以看出,R1規(guī)則說明2009級學(xué)生偏愛文史類課程,并且多數(shù)學(xué)生選擇職稱為副教授的教師;R2規(guī)則說明2010級學(xué)生對經(jīng)濟類課程感興趣,并且對教授職稱的老師非常認可;R3規(guī)則說明各年級學(xué)生都對藝體類課程有興趣,而且對老師的職稱沒有要求;R4規(guī)則說明學(xué)生對學(xué)分比較高的課程有興趣,等等。根據(jù)表2中結(jié)果,可以建議下學(xué)期廣泛開展藝體類選修課,鍛煉體魄陶冶情操,向2009級學(xué)生增開文史類課程,向2010級學(xué)生增開經(jīng)濟類課程,等等。

4結(jié)論

數(shù)據(jù)挖掘技術(shù)已經(jīng)成功地應(yīng)用于銀行和商業(yè)領(lǐng)域中,在高校、政府等非營利性機構(gòu)中應(yīng)用很少。本文采用FP-growth算法對高校學(xué)生選課信息進行數(shù)據(jù)挖掘,輔助教務(wù)處完成下學(xué)期選修課程和教師資源的合理安排,提高教學(xué)管理效率。此問題還需進一步深入研究,從多層次和多維度對系統(tǒng)中的數(shù)據(jù)進行挖掘。

主要參考文獻

[1] [加]Jiawei Han,Micheline Kamber. 范明,孟小峰,譯. 數(shù)據(jù)挖掘概念與技術(shù)[M]. 北京:機械工業(yè)出版社,2001.

[2] 楊克松. 論關(guān)聯(lián)規(guī)則在高校選課系統(tǒng)中的應(yīng)用[J]. 福建電腦,2007(10).

主站蜘蛛池模板: 毛片最新网址| 日本不卡在线| 国产人人干| 国产无吗一区二区三区在线欢| 亚洲日韩精品伊甸| 国产精品微拍| 九九九国产| 视频一区亚洲| 亚洲无码视频一区二区三区| 午夜人性色福利无码视频在线观看| 亚洲啪啪网| 日韩a级片视频| 青青青草国产| 国产日产欧美精品| 97色伦色在线综合视频| 国产精品视频系列专区| 午夜电影在线观看国产1区| 国产综合在线观看视频| 久久99国产综合精品1| 亚洲伊人电影| 另类重口100页在线播放| 日本一区高清| 婷婷亚洲最大| 精品人妻无码中字系列| 日韩黄色大片免费看| 色天天综合| 欧美高清日韩| 大乳丰满人妻中文字幕日本| 精品人妻无码中字系列| 国产乱子伦无码精品小说| 国产青青操| 国产一级一级毛片永久| 国产中文一区二区苍井空| 宅男噜噜噜66国产在线观看| 国产精品久线在线观看| 欧美日韩第二页| 国产第一页屁屁影院| 欧美日韩高清在线| 毛片免费视频| 国产毛片高清一级国语 | 国产啪在线91| 亚洲午夜片| 国产专区综合另类日韩一区| 亚洲黄色高清| 香蕉久人久人青草青草| 国产夜色视频| a色毛片免费视频| 中文字幕天无码久久精品视频免费 | 国产成人精品在线| 五月婷婷激情四射| 亚洲精品欧美日本中文字幕| 国产自在线拍| 操国产美女| 2018日日摸夜夜添狠狠躁| 色婷婷综合在线| 亚洲第一黄色网址| 手机在线国产精品| 日本一本在线视频| 被公侵犯人妻少妇一区二区三区| 91精品久久久久久无码人妻| 欧美日韩精品在线播放| 丁香婷婷激情网| 欧美人与牲动交a欧美精品 | 男女性午夜福利网站| 色婷婷久久| 亚洲黄网在线| 国产色伊人| 搞黄网站免费观看| 久久人搡人人玩人妻精品| 色婷婷电影网| 狠狠色丁香婷婷综合| 制服无码网站| 国产永久无码观看在线| 国产精品3p视频| 国产激爽大片在线播放| 污污网站在线观看| 午夜a级毛片| 国产一级二级三级毛片| 54pao国产成人免费视频| 欧美日韩一区二区在线播放| 制服丝袜国产精品| 亚洲乱码在线视频|