999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于關聯規則數據挖掘技術在教學管理中的應用

2012-12-29 03:54:50李曉光
中國新技術新產品 2012年17期
關鍵詞:數據挖掘關聯規則

李曉光

(哈爾濱學院,黑龍江 哈爾濱 150086)

1 概述

在現代科學的不斷進步的今天,高校的教學管理也不可避免的要趨于日益規范化、信息化和網絡化。其主要側重點要轉向項目研究、方法創新、優化服務而非單一的規范管理。通過數據挖掘和知識發現技術,我們可以從現有數據中分析提取潛在有用的知識信息并應于與教學管理中。本文將介紹學分制選課成績信息的關聯規則挖掘的相關內容,并結合Oracle數據庫的教學數據庫系統,對關聯數據挖掘技術進行探討。

2 基本的挖掘算法

基本的數據挖掘算法主要包含置信度(confidence)和支持度(support)兩個參數。Apriori是已知的最早的關聯規則的挖掘基本算法。它的主要作用是用來描述用戶對挖掘出來的規則的偏好程度。把瀏覽大量事務數據時的每一個的單個項累加起來,在所有事物瀏覽完畢后,把自身支持度小于用戶給出的支持度的項目刪除,以此為基礎拓展到多項事務中去。

3 以Oracle數據庫系統為基礎的挖掘系統

在應用服務器層上進行數據邏輯處理的工作,是在普遍的C/S和B/S數據庫應用系統中所采取的辦法,我們通常把數據庫當成一個儲存數據的工具來看待和管理,在返還給數據庫之前,我們想要先提取數據庫中的某一種特定數據并進行處理。在這個過程中,Oracle數據庫是目前是最常用也是最優秀的有關于數據存儲,、轉換、應用的中心系統。數據挖掘系統在工作時,時常要對數據表中所有數據進行徹底掃描,因為這樣可以將盡可能多的把整體數據轉換和處理過程放在數據庫系統內來執行,以提高數據掃描效率。

4 教學系統中的挖掘實例

4.1 學生成績事務數據預處理

首先,我們需要學生成績的事務型數據表,這是因為使用關聯挖掘算法需將具體學生的所有成績數據元組組合并成一個事務數據。通常數據庫中存儲學生成績的方式為N對N的元組,即“學號——課程號——成績”的形式。不難發現,我們很難把它們組裝到一個事務中去,因為每個學生在數據表中都是由多個元組組成的。倘若這樣大型的事務性數據表要在在挖掘過程中重新創建,那就要花去很長的運算時間,得不償失,所以將其一直存儲在數據庫內才是正確的選擇。

筆者認事物數據的建立可以分解為:數據集成、數據選擇和預分析。

(1)數據集成。在這個步驟中,從操作型環境中提取并集成的數據中語句不可避免的會含有許多語句的二義性問題,我們要首先把它統一起來或者直接消除。消除語義二義性是在教學系統的數據處理時的主要工作。例如對于《c語言程序設計》,有的表則會將其顯示為:“c語言”。而他們指的其實是一回事,所以我們要把它們合二為一。建立在園區網絡的系統研發應該以兩個數據集市為主題,即學生與課程。

(2)數據選擇。減小數據量、保證數據挖掘結果的優質性是預分析和數據選擇的主要功能。因為在之前的過程中,由于數據倉庫的容量會不斷增加。數據挖掘時的一次耗時也會相應地加長。會給用戶造成巨大的負擔。

(3)數據預處理。首先,要將處于離散狀態的多元組的學生成績數據和成績轉化為事務性的成績數據,一個事務元組配對一個學生,既學號——成績事務組。具體形式如下:(0243041087,“C語言程序設計B,軟件工程B,數據結構 A,?”)或(0243041293,“C 語言程序設計 A,匯編語言 B,人工智能 B,? ”)。其中,用一個足夠長的字符串來存儲,每個事務用逗號作為間隔,使用的時候通過很簡單的字符串分析就能夠提取出里面的所有成績事務。

4.2 數據挖掘

取得課程間的相關信息,進而指導學生選課是關聯規則對學生成績數據庫進行數據挖掘的最終目標。Apriori、AIS、SETM和 Partitio等是關聯規則的主要分析算法,本文中的實例將采用Apriori算法。

在進行處理時,學生考試成績,隸屬院系等基本信息以及在數據預備階段形成的各課程所隸屬的課程分類信息都是關聯規則分析中可能用到的,應該加以留存。依據學生的考試成績,分析出各門課程之間的內在聯系,提高數據挖掘的精確度,僅僅靠考慮可信度以及支持度在實際應用中是遠遠不夠的,有時甚至還會引起不必要的誤導。筆者認為可以通過在原來的關聯規則上增加興趣度閾值這一手段來實現。例如《C語言程序設計》(以下簡稱《C語言》)和《軟件工程》(以下簡稱《軟件》)成績為優的學生數量在成績庫中占15%,但是《軟件》中優秀的學生數量在《C語言》為優的學生中占到數量的50%,我們可以由這兩個足夠大的支持度和可信度得出:“提高《C語言》的教學水平有助于《軟件》教學成績的提高”,這種結論看似合理,而實際的情況卻是原始記錄顯示選修《軟件》的學生有60%成績都是優,也就是說有35%的學生《C語言》成績非優但《工程》的成績為優。而且《軟件》成績優秀的概率高于已知《C語言》成績為優的概率這一定律,對于任意我們不知道信息的學生都成立。所以,如果用戶在選擇時沒有仔細分析,上面的信息很顯然會給他們造成很負面的誤導。所以我們引入興趣度閾值這一參數來解決這個問題。

定義規則R的興趣度公式為:IR=(CRSRH)/max(CR,SRH)

其中CR是規則R的可信度|H∧B|/|B|,SRH就是原始記錄中支持該規則推出的信息即規則右部H的比例。很顯然CR與SRH之間是不具有任何關聯性的,興趣度IR在計算時,R的結果可正可負。正負就是R值得意義所在。如果為負,就表示該規則是具有誤導性的,應該舍棄。反之則表示該規則有效,輸出。

4.3 學生成績關聯挖掘規則和過程的產生

在于對事務的計數上是關聯挖掘算法Apriori的主要處理過程。但要是因排列組合導致事務個數特別多,就可能導致產生的候選式遠遠超過一般計算機內存的承受力。因此,內存與外存之間的切換是Apriori算法過程中必然需要考慮到的問題。解決這個問題,最簡單的辦法就是直接將候選式保存在Oracle數據庫中,建立一張臨時的數據表—CanidateTable。 CanidateTable內剩下的元組就是頻繁項了,頻繁項可以用DELETE FROM Candidate Table WHERE支持度計數<最小支持度計數執行完成后得到。對于產生的候選式十分巨大的情況,我們可以通過建立索引,提高上述篩選候選式的效率。

4.4 結果描述

我們可以利用可視化工具將數據挖掘獲取的信息以用戶理解和觀察的方式反映給用戶。在本系統中選用表格進行反映表述。用表格去表示某學院學生成績挖掘結果,范式為(no,front,rear,C,S,I),這些單詞和字母分別代表的是是產生關聯規則的序號、關聯規則前件、關聯規則后件、可信度、興趣度和支持度。

通過分析挖掘,我們可以得到課程之間的相關關系,這樣可以幫助管理者做出正確的決策,指導他選課過程,有助于學生更加有針對性的學習各門課程。

[1]HAN J,KAMBER M.Data Mining:Concepts and Techniques.Beijing:Higher Education Press,2001.

[2]Rakesh Agrawal,Tomasz Imielinski,Arun Swami.MiningAssociation Rules between Sets of Items in Large Databases,1993

[3]董彩云,曲守寧.數據挖掘及其在高校教學系統中的應用[M].濟南大學學報,2004.

[8]張梅峰,張建偉,張新敬,等.基于Apriori的有效關聯規則挖掘算法的研究[J].計算機工程與應用,2002,39(19):196-198.

[9]張智軍,方穎,許云濤.基于Apriori算法的水平加權關聯規則挖掘 [J].計算機工程與應用,2002,39(14):197-199.

猜你喜歡
數據挖掘關聯規則
撐竿跳規則的制定
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
數獨的規則和演變
探討人工智能與數據挖掘發展趨勢
奇趣搭配
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規則對我國的啟示
一種基于Hadoop的大數據挖掘云服務及應用
主站蜘蛛池模板: 99国产精品免费观看视频| 天天躁日日躁狠狠躁中文字幕| 谁有在线观看日韩亚洲最新视频| 97视频精品全国免费观看 | 久久久久青草大香线综合精品| 精品国产成人a在线观看| 国产成人免费高清AⅤ| jizz在线免费播放| 性做久久久久久久免费看| 国产真实乱子伦精品视手机观看 | 五月天香蕉视频国产亚| 亚洲中文精品人人永久免费| 色婷婷成人| 视频一区视频二区日韩专区| 国产成人综合网| 99精品免费在线| 美女啪啪无遮挡| 色婷婷在线影院| 色悠久久综合| 精品1区2区3区| 国产拍揄自揄精品视频网站| 宅男噜噜噜66国产在线观看| 婷婷久久综合九色综合88| 久久中文无码精品| 久久人妻xunleige无码| 午夜国产精品视频| 免费无遮挡AV| 国产成人免费视频精品一区二区| 日韩第一页在线| 久久人搡人人玩人妻精品| 成人无码一区二区三区视频在线观看 | 成人久久精品一区二区三区| 欧美狠狠干| 国产XXXX做受性欧美88| 精品伊人久久久香线蕉| 亚洲首页国产精品丝袜| 第一区免费在线观看| 无码中文字幕精品推荐| 亚洲欧美不卡中文字幕| 激情五月婷婷综合网| 99久久国产综合精品2020| 免费无码AV片在线观看中文| 亚洲一区网站| 久久久久人妻一区精品色奶水| 91精品国产一区| 国产一级毛片在线| 亚洲网综合| 国产免费久久精品99re不卡| 亚洲区欧美区| 国产白浆视频| 欧美亚洲一区二区三区导航| 免费高清毛片| 亚洲不卡网| 亚洲国产中文在线二区三区免| 99久久99视频| 在线精品自拍| 国产AV无码专区亚洲A∨毛片| 国产熟睡乱子伦视频网站| 福利一区在线| 国产精品福利社| 日韩AV手机在线观看蜜芽| 国产欧美视频一区二区三区| 四虎永久在线视频| 日本黄色a视频| 9啪在线视频| 国产人免费人成免费视频| 日韩毛片在线播放| 国产JIZzJIzz视频全部免费| 成人午夜网址| 麻豆精品在线播放| 在线播放精品一区二区啪视频| 亚洲欧美激情另类| 免费欧美一级| 国产精品制服| 东京热一区二区三区无码视频| 免费中文字幕一级毛片| 又大又硬又爽免费视频| 欧美综合中文字幕久久| 久久黄色视频影| 国产黄色视频综合| 色综合中文| 国产精品无码AV片在线观看播放|