999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于距離的孤立點挖掘改進算法在教務管理系統中的應用

2014-07-24 15:47:11牛永鑫
新媒體研究 2014年8期
關鍵詞:數據挖掘

摘 要 通過對經典的基于距離的孤立點挖掘算法的分析與研究,引入“關鍵屬性”,即減少了挖掘數據量,提高了孤立點挖掘的效率,并將該挖掘模型應用到教務管理系統學生成績歷史數據的挖掘中,從而實現了該系統的設計。

關鍵詞 教務管理系統;孤立點;數據挖掘

中圖分類號:TP311 文獻標識碼:A 文章編號:1671-7597(2014)08-0052-02

教務管理系統是一個面向學校教務管理人員,為其提供服務的綜合管理系統。教務人員通過本系統完成日常教務工作。從學生入學開始到畢業離校,其在學校內的所有和教務相關的數據都通過教務系統進行管理。目前,這些數據還未得到有效利用,只是一個待開發的“寶藏”。鑒于社會對高等學校發展的需求和目前高校數據管理現狀,利用這些數據理性地分析學校各方面工作的成效以及學生培養過程中的得失變得十分重要。

目前,教務管理系統中的數據挖掘大多利用關聯分析或分類分析,以發現一些大的模式。但關聯規則在發現大的規則的同時也會忽略那些不經常出現的情況,有時這些例外情況更應該引起教育決策者和管理者的注意。本文嘗試利用孤立點挖掘技術,對遼寧石化職業技術學院教務管理系統中積累的數據進行分析,發現那些值得注意的例外對象,為教學管理者和學生管理者提供有用的信息。

1 應用模型的建立

1.1 數據預處理

本文選取的是遼寧石化職業技術學院石油化工生產技術專業08級57名學生在入學后的三個學期的基礎必修課和專業必修課的考試分數作為實驗應用的數據集,在數據預處理階段,為了在下面的學生平均績點能夠參照公式計算,所以將考試分數小于60分的學生成績均修改為50分,因為在公式中如果不及格的分數除以10再減5則就是負數,但是學生的學分績點不可能為負。

1.2 孤立點定義

圖1 學生成績平均績點圖

本文中以學生成績績點分析為例,選取遼寧石化職業技術學院石油化工生產技術專業10級57人的第一、二、三學期的學生考試分數作為原始數據,三個學期的學分績點作為檢測屬性,屬于多變量的孤立點檢測問題。通過對數據的分析,利用孤立點挖掘算法可以檢測出學生的學習成績下降、上升幅度大的和成績不穩定的即為孤立點。經過數據預處理后的學生平均績點如圖1所示。

2 孤立點數據挖掘過程

2.1 系統結構

相對于傳統的基于距離的孤立點檢測算法,經過改進的挖掘算法同樣可以尋找出相似的孤立點,并給定了孤立點的程度,取消了設置參數p和d的要求;同時通過引入關鍵屬性,可以在數據預處理階段刪除數據集中非關鍵屬性的數據,從而提高了效率;第三通過改進距離度量,可以降低將正常點誤認為是孤立點的概率。在本文中,將改進后的數據挖掘算法應用在遼寧石化職業技術學院教務管理系統中,對學生成績的平均績點進行孤立點挖掘,以期挖掘出“例外的”但是有用的信息,提供給教育管理者做決策。數據挖掘的程序框圖如圖2所示。

2.2 確定關鍵屬性

對于圖1中的學生三個學期的成績平均績點,可以計算出相應的屬性隸屬度,分別為λ1=0.142253,λ1=0.288887,λ3=0.035729,可以看出λ2>λ1>λ3,λ2即為關鍵屬性。所以在數據預處理階段,可以將屬性1和3的數據刪除,提高了孤立點挖掘的效率。

2.3 距離度量改進

圖3 對于圖3.1的挖掘結果圖

為了降低數據分布不均勻給孤立點挖掘結果帶來的影響,即把正常點誤認為孤立點,本文中采用了基于改進距離度量的方法來降低這種影響,挖掘結果如圖3所示。

3 結果分析

程序運行結果如圖4所示。

圖4 基于所有屬性的孤立點挖掘結果圖

通過圖4可以發現,在遼寧石化職業技術學院石油化工生產技術專業57人中挖掘出的8個孤立點,絕大多數是成績不穩定的學生,比如王文濤、楊恒等,成績下降的學生有彭海州、劉強等,成績上升的有呂澤華,這給教育管理者提供了很好的工作參考信息,能夠使教育者抓住班級的特例學生,特別是成績下降很快的學生,老師可以經常關注他們的學習,以使學生能夠在短時間內將成績提高上來。

另外,在算法改進的過程中,對于引進關鍵屬性的概念,可以將非關鍵屬性的數據不做計算,提高了算法的效率,節約了時間。如圖5、6所示。

圖5 基于λ2的孤立點挖掘結果圖

由圖4-6相比較來看,孤立點的挖掘結果基本相同,只是在順序上略有差別,但這點兒差別對于教育工作者來講并不會受到影響,所以在數據預處理階段,本文通過計算出的屬性隸

圖6 基于λ1和λ2的孤立點挖掘結果圖

屬度,確定出關鍵屬性,在之后的孤立點挖掘算法中只對關鍵屬性的數據進行挖掘,在挖掘結果中也保留了記錄的全部屬性,這樣就給出了孤立點孤立程度的量的表示。

與傳統的孤立點挖掘方法相比,本文采用的算法消除了對參數p和d的設置,用戶只需指定需要挖掘出的孤立點個數,即k值,就可以檢測出k個孤立點。在時間復雜度上,本文采用的算法為o(n2),稍優于基于索引o(kn2)的挖掘算法。

參考文獻

[1]楊永銘,王喆.孤立點挖掘算法研究[J].計算機與數字工程,2008,1(36):11-14.

[2]韋佳,彭宏,林毅申.基于改進距離的孤立點檢測方法[J].華南理工大學學報(自然科學版),2008,36(9):26-27.

[3]邵峰晶.數據挖掘原理與算法[M].北京:中國水利水電出版社,2003.

[4]劉同明.數據挖掘技術及其應用[M].北京:國防工業出版社,2001.

[5]C.Gerior.Software Data mining.DATAMATION,1996.

[6]任承業.校園信息系統中數據挖掘的研究與應用[J].2003.

[7]陶蘭,王寶迎,呂建軍.數據挖掘技術在高等學校決策支持中的應用[J].中國農業大學學報,2003(1):82-84.

作者簡介

牛永鑫(1969-),男,漢族,遼寧錦州人,副教授,碩士,主要從事計算機網絡,數據挖掘,計算機應用設計。endprint

摘 要 通過對經典的基于距離的孤立點挖掘算法的分析與研究,引入“關鍵屬性”,即減少了挖掘數據量,提高了孤立點挖掘的效率,并將該挖掘模型應用到教務管理系統學生成績歷史數據的挖掘中,從而實現了該系統的設計。

關鍵詞 教務管理系統;孤立點;數據挖掘

中圖分類號:TP311 文獻標識碼:A 文章編號:1671-7597(2014)08-0052-02

教務管理系統是一個面向學校教務管理人員,為其提供服務的綜合管理系統。教務人員通過本系統完成日常教務工作。從學生入學開始到畢業離校,其在學校內的所有和教務相關的數據都通過教務系統進行管理。目前,這些數據還未得到有效利用,只是一個待開發的“寶藏”。鑒于社會對高等學校發展的需求和目前高校數據管理現狀,利用這些數據理性地分析學校各方面工作的成效以及學生培養過程中的得失變得十分重要。

目前,教務管理系統中的數據挖掘大多利用關聯分析或分類分析,以發現一些大的模式。但關聯規則在發現大的規則的同時也會忽略那些不經常出現的情況,有時這些例外情況更應該引起教育決策者和管理者的注意。本文嘗試利用孤立點挖掘技術,對遼寧石化職業技術學院教務管理系統中積累的數據進行分析,發現那些值得注意的例外對象,為教學管理者和學生管理者提供有用的信息。

1 應用模型的建立

1.1 數據預處理

本文選取的是遼寧石化職業技術學院石油化工生產技術專業08級57名學生在入學后的三個學期的基礎必修課和專業必修課的考試分數作為實驗應用的數據集,在數據預處理階段,為了在下面的學生平均績點能夠參照公式計算,所以將考試分數小于60分的學生成績均修改為50分,因為在公式中如果不及格的分數除以10再減5則就是負數,但是學生的學分績點不可能為負。

1.2 孤立點定義

圖1 學生成績平均績點圖

本文中以學生成績績點分析為例,選取遼寧石化職業技術學院石油化工生產技術專業10級57人的第一、二、三學期的學生考試分數作為原始數據,三個學期的學分績點作為檢測屬性,屬于多變量的孤立點檢測問題。通過對數據的分析,利用孤立點挖掘算法可以檢測出學生的學習成績下降、上升幅度大的和成績不穩定的即為孤立點。經過數據預處理后的學生平均績點如圖1所示。

2 孤立點數據挖掘過程

2.1 系統結構

相對于傳統的基于距離的孤立點檢測算法,經過改進的挖掘算法同樣可以尋找出相似的孤立點,并給定了孤立點的程度,取消了設置參數p和d的要求;同時通過引入關鍵屬性,可以在數據預處理階段刪除數據集中非關鍵屬性的數據,從而提高了效率;第三通過改進距離度量,可以降低將正常點誤認為是孤立點的概率。在本文中,將改進后的數據挖掘算法應用在遼寧石化職業技術學院教務管理系統中,對學生成績的平均績點進行孤立點挖掘,以期挖掘出“例外的”但是有用的信息,提供給教育管理者做決策。數據挖掘的程序框圖如圖2所示。

2.2 確定關鍵屬性

對于圖1中的學生三個學期的成績平均績點,可以計算出相應的屬性隸屬度,分別為λ1=0.142253,λ1=0.288887,λ3=0.035729,可以看出λ2>λ1>λ3,λ2即為關鍵屬性。所以在數據預處理階段,可以將屬性1和3的數據刪除,提高了孤立點挖掘的效率。

2.3 距離度量改進

圖3 對于圖3.1的挖掘結果圖

為了降低數據分布不均勻給孤立點挖掘結果帶來的影響,即把正常點誤認為孤立點,本文中采用了基于改進距離度量的方法來降低這種影響,挖掘結果如圖3所示。

3 結果分析

程序運行結果如圖4所示。

圖4 基于所有屬性的孤立點挖掘結果圖

通過圖4可以發現,在遼寧石化職業技術學院石油化工生產技術專業57人中挖掘出的8個孤立點,絕大多數是成績不穩定的學生,比如王文濤、楊恒等,成績下降的學生有彭海州、劉強等,成績上升的有呂澤華,這給教育管理者提供了很好的工作參考信息,能夠使教育者抓住班級的特例學生,特別是成績下降很快的學生,老師可以經常關注他們的學習,以使學生能夠在短時間內將成績提高上來。

另外,在算法改進的過程中,對于引進關鍵屬性的概念,可以將非關鍵屬性的數據不做計算,提高了算法的效率,節約了時間。如圖5、6所示。

圖5 基于λ2的孤立點挖掘結果圖

由圖4-6相比較來看,孤立點的挖掘結果基本相同,只是在順序上略有差別,但這點兒差別對于教育工作者來講并不會受到影響,所以在數據預處理階段,本文通過計算出的屬性隸

圖6 基于λ1和λ2的孤立點挖掘結果圖

屬度,確定出關鍵屬性,在之后的孤立點挖掘算法中只對關鍵屬性的數據進行挖掘,在挖掘結果中也保留了記錄的全部屬性,這樣就給出了孤立點孤立程度的量的表示。

與傳統的孤立點挖掘方法相比,本文采用的算法消除了對參數p和d的設置,用戶只需指定需要挖掘出的孤立點個數,即k值,就可以檢測出k個孤立點。在時間復雜度上,本文采用的算法為o(n2),稍優于基于索引o(kn2)的挖掘算法。

參考文獻

[1]楊永銘,王喆.孤立點挖掘算法研究[J].計算機與數字工程,2008,1(36):11-14.

[2]韋佳,彭宏,林毅申.基于改進距離的孤立點檢測方法[J].華南理工大學學報(自然科學版),2008,36(9):26-27.

[3]邵峰晶.數據挖掘原理與算法[M].北京:中國水利水電出版社,2003.

[4]劉同明.數據挖掘技術及其應用[M].北京:國防工業出版社,2001.

[5]C.Gerior.Software Data mining.DATAMATION,1996.

[6]任承業.校園信息系統中數據挖掘的研究與應用[J].2003.

[7]陶蘭,王寶迎,呂建軍.數據挖掘技術在高等學校決策支持中的應用[J].中國農業大學學報,2003(1):82-84.

作者簡介

牛永鑫(1969-),男,漢族,遼寧錦州人,副教授,碩士,主要從事計算機網絡,數據挖掘,計算機應用設計。endprint

摘 要 通過對經典的基于距離的孤立點挖掘算法的分析與研究,引入“關鍵屬性”,即減少了挖掘數據量,提高了孤立點挖掘的效率,并將該挖掘模型應用到教務管理系統學生成績歷史數據的挖掘中,從而實現了該系統的設計。

關鍵詞 教務管理系統;孤立點;數據挖掘

中圖分類號:TP311 文獻標識碼:A 文章編號:1671-7597(2014)08-0052-02

教務管理系統是一個面向學校教務管理人員,為其提供服務的綜合管理系統。教務人員通過本系統完成日常教務工作。從學生入學開始到畢業離校,其在學校內的所有和教務相關的數據都通過教務系統進行管理。目前,這些數據還未得到有效利用,只是一個待開發的“寶藏”。鑒于社會對高等學校發展的需求和目前高校數據管理現狀,利用這些數據理性地分析學校各方面工作的成效以及學生培養過程中的得失變得十分重要。

目前,教務管理系統中的數據挖掘大多利用關聯分析或分類分析,以發現一些大的模式。但關聯規則在發現大的規則的同時也會忽略那些不經常出現的情況,有時這些例外情況更應該引起教育決策者和管理者的注意。本文嘗試利用孤立點挖掘技術,對遼寧石化職業技術學院教務管理系統中積累的數據進行分析,發現那些值得注意的例外對象,為教學管理者和學生管理者提供有用的信息。

1 應用模型的建立

1.1 數據預處理

本文選取的是遼寧石化職業技術學院石油化工生產技術專業08級57名學生在入學后的三個學期的基礎必修課和專業必修課的考試分數作為實驗應用的數據集,在數據預處理階段,為了在下面的學生平均績點能夠參照公式計算,所以將考試分數小于60分的學生成績均修改為50分,因為在公式中如果不及格的分數除以10再減5則就是負數,但是學生的學分績點不可能為負。

1.2 孤立點定義

圖1 學生成績平均績點圖

本文中以學生成績績點分析為例,選取遼寧石化職業技術學院石油化工生產技術專業10級57人的第一、二、三學期的學生考試分數作為原始數據,三個學期的學分績點作為檢測屬性,屬于多變量的孤立點檢測問題。通過對數據的分析,利用孤立點挖掘算法可以檢測出學生的學習成績下降、上升幅度大的和成績不穩定的即為孤立點。經過數據預處理后的學生平均績點如圖1所示。

2 孤立點數據挖掘過程

2.1 系統結構

相對于傳統的基于距離的孤立點檢測算法,經過改進的挖掘算法同樣可以尋找出相似的孤立點,并給定了孤立點的程度,取消了設置參數p和d的要求;同時通過引入關鍵屬性,可以在數據預處理階段刪除數據集中非關鍵屬性的數據,從而提高了效率;第三通過改進距離度量,可以降低將正常點誤認為是孤立點的概率。在本文中,將改進后的數據挖掘算法應用在遼寧石化職業技術學院教務管理系統中,對學生成績的平均績點進行孤立點挖掘,以期挖掘出“例外的”但是有用的信息,提供給教育管理者做決策。數據挖掘的程序框圖如圖2所示。

2.2 確定關鍵屬性

對于圖1中的學生三個學期的成績平均績點,可以計算出相應的屬性隸屬度,分別為λ1=0.142253,λ1=0.288887,λ3=0.035729,可以看出λ2>λ1>λ3,λ2即為關鍵屬性。所以在數據預處理階段,可以將屬性1和3的數據刪除,提高了孤立點挖掘的效率。

2.3 距離度量改進

圖3 對于圖3.1的挖掘結果圖

為了降低數據分布不均勻給孤立點挖掘結果帶來的影響,即把正常點誤認為孤立點,本文中采用了基于改進距離度量的方法來降低這種影響,挖掘結果如圖3所示。

3 結果分析

程序運行結果如圖4所示。

圖4 基于所有屬性的孤立點挖掘結果圖

通過圖4可以發現,在遼寧石化職業技術學院石油化工生產技術專業57人中挖掘出的8個孤立點,絕大多數是成績不穩定的學生,比如王文濤、楊恒等,成績下降的學生有彭海州、劉強等,成績上升的有呂澤華,這給教育管理者提供了很好的工作參考信息,能夠使教育者抓住班級的特例學生,特別是成績下降很快的學生,老師可以經常關注他們的學習,以使學生能夠在短時間內將成績提高上來。

另外,在算法改進的過程中,對于引進關鍵屬性的概念,可以將非關鍵屬性的數據不做計算,提高了算法的效率,節約了時間。如圖5、6所示。

圖5 基于λ2的孤立點挖掘結果圖

由圖4-6相比較來看,孤立點的挖掘結果基本相同,只是在順序上略有差別,但這點兒差別對于教育工作者來講并不會受到影響,所以在數據預處理階段,本文通過計算出的屬性隸

圖6 基于λ1和λ2的孤立點挖掘結果圖

屬度,確定出關鍵屬性,在之后的孤立點挖掘算法中只對關鍵屬性的數據進行挖掘,在挖掘結果中也保留了記錄的全部屬性,這樣就給出了孤立點孤立程度的量的表示。

與傳統的孤立點挖掘方法相比,本文采用的算法消除了對參數p和d的設置,用戶只需指定需要挖掘出的孤立點個數,即k值,就可以檢測出k個孤立點。在時間復雜度上,本文采用的算法為o(n2),稍優于基于索引o(kn2)的挖掘算法。

參考文獻

[1]楊永銘,王喆.孤立點挖掘算法研究[J].計算機與數字工程,2008,1(36):11-14.

[2]韋佳,彭宏,林毅申.基于改進距離的孤立點檢測方法[J].華南理工大學學報(自然科學版),2008,36(9):26-27.

[3]邵峰晶.數據挖掘原理與算法[M].北京:中國水利水電出版社,2003.

[4]劉同明.數據挖掘技術及其應用[M].北京:國防工業出版社,2001.

[5]C.Gerior.Software Data mining.DATAMATION,1996.

[6]任承業.校園信息系統中數據挖掘的研究與應用[J].2003.

[7]陶蘭,王寶迎,呂建軍.數據挖掘技術在高等學校決策支持中的應用[J].中國農業大學學報,2003(1):82-84.

作者簡介

牛永鑫(1969-),男,漢族,遼寧錦州人,副教授,碩士,主要從事計算機網絡,數據挖掘,計算機應用設計。endprint

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 国产精品污视频| 亚洲AⅤ综合在线欧美一区| 精品国产香蕉在线播出| 中文字幕在线视频免费| 国产va在线观看免费| 亚洲最黄视频| 暴力调教一区二区三区| 国产在线观看第二页| 丰满人妻中出白浆| 91精品人妻一区二区| 国产91在线免费视频| 国国产a国产片免费麻豆| 91探花国产综合在线精品| 成人午夜福利视频| 国产美女在线观看| 99热亚洲精品6码| 亚洲综合九九| 精品国产一区二区三区在线观看 | 久久免费视频6| 欧美色综合网站| 国产婬乱a一级毛片多女| 欧美无专区| 亚洲欧美日韩综合二区三区| 99免费视频观看| 国产91丝袜在线播放动漫 | 自拍偷拍欧美日韩| 欧美日韩精品一区二区视频| 尤物精品国产福利网站| 久久99国产精品成人欧美| 成·人免费午夜无码视频在线观看| 午夜啪啪网| 国产在线专区| 国产欧美日韩精品第二区| 毛片免费高清免费| www.亚洲国产| 中文字幕2区| 欧美日韩亚洲综合在线观看| 国产主播在线一区| 97se亚洲综合不卡| 青青青视频91在线 | 日韩午夜伦| av无码久久精品| www亚洲天堂| 国产永久免费视频m3u8| 国产精品林美惠子在线观看| 亚洲浓毛av| 国产免费高清无需播放器| 欧美精品不卡| 亚洲精品日产精品乱码不卡| 免费久久一级欧美特大黄| 欧美自慰一级看片免费| 国产又色又爽又黄| 黄色在线不卡| 草草影院国产第一页| 国产91蝌蚪窝| 国内黄色精品| 久久精品aⅴ无码中文字幕| 99免费在线观看视频| 国产精品成人AⅤ在线一二三四| 成人小视频在线观看免费| 在线看片中文字幕| 亚洲AV人人澡人人双人| 精品国产免费观看| 精品剧情v国产在线观看| 精品视频在线一区| 久久国产精品夜色| 尤物精品国产福利网站| a亚洲视频| 欧美第二区| 曰AV在线无码| 国产毛片基地| 午夜a视频| 日韩成人高清无码| 香蕉久人久人青草青草| 成年女人18毛片毛片免费| 在线精品亚洲一区二区古装| 亚洲日本韩在线观看| 亚洲成人在线免费观看| www.91中文字幕| 色综合中文字幕| 91在线免费公开视频| 国产在线视频欧美亚综合|