999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

學生綜合素質評估的層次貝葉斯網絡聚類方法

2011-12-26 08:59:24李蘭春王雙成
東北師大學報(自然科學版) 2011年3期
關鍵詞:素質方法學生

李蘭春,王雙成,王 輝

(1.上海立信會計學院外語學院,上海 201620;

2.上海立信會計學院數學與信息學院,上海 201620;

3.中央民族大學信息工程學院,北京 100081)

學生綜合素質評估的層次貝葉斯網絡聚類方法

李蘭春1,王雙成2,王 輝3

(1.上海立信會計學院外語學院,上海 201620;

2.上海立信會計學院數學與信息學院,上海 201620;

3.中央民族大學信息工程學院,北京 100081)

針對學生綜合素質評估特點和現有評估方法存在的問題,建立了學生綜合素質評估的層次樸素貝葉斯網絡聚類方法,這種方法不需要許多例子,甚至在沒有例子的情況下也能夠進行規則提煉和預測.實驗結果顯示,層次樸素貝葉斯網絡聚類方法具有良好的預測準確性,這將使基于層次樸素貝葉斯網絡聚類的學生綜合素質評估更加可靠.

學生綜合素質評估;指標體系;層次樸素貝葉斯網絡;聚類

0 引言

學生綜合素質評估[1-2]是檢驗學生全面發展水平的有效方法之一,同時也為加強學生思想教育和管理工作,以及制定培養學生全面發展策略提供依據.學生綜合素質評估是一個非常復雜的問題,其中有兩個關鍵的因素:一個是建立指標體系,指標體系是評估的基礎;另一個是運用數學或計算機智能方法對指標進行綜合處理,經過識別和判斷獲得評估等級.

目前的評估方法主要采用三級指標體系[3-5],在同級(二級或三級)指標之間相互獨立的假設下,通過二級和三級指標的層次線性加權求和,以及計算結果的區間范圍劃分來進行等級計算.而現實中的同級指標之間一般并不相互獨立,而且等級與二級和三級指標之間的關系往往也是非線性的.現有的評估方法只注重現在,而忽略過去(歷史),但過去對現在往往也有很大影響.使用二級和三級指標(屬性)對一級指標(類)進行等級識別和判斷是一個分類(或聚類)預測問題.基于分類(或聚類)的等級預測不需要線性關系的假設,可不受完全相互獨立性的約束,而且能夠有效利用歷史信息,因此在評價的可靠性方面具有優勢,并可開拓綜合評估的新思路.

分類技術是使用計算機對人類概念學習與應用能力的模擬,已成為機器學習、模式識別和數據采掘等領域研究的核心內容之一.現已發展了許多著名的分類器,如樸素(naive)貝葉斯分類器、TAN分類器、C4.5分類器、支持向量機和神經網絡等,它們各有特色,已在許多領域得到了廣泛的應用.但這些分類器都需要一定數量的例子用于學習(訓練),當具有不完整例子(類標簽很少、某些類標簽殘缺或根本沒有類標簽)時,由于分類器得不到很好的訓練(甚至一些參數無法估計),將導致分類預測結果不可靠,甚至無法進行分類預測.而由于各種原因,在學生綜合素質評估中這種不完整的例子集普遍存在,目前還缺乏對具有不完整例子情況的針對性研究.樸素貝葉斯網絡聚類適合于進行這類情況的識別和預測,這種聚類技術不僅在例子少或例子殘缺時能夠進行有效的學習和預測,甚至沒有例子也可歸納出分類規則.經典的樸素貝葉斯網絡聚類[6]是結合樸素貝葉斯網絡與EM(expectation-maximization)算法進行的聚類,其中的條件密度估計一般選擇高斯函數.由于EM算法是對分布參數的局部貪婪(greedy)尋優,因此對初始值敏感,易于陷入局部極值,參數迭代還可能收斂到并非似然函數極值的參數空間的邊界,從而產生欺騙收斂,這可能導致聚類結果出現極端情況(類值聚集在少數類).

本文針對學生綜合素質評估需求和經典樸素貝葉斯網絡聚類存在的問題,結合樸素貝葉斯網絡結構和Gibbs sampling[7]進行層次聚類,建立層次樸素貝葉斯網絡聚類(簡記為HNBC)方法,能夠有效避免使用EM算法所導致的局部最優問題,并且將HNBC方法用于學生綜合素質評估還具有魯棒性、靈活性和可擴展性等特點.為檢驗HNBC方法的可靠性,使用國際標準數據進行了預測準確率實驗與分析.

用C,X1,…,Xn表示類變量與屬性變量;c,x1,…,xn是具體的取值;D表示數據集;N是數據集中的記錄數量,其中前N*個記錄具有類標簽,后N-N*個記錄沒有類標簽.

1 HNBC結構和過程

HNBC是在聚類結構的基礎上,實現聚類方法的過程.層次聚類可以具有多個層次,依據學生綜合素質評估特點,本文只研究具有兩個層次的聚類問題.下面給出兩個層次的聚類結構和聚類過程.

1.1 HNBC結構

結構是聚類的基礎,根據結構來確定聯合概率的分解形式和參數布局.標準的樸素貝葉斯網絡聚類采用星形結構,HNBC的結構是星形結構的復合,因此,可將其分解為一些相互關聯的星形結構,也就是HNBC可分解成具有層次順序的一系列樸素貝葉斯聚類.兩個層次的HNBC結構如圖1所示.

圖1 兩層次HNBC結構

1.2 HNBC過程和特征

具有兩個層次的HNBC由兩個聚類階段構成:一個是下層子聚類;另一個是上層總聚類.首先進行下層子聚類,在下層子聚類預測結果的基礎上再進行上層總聚類,最終得到待預測變量的值.

(1)聚類過程

在HNBC的上下兩個層次中,下層子聚類是依據Xui1,…,XuIvi(i=1,…,t)通過聚類預測得到XuI的過程,其中Xui1,…,Xuivi是屬性,有對應的數據,Xui是類,需要進行聚類預測;上層總聚類是在下層子聚類預測結果的基礎上而進行的聚類,即根據X1,…,Xt通過聚類確定C的過程.X1,…,Xt都是離散指標,它們的數據是下層聚類的結果,上層聚類預測的結果便是所需要的最終結果.

(2)聚類特征

HNBC非常靈活.聚類結構中的葉子結點(如圖1中的Xui1,…,Xuivi)既可以是離散屬性,也可以是連續屬性.在局部的樸素貝葉斯聚類中,屬性結點可以是葉子結點,也可以是中間非葉子結點,當然如果是非葉子結點,需要先進行下層聚類,以確定這些非葉子結點對應變量的值.

(3)聚類的可擴展性

在圖1給出的兩層次HNBC模型中,Xuivi是樹的葉子結點,也可以對模型進行擴展,擴展后的Xuivi不再是葉子結點,而是中間結點.既可以進行完全擴展(所有葉子節點都擴展),也可以進行部分擴展(只擴展部分葉子結點),根據實際情況而定.也就是,一個非根結點,既可以表示一個變量,也能夠代表一個樸素貝葉斯聚類模型,還可以是HNBC模型.但擴展的層數不宜太多,多層次聚類可能會降低預測的可靠性,因為存在層次誤差累計效應.

2 HNBC方法

由于HNBC包含兩個層次的聚類,上層聚類(離散屬性聚類)所采用的方法可以看做是下層聚類(混合屬性聚類)的特殊情況,因此,只給出下層混合數據聚類方法.為表述的方便,屬性和類變量仍用X1,…,Xn,C表示,S表示星形結構.

確定類值的方法:

依據星形結構S所蘊含的變量之間條件獨立性,得到聯合概率的分解式為:

其中:p(c)是類先驗概率,p(xi|c,S)是條件概率(Xi是離散變量)或條件密度(Xi是連續變量).對給定的類數,隨機初始化C的值,并對C的值進行迭代修正,直到迭代趨于穩定.在每一次迭代中,按數據集中記錄的順序依次對類變量C的值進行修正,修正完所有記錄中的C值實現一次迭代.

設在第m個記錄C具有待修正值cm,Xi的值為xmi,^cm表示cm經過修正后的值,變量C的可能取值為c1,…,crc.用D(k-1)表示第k次迭代修正前的數據集,D(k-1)n表示第k次迭代修正中對cm修正后的數據集,D(k)表示第k次迭代修正后的數據集.

對于離散屬性Xi,只需采用最大似然方法估計(使用頻率估計概率)屬性條件概率即可.

對于連續屬性Xi,使用高斯函數估計屬性條件密度,即

3 學生綜合素質評估

基于HNBC方法進行學生綜合素質評估,首先需要建立指標體系,然后依據指標體系確定聚類結構,結合聚類結構和Gibbs sampling才可進行聚類.

3.1 指標體系

采用三級指標體系,當然模型同樣適合于多級指標體系,下面給出一個可用于學生綜合素質評估的指標體系.

(1)一級指標

學生綜合素質等級(C),共4個級別:A級(高)、B級(較高)、C級(一般)和D級(較低).

(2)二級指標

學生綜合素質所屬的二級指標是:知識結構(X1)、認知結構(X2)、人格形成(X3).它們都分三個等級,分別為:A級(好)、B級(中)和C級(差).

(3)三級指標

知識結構所屬的三級指標是:概念學習(X11)、規則掌握(X12)、問題解決(X13).

認知結構所屬的三級指標是:輸入能力(X21)、存儲能力(X22)、加工能力(X23)、內部動力(X24)、外部動力(X25)、大認知策略(X26)、中認知策略(X27)、小認知策略(X28).

人格形成所屬的三級指標是:責任心(X31)、自信心(X32)、獨立性(X33)、刻苦精神(X34)、忍耐力(X35)、經受挫折能力(X36)、融入社會能力(X37).

第三級指標既可以是離散指標,也可以是連續指標,根據實際情況而定,在三級指標的下面還可以擴展出四級指標,對多級指標的聚類預測方法與三級指標類似.

3.2 HNBC結構

根據上面的學生綜合素質評估指標體系可得到HNBC結構如圖2:

圖2 用于學生綜合素質評估的HNBC結構

基于聚類結構和歷史數據進行概率和密度估計,從而得到用于學生綜合素質評估的HNBC模型,輸入學生綜合素質的最新信息通過聚類運算便可獲得該學生的綜合素質等級.

3.3 HNBC預測可靠性實驗與分析

在UCI機器學習數據倉庫[8]中選擇10個分類數據集,只保留不足4%的類標簽,對去除類標簽的記錄分別進行分類和聚類預測,并將預測結果與真正的類標簽進行比較獲得預測準確率,情況如表1所示.其中NBCA,CPA和PI分別表示樸素貝葉斯網絡分類器的分類準確率(naive Bayesian network classing accuracy)、聚類預測準確率(clustering prediction accuracy)和提高百分率(percentage increase).

表1 預測準確率比較

根據表1中的數據可以計算出,NBCA的平均聚類預測準確率是64.91%,CPA的預測準確率是83.88%,平均提高幅度是29.22%.可見CPA方法更加準確,將其用于學生綜合素質評估,其評估結果的判斷也將更加可靠.

4 小結

本文根據學生發展的特點,建立了一種學生綜合素質評估的層次樸素貝葉斯網絡聚類模型,其中的三級指標可以是離散指標,也可以是連續指標.模型對例子數量沒有具體要求,甚至在沒有例子的情況下也能夠提煉出規則進行識別和判斷,尤其適合于大量學生的一次性綜合素質評估.這種模型在評估過程中還具有魯棒性、靈活性和可擴展性等特點,并且能夠廣泛用于其他領域的評估.

[1] 支敏,盧云輝.基于 AHP的大學生綜合素質評估[J].貴州民族學院學報:哲學社會科學版,2006,4:168-171.

[2] 胡習文.基于FNN的智能學生綜合素質評估模型研究[J].武漢理工大學學報:信息與管理工程版,2007,29(3):103-107.

[3] 黃僑,林陽子,任遠.基于關聯度的預應力混凝土梁橋綜合評估方法[J].武漢理工大學學報,2007,29(7):13-17.

[4] 辛楓冬,趙國杰.企業領導者隱性知識結構的模糊綜合評判[J].統計與決策,2010,26(2):174-176.

[5] 胡勇,吳少華,胡朝浪.信息系統風險灰色評估方法[J].計算機應用研究,2008,25(8):2477-2479.

[6] CHEESEMAN P,KELLY J,SELF M,et al.Autoclass:a Bayesian classification system[C]//LAIRD J,SAN MATEO.Proceedings of the 15th International Conference on Machine Learning,CA:Morgan Kaufmann,1988,54-64.

[7] GEMAN S,GEMAN D.Stochastic relaxation,gibbs distributions and the Bayesian restoration of images[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1984,6:721-742.

[8] MURPHY S L,AHA D W.UCI repository of machine learning databases[EB/OL].[2010-10-15].http://www.ics.uci.edu/~mlearn/MLRepository.Html.

The clustering method of hierarchical naive Bayesian network for student comprehensive quality assessment

LI Lan-chun1,WANG Shuang-cheng2,WANG Hui3
(1.School of Foreign Studies,Shanghai Lixin University of Commerce,Shanghai 201620,China;
2.School of Mathematics and Information,Shanghai Lixin University of Commerce,Shanghai 201620,China;
3.School of Information Engineering,The Central University for Nationalities,Beijing 100081,China)

The student comprehensive quality assessment is one effective way for testing student overall level of development.A hierarchical naive Bayesian network clustering method is developed for student comprehensive quality assessment based on the features of student comprehensive quality assessment and the problems in existing assessment methods.This method not need many examples.Even if no example,it can also extracte rules and do prediction.The experimental results show that the method has very good prediction accuracy so that it will be more reliable to assess student comprehensive quality.

student comprehensive quality assessment;assessment;hierarchical naive Bayesian network;clustering

TP 181

520·20

A

1000-1832(2011)03-0049-05

2010-12-05

國家自然科學基金資助項目(60675036);教育部人文社科基金資助項目(10YJA630154);上海市教委重點學科建設項

目(J51702);上海市教委科研創新重點項目(09zz202).

李蘭春(1959—),女,講師,主要從事教育評估理論與方法研究;王雙成(1958—),男,博士,教授,主要從事計算機智能技術與應用研究;王輝(1961—),男,教授,主要從事決策支持技術與應用研究.

陶 理)

猜你喜歡
素質方法學生
趕不走的學生
學生寫話
學生寫的話
素質是一場博弈
什么是重要的素質
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
聰明的學生等
素質開發完全圖冊
孩子(2009年1期)2009-01-22 08:34:30
主站蜘蛛池模板: 日本欧美一二三区色视频| 色偷偷综合网| 国产午夜福利在线小视频| 香蕉在线视频网站| 狂欢视频在线观看不卡| 欧美伊人色综合久久天天| 99在线国产| 亚洲色图在线观看| 国产成人无码Av在线播放无广告| 久久精品丝袜| 97视频精品全国在线观看| 91精品国产无线乱码在线 | 99热6这里只有精品| 自偷自拍三级全三级视频| 日韩免费视频播播| av在线手机播放| 在线观看无码av免费不卡网站| 无码丝袜人妻| 欧美精品高清| 国产剧情一区二区| 欧美在线导航| 一区二区日韩国产精久久| 91精品国产91久久久久久三级| 亚洲三级影院| 在线国产91| 毛片手机在线看| 国产视频你懂得| 国产人免费人成免费视频| 亚洲精品午夜无码电影网| 国产成人亚洲精品色欲AV| 国产成人av大片在线播放| 国产精品无码一二三视频| 日本欧美视频在线观看| 亚洲an第二区国产精品| 国产成人精品一区二区三区| 熟妇丰满人妻av无码区| 国产视频一区二区在线观看| 国内自拍久第一页| 国产在线小视频| 亚洲大尺码专区影院| 亚洲欧美一区二区三区麻豆| 亚洲九九视频| 欧美激情成人网| 国产免费福利网站| 亚洲人成人伊人成综合网无码| JIZZ亚洲国产| 91免费国产在线观看尤物| 噜噜噜久久| 91娇喘视频| 日本五区在线不卡精品| 国产精品第一区在线观看| 这里只有精品国产| 国产黑丝视频在线观看| 国产噜噜噜| 亚洲无码久久久久| 亚洲成人精品在线| 欧美yw精品日本国产精品| 午夜人性色福利无码视频在线观看| 18禁不卡免费网站| a亚洲天堂| 亚洲中文在线视频| 一级毛片中文字幕| 国产无码制服丝袜| 亚洲日韩精品欧美中文字幕| 思思99思思久久最新精品| 99久久精彩视频| 亚洲码在线中文在线观看| 亚洲精品久综合蜜| 99re视频在线| 国产制服丝袜91在线| 久久综合伊人 六十路| 欧美国产在线看| 久热中文字幕在线观看| 国产成人精品一区二区三区| 狼友视频一区二区三区| 国产精品人成在线播放| 亚洲电影天堂在线国语对白| 亚洲AV免费一区二区三区| 亚洲专区一区二区在线观看| 亚洲福利网址| 国产香蕉一区二区在线网站| 香蕉视频在线观看www|