[摘 要]本文針對(duì)在大類招生背景下北京科技大學(xué)經(jīng)濟(jì)管理學(xué)院2005級(jí)學(xué)生的考試成績(jī),應(yīng)用數(shù)據(jù)挖掘技術(shù)分析分專業(yè)前學(xué)生成績(jī)與專業(yè)及分專業(yè)后課程學(xué)習(xí)之間可能存在的潛在的聯(lián)系。首先進(jìn)行數(shù)據(jù)預(yù)處理以保證數(shù)據(jù)挖掘結(jié)果的質(zhì)量和提高數(shù)據(jù)挖掘的效率;然后根據(jù)分專業(yè)前的課程成績(jī)對(duì)學(xué)生進(jìn)行聚類,并分析各類的成績(jī)特征;最后以信息管理與信息系統(tǒng)專業(yè)為例,分析各類學(xué)生在分專業(yè)后的優(yōu)勢(shì)課程和較弱課程。
[關(guān)鍵詞]數(shù)據(jù)挖掘;聚類;學(xué)生成績(jī)分析
doi:10.3969/j.issn.1673-0194.2009.15.014
[中圖分類號(hào)]TP391[文獻(xiàn)標(biāo)識(shí)碼]A[文章編號(hào)]1673-0194(2009)15-0045-03
1 引 言
本科按學(xué)科大類招生已在部分高校實(shí)施,這些高校按一級(jí)或二級(jí)學(xué)科進(jìn)行招生,在經(jīng)過約兩年的統(tǒng)一基礎(chǔ)培養(yǎng)后,由學(xué)生結(jié)合就業(yè)、興趣等選擇具體專業(yè)方向,開始專業(yè)課程及實(shí)踐課程的學(xué)習(xí)直至畢業(yè)[1]。本文研究數(shù)據(jù)挖掘技術(shù)在大類招生背景下學(xué)生成績(jī)分析中的應(yīng)用,數(shù)據(jù)來源于北京科技大學(xué)經(jīng)濟(jì)管理學(xué)院2005級(jí)學(xué)生前5個(gè)學(xué)期的成績(jī),其中前4個(gè)學(xué)期為分專業(yè)前的成績(jī),第5個(gè)學(xué)期為分專業(yè)后的成績(jī)。通過觀察這些數(shù)據(jù)可以發(fā)現(xiàn)如下特點(diǎn):①成績(jī)分布在0~100之間,且各個(gè)分?jǐn)?shù)段的密度不同,其中成績(jī)?nèi)≈翟?0~90分之間的比例非常大;②分專業(yè)前的課程數(shù)量很多,且其中的某些課程與專業(yè)選擇相關(guān)性很小;③部分課程存在得分普遍較高或得分普遍較低的現(xiàn)象;④分專業(yè)前的課程主要包括:高等數(shù)學(xué)I、概率與數(shù)理統(tǒng)計(jì)、外語I、線性代數(shù)、計(jì)算機(jī)基礎(chǔ)、會(huì)計(jì)學(xué)、財(cái)政金融學(xué)、管理信息系統(tǒng)、馬克思主義哲學(xué)、軍事理論、體育I等46門課程;……