999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

學生成績分析中數據倉庫與數據挖掘的應用分析

2017-10-16 21:45:03李川
中國新通信 2017年17期
關鍵詞:數據挖掘應用學生

李川

【摘要】 在屬于高等教育場所的大學之中,學生成績不僅僅是一個單一的評定標準,更需要反映出學生在接受教育過程中所出現的某方面的問題。并且大學學生的數量眾多,在每次的期末考試中成績數據的量十分巨大,如果沒有一個細致完善的數據系統作為支撐的話,學生的成績就會變得十分混亂,嚴重影響到了學校的教學秩序。在本文中,我們將詳細研究分析數據倉庫和數據挖掘這兩種技術在學生成績分析過程當中的應用,從多角度全方位的分析這兩種技術給學生成績分析帶來的便利。

【關鍵詞】 學生 成績分析 數據倉庫 數據挖掘 應用

引言:在現階段,隨著高校的數字化的校園建設進程加快,學校內部的數字化管理系統也在發展中日益完善。但是,這些數據在一些高校中往往只是以簡單的計算機內部存儲的形式進行存儲,這些存儲的數據往往只能向師生提供簡單的查詢服務,并不能對數據進行系統化分門別類的查詢和深入化的分析。而通過數據倉庫和數據挖掘技術的應用,能夠有效的解決大量數據存儲混亂,不能對學校的教學工作提出系統化的管理協助等問題。通過對這兩種技術的合理應用,能夠使數據合理的存儲和應用,并能夠全面提升高校的教育管理水平,為其提供實質化的幫助。

一、數據倉庫在學生成績分析中的應用概述

1.1數據倉庫的概述

數據倉庫是一種系統化、集成化、自動化的,并且能夠隨著時間的變化自動進行更新的面向主題的一種集合式的數據群。它可以用于各種經營管理的場合和機構,能夠對經營管理的組織提出數據上的決策幫助,在經營管理組織的決策階段,數據倉庫能夠起到很重要的參考作用。在高校學生成績分析的過程中,數據倉庫的合理應用也能夠具有很大的價值。在目前的高校管理信息系統當中,很大一部分數據將會作為數據倉庫建設的重要參考被納入數據倉庫之中。現階段在高校內部數據管理中,多是以各種方面的數據庫獨立存在的方式來進行綜合的數據管理,例如學生成績查詢系統、教務處管理系統、學工處管理系統等。這些獨立的數據庫管理系統往往無法相互關聯或關聯的程度較小,并且這些數據管理系統內部都包含著大量的數據信息,無法通過完全廢棄舊的數據管理系統的方式進行資源重組[1],同時由于學校各部門的職責也都不盡相同,因此各部門的數據管理系統的開發單也不是統一的,這就給數據的綜合性管理增加了許多的難度。因此高校的管理系統必須構建數據倉庫,提高對各類型數據的全面統一管理的能力,通過數據倉庫,能夠使管理系統中的數據相互關聯起來,保證了數據的整體性和相關性,為高校在教學和管理活動中的決策提供重要的參考。

1.2數據倉庫要滿足學生成績分析系統的需求

高校在數據倉庫建立之前,還需要做一步重要的前期準備工作,就是對學生成績分析系統的基本需求要有一個明確的了解。一般來說,學生成績分析系統所要做到的基本工作就是對學生成績的特點進行系統的分析,確定學生成績分析系統能夠根據學生的特點進行系統化的管理分析。同時還要做到工作的細化,通過建立數據倉庫可以對學生所在班級的教務管理工作進行優化,對院系的教務管理工作進行優化,還需要根據學生成績分析系統的數據[2],對學校整體的教學計劃進行調整,針對于整個學校的教學管理做一個系統的優化。這就需要數據倉庫的開發人員要充分了解學生成績分析系統的需求,明確通過針對性的設計能夠使整個系統實現哪些功能,并且要了解其中的數據能夠做出什么樣的預測,經過對學生成績分析系統的充分了解之后,才能根據需求進行針對性的設計,將數據倉庫的優勢完全發揮出來。例如,在數據倉庫的需求了解中,應該了解到數據倉庫的建立需要滿足所有學生的成績分析需求,并且在整體上要對班級、院系乃至于全校的某門共同課程進行系統化的分析,或是需要對不同的授課教師所教的某一門課程進行分析和對比,這些精細化的數據分析要求,對學生成績分析系統中信息的粒度要求十分高,在數據的粒度上需要達到最精細化的程度。數據倉庫的職責,不僅僅是對學生的成績進行一個收集,需要的是通過數據倉庫的利用對學生的成績進行系統化的分析,同時還需要從課程、授課教師、學生本身等各方面各角度進行分析,對整個成績的細節概況要有全面而充分的了解。

1.3數據倉庫的具體設計方案

數據倉庫的設計大體上可分為兩種基本方法,一種為“自頂向下”的方法,另一種為“自底向上”的方法[3]。這兩種基本方法各有著優缺點,在單獨使用的情況下效果不佳。而通過將兩種基本方法結合使用的情況下,可以收到很好的效果。在設計的過程中,可以適當地借鑒企業級別的數據倉庫進行設計,要對總體的設計框架有一個明確的構思。在這里,我們則需要引進一下數據集市的概念,數據集市是在數據倉庫系統當中重要的一部分,可以看做是數據倉庫的邏輯子集,而數據倉庫則是這些邏輯子集的集合,并且將這些邏輯子集系統化,一致化。我們在數據集市的設計中,也要以整體的設計理念作為指導,通過系統化的設計指導方向來進行設計。學生成績分析系統內部所包含的數據量是十分巨大的,這也是由于系統的職責和任務就是對教務工作的管理工作提供決策支持的特性所造成的。在學生成績分析系統當中里面的數據呈現多維化、多樣化、精細化、更新速度快的特點,因此數據倉庫的設計必須要謹慎有加,這樣才能夠保證在這種大量的數據中能夠做出準確的系統化的分析和判斷。數據倉庫的另一個設計重點則是對數據模式的設計,數據模式是數據倉庫中最為重要的部分,也是整個數據倉庫的核心部位。我們也可以將數據倉庫的建立模型看做一個具有單一化層面相互關聯的數據模型向多元化的多維數據模型的轉變。我們在數據倉庫的整體設計中可以將整體的設計理念分為三個層次,使用三層數據建模的方式來完成數據倉庫的整體設計過程。這三個層次分別為概念模型設計、邏輯模型設計和物理模型設計[4]。這三個層面的設計構成了整個數據倉庫的設計方向和設計理念。下面將對這三個層次的設計做詳細的闡述。

1.3.1概念模型的設計概述

概念模型是對整個數據倉庫進行一個整體而全面的分析和概括,是一個大綱性質的模型設計。在整個概念模型的設計中,主要涉及的大方向有兩個,第一個方向就是確定整個系統的主題域,這是在概念模型的設計當中首先要去做的一步,也是重要性極高的一步。第二個方向則是要確定邊界,這個邊界具體是指數據倉庫中的內容和界定系統的邊界。通過界定邊界的設計,可以使數據倉庫中的數據含量更加的精確,從而達到整個數據倉庫在設計初期的優化。endprint

在學生成績分析數據倉庫中,所包含的主題主要有學生成績主題、教師授課情況主題、課程信息主題等各種方面。在學生成績的主題方面,主要包含了學生的基本信息、成績登記信息、課程信息以及授課教師情況等;教師授課主題主要包括了教師的基本信息、課程進度、授課課時等基本情況;在課程信息主題中,主要包括了課程類型、課程規定課時、選修課程和必修課程分類以及課程安排明細等方面。這些主題所涉及的各個方面都是整個學生成績分析數據倉庫的主要依據。在這些詳細的主題域和主題邊界被確定之后,便可以對所要研究的主題進行詳細分析,概念模型的設計是整個學生成績分析數據倉庫的重要基礎,也是整個數據倉庫中必須要去做好的先決條件。

1.3.2邏輯模型的設計概述

在進入了邏輯模型設計的階段,主要的任務則是對在概念模型設計中建立的主題域進行系統詳細的分析。在這個系統設計階段,對所選取的主題要注重按照粒度層次進行系統化的劃分,在邏輯模型構建的方法中,我們可以使用星式模型進行構造。通過實踐表明,星式模型是實現邏輯模型構造的基本方法。在通過星式模型完成設計的過程中,我們還需要注意一下幾個方面的問題。1、粒度選擇的問題。在粒度的設計方面,高校學生成績分析數據倉庫內部所含的數據每年的總行數大概在10000行左右,因此我們可以采取單一的粒度設計模式進行粒度設計,使其充分數據倉庫的工作機理。2、對于數據表的合理規劃。在高校學生成績分析的數據倉庫中,在每個主題中所含的數據表內的數據含量并不是十分大,我們就不用通過數據分割處理的方式進行處理。在每個表中,所使用的信息相對來說都比較固定,因此我們可以根據這些變動不大固有的信息進行對數據表的規劃。

1.3.3物理模型的設計概述

在物理模型的設計中,所用的轉換方式是可以按照傳統的數據庫模式進行設計的,在物理模型的設計中,我們需注意的是數據標準的定義方式和數據倉庫中的維度信息。在物理模型的設計中,主要的設計方向應該是學生成績數據的存儲方式,對于表中數據含量特別大的部分,我們在物理模型的設計中可以采用分區存放的方式來進行。對于一些數據含量較小的維表來說,我們就可以把這些維表集中存放于某個數據表的空間之中,在物理模型的設計之中,也要充分考慮到數據的讀取速度,要在成本允許的情況下盡可能的利用高速的存儲設備進行數據的讀取。同時建立索引的方法也能夠在很大程度上提高數據的讀取速度,但索引會在數據的更新方面造成一些困擾,有可能導致數據的更新速度表面,出現系統數據延遲的狀況,影響數據的協助決策功能的發揮。因此,對于數據量不是非常巨大的情況下,盡量不要使用索引。

二、數據挖掘技術在學生成績分析系統中的應用概述

2.1數據挖掘技術的概述

數據挖掘技術就是從大量的數據之中自動發現并提取人們感興趣的信息,以幫助人們進行協助決策的目的。數據挖掘技術對于大量的數據篩選工作有著重要的幫助,能夠使人們在大量的、不規則的、不完整的數據中盡快的尋找到自己所需要的數據,極大的提高了工作效率[5],避免了時間的浪費。而數據挖掘技術在學生成績分析中也會有很大的幫助,通過數據挖掘,能夠使教務處的相關工作人員準確的找出學生成績間的內在聯系和反映出的狀況,避免了在龐大的數據群中花費大量時間去篩選,使得教學工作能夠更加科學有效的進行開展。

2.2數據標準化處理的概述

在各科成績之間 ,分數段的分布是有著明顯的差異的。例如在一些政治類的必修課中,如馬克思主義基本原理概論、毛澤東思想和中國特色社會主義理論體系概論等課程中,學生的分數波動幅度整體來說不大,而在一些數學類的課程中,學生之間的分數差距就會相對較大。因此,對于學生的成績數據做作線性的標準化處理就顯得十分必要,我們可以在0到1的集合范圍內對學生的成績進行統一的轉化,將學生的成績轉化為0到1之間的實數,最高分為1,最低分為0,然后其他分數按照線性規律轉化為不同的實數[6],這種標準化值的線性排列的方法可以使數據的查找更為精確,使得教務工作人員在進行數據分析時能夠準確的找出具有代表性的樣本數據,使數據在協助決策的過程中發揮更大的作用。

2.3數據的聚類分析

聚類分析也是數據挖掘技術當中非常重要的分析方法,是數據挖掘技術實施過程中必不可少的重要分析方法。聚類分析主要有兩種分析方法,一種是基于K一Means算法的聚類分析,另一種是基于Huffman樹的K一Means聚類分析[7],這兩種聚類分析方法是目前最為常用的兩種分析方法,下面將對這兩種聚類分析方法進行詳細的說明。

2.3.1基于K一Means算法的聚類分析

這種聚類分析的方法在應用范圍上來說較為廣泛,在使用中首先要選定聚類的類別數,把它記為K,然后采用迭代更新的聚類方法進行分析,最終得到K個聚類中心所表達的聚類結果,在每一次迭代的變化過程當中,數據都在向著目標的函數值進行靠近,如果在聚類結果中目標的函數取得了極小值,且聚類效果較好的話,那么便達成了終止條件。K一Means算法的基本工作機理是在算法以內,平方誤差和函數作為目標函數,在事先指定的K個劃分當中通過迭代優化的方式使得目標的函數值最小。這種算法在聚類分析中是一種重要的算法,并且十分簡單高效,能夠做到對數據進行迅速反映,得出的結果也相對較為準確。但是這種算法隨著數據的量和分類的不斷增多,這種算法的劣勢也逐漸的顯露出來,其中包括K值的估計不夠準確,初選的始聚類中心的問題等一系列問題,針對于這些問題的情況,基于Huffman樹的K一Means聚類算法也隨之產生,對聚類算法進行了進一步的優化。

2.3.2基于Huffman樹的K一Means聚類算法

這種算法相對于原先的K類均值算法來說做到了進一步的優化,首先這種算法利用了Huffman樹的理念,對初始中心點的選取做了進一步的優化,其次改進了K類均值聚類算法在全局方面計算相對失準的情況,一定程度上解決了這種均值算法的片面性的問題。下面將介紹關于基于Huffman樹的K一Means聚類算法的基本步驟。endprint

1、計算數據相異度的矩陣建立。我們要利用數據樣本,根據算法原理將數據樣本構成Huffman樹,并且根據所構造的樹進行全面的算法分析。在樹的構造過程中,我們要選取歐式距離中最小的兩個數據點進行新樹的子樹構造,并且需要根據這兩點的算術平均值來作為新樹當中節點的值進行計算,并且要對樹根節點的相異度矩陣進行重新計算。

2、確定節點。根據圖表所得的理論分析,通過樹的構造過程逆序找到K-1個節點[8],同時將節點去掉的話會得到 K個子樹,在子樹的根節點就是K個初始聚類中心點。

2.4聚類分析技術在學生成績分析中的具體應用

通過聚類分析技術,能夠對學生成績的影響因素進行具體細致的分析,并找出學生某學科成績所展現的整體特點,對決策的協助有著很大的幫助。聚類分析可以將學生的成績與各種因素相互關聯,并且在分析中尋找出對成績影響較大的因素進行具體分析,從而全面提高高校的教學質量。在聚類分析技術之中可以將學生的眾多成績進行歸類,通過歸類成為的簇的大小、形態和聚類中心值的情況,準確的將影響學生成績的潛在因素挖掘出來,并且根據這些分析對教學管理做出針對性的調整,從而提高高校的整體教學水平,充分發揮了學生成績分析系統數據挖掘技術的作用。

三、總結

數據倉庫和數據挖掘針對于大量的數據管理有著重要的作用,能夠充分發揮數據的協助決策的作用,為單位決策管理部門提供了重要的決策參考。數據倉庫和數據挖掘技術在學生成績分析系統中的作用也是十分顯著的。通過數據倉庫的建立和數據挖掘中聚類分析技術的應用,全面提高了學生成績分析系統的作用,對教學水平的提升和管理決策的實時調整有著顯著的效果。

參 考 文 獻

[1] 黃宇達,向前.學生成績分析OLAP數據倉庫的設計與實現[J].電腦知識與技術 , 2012 , 08 (13) :2944-2948

[2] 王婷婷,燕基于學生成績分析數據倉庫的設計[J].中國電子商務, 2013 (11) :159-159

[3]李嵐.基于數據倉庫的學生成績分析與研究[D].北京交通大學 , 2014

[4] 陳偉蓮.基于數據挖掘技術的某學院成績分析應用[J].華南理工大學 , 2012

[5] 王峰.基于數據倉庫的大學生成績分析與應用[J].計算機光盤軟件與應用, 2013 (5) :207-208

[6]劉春輝, 李芳. 數據挖掘技術在學生成績分析中的應用[J]. 黑龍江科技信息, 2012(18):219-220.

[7]劉斌, 陳依潼. 數據挖掘技術在學生成績分析中的應用[J]. 電腦編程技巧與維護, 2014(16):45-46.

[8] 賈延斌, 楊光. 數據倉庫在學生成績分析中的應用研究[J]. 陜西青年職業學院學報, 2017(1).endprint

猜你喜歡
數據挖掘應用學生
探討人工智能與數據挖掘發展趨勢
趕不走的學生
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
學生寫話
GM(1,1)白化微分優化方程預測模型建模過程應用分析
科技視界(2016年20期)2016-09-29 12:03:12
煤礦井下坑道鉆機人機工程學應用分析
科技視界(2016年20期)2016-09-29 11:47:01
氣體分離提純應用變壓吸附技術的分析
科技視界(2016年20期)2016-09-29 11:02:20
會計與統計的比較研究
學生寫的話
一種基于Hadoop的大數據挖掘云服務及應用
主站蜘蛛池模板: 网久久综合| 国产色婷婷视频在线观看| av午夜福利一片免费看| 国产一级裸网站| av在线5g无码天天| 人妻中文字幕无码久久一区| 热re99久久精品国99热| 波多野结衣爽到高潮漏水大喷| 人妻精品全国免费视频| 爽爽影院十八禁在线观看| 国产电话自拍伊人| 成年人视频一区二区| 91外围女在线观看| 超碰91免费人妻| 毛片视频网址| 国产精品极品美女自在线网站| 国产欧美精品专区一区二区| 无码精品一区二区久久久| 国产麻豆精品久久一二三| 二级特黄绝大片免费视频大片| 毛片久久久| 日本国产精品| 久久伊人操| 国内精品小视频在线| 激情乱人伦| 69av免费视频| 亚洲色图另类| 日韩精品无码不卡无码| 国产农村1级毛片| 欧美 国产 人人视频| 亚洲国产精品日韩av专区| 无码在线激情片| 精品伊人久久久久7777人| 国产精品亚洲日韩AⅤ在线观看| 色婷婷啪啪| 国产经典三级在线| 久久久久无码国产精品不卡| 日韩一二三区视频精品| 在线观看无码a∨| 日本午夜精品一本在线观看| 在线播放国产99re| 欧美自拍另类欧美综合图区| 国产精品久久久久鬼色| 九九热精品在线视频| 青青久视频| 国产午夜福利亚洲第一| 毛片卡一卡二| 91九色视频网| 国产日本欧美亚洲精品视| 一区二区三区国产精品视频| 91在线精品麻豆欧美在线| 亚洲精品少妇熟女| 少妇高潮惨叫久久久久久| 色婷婷电影网| 国产区网址| AV无码国产在线看岛国岛| 国产精品乱偷免费视频| 五月婷婷综合网| 干中文字幕| 久久国产免费观看| 亚洲福利片无码最新在线播放| 国产自在线播放| 国产亚洲精品97在线观看| 亚洲AV无码久久精品色欲| 亚洲最黄视频| 日韩无码视频网站| 亚洲欧美不卡| 婷婷丁香在线观看| av在线5g无码天天| 精品国产一二三区| 日韩美毛片| 尤物在线观看乱码| 手机在线看片不卡中文字幕| 精品欧美一区二区三区在线| 婷婷亚洲最大| 亚洲日韩高清在线亚洲专区| 成人中文字幕在线| www.99精品视频在线播放| 黄色一级视频欧美| 亚洲人成网站色7799在线播放| 国产成人啪视频一区二区三区| 97青青青国产在线播放|