999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于大數(shù)據(jù)的高校學(xué)生畫像技術(shù)研究

2019-12-17 03:32:16連家劍廣西大學(xué)計(jì)算機(jī)與電子信息學(xué)院桂林理工大學(xué)南寧分校
數(shù)碼世界 2019年12期
關(guān)鍵詞:數(shù)據(jù)挖掘校園分析

連家劍 廣西大學(xué)計(jì)算機(jī)與電子信息學(xué)院/桂林理工大學(xué) 南寧分校

引言

隨著大數(shù)據(jù)、物聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)等新型信息技術(shù)的廣泛應(yīng)用,高校信息化已經(jīng)從“數(shù)字化”走到了“智慧化”。其中,大數(shù)據(jù)作為智慧校園建設(shè)的關(guān)鍵支撐技術(shù),對(duì)智慧校園建設(shè)具有無可替代的作用。通過大數(shù)據(jù)綜合分析,掌握校園里師生的行為規(guī)律和學(xué)校的整體運(yùn)行水平,對(duì)學(xué)校整體教學(xué)科研形勢(shì)和發(fā)展態(tài)勢(shì)整體研判、動(dòng)態(tài)監(jiān)測(cè),從被動(dòng)應(yīng)對(duì)到主動(dòng)服務(wù)轉(zhuǎn)型,實(shí)現(xiàn)源頭發(fā)現(xiàn)、智慧服務(wù)。

1 國(guó)內(nèi)外高校大數(shù)據(jù)應(yīng)用現(xiàn)狀

大數(shù)據(jù)、云計(jì)算、物聯(lián)網(wǎng)等技術(shù)近年來給教育行業(yè)帶來了巨大的沖擊。許多高校均開始利用校園大數(shù)據(jù)開發(fā)了諸多面向管理和師生服務(wù)的應(yīng)用,依賴數(shù)據(jù)挖掘方法支持教育領(lǐng)域的校園管理與決策以及對(duì)學(xué)生行為規(guī)律的分析。國(guó)外的多家在線教育機(jī)構(gòu),如edx、Coursera、Udacity 等,針對(duì)在線教育過程中很多學(xué)生高發(fā)的輟學(xué)情況,應(yīng)用數(shù)據(jù)挖掘方法對(duì)學(xué)生在線學(xué)習(xí)數(shù)據(jù)進(jìn)行深層次挖掘分析,發(fā)現(xiàn)引發(fā)學(xué)生輟學(xué)的內(nèi)在原因,并基于挖掘結(jié)果制定督促和引導(dǎo)策略,從而大大改善了在線教育的輟學(xué)問題。智能教學(xué)系統(tǒng)ITS(Intellectual Tutoring System)則基于學(xué)生與系統(tǒng)中的交互日志數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,獲取學(xué)生學(xué)習(xí)行為特征,建立個(gè)性化知識(shí)庫,分析學(xué)生知識(shí)掌握情況,自適應(yīng)地幫助學(xué)生建立培養(yǎng)知識(shí)體系。

在國(guó)內(nèi),隨著國(guó)家高度重視教育信息化的建設(shè),各大高校開始重視數(shù)據(jù)深度分析和應(yīng)用工作。比如華東師范大學(xué)利用預(yù)警系統(tǒng)跟蹤學(xué)生的餐飲消費(fèi)數(shù)據(jù),跟蹤分析學(xué)生是否有經(jīng)濟(jì)困難,是否需要幫助。北京郵電大學(xué)高校學(xué)生行為分析系統(tǒng)完成了校園異構(gòu)數(shù)據(jù)的分布式存儲(chǔ)和處理,實(shí)現(xiàn)了校園數(shù)據(jù)的深入挖掘和分析。中國(guó)科學(xué)技術(shù)大學(xué)利用學(xué)生在可控社交網(wǎng)絡(luò)實(shí)驗(yàn)室上的行為數(shù)據(jù)以及學(xué)生在校的行為數(shù)據(jù)(微博、郵箱、刷卡信息、借閱信息)進(jìn)行分析挖掘,以學(xué)生“體檢報(bào)告”的形式對(duì)行為進(jìn)行總結(jié),并在預(yù)警食堂突發(fā)事件和學(xué)生非正常離校方面取得了很大的進(jìn)展。

2 基于高校教育數(shù)據(jù)的用戶畫像應(yīng)用

用戶畫像是指抽象的標(biāo)簽化用戶模型。這個(gè)模型是依據(jù)對(duì)用戶基本信息、社會(huì)信息、偏好信息與行為信息概括而來的。在形成用戶畫像過程中,最核心的步驟是為用戶貼上合適的“標(biāo)簽”。這些給畫像貼上的標(biāo)簽是分析所采集到的用戶數(shù)據(jù)產(chǎn)生的,并且可以對(duì)這些數(shù)據(jù)信息進(jìn)行高度的概括。

用戶畫像所涉及的數(shù)據(jù)挖掘算法主要包括分類算法、聚類算法、關(guān)聯(lián)算法等,同時(shí)還引入概率統(tǒng)計(jì)、機(jī)器學(xué)習(xí)、人工智能等相關(guān)學(xué)科的技術(shù),使其更具綜合性和交叉性。傳統(tǒng)的數(shù)據(jù)挖掘算法在商業(yè)領(lǐng)域和科研領(lǐng)域都得到廣泛應(yīng)用,但在處理大規(guī)模數(shù)據(jù)方面,傳統(tǒng)算法不能在可接受的時(shí)間內(nèi)獲取較好的結(jié)果,甚至因儲(chǔ)存空間限制,挖掘算法無法正常運(yùn)行。鑒于傳統(tǒng)數(shù)據(jù)挖掘算法擴(kuò)展性、伸縮性和資源利用不足的缺陷,越來越多的學(xué)者開始研究并行化的數(shù)據(jù)挖掘算法。司雅楠等研究高校大數(shù)據(jù)分析挖掘系統(tǒng)的設(shè)計(jì)框架,并提出基于Map Reduce的Apriori最小支持度閾值算法應(yīng)用于學(xué)生成績(jī)的關(guān)聯(lián)分析;梁柱等通過分析高校校園大數(shù)據(jù)的特點(diǎn),對(duì)傳統(tǒng)的K-means聚類算法進(jìn)行改進(jìn)并在Spark平臺(tái)上進(jìn)行并行化,應(yīng)用于學(xué)生行為聚類,研究并開發(fā)基于Spark平臺(tái)的學(xué)生行為分析與預(yù)測(cè)系統(tǒng)。

從目前高校存在的學(xué)生畫像系統(tǒng)可以看出,現(xiàn)存的學(xué)生畫像系統(tǒng)分析的維度都比較少,分析的數(shù)據(jù)源廣度也不夠。同時(shí),對(duì)高校學(xué)生產(chǎn)生的多維度的數(shù)據(jù)缺乏協(xié)同性,沒有將學(xué)生的其他維度信息(基本信息、貧困程度、失聯(lián)預(yù)警等)綜合起來構(gòu)建用戶畫像。此外,傳統(tǒng)的數(shù)據(jù)挖掘算法無法滿足這些結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的處理要求,傳統(tǒng)數(shù)據(jù)挖掘技術(shù)面臨巨大的挑戰(zhàn),這也導(dǎo)致高校的大數(shù)據(jù)并沒有充分被利用,校園大數(shù)據(jù)有待新的數(shù)據(jù)處理工具進(jìn)行深層次的挖掘。

3 基于高校大數(shù)據(jù)的學(xué)生畫像系統(tǒng)設(shè)計(jì)方案

3.1 系統(tǒng)架構(gòu)

本文研究構(gòu)建一個(gè)基于高校大數(shù)據(jù)的學(xué)生畫像系統(tǒng),采用主流的Hadoop大數(shù)據(jù)框架,對(duì)數(shù)字化校園環(huán)境產(chǎn)生的大規(guī)模學(xué)生行為數(shù)據(jù)進(jìn)行采集、加工和分析,對(duì)異構(gòu)數(shù)據(jù)進(jìn)行分布式存儲(chǔ)和處理,通過數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)等技術(shù),構(gòu)建“學(xué)生畫像”標(biāo)簽庫,實(shí)現(xiàn)學(xué)生行為數(shù)據(jù)的智能分析與動(dòng)態(tài)預(yù)測(cè)機(jī)制。本文的高校學(xué)生畫像系統(tǒng)的總體架構(gòu)由四個(gè)層級(jí)組成,分別為異構(gòu)數(shù)據(jù)源層、數(shù)據(jù)存儲(chǔ)層、數(shù)據(jù)分析與處理層以及應(yīng)用服務(wù)層,如圖1所示。

圖1 基于高校大數(shù)據(jù)的學(xué)生畫像系統(tǒng)框架

主要內(nèi)容如下:

(1)整合高校基礎(chǔ)數(shù)據(jù)資源,實(shí)現(xiàn)數(shù)據(jù)的共享和轉(zhuǎn)化。目前高校積累了豐富的學(xué)生行為數(shù)據(jù),包括消費(fèi)數(shù)據(jù)、成績(jī)、教務(wù)考勤、圖書、網(wǎng)絡(luò)日志等多種數(shù)據(jù)。將學(xué)校各應(yīng)用系統(tǒng)的數(shù)據(jù)進(jìn)行集成和整合,使來源各異、種類不一的各類數(shù)據(jù)可以相互使用,打破系統(tǒng)間的信息孤島,實(shí)現(xiàn)數(shù)據(jù)的共享和應(yīng)用。

(2)構(gòu)建基于高校數(shù)據(jù)的“學(xué)生畫像”研究指標(biāo)。學(xué)生畫像工作的核心是給學(xué)生“打標(biāo)簽”,通過分析數(shù)據(jù)可用性以及評(píng)價(jià)學(xué)生在校行為的指標(biāo),構(gòu)建學(xué)生“畫像”標(biāo)簽庫,確定構(gòu)建的畫像的維度。

(3)研究基于Hadoop技術(shù)的數(shù)據(jù)存儲(chǔ)架構(gòu)。用于存儲(chǔ)高校學(xué)生行為結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),對(duì)接校內(nèi)各應(yīng)用系統(tǒng),為業(yè)務(wù)應(yīng)用程序提供數(shù)據(jù)服務(wù)接口。

(4)研究基于Spark架構(gòu)的大數(shù)據(jù)分析挖掘技術(shù)。針對(duì)學(xué)生畫像、預(yù)警問題,基于Spark大數(shù)據(jù)分析平臺(tái)對(duì)數(shù)據(jù)采集與存儲(chǔ)層提供的多種數(shù)據(jù),采用數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等相關(guān)技術(shù),對(duì)數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系、潛在價(jià)值等進(jìn)行挖掘,提供分布式計(jì)算服務(wù)。

(5)研究Web框架與前端可視化模塊。開發(fā)學(xué)生畫像數(shù)據(jù)展示系統(tǒng),采用豐富的可視化技術(shù),直觀呈現(xiàn)大數(shù)據(jù)分析效果,為學(xué)生、學(xué)院及管理部門提供學(xué)生消費(fèi)、學(xué)習(xí)等多方位的行為分析與預(yù)測(cè)功能。

3.2 解決的關(guān)鍵問題

(1)異構(gòu)數(shù)據(jù)源的數(shù)據(jù)采集

高校學(xué)生行為分析數(shù)據(jù)包括結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù),將現(xiàn)有分布的、異構(gòu)的高校信息系統(tǒng)中的數(shù)據(jù)進(jìn)行抓取、采集、清洗,最后加載到數(shù)據(jù)倉(cāng)庫或數(shù)據(jù)集市中,為數(shù)據(jù)挖掘與分析提供基礎(chǔ)。

(2)異構(gòu)數(shù)據(jù)的存儲(chǔ)

存儲(chǔ)高校學(xué)生行為數(shù)據(jù)中的結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),對(duì)于非結(jié)構(gòu)化數(shù)據(jù),重點(diǎn)研究基于HDFS的文件存儲(chǔ)方法;對(duì)于結(jié)構(gòu)化數(shù)據(jù),重點(diǎn)研究基于HBase的分布式存儲(chǔ)。

(3)學(xué)生畫像所涉及大數(shù)據(jù)分析與挖掘技術(shù)

通過研究基于MapReduce或Spark計(jì)算框架的數(shù)據(jù)挖掘與分析技術(shù),以統(tǒng)計(jì)分析、聚類、預(yù)測(cè)等數(shù)據(jù)挖掘方法為基礎(chǔ),進(jìn)行算法選型與應(yīng)用實(shí)驗(yàn),對(duì)海量行為數(shù)據(jù)進(jìn)行分析和挖掘。

4 結(jié)語

本文的研究可以為大多數(shù)高等院校提供一種相對(duì)可行的學(xué)生畫像系統(tǒng)構(gòu)建方案。項(xiàng)目依托典型的Hadoop架構(gòu)、數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)算法等技術(shù),最大化的挖掘智慧校園數(shù)據(jù)背后的價(jià)值。該平臺(tái)建成后能夠充分利用各部門的業(yè)務(wù)數(shù)據(jù),有效的展現(xiàn)業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)價(jià)值,為提升學(xué)生的日常行為分析、管理及發(fā)展指導(dǎo)建議提供可靠的依據(jù)。本課題構(gòu)建的高校學(xué)生畫像系統(tǒng)是具有開拓性的實(shí)踐探索,在高校中具有廣闊的應(yīng)用前景。

猜你喜歡
數(shù)據(jù)挖掘校園分析
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
隱蔽失效適航要求符合性驗(yàn)證分析
電力系統(tǒng)不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
校園的早晨
琴童(2017年3期)2017-04-05 14:49:04
春滿校園
電力系統(tǒng)及其自動(dòng)化發(fā)展趨勢(shì)分析
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
開心校園
爆笑校園
主站蜘蛛池模板: 日韩成人午夜| 五月天天天色| 又爽又大又黄a级毛片在线视频 | 日韩一区二区三免费高清| 无码AV动漫| 欧美精品xx| 理论片一区| 亚洲二三区| 无码丝袜人妻| 久久女人网| 国产免费福利网站| 91po国产在线精品免费观看| 亚洲欧美日韩成人高清在线一区| 国产精品9| 亚卅精品无码久久毛片乌克兰| 中文无码毛片又爽又刺激| 99激情网| 天天摸天天操免费播放小视频| 亚洲AV无码久久精品色欲| 日韩黄色在线| 久久久久免费精品国产| 亚洲国产一区在线观看| 国产麻豆精品手机在线观看| 在线观看91香蕉国产免费| 亚洲天堂日本| 国产第一页免费浮力影院| 91福利在线看| 精品无码国产一区二区三区AV| 国产成人久久777777| 日韩精品少妇无码受不了| 手机看片1024久久精品你懂的| 欧美日韩国产综合视频在线观看 | 亚洲高清免费在线观看| 97国产在线播放| 久久精品无码中文字幕| 日韩精品亚洲人旧成在线| 国产在线观看人成激情视频| 国产女人爽到高潮的免费视频| 免费毛片视频| 国产乱子伦一区二区=| AV在线天堂进入| 在线免费无码视频| 欧洲在线免费视频| 伊人国产无码高清视频| 91麻豆国产视频| 老司机午夜精品视频你懂的| 国产精品视频白浆免费视频| 久久国产香蕉| 欧美成人综合视频| 国产在线观看第二页| 77777亚洲午夜久久多人| 久久黄色一级视频| 国产区福利小视频在线观看尤物| 国产真实二区一区在线亚洲 | 天堂成人av| 免费又爽又刺激高潮网址| 亚洲日本中文综合在线| 91免费国产在线观看尤物| 久久青草热| 久久亚洲国产最新网站| 成人精品免费视频| 国产麻豆aⅴ精品无码| 伊人蕉久影院| 国产成人精品一区二区不卡| 亚洲欧美天堂网| 国产精品极品美女自在线| 在线免费亚洲无码视频| 99在线视频网站| 91人妻日韩人妻无码专区精品| 亚洲一区国色天香| 99re免费视频| 91精品最新国内在线播放| 久久国产亚洲偷自| 九色综合伊人久久富二代| 亚洲第一视频网站| 欧美中文字幕在线二区| 亚洲第一香蕉视频| 色视频国产| 国产第二十一页| 91福利一区二区三区| 亚洲欧美日韩另类在线一| 天堂av综合网|