999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數據挖掘技術在招生工作中的應用研究

2016-05-26 21:07:44古亮劉培艷楊菲
考試周刊 2016年26期
關鍵詞:數據分析數據挖掘

古亮+劉培艷+楊菲

摘 要: 本文通過對高校招生現狀進行了總結分析,通過分析發現其中存在的問題,對數據挖掘技術進行了闡述,并將數據挖掘技術引進招生數據分析工作,旨在通過對招生數據的分析發現隱含的信息,據此優化招生工作。

關鍵詞: 數據挖掘 高校招生 數據分析

一、高校招生現狀分析

近年來,我國高校招生形勢發生了巨大的變化,造成這種狀況的原因很多,歸納起來有以下幾個方面。一是隨著國家教育政策的改革、高校擴招擴建及一些專科院校評估升級為本科院校等原因,導致高校本科招生總數逐年增加,但是生源數量有限,甚至呈逐年減少狀況,因此如何在保證生源質量的前提下完成招生任務,是當前招生工作者面臨的重要問題;二是國外教育機構逐漸增多,學生有更多的機會選擇出國留學,因此,高校的生源危機日漸嚴重,招生形勢日趨緊張。在這種情況下,高校如何通過創新的招生策略、準確的生源信息爭取足夠的、高質量的生源,是搞好招生工作的重中之重,也是關系到學校發展甚至生死存亡的關鍵。

除此之外,信息時代的到來,給高校的招生工作帶來了新的契機,各大高校分別用網站、微信平臺等進行宣傳,并研發了各自的招生信息管理系統,建立了招生信息數據庫,用來存儲并處理歷年的招生數據,這些處理只是簡單地對數據的歸納整理、存儲和讀取,并未進行深層的數據分析和信息提取,但是在這些數據中可能會隱含一些潛在的并且非常有價值的信息,這些信息將對今后的招生工作產生一定的指導作用,卻很少有人涉及。

二、數據挖掘技術

1.數據挖掘的概念

數據挖掘(data mining)是從大量的、不完全的、有噪聲的、模糊的、隨機的數據中提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程[1]。一般認為,廣義的數據挖掘又稱為數據庫中的知識發現(KDD),是指面對海量的數據,這些數據是冗余的、殘缺不齊的、有噪聲的、具有不確定性的數據集中,發現其中蘊含的那些是先未知的、可信賴的和有用的那些規律和知識的過程。狹義的數據挖掘僅僅是指從特定的數據集中提煉知識的過程。

2.數據挖掘應用

數據挖掘應用研究是指開發各種數據挖掘系統和工具,并在各個行業中應用[2]。目前的典型應用領域包括市場分析和預測、工業生產、金融、科學研究、Web數據挖掘、工程診斷等各個領域,如分析地殼的構造活動、網頁內容自動分類和聚類等。

數據挖掘技術的研究逐漸深入,其應用非常廣泛,凡是有具備數據分析潛質的數據庫都可以用相關數據挖掘工具進行有目的的數據分析。近年來,有一些高校招生開始運用數據挖掘技術分析本校的生源狀況,不斷調整本校的招生數、招生策略等,從而在現在的生源大戰中占得一席之地,但還未形成一套成熟的系統和方法。

三、數據挖掘技術在高校招生工作中的應用

1.數據庫的建立

在進行數據處理之前,首先應建立數據庫,規范標準的數據庫是數據分析處理的前提。在這里以每一位學生作為一條數據,我們將歷年的招生信息作如下處理:

(1)考生ID。這是標志每位學生的關鍵字,可以直接使用學生的考生號。

(2)考生姓名。用于核對、補全考生信息。

(3)考生性別。對于某些專業或者地區,性別可能會成為影響考生志愿的一個因素。

(4)考生籍貫。在這里,我們按照地理位置,以天津為中心,將天津作為A區向外輻射;北京、河北、山東、江蘇作為B區;東北三省及陜西、山西、內蒙古、河南、江蘇、安徽、湖北、上海、江西、浙江等省份作為C區,其余地區為D區。

(5)錄取專業。考生錄取的專業可能會和考生生源地及是否報到有關系;

(6)考生成績。我們以當地當前批次的提檔線為標準,每超過10分為一檔,將考生劃分為五擋,分別是:0-10分為E檔,11-20分為D檔,21-30分為C檔,31-40分為B檔,40分以上的考生均為A檔。

(7)是否報到。0為未報到考生,1為報到考生。

2.數據的預處理

因為數據是由手工錄入的,所以有些數據可能會出現一些錯誤,比如說值丟失、異常、冗余等,因此我們首先要對數據進行清理工作。比如ID只能是n位數字格式的字符串,成績則限定在學校最低錄取分數線和最高分之間,并且經過處理之后只能是字符“A”、“B”、“C”、“D”、“E”,籍貫同理,專業則對應成學校的專業代碼,是否報道同樣以0和1作為標志。對數據進行預處理后,數據庫中的數據則變成統一的、精確的數據,可以進行下一步分析和處理。

3.確定數據挖掘模型

我們采用貝葉斯算法進行數據挖掘處理。貝葉斯是一種分類統計方法,用于預測類成員關系的可能性,比如判斷某一樣本屬于某一特定類的概率,它分為樸素貝葉斯分類和貝葉斯網絡分類兩種[3]。目前,這種算法已經表現出非常高的準確率。本文采用的是樸素貝葉斯算法。貝葉斯分類是基于貝葉斯定理進行分類的,主要判斷給出的樣本屬于某一類的概率,假設X是類標號未知的數據樣本,H為某種假定,如數據樣本X屬于一個特定的類別C。分類問題就是決定P(HIX),即在獲得數據樣本X時假設成立的概率[4]。我們用2011-2013年天津師范大學的招生數據作為訓練集樣本進行訓練,預測某一條件的考生錄取我校某專業報道的概率,假如預測的結果為是,說明這類條件的考生更有可能報考并進入我校就讀,反之,則說明此類考生報考我校的可能性很小,或者即使錄取報道的可能性也很小,以此指導我校的招生計劃編制和招生錄取工作。

4.結果分析

經過數據的分析和處理,我們可以得出以下結論:

(1)就考生籍貫與報到率之間的關系而言,A地區的考生報到率最高,原因可能在于本地的院校對于吸收本地生源還是存在很大優勢的,因此我們在進行計劃編制的時候應該適當地向本地傾斜,并加大在本地區的宣傳力度,包括招生宣傳和日常的學生工作及大學生實習就業等;B區次之,包括山東、河北等地區的生源,這部分地區由于距離天津近,且考生數量多而當地院校數量有限,對周邊院校具有更高的傾向性,因此我們可以對這些地區加大宣傳力度,增加計劃數量等,以保證生源的穩定;而C類和D類地區的考生報到率就相對較低,可能的原因有距離遠,有些考生可能不愿意到距離很遠的院校就讀,一些氣候、生活習慣等原因也會成為影響這些考生報考志愿的原因之一。除此之外,地區的經濟結構也是影響考生志愿的一大因素,比如南方一些地區主要對于經濟貿易類的專業更感興趣一些,而我們主要專業集中在哲學、教育學等領域,對這類生源的吸引力相對小一些,因此生源一直不理想,報到率相對較低。

(2)就考生性別、專業與報到率之間的關系而言,某些專業對于性別的傾向性特別高,比如說學前教育專業,男生第一志愿的填報率本省就非常低,即便是被錄取了,此專業的男生報到率也非常低。因此,我們在招生志愿不滿需要進行調劑的時候,要根據這一結果制定相應的原則進行規避,盡量不對男考生調劑此專業,否則會造成指標的浪費,影響招生結果。除此之外,我們應與相應學院進行溝通,加強這類專業的宣傳,盡量調整此類專業的性別分配不均衡狀態。

(3)就考生成績與地區的相關性而言,B類地區的考生總體成績較高,集中在A,B檔,可能是由于這類地區計劃少,生源多,相對競爭較大,因此我們應該適當調整政策,向這類地區傾斜。

(4)就專業與報到率而言,學校存在某些專業報到率低而另一些專業的報到率高等現象。因此,我們一方面應該適當調整各專業的計劃數,另一方面應該與相關學院一起商討應對措施,提升專業影響力。

四、結語

隨著政策的變化和信息技術的發展,招生方式日漸多元化、規范化、公平化、合理化,而招生形勢日漸嚴峻,高校該如何在這種日趨緊張的形勢下脫穎而出,爭取足量的、優質的生源是高校生存和發展的關鍵所在,本文以天津師范大學近三年的招生數據為基礎,建立標準數據庫,并對數據進行分析處理,找出數據屬性之間的關系,并從中總結出相應的隱含信息,尋找對我校興趣最高或者左右可能報考我校的考生特征及優質考生的興趣點所在,并以此指導招生工作進行招生決策和招生策略的調整,科學地、合理地、高效地開展招生宣傳、計劃編制、招生錄取和專業調劑等工作,對于高校招生工作的有效開展及保證高校辦學質量有重要的實踐意義。

參考文獻:

[1]陳文文.數據挖掘在高校規模分析決策中的應用研究[D].沈陽理工大學碩士論文,2011-12-01.

[2]饒瑩心.數據挖掘技術在招生決策系統中的應用[D].華東理工大學碩士論文,2013-4-15.

[3]沈偉.基于數據挖掘技術的高職院校招生決策倉庫設計與實現[J].網絡安全技術與應用,2015,3.

[4]蔣瑩瑩.淺談數據挖掘技術在電大開放教育招生中的應用[J].現代教育,2011,9.

本論文受2014年天津師范大學教育科學研究基金項目資助(項目號:52WT1404)

本論文受天津廣播電視大學2013年度校級課題項目資助(項目號:13XY1032)

猜你喜歡
數據分析數據挖掘
探討人工智能與數據挖掘發展趨勢
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
我校如何利用體育大課間活動解決男生引體向上這個薄弱環節
體育時空(2016年8期)2016-10-25 18:02:39
Excel電子表格在財務日常工作中的應用
淺析大數據時代背景下的市場營銷策略
新常態下集團公司內部審計工作研究
中國市場(2016年36期)2016-10-19 04:31:23
淺析大數據時代對企業營銷模式的影響
基于讀者到館行為數據分析的高校圖書館服務優化建議
科技視界(2016年22期)2016-10-18 14:37:36
一種基于Hadoop的大數據挖掘云服務及應用
主站蜘蛛池模板: 中文字幕无码av专区久久| 一本大道AV人久久综合| 国产欧美视频一区二区三区| 一本大道香蕉中文日本不卡高清二区 | 日韩高清欧美| 国产精品丝袜在线| 国产成人AV综合久久| 好吊色国产欧美日韩免费观看| 99久久国产综合精品女同| 国产一二三区视频| 欧美日韩精品综合在线一区| 国产精品无码一二三视频| 国产黄色片在线看| 国产麻豆精品在线观看| 五月婷婷激情四射| 亚洲天堂精品在线| 欧美日韩第三页| 久996视频精品免费观看| 欧美日韩激情在线| 免费无码网站| 国产在线无码一区二区三区| 亚洲无码91视频| 日韩av高清无码一区二区三区| 国产成人综合亚洲网址| 91精品国产综合久久香蕉922| 国产精品太粉嫩高中在线观看| 五月天福利视频| 野花国产精品入口| 亚洲制服丝袜第一页| 国产AV无码专区亚洲A∨毛片| 国产视频大全| 亚洲国产日韩在线成人蜜芽| 国产精品综合久久久| 久久婷婷六月| 在线中文字幕网| 色AV色 综合网站| 久久国产精品影院| 在线观看亚洲天堂| 日韩精品毛片| 精品一区二区三区波多野结衣| 国产一区二区丝袜高跟鞋| 国产精品欧美日本韩免费一区二区三区不卡 | 欧美v在线| 久久久精品无码一区二区三区| 久久77777| 国产欧美视频在线观看| 成人免费黄色小视频| 91啦中文字幕| 国产免费黄| 日韩最新中文字幕| 欧美一级在线| 国产在线视频欧美亚综合| 日韩不卡免费视频| 日韩少妇激情一区二区| 日韩一二三区视频精品| 国产免费久久精品99re丫丫一| 国产视频入口| 五月激情婷婷综合| 在线观看无码av五月花| 青青久久91| 欧美黄网站免费观看| 国产成人综合网| 国产流白浆视频| 亚洲第一天堂无码专区| 欧美在线黄| 日本www色视频| 亚洲中文无码h在线观看| 精品视频免费在线| 日韩 欧美 国产 精品 综合| 久久婷婷国产综合尤物精品| 欧美笫一页| 尤物精品视频一区二区三区| 欧美特级AAAAAA视频免费观看| 最新加勒比隔壁人妻| 99激情网| 欧美午夜精品| 日韩精品无码不卡无码| 国产剧情无码视频在线观看| 亚洲国产日韩欧美在线| 亚洲综合片| 欧美国产日韩另类| 为你提供最新久久精品久久综合|