摘 要: 本文探討了一種基于分類和關聯規則挖掘的數據挖掘方法:利用相似性分析將教師分為若干類型,對每一類型應用關聯規則挖掘其中隱含的規則;并應用于高校人才引進、任用等管理工作中。
關鍵詞: 數據挖掘技術 高校人力資源管理 應用
1.引言
數據挖掘(Data Mining,DM)也稱為“從數據中挖掘知識”,就是從大量的數據中,找出隱藏其中的、有用的信息和知識的過程。“啤酒加尿布”的故事,是數據挖掘的一個典型應用。目前,高校都建立了完善的人事信息管理系統,并積累了大量數據[1]。對高校人力資源數據運用數據挖掘技術進行分析,抽取其中有用的信息,對高校教師的引進、任用等管理工作能起到一定的輔助作用[2]。
2.高校人力資源的數據模型
在高校人力資源挖掘中所使用的數據表的模式為:人力資源表(職工編號,職務,學歷,職稱,身份,政治面貌,性別,專業代號,考核成績,畢業學校,出生年代,本校兼職,學歷培訓,來源類別,來校年齡,工作年齡,業務培訓,科研論文,科研立項)。
由于人力資源中的屬性大多具有有限個不同值,為了便于對被評測教師進行分類,我們對部分相應指標進行編碼如下:
·職工編號:教師的主碼,不參加分類和規則挖掘。
·職務:無(0)、副科(1)、正科(2)、副處(3)、正處(4)、副廳(5)、正廳(6)。
·學歷:初中(0)、高中(1)、中技/中專(2)、大專(3)、學士(4)、雙學位(5)、碩士(6)、博士(7)、博士后(8)。
·職稱:無(0)、初級(1)、中級(2)、副高(3)、正高(4)。
·身份:行政(1)、工勤及其他(2)、教輔(3)、教師(4)、科研(5)。
·政治面貌:群眾(1)、共青團員(2)、共產黨員(3)、民主黨派(4)。
·性別:女(0)、男(1)。
·專業代號:哲學/社會學政治法律(1)、經濟管理(2)、文化教育(3)、自然科學(4)、農業科學(5)、醫藥衛生(6)、工程技術(8)。
·考核成績:95—100分(5)、85—94分(4)、75—84分(3)、60—74分(2)、<60分(0)。
·畢業學校:重點院校(5)、一般院校(4)、進修(3)、專科(2)、中技/高中(1)、初中(0)、留學(6)。
·出生年代:兩位整數,如60,指1960年—1969年出生的人。
·本校兼職:兼職教師(1)、本校教師(0)。
·學歷培訓:有(1)、無(0)。
·專長:有(1)、無(0)。
·學科:重點(1)、一般(0)
·來源類別:畢業分配(1)、調入(2)、博士后出站(3)、回國人員(4)。
·來校年齡、工作年齡、業務培訓、科研論文、科研立項:為數量指標。
3.高校人力資源數據挖掘中使用的算法
(1)教師群體分類方法
在人力資源表中設置了很多屬性,用于體現教師的各方面特征指標,便于對教師從各方面進行分類。常用的分類法是:基于相似度的計算。
設兩個教師;人力資源表中特征指標個數為m;Y≤i≤m)表示第i個特征指i個指標T
4)根據分類對象的實際情況和分類要求確定分類強度p和各指標從而可以計算教師兩兩之間的整體相似度,在強度p下把教師群體分為若干類[3]。
(2)關聯規則挖掘
關聯規則從本質上講是條件概率:A發生時,B同時也出現的概率是多大[2]。記為A=>B,其中,A?奐Y,B