仲勇
摘要:本文針對大型企業,員工分布在各地,且人數眾多,在當前數據量爆發式增長的情況下,很有必要利用大數據技術建立員工標簽,快速、及時解決數據建模、挖掘和分析,有效建立人才庫,提升企業核心競爭力。文章分析了利用大數據技術建立員工標簽的必要性、標簽分類、構建步驟、應用范圍及構建注意事項。
[關鍵詞]大數據 員工標簽 模型
對于集團型企業,尤其是大型跨國公司,員工人數動輒幾十萬,精準發現企業人才,提升人力資源管理水平,利用大數據技術,從大量數據中快速挖掘人員價值,提升人力資源管理的效率和精確性很有研究價值。
1利用大數據技術建立企業員工標簽的必要性
隨著企業管理的不斷精細化和精確化,人才對企業的發展起到了關鍵作用,尤其是集團型企業,信息化基礎建設已趨于成熟,各種基礎信息的管理已比較完善。為了更好的挖掘和分析人才,有效且全面掌握人員信息的價值越來越重要,基于員工的屬性、行為和特征,借助數據挖掘模型和大數據技術等手段,找到與企業發展相適應的組織、制度、流程、支撐工具。通過整合各類數據,對員工建立起全方位的標簽信息,有效提升人力資源精細化管理水平,大型集團型企業建立自身的人力標簽體系也迫在眉睫。
信息化發展已從過去的IT時代邁向DT時代,數據量的爆發式增長,對數據的分析、管理、利用帶來了新的挑戰,對于大數據技術來說,在大量的數據中找到有意義的模式和規則,數據的獲得不再是一一個障礙,而是一個優勢,對于數據量早已逾越TB、增長率驚人、實時性要求高的情況下利用大數據技術對數據進行處理和挖掘也勢在必行。
2員工標簽體系建立目標
優化整合信息資源:將數據有效分類,并建立數據間的關聯關系,建設人力資源數據分類體系,為各級領導及相關工作人員提供信息獲取渠道。實現數據的統一采集、統一存儲、統一·處理,統一的數據展示、分析平臺和門戶,提高數據的及時性和準確性。
決策手段信息化與智能化。運用數據挖掘、大數據技術等實現數據整合和可視化。
構建標簽模型。利用信息技術,挖掘和分析各類信息資源,構建標簽模型。
3大數據技術在標簽建立過程中的應用
3.1數據采集技術
利用Sqoop進行數據采集和匯聚,Sqoop是一個用來將Hadoop和關系型數據庫中的數據相互轉移的工具,可以將一個關系型數據庫(例如:MySQL,Oracle,Postgres等)中的數據導進到Hadoop的HDFS中,也可以將HDFS的數據導進到關系型數據庫中。使用元數據模型來判斷數據類型并在數據從數據源轉移到Hadoop時確保類型安全的數據處理。Sqoop專為大數據批量傳輸設計,能夠分割數據集并創建Hadoop任務來處理每個區塊。
利用Flume收集日志信息,Flume是Cloudera提供的一個分布式、可靠、和高可用的海量日志采集、聚合和傳輸的日志收集系統,支持在日志系統中定制各類數據發送方,用于收集數據。
3.2數據清洗
數據清洗就是利用數理統計技術、數據挖掘技術或預先定義的數據清洗規則將臟數據轉化成滿足數據質量要求的數據。
3.3數據建模和挖掘
模型的定義:通過定義模型,可以充分利用目前成熟的機器學習框架,如R、Spark等機器學習模型計算能力。系統使用人員在配置好數據后,選擇合適的模型工具和模型算法,通過調用機器學習框架的能力,得到最終的建模結果;同時,在必要的情況下,需要比較不同工具和算法的結果,從而幫助系統人員獲得最優模型。
通過建設模型工具,應用機器學習中分類模型、回歸模型和聚類模型的計算,從而對人員數據進行更廣泛和深入的挖掘;通過建設數據工具,幫助用戶全面的掌握企業人員情況,從而制定更合適有效的人才管理規劃,并建立企業人才庫。
4員工標簽分類
通過對各類信息的梳理,如人員資歷,人員績效考核,人員能力等,形成對個人綜合分析評價的個人畫像,關鍵分類如下:
4.1員工資質標簽
資質是在既定的工作、任務、組織或文化中區分績效水平的個性特征的集合。資質決定一個人是否能勝任某項工作或很好的完成某項任務,如一級建造師、注冊咨詢師等。
4.2員工業績標簽
員工業績是對一段時間的工作成果表現的評價,通過建立員工業績標簽可以反映該員工在過去的工作成績,如優秀、良好等評價。
4.3員工能力標簽
員工標簽是一個或多個員工特征的集合,根據不同的員工屬性信息、行為特征等給企業員工打上不同的標簽,通過不同的標簽員工進行針對性的能力提升推薦和職業規劃設計,提升員工服務能力和提高人力資源的精確管理。同時員工的標簽體系可以為原有的粗放式管理向精確化管理方式轉變奠定基礎。如建立含有基礎素質、業務能力、業務質量、成本效益在內的四個維度的員工能力畫像模型,反映員工的實際工作勝任情況。
4.4員工滿意度標簽
員工滿意度是指員工個體作為職業人的滿意程度。根據行為科學理論,決定員工滿意度的因素既有公司政策與管理、督導、工資、同事關系、工作環境等所謂保健因素;又有上進心、責任感、工作本身、贊賞、成就感等激勵因素。這些因素在不同時期以不同的程度決定著企業內部不同層次職工的滿意程度。根據上述因素可構建如下的員工滿意程度指標體系:對工作條件的滿意度、對工作本身的滿意度、對工作回報的滿意度、對企業人際關系的滿意度等。
4.5員工潛力標簽
對于大型公司,人數較多的情況下,做員工發展潛力評價很有必要性,這也是高層了解基層的一一個渠道。基于員工的學歷、職級、工齡、年齡等情況制定了一套標簽模型,以便綜合反映一個人未來的發展潛力如何。
5標簽體系構建步驟
5.1目標分析
員工畫像構建的目的不盡相同,有的是實現精準營銷,增加產品銷量;有的是進行產品改進,提升員工體驗。明確員工畫像的目標是構建員工畫像的第一步,也是設計標簽體系的基礎。
目標分析一般可以分為業務目標分析和可用數據分析兩步。目標分析的結果有兩個:一個是畫像的目標,也就是畫像的效果評估標準;另一個是可用于畫像的數據。畫像的目標確立要建立在對數據深入分析的基礎上,脫離數據制定的畫像目標是沒有意義的。
5.2標簽體系構建
分析完已有數據和畫像目標之后,還不能直接進行畫像建模工作,在畫像建模開始之前需要先進行標體系的制定。
此外,需要明確的一點是:標簽體系不是一成不變的,隨著人力資源業務的發展,標簽體系也會發生變化。
5.3畫像構建
基于員工基礎數據,根據構建好的標簽體系,就可以進行畫像構建的工作了。員工標簽的刻畫是一個長期的工作,不可能一一步到位,需要不斷地擴充和優化。一次性構建中如果數據維度過多,可能會有目標不明確、需求相互沖突、構建效率低等問題,因此在構建過程中建議將范圍進行分解,每一階段只構建某一類標簽。
6標簽應用范圍
(1)實現企業員工信息的匯聚、清洗和梳理;
(2)為企業人才庫建立提供信息依據;
(3)為企業合理用工和員工提拔提供數據支持;
(4)規范企業用工管理、實現降本增效;
(5)分析員工價值,挖掘企業核心人才。
7標簽建立注意事項
(1)數據集成:通過數據整合平臺建立數據倉庫,裝載來源于各個系統的人力數據,包括歷史數據的一次性裝入,和日常發生數據的定時、不定時抽取;
(2)數據支撐:支撐服務層連接決策支持應用和各類數據資源,組織和整合各類數據、組件和服務,為上層應用的搭建和運行提供支撐服務;
(3)標簽體系和規范:在構建標簽模型前進行業務需求的梳理,明確要建立的標簽和數據規范;
(4)決策模型:是決策分析系統的重要分析基礎,為企業管理者提供輔助決策的科學管理工具;包括現有人員休假預測、人員退休預測等;
(5)整體規劃、分布建設:標簽體系的建設是長期,不斷完善的過程,隨著人力管理的不斷深入,需要持續完善和擴充員工標簽體系。