楊夏薇



摘? 要: 針對傳統人力資源決策技術對海量人力資源數據辨別能力不高,導致決策效果不佳,研究基于Hadoop大數據平臺的人力資源決策技術。該技術對海量的企業人力資源數據進行分布式處理,將神經網絡下的員工信息按照輸入層、隱含層、輸出層進行組別劃分;根據影響每一數據組數據變化的影響因素建立初選數據集合;通過計算人力資源的熵值離散度設立決策指標,以員工的姓名、部門、歷史業績、往期工作效率等要素作為選擇條件;采用決策樹分類算法構建決策樹,生成人力資源決策分析報表,以此實現人力資源決策技術。實驗結果表明:所研究的人力資源決策技術面對海量的人力資源數據,其辨識能力更強,決策結果的完整度達到了98.35%,比傳統決策技術高出了21.55%。由此可見,所研究的決策技術性能更優越、更能滿足企業當前的發展需求。
關鍵詞: 人力資源決策技術; Hadoop平臺; 數據挖掘; 分布式處理; 決策指標設立; 決策樹構建
中圖分類號: TN911?34; TP311? ? ? ? ? ? ? ? ? ? 文獻標識碼: A? ? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2020)03?0183?04
Research on human resource decision?making technology based on Hadoop platform
YANG Xiawei
(Zhixing College of Hubei University, Wuhan 430011, China)
Abstract: The traditional human resource decision?making technology has poor resolving ability on massive human resource data, resulting in unsatisfactory decision?making effect. Therefore, the human resource decision?making technology based on Hadoop platform is studied. As far as the technology is concerned, the massive enterprise human resource data is subject to distributed processing, and the employee information in the neural network is divided into groups according to the input layer, the hidden layer and the output layer. A primary data set is created according to the factors affecting the data change of each data group. The decision?making indicators are set up based on the calculation of entropy dispersion of human resources. The employees′ names, departments, historical performances and previous work efficiencies are taken as the selection conditions, and the decision tree classification algorithm is adopted to build the decision tree and generate the human resource decision analysis report, thus realizing the human resource decision?making technology. The experimental results show that the resolving ability of the studied human resource decision?making technology is more powerful in the processing of massive human resource data, and the integrity of decision?making results reaches 98.35%, which is 21.55% higher than the traditional decision?making technology. It can be seen that the decision?making performance of the technology is better and can further meet the current development needs of enterprises.
Keywords: human resource decision?making technology; Hadoop platform; data mining; distributed processing; decision?making index creation; decision tree establishment
0? 引? 言
人力資源管理是企事業單位中的主要組成部分,對企業的業務往來、前景發展起到重要的影響。為了順應當前的企業經濟結構的變化和發展趨勢,提高企業的工作效率和經濟效益,國家各行各業都將大數據技術應用到人力資源管理決策中,通過運用大數據平臺中的軟件系統、框架,實現更加全面化、系統化、效率化和現實化的決策技術,以此提高企事業單位的核心競爭力,滿足企業長遠發展的目標[1]。
Hadoop是一個分布式系統基礎構架,基于Hadoop大數據平臺,找出Hadoop與人力資源決策管理之間的聯系,提高對人力資源數據吞吐量,以此來訪問決策模塊中的各類人員信息,實現更加符合員工自身條件的決策。將所研究的決策技術運用到人員數量龐大、產業結構復雜、企業部門多的企業人力資源實際工作之中,實現對企業中海量人員的人力資源決策,并為其他方面的決策技術研究提供理論依據和研究思路,為國家的社會主義經濟建設提供技術支持[2]。
1? 基于Hadoop大數據平臺的人力資源決策技術
收集企業員工的基本信息,包括姓名、性別、年齡、居住地址、籍貫等,將這些信息設定表頭按部門進行分組,并將劃分好的數據按照部門上傳到Hadoop大數據平臺上,利用人力資源信息管理決策系統,基于員工的工作年限、受教育程度、專業技能水平等進行決策,該平臺的操作頁面[3]如圖1所示。
根據圖1可知,人力資源部門的管理人員登錄到上述頁面后,將所有數據進行整合,保證所有人員信息的完整性,然后將這些信息格式化統一,根據設置的決策指標建立一個決策樹,比較企業員工之間的工作水平及業務能力。
1.1? 分布式分類基礎數據軟件算法設計
當前大型企業中的員工數量較多,企業為增加經濟效益和工作效率,對員工的業務能力和發展方向非常重視,因此在面對龐大的企業員工數據時,為了保證決策的合理性和準確性,利用Hadoop大數據平臺將這些員工數據信息進行分布式處理。通過員工的受教育程度、實際工作經驗、以往工作效率和業績進行未來發展預測,從而有效地劃分出員工能力等級,以此明確每個部門中的員工對企業未來發展的貢獻值[4]。
在效益較好、發展較快、產業結構較為復雜的企事業單位中,每名員工都在不斷變化,可以說企業人力資源相關數據信息每日都在變更,這就令人力資源信息管理部門收集和分析數據的難度增加,傳統的數據平臺無法精準地對這樣龐大的信息進行準確查找和判斷。而Hadoop為海量的人員數據存儲和分析處理提供了新的解決方案,Hadoop基于一個開源框架,采用分布式的方法存儲和處理大規模數據集,憑借其高容錯性和可伸縮性的特點,利用名稱節點維護命名空間層次結構和文件系統元數據,將命名空間和元數據存儲在RAM中并定期刷新磁盤;數據節點在本地文件系統中存儲人員信息文件數據,并定期向名稱節點匯報數據存儲模塊的員工數據信息的變動情況。而分布式的數據處理方式需要利用循環神經網絡,對員工信息進行序列處理[5],該處理結構如圖2所示。
通過圖2可知,隱含層是該分布結構的核心,同時也是處理信息的地方。假設計入輸入層的數據為[n],隱含層的神經元數量為[m],輸出層的數據量為[r]。圖2中利用[Q]表示輸入層到隱含層的矩陣;[P]表示該網絡中隱含層在[t-1]時刻下輸出值在[t]時刻的權重矩陣;[O]則是隱含層到輸出層的權重矩陣[6]。設在第[t]時刻輸入到序列中的員工信息為[at],輸出的信息為[bt],隱含層為[ct],其劃分公式為:
式中:[λ]表示激活函數;[β]表示激活函數中所有相關參數的數據集。前[t-1]時間下積累的人員信息[ct]和當前的員工信息[at]共同決定了在[t]時間的員工業績工作水平等信息。忽略基本人員信息,只考慮員工考核信息進行傳遞,實現員工信息的分布式劃分[7]。
1.2? 設置決策指標
根據劃分好的員工數據設立一個可供決策的指標,該指標建立在企業人力資源戰略決策的目的和影響因素之上,對員工信息進行分析與確認,形成一個能支持人力資源基本戰略決策,并能進一步篩選指標的集合,為實現人力資源決策做好鋪墊。當前設立決策指標的方法有很多,包括綜合分析法、屬性類別分析法等,綜合分析比較整理選用這些方法中優秀的部分,結合具體實際,以曾經使用過的對企業發展戰略有影響的指標作為參考,重新設定新指標,此時的指標受到表1中的因素影響[8]。
通過表1可知,影響決策指標的因素包括內部自身影響和外部環境影響,因此建立一個人力資源決策指標初選集合[M=m1,m2,…,m20],并用熵值來表示指標的離散度,建立原始數據矩陣為[A=kij×n],[kij]表示第[i]個備選指標和第[j]個樣本數據(其中,[i]和[j]均為[m]個非零自然數)。此時的熵值離散度為:
式中:[s=1ln n],表示人力資源決策參考數據,[ei]表示第[i]個備選指標下的熵值。當[h]值越大時,說明該指標所能篩選的能力越大;當[h]值過小時則說明該指標設立不夠精準,此時的指標對于人員信息的區分能力較小,要重新進行設定[9]。
1.3? 構建決策樹實現決策算法
人力資源管理決策模塊中主要包括企業組織架構、員工信息以及人事事件管理三個子模塊,建立決策樹利用上述設置的決策指標對這三個子模塊進行數據提取,實現企業人力資源的決策。該決策技術[10]的操作過程如圖3所示。
企業組織架構中主要包含員工職務、職位、級別、地址以及工資等數據。該技術在Hadoop大數據平臺中的系統界面選擇相應的組織管理對象后,進行管理對象的信息維護,如員工姓名、開始日期、結束日期、備注、與其他部門的關系等,然后將這些資料保存,根據設定的決策指標進行自動匹配,生成一個決策人員所需要的組織架構樹形瀏覽表。根據需要決策的目標,選擇表頭的篩選按鈕,得到所需要決策的員工信息,同時,每一姓名下的人員入職時間、工作年限等信息通過數據透視表透視到與該表相關聯的子表之中。同理,對企業的財務信息、生產和銷售數據進行維護,保證企業信息和員工信息的同步[11]。該決策樹采用決策樹分類算法計算生成: