中興通訊 辛麗華
31669部隊 成廣勛
武漢鐵盾民防工程有限公司 陳 嵐
中興通訊 屠 強 楊桂榮
本文針對退役軍人從業平臺分析的各種問題,提出一種基于大數據的從業分析平臺框架,解決了傳統退役軍人從業分析中的政策反饋不明、執行度未知、數據分析不夠深入、以及政策宣貫不夠暢通的問題。提供一個執行/反饋的雙向通道,縮短問題發現、解決的周期,提高了職能部門工作效率,也為國家政策法規制定提供參考。
序言:2018年7月31日,國務院新聞辦公室舉行新聞發布會中講到建國以后退役士兵總數為5700萬,并以每年幾十萬的速度在增長,退役軍人的數據的新一輪統計正在進行。
退役軍人事務部等軍地12個部門聯合印發《關于促進新時代退役軍人就業創業工作的意見》(以下簡稱《意見》)。《意見》指出,退役軍人是重要的人力資源,是建設中國特色社會主義的重要力量。促進退役軍人就業創業,對于更好實現退役軍人自身價值助推經濟社會發展、服務國防和軍隊建設都具有重要意義。《意見》給出全方位的退役軍人就業優撫政策,要求各機關、企事業單位、教育部門、社會團體互相配合共同努力,提升退役軍人就業情況。
在互聯網時代的現在,數據是一筆巨大的財富,退役軍人的海量信息無疑也潛藏著無窮的寶藏,讓數據說話,助力社會發展,是大勢所趨。數據,是時代的力量。
在國家支持方面政策支持到位,國家專門成立專門部門來指導退役軍人的就業安置,但是在統計方面相對落后,而且目前的統計分析速度慢,效率差,效果也不理想,在當前數據技術飛速發展的現在顯得落后
在應用上,統計數據僅用來做簡單分析,尚無一個綜合的平臺深度挖掘、綜合研究分析結果,更不用說長期的跟蹤調研。即便有些機構、個人、職能部門做了些研究工作,但是研究范圍窄,局限性大,而且存在重復勞動,彼此合作溝通不夠,形不成合力,造成了極大的資源浪費。
本平臺以大數據做基礎,以所有統計數據做出發點,支持各種離線計算、在線分析,針對個體的綜合數據做全量計算,從而能夠更直觀的觀察到政策實施效果、個人滿意度和政策法規的不足之處,為退役軍人從業政策作出反饋,繼而指導完善各種法規制度、全方位推動各種優理政策和活動,提高退役軍人新職涯的滿意度,提高退役軍人的生活水平和質量。
本平臺支持退役軍人對工作的持續跟蹤、反饋。跟蹤調研就業情況,接受工作情況反饋、生活情況反饋,收集各種就業、創業需求,綜合各種政策法規、利好信息作綜合計算,確實的貼合需求作反饋,制定真正具有實際意義的指導意見。持續跟蹤,持續關懷,使得退役軍人真正有組織,有歸屬,真正增加了軍隊的向心力和凝聚力。
本平臺還打通消息傳遞渠道,解決了消息閉塞、宣貫不及時的問題,提高了政策法規的實效性,極大了提高了職能部門的工作效率。
平臺登記退役軍人個人基礎信息,包括身體狀況、家庭信息、教育經歷、服役期間狀態、表現等,采集退役軍人退役后工作信息,包括薪資信息、技術需求、教育經歷需求,接受退役軍人的工作滿意度、契合度以及各種合理需求反饋,收集企事業單位單位的用人需求,地方各單位的扶持政策、規劃、以及各種優撫活動。形成一個健全的退役軍人信息數據倉庫。
平臺對采集數據作全量計算分析,通過聚合聚類等手段,深度挖掘數據,形成完整的工作狀態報告,政策落實信息,政策合理性、健全性分析等系列分析結果。
平臺支持實時的狀態分析,實時分析退役軍人的現有狀態,接受緊急需求,有問題及時發現及時解決,極大的提高了問題解決效率,充分的在緊要關頭站在退役軍人身后,保障退役軍人的生活狀態。
平臺還支持退役軍人關懷,及時傳達各級的優撫政策,及時推送各種優撫活動、建立起有效的宣傳、溝通平臺。
構建面向個各職能部門、退役軍人的大數據平臺,及時、快速、有效的收集復雜的海量數據。對采集數據進行清洗、加載,持久化保存,形成分布式數據倉庫,供大數據分布式計算分析使用。對預處理數據進行分布式計算、深度挖掘,多維度分析。同時,平臺不斷自學習,更新自己的知識庫和算法庫,對計算結果進行實時監測和各種離線分析,輸出各方面分析計算結果報告。關鍵信息采用加密技術,對數據進行加密脫敏存儲,提高數據的安全性。
平臺將系統權限逐級劃分給各級職能部門和個人,控制用戶的操作權限和數據權限,尊重用戶隱私。
平臺支持消息推送機制,及時發布、公告各級的最新政策法規、活動規劃等,打通消息傳達渠道,為消息實效性提供保證。
3.2.1 數據收集
退役軍人個人數據基礎信息由于涉密性較強,需要專人、專職登錄采集,并采錄入庫。現有的統計信息數據大部分為結構化數據,存儲于常規的關系型SQL數據庫如mysql、oracle等,可通過Sqoop導入。
退役后職業狀態由個人、單位、第三方機構等反饋,平臺提供反饋渠道,提供就業雙方雙通道反饋,更能客觀直接的暴露問題。
國家、地方的優撫政策、法規、活動由政府職能部門登記發表,渠道正規、專業性更強。發布的數據直接導入本平臺。
其他如syslog日志信息可通過Flume進行采集。
3.2.2 數據預處理
對采集數據進行:
(1)數據清洗,補充缺失值數據,消除數據噪點和離群點,統一數據格式,修正數據,提高數據的一致性、準確性和可用性
(2)數據集成,集成多種數據源,形成集成、統一的數據庫、數據立方體等。消除冗余數據,提高了數據質量。
(3)數據規約,在不影響分析結果準確性的情況下簡化表示數據集。采用維規約、數據規約、數據抽樣等手段提高大數據的價值密度,提高數據的存儲價值比例。
(4)數據轉換,數據規范化、離散化并概念分層,通過轉化實現數據統一,進一步提高了數據的一致性和可用性。
通過以上處理,實現數據的一致性、準確性、真實性、可行人性、可解釋性,提高了數據的價值。為后期計算分析打下堅實、可靠的基礎。
3.2.3 數據分布式計算及存儲
本平臺采用分布式云計算技術提高了計算效率。對樣本數據采用專門的算法進行計算,以獲得期許的結果。采用Spark作為主計算框架,Storm、Flink、Spark Streaming作為流計算支撐,提供全方面的離線數據和實時數據分析。同時提供交互式查詢,為各級用戶提供更契合的分析結果。分析結果可輸入至Hdfs或Es,通過各維度、全方位的分析,充分暴露問題短板,更客觀的呈現當前退役軍人的工作、生活狀態,為后續持續化發展、政策優化等提供參考。
3.2.4 分析結果展示
本平臺支持Web、APP等應用終端,支持在不同設備現實計算分析結果。系統根據行政級別、職能等作權限劃分,設置不同的操作權限和數據權限,根據不同的需求生成計算報告。
報告形式可定制化,適配不用用戶。
平臺提供實時分析結果監測,支持焦點、熱點、重點展示,可暴露緊、嚴重、特殊的情況,第一時間發現問題解決問題。
3.2.5 消息推送
平臺支持消息訂閱/推送,及時發布傳達各級政策法規,有效、可靠、正確的傳遞信息。目前。通過郵件、微信、QQ等常規社交軟件,以及APP消息PUSH功能,覆蓋使用習慣不同的用戶。打通行政區域的政策宣貫渠道,解決消息閉塞的痛點。
本平臺基于大數據計算,在復雜、海量的信息數據中解讀各種政策法規,落實現狀,實施效果,充分反饋,深度分析,全方位的計算分析填補大數據應用在此方面的空白。數據分析計算結果受眾覆蓋廣泛,可為國家政策制定、社會研究、職能部門活動策劃提供參考。