郜攀峰



摘? 要: 在高校畢業就業情況分析的過程中,由于數據量過于龐大,原有分析方法的分析結果精度較差。因而,文中提出基于大數據分析技術的高校畢業就業分析方法。采用大數據網絡設定數據獲取渠道完成數據采集工作,統一數據樣本格式,制定數據處理流程,獲得處理后的數據樣本。采用大數據分析技術中的關聯性分析方法,完成對高校畢業就業情況的分析工作。至此,基于大數據分析技術的高校畢業就業狀況分析方法設計完成。設計調查問卷,選擇數據處理設備,得到問卷調查結果,通過原有方法與此方法獲得問卷分析結果。與原有分析方法相比,所設計方法分析精度更高。綜上所述,此方法更適用于就業分析工作。
關鍵詞: 高校畢業; 就業分析; 大數據分析; 數據采集; 關聯性分析; 云計算
中圖分類號: TN919?34; TP391? ? ? ? ? ? ? ? ? ? 文獻標識碼: A? ? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2020)18?0047?03
Abstract: As the amount of data is vast in the process of analyzing the employment situation of college graduates, resulting in the poor accuracy of analysis results in the original analysis methods, a method of the college graduates employment analysis based on big data analysis technology is proposed. The big data network is used to set the data acquisition channel, so as to accomplish data acquisition, unify data sample format, lay down data processing process, and obtain the processed data sample. The correlation analysis method in the big data analysis technology is adopted to complete the analysis of employment situation of college graduates. So far, the design of college graduates employment analysis method based on the big data analysis technology is completed. The questionnaire was designed and data processing equipment was selected to obtain the questionnaire results. The questionnaire analysis results are obtained by means of the original method and this method. This method has higher analysis accuracy in comparison with the original analysis method. To sum up, the designed method is more suitable for the employment analysis.
Keywords: college graduates; employment analysis; big data analysis; data collection; correlation analysis; cloud computing
0? 引? 言
分析高校畢業生就業狀況,對于我國經濟發展與就業市場的宏觀調控至關重要。以高校就業情況為基礎制定未來就業調控是維持我國就業市場規范化的重要手段[1?3]。
就目前畢業生數目龐大的現狀,大數據分析最為適合分析畢業生就業情況。通過采用常用的軟件對畢業生就業信息進行捕捉、管理以及處理,以此分析出畢業生的就業狀況、就業方向以及決定就業的因素。在分析的過程中,采用大規模并行處理技術、數據挖掘方法、分布式文件管理、綜合性數據庫、云計算等技術,提高大數據分析的速度與質量,由此保證畢業生就業狀況分析的精度與準確度[4?6]。
1? 大數據分析技術的高校畢業就業狀況分析方法
就高校畢業就業狀況而言,每年高校畢業生數目龐大。采用普通的數據采集與處理手段無法對龐大的數據群進行精確分析。因而,采用大數據技術中的關聯性以及大數據網絡完成數據收集處理過程,并根據處理結果,完成對高校畢業就業的分析工作。就業狀況分析流程如圖1所示。
采用上述流程完成就業情況分析方法的設計工作,在設計中注重數據采集的完整度以及數據整合的規范性,以此為數據分析提供基礎。
1.1? 高校畢業就業狀況數據采集
在此利用數據網絡采集到的數據與各院校之間的公開數據庫或大數據平臺進行數據交換,豐富數據網絡的數據內容。構建大數據網絡中的信息挖掘數據庫,對數據庫內的信息處理整合。形成相應的數據樣本,并對其進行輸出匯總。大部分的就業信息通過專線完成數據的獲取與交換。在此過程中,需運用眾多渠道,其中包括政府公共數據發布、高等院校數據公開[7]、學信網數據統計畢業生就業協議數量及報道地點信息。部分信息獲取渠道列舉如圖2所示。
科學應用上述渠道完成信息獲取,通過采用其他方式采集來自其他系統的海量畢業生信息,設定相同的表名,保存至數據庫中,結合由專線獲取到的基礎就業信息,作為高校畢業就業狀況基礎數據。
1.2? 就業狀況數據統計與處理
在此次數據處理的過程中,以數據庫中的數據項為基礎。由于就業狀況的數據項較為復雜,采用數據項的基本項,描述畢業生就業的情況與方向。在數據項設計中需包含大量的畢業生個人信息,為保證處理后的信息符合此次設計,就數據項所含內容進行設定。具體內容如表1所示。
采用上述數據項設定后,對數據庫內信息進行處理整合。通過數據清洗[8?9]、數據集成、數據變換[10]以及數據規約完成數據預處理。在預處理過程中,著重注意數據變換工作,將數據庫中的多個數據源整合為一個數據形式,應用數據規范化處理,對數據庫內的無效、錯誤數據清除,保證數據樣本的有效性。
1.3? 實現就業狀況分析
通過上述的信息數據的預處理結果,采用大數據分析技術實現大學畢業就業狀況分析。分析過程除大數據分析技術外,還需相應的設備實現分析工作,通過服務器獲取數據庫內部信息。在分析設備內安裝多核處理器[11?13],實現數據的高度運轉分析。采用此設備完成獲取數據庫信息及大數據中的關聯性分析,并完成就業情況研究。應用關聯性分析中的因子[14]分析方式研究其情況,將數據庫中相關性高的數據構成一個基本分析結構,即公共分析因子。使用此因子可以得到數據關聯的線性組合,即:
對式(2)進行轉化,可知在就業情況分析的過程中分析因子與信息量之間的關系。
式中:[C]為變量矩陣;[χ]為特殊分析因子[15]。采用上述公式,完成對高效畢業就業狀況信息的分析工作。至此,基于大數據分析技術的高校畢業就業狀況分析方法完成。
2? 實例論證分析
2.1? 實驗準備過程
在此次的實例分析中,采用問卷調查的形式完成分析方法研究過程。調查問卷的設計除常用的信息外,增加就業方面的相關問題,以此作為評定2種分析方法區別的重要樣本數據之一。調查問卷采用紙質問卷與電子問卷相結合的方式。將問卷發放1 000份,并積極回收。將回收到的數據進行處理分析得出相應的結果。為有效控制實驗過程,設定使用的設備與軟件。具體參數如表2所示。
采用上述問卷以及數據處理設備完成對原有方法與本文設計方法之間的對比分析結果研究,將結果通過表格描述。
2.2? 實驗結果分析
根據上述內容,完成此次實例分析。將處理后的數據通過表格顯示,具體內容如表3所示。
將問卷數據整理結果作為實驗樣本,采用原有方法與本文方法對其分析,得出相應分析結果如表4所示。
在此次問卷設計中,共發放問卷1 000份,回收問卷950份,有效問卷950份。其中,男性為450人,女性為500人,年齡大部分為25~45歲之間,問卷的受訪人群多來自東南沿海城市。采用原有方法與本文方法對數據進行分析得出每一個問題的分析精度。從結果可以看出,使用本文方法對數據的分析結果精度均高于原有方法。在分析過程中,本文方法的數據處理過程可以有效剔除無用的信息,提高分析能力,保證分析結果的精度。綜上所述,本文設計方法在分析效果以及使用性能上都優于原有方法,應對其普及推廣。
3? 結? 語
采用大數據分析技術對高校畢業就業情況加以分析,可有效提升使用者的用戶體驗以及分析方法的分析能力。在原有分析方法的基礎上,增加數據采集的來源與預處理的方式,提升海量數據的分析處理速度。此次方法設計的重點在于數據的分析,應用大數據技術中的分析控制理論完成此工作。通過實例分析可知,本文設計方法優于原有方法。因而,將其推廣應用可提升對就業情況的研究與發展。
參考文獻
[1] 李端超,王松,黃太貴,等.基于大數據平臺的電網線損與竊電預警分析關鍵技術[J].電力系統保護與控制,2018,46(5):143?151.
[2] 楊彬.大數據分析技術的研究[J].電子測試,2017(21):123?124.
[3] 杜若,謝川,吳群艷.電力環保大數據平臺開發及智能運用[J].電力大數據,2017,20(8):64?67.
[4] 門威,丹國萍.智慧校園環境下的學生軌跡數據分析技術[J].漯河職業技術學院學報,2017,16(5):7?9.
[5] 趙丹.基于大數據分析的運動損傷估計模型設計[J].現代電子技術,2017,40(17):101?104.
[6] 葉潤國,吳迪,韓曉露.地理信息大數據安全保障模型和標準體系[J].科學技術與工程,2017,17(36):105?111.
[7] 聶瑞華,王欣明,李卓越.從概念走向實踐:基礎教育大數據的框架與實現研究[J].中國電化教育,2017(3):70?75.
[8] 季惠斌.大數據時代思想政治教育思維方式的轉變[J].東北師大學報(哲學社會科學版),2017(1):150?155.
[9] 蔡雄飛,王濟,梅再美,等.環境科學碩士研究生就業分析及培養模式探討:以貴州師范大學環境科學專業為例[J].廣東化工,2018,45(5):257?259.
[10] 王瑩瑩.勞動力空間集聚的就業效應:基于中國城市面板數據的經驗分析[J].云南財經大學學報,2018,34(2):36?47.
[11] 張帆,向首艷,陳敏,等.醫科大學營養學專業本科生就業情況分析[J].中華醫學教育探索雜志,2018,17(6):645?648.
[12] 胡明月,張岳,陳東明.護理科學學位和專業學位碩士研究生同向性就業現狀分析[J].護理學雜志,2017,32(4):64?67.
[13] 吳林陽,羅蓉,郭雪婷,等.CPU和DRAM加速任務劃分方法:大數據處理中Hash Joins的加速實例[J].計算機研究與發展,2018,55(2):289?304.
[14] 李剛,黃斌,顏耀,等.基于云計算的海洋綜合性試驗船大數據處理模式探討[J].艦船科學技術,2018,40(3):90?95.
[15] 李炎,馬俊明,安博,等.一個基于Web的輕量級大數據處理與可視化工具[J].計算機科學,2018,45(9):60?64.