李楠
(西安醫學院護理與康復學院,陜西西安 710021)
大學畢業生日益增多,就業難問題越來越嚴重。大部分大學畢業生對就業定位選擇困難,固化的選擇工作思維,增加了大學畢業生就業困難的程度[1]。這就需要每個大學積極為畢業生開展就業指導、就業單位分析與就業推薦等服務[2]。開發一個可以提升大學就業中心工作效率與服務質量的信息管理系統具有重要意義。信息管理系統可應用于各個領域,例如蘇蔓等設計的血站免疫血液學實驗室信息管理系統,提升了實驗室的工作效率與實驗過程的管理水平[3];吳凡等研究基于多智能體技術的智能電網信息管理系統,為智能電網信息化與智能化提供有效的技術支持[4]。
大數據處理分布式軟件框的核心是Hadoop,大數據編程框架的核心是Mapreduce,數據挖掘中分布式計算模型的核心是云計算[5],大數據平臺數據存儲的核心是Nosql;大數據技術具備海量性與多樣性的特點,該技術屬于大數據平臺最先涉足的領域[6]。因此,設計大數據平臺的大學就業信息管理系統,以減輕大學就業指導中心管理工作人員的工作負擔,提升大學畢業生就業比率。
基于大數據平臺的大學就業信息管理系統包含畢業生信息管理平臺、企業信息管理平臺、個性化推薦平臺與就業信息跟蹤管理平臺4個子系統。基于大數據平臺的大學就業信息管理系統功能模塊如圖1所示。

圖1 大學就業信息管理系統功能模塊
畢業生管理平臺包含個人信息管理、就業信息管理、求職管理與個人信息維4 個功能模塊,其中個人信息管理模塊指畢業生對個人信息資料的管理,即填寫個人信息,存儲于學籍數據庫并制作求職簡歷供企業查詢有關人才;就業信息管理模塊指畢業生能夠查看系統管理員提供的最新就業新聞與就業指導,充分了解就業相關信息;求職管理模塊為畢業生提供企業發布的招聘信息,畢業生通過搜索關鍵詞能夠查看系統內企業的有關信息,以留言的方式,實現就業方面的交流;個人信息維護模塊負責為畢業生提供修改個人密碼服務。
企業信息管理平臺包含企業信息管理模塊、招聘管理模塊與企業信息維護模塊3 個功能模塊,其中企業信息管理模塊指企業編輯自身的信息,使畢業生能夠及時了解該企業的有關信息;招聘管理模塊負責企業編輯招聘信息,企業通過關鍵字搜索有關人才,尋找滿足崗位需求的畢業生,以留言的方式,實現企業和學生間的在線交流;企業信息維護模塊負責為企業提供修改密碼服務。
個性化推薦平臺由個性化就業推薦引擎組成,依據畢業生與企業的信息為畢業生推薦工作,利用基于用戶歷史信息的推薦實現離線就業推薦;利用基于實時用戶行為數據推薦實現在線實時就業推薦。
就業信息跟蹤管理平臺包含就業信息管理模塊與就業數據統計模塊兩個功能模塊,其中就業信息管理模塊負責記錄畢業生簽約的工作情況信息(工作單位、工作時間與薪資等方面的信息),系統管理員為畢業生提供專業的就業指導信息,并檢驗企業發布招聘信息的真實性,按照招聘信息為大學做就業指導分析統計,為大學改善教學管理提供數據支持;就業數據統計模塊負責統計畢業生信息、企業信息與就業情況信息,分析畢業生就業情況與人才需求的趨勢,為大學改變教學模式提供數據支持。
基于用戶歷史信息推薦方法通過計算畢業生相似度與企業相似度,實現用戶離線推薦[7]。數據來源于系統中畢業生管理平臺與企業信息管理平臺,基于用戶歷史信息的推薦模型如圖2 所示。基于用戶歷史信息的推薦模型負責計算畢業生與企業的相似度,對其實施聚類,相似度計算包含可度量相似度計算與不可度量相似度計算,可度量相似度計算是依據畢業生的基本信息獲取期望權重,計算畢業生的相似度;不可度量相似度計算是依據畢業生的實踐經歷與實習經歷,以提取關鍵詞的方式計算畢業生的相似度[8]。畢業生相似度的計算是通過分析畢業生就業特征,依據權重設置,匹配相似畢業生;企業相似度的計算是通過企業信息與企業招聘需求等信息實施相似度計算;然后完成企業與畢業生的聚類;基于用戶歷史信息的推薦方法是按照企業招聘需求與畢業生就業特征實施關鍵詞匹配,依據需求中的重要程度確定權重,完成畢業生匹配、畢業生與工作的匹配,最后顯示推薦結果[9]。

圖2 推薦模型
1.2.1 畢業生聚類分析
畢業生就業特征屬于畢業生就業時的基本屬性,可以呈現畢業生間的相似程度。按照畢業生就業特征組建畢業生的就業體征向量P={P1,P2,…,Pn},Pmn是第m個畢業生的第n個屬性,表達式如下:

按照畢業生就業特征維度獲取兩個不同畢業生stui與stuj在同一維度中的相似度,計算公式如下:

其中,畢業生是Sn(stui,stuj);畢業生stui第n個屬性值是;畢業生stuj第n個屬性值是;第n個屬性值的最大值是;第n個屬性值的最小值是。假設畢業生stui的n維向量是stui={Pstui1,Pstui2,…,Pstuin};假設畢業生stuj的n維向量是stuj={Pstuj1,Pstuj2,…,Pstujn};歐幾里德距離的計算公式如下:

由于不同就業特征維度的特征權重不同,因此假設畢業生就業權重向量θ={θ1,θ2,…,θn},這樣便可獲取新的距離公式如下:

總體特征向量的表達公式如下:

通過式(5)能夠獲取各個畢業生的特征向量與各個畢業生的特征向量相似度,這樣就能得知某部分畢業生存在相似性,實施畢業生群體的聚類。對存在相似性的企業實施聚類方法與畢業生群體的聚類方法一致。
1.2.2 企業相似度計算
為對比分析各個企業間的相似度,將企業的各個業務定義為一個向量c={y1,y2,…,yn},企業招聘信息中對畢業生需求的元素是y,組建企業和需求的二維數據組是Q[m][n],Q[m][n]的各個向量表示一個企業向量c。企業利用式(3)可實施量化指標計算,企業不可量化指標則利用基于內容的推薦算法實施文本匹配。
基于用戶行為數據推薦方法是按照有關數據了解用戶行為偏好,根據不同行為偏好對相似用戶實施聚類,為用戶推薦相匹配的工作。通過實時數據并行化處理能力與基于用戶的協同過濾、基于物品的協同過濾算法實施數據建模,實現用戶在線實時推薦[10]。
1.3.1 基于用戶的協同過濾
基于用戶的協同過濾指若能獲取和畢業生A具有一樣偏好的其余畢業生,則為畢業生A推薦的結果是依據這些畢業生關注與其投遞的企業狀況獲取的[11-12]。假設有過物品行為的畢業生分別是u與v,設置畢業生u的物品集合是N(u),畢業生v曾經的物品集合是N(v),按照對畢業生與畢業生行為的物品間的關系獲取u與v的相似度,計算公式如下:


1.3.2 基于物品的協同過濾
基于物品的協同過濾指用戶推薦與其曾經喜歡物品的相似物品[13],具體步驟如下:
步驟1:構建畢業生u偏好向量[Su1,Su2,Su3,…,Sun]T;
步驟2:構建項目與評分的二維矩陣,不同項目的評分情況由U代表,公式如下:

步驟3:構建物品共現向量,共現向量是一個表示不同畢業生對物品實施評分情況的矩陣,該矩陣代表不同物品間的相似性[14],假設對物品a實施評分的用戶數量是Pa,對物品b實施評分的用戶數量是Pb,那么物品a與b共現次數的表達式如下:

步驟4:生成推薦,將畢業生偏好向量與物品共現矩陣相乘,獲取一個全新向量,即推薦向量R,Tin的值與畢業生偏好于某一物品(行為)的程度成正比,依據推薦需求為畢業生推薦前n個結果[15]。推薦向量計算公式如下:

以某大學為實驗對象,在2019 年1-3 月期間,利用文中系統對該大學實施就業信息管理,測試該系統的查詢管理性能、響應時間性能、資源占用率與就業推薦性能。
以管理大學就業信息中的求職信息為例,畢業生成功登錄文中系統后,能夠通過求職管理模塊實施求職方面的操作[16-18],畢業生可查看系統內的全部招聘信息,查看結果如表1 所示。根據表1 可知,文中系統可有效查看招聘信息,畢業生能夠輸入關鍵字對有關企業的招聘信息進行實施查詢訪問,實現畢業生和企業間的在線交流。實驗證明,文中系統能夠有效管理大學就業信息中的求職信息。

表1 招聘信息查看結果
將Loadrunner 當作系統性能測試工具,測試文中系統與文獻[3]系統、文獻[4]系統在不同用戶并發訪問數量時系統的響應時間,測試結果如圖3 所示。根據圖3 可知,在不同用戶并發訪問數量時,文中系統的響應時間均明顯低于其余兩種系統。當用戶并發訪問數量達到200 人時,文中系統的響應時間趨于平穩,一直維持在5 s 以內,表示文中系統響應時間短,隨著用戶并發訪問數量的不斷增加,文中系統依舊保持較好的響應時間,具有極佳的性能。隨著用戶并發訪問數量的不斷增加,文獻[3]系統與文獻[4]系統的響應時間上升幅度波動較大,且系統響應時間較慢,表示文獻[3]系統與文獻[4]系統不適用于大量用戶共同使用系統,若用戶并發訪問數量過多,那么該系統會出現崩潰狀況,其系統性能不佳。實驗證明,在不同用戶并發訪問數量時,文中系統的響應時間更快、穩定性好。

圖3 3個系統的響應時間測試結果
以200 個用戶并發訪問系統為例,測試3 個系統的Web 服務器資源使用情況,Web 服務器資源使用情況通過CPU 占用率與內存占用率兩個指標呈現,測試結果如圖4 所示。根據圖4 可知,在用戶并發訪問數量一定時,文中系統的CPU 占用率與內存占用率均明顯低于文獻[3]系統與文獻[4]系統,文中系統的CPU 占用率比其余兩個系統分別低了28.4%與24.4%,文中系統的內存占用率比其余兩個系統分別低了27.2%與28.0%。實驗證明,文中系統的Web 服務器資源占用率明顯低于其余兩個系統,文中系統能夠穩定運行,不會出現服務器死機的情況。

圖4 Web服務器資源使用情況
在2019 年1-3 月份期間,利用文中系統對該大學部分應屆畢業生(1 000 人)實施就業推薦,分析該大學這些畢業生與其同專業的前一年畢業生在1-3月份的就業情況,對比結果如圖5 所示。根據圖5 可知,應用文中系統后,該大學不同專業的應屆畢業生在1-3 月份的就業比率相比前一年存在顯著提升,應用該系統后大學畢業生的就業比率基本維持在80%以上。實驗證明,文中系統可有效提升大學畢業生就業比率。

圖5 對比結果
大學就業信息管理屬于高等院校教育工作的重要部分,為此設計基于大數據平臺的大學就業信息管理系統,增強對大學畢業生就業跟蹤的服務力度,提升大學畢業生就業比率,實時掌握有效的大學畢業生供需信息,可為調整大學教學管理模式提供數據支持,同時為社會培養出優秀的專用型人才做出貢獻。