郭潔暢 杜鵬 杭州電子科技大學數字媒體與藝術設計學院
大學生兼職電商平臺工作推薦系統的實現
郭潔暢 杜鵬 杭州電子科技大學數字媒體與藝術設計學院
本文所介紹的是一款作為招聘網站的一個重要組成部分,根據用戶信息提取標簽并智能匹配推送適合工作的功能網站。該網站主要通過對用戶基本信息、發布的簡歷或是工作信息、收藏瀏覽信息監督等方面提取個人標簽,智能地為應聘者與招聘企業實時智能地推送合適的信息,把握最新消息,快速找到合適的工作與人才。
招聘平臺 標簽提取 智能推送
現代大學生缺乏對職業生涯規劃的認知,導致他們普遍缺乏職業生涯規劃意識。不明白自身優勢與特征,也缺乏對具體職業的利弊判斷,導致找工作困難,同時企業也難以招聘到合適的人才充實空閑的崗位。企業與個人之間缺少一道相互介紹的橋梁,用以智能提取雙方特征并且實時交換信息,而這是當前許多招聘網站沒有做到的。
招聘網站的出現為企業與個人提供了一個信息交流平臺,但是個人或單個組織在平臺海量信息的淹沒下,可以說很難快速有效地找到自己需要的信息。并且出于對自身認知的缺陷角度,即使找到一些自認為合適的信息,也有很大可能并不是真的符合個人特征。
在此研究背景下開發擁有識別標簽的智能工作推薦系統,本文開發一款適用于各類招聘網站的工作、人才推送系統,集信息采集、標簽提取、匹配計算、實時推送更新功能于一體,是一個招聘網站的重要組成部分。
本系統作為網絡求職平臺的一部分,合理繼承了網絡求職平臺“簡單”、“快速”、“高效”、“貼心”的設計服務思想,追求簡單清爽的頁面布局與設計思路,砍掉了許多不必要的功能,使得服務對象明顯,頁面操作簡單。
本系統將招聘者與應聘者功能模塊幾乎完全分開,方便用戶使用,分別略去了大量單獨用戶難以使用到的功能,如招聘者的簡歷設計功能、工作檢索功能等。
本系統主要特色在于“智能”、“個性”二詞,為了達到這兩點的要求,本系統作出了如下設計:首先,所有的標簽均來自用戶自身的設定、選擇和行為抽取,完全是針對每一個用戶獨立打造推送通道,絕不會有除此之外的別的因素影響匹配結果。真正地為用戶考慮,突出用戶個性;其次,用戶在本系統中僅僅需要完成與一般網絡招聘平臺一樣的用戶資料填寫與簡歷完善操作,不需要任何額外的特殊操作,系統將會從用戶的日常操作中智能提取標簽詞,真正做到便捷、高效、貼近用戶,減少用戶負擔,智能打造招聘、求職服務通道。
眾所周知的是,歐美文字是字母語言的代表,其文字特征明顯,可以較為簡單的通過空格來區分開詞語。但是,作為世界最復雜的語言的中文,我們并不能簡單地通過空格來區分開中文詞組,更為復雜的是,中文存在大量的同義詞、歧義詞,如何區分短語和實現分詞一直都是中文分詞的難點。目前世界上比較流行的是兩種匹配分詞算法:至上而下的掃描學習算法與基于大數據庫的分詞算法。本系統作為一個標簽匹配的應用系統,并不打算開發出新的分詞算法,因此,本系統采用的是目前較為容易實現的基于大數據庫的分詞算法。
基于大數據庫的中文標簽分詞算法,首要的就是需要有一個含有大量標簽詞的數據庫,并且將標簽集分為:性格、專業、能力、城市、工作、其他等數個類別。本系統將會在不同的特定的區域掃描不同的標簽,除非使用戶自我添加的標簽詞,否則用戶的標簽詞只會由系統指定的數據庫中產生。并且,每一個區域所能產生的標簽種類也是固定的。所有的標簽數據均來自于大數據收集網站所提供的各大招聘網站的爬取數據,保證了可用性與覆蓋性。
無論我們的標簽庫初始設置時時有多么龐大、詳細,總會有許多關鍵詞我們是無法掃描出來的,因此,本系統就需要一個能夠自主學習填充標簽庫的算法。與其說這是一個算法,不如說是一種思想。首先,我們需要確定哪些部分的新的關鍵詞會是我們需要的;其次,這些地方所產生的關鍵詞所形成的標簽應該歸屬到哪一個區域中去;最后,考慮到新增標簽詞的關系,我們需要篩除一部分冗余的標簽詞。
本文介紹了一款作為招聘網站的一個重要組成部分,根據用戶信息提取標簽并智能匹配推送適合工作的功能網站。在系統附加功能上難免會有一些不完善的地方。比如在簡歷與工作發布上,存在填寫內容較為簡單的現象,需要對填寫內容做進一步的優化。此外,本系統的標簽數據庫數據還遠遠不夠支撐一款正式推送系統運行,因此,優化填寫內容和充實標簽數據庫將是下一步工作重點。
[1]何仕.大學生求職心理障礙及其對策研究[J],沈陽農業大學學報(社會科學版),2007,9(3):361-364