黃姿 胡小忠 徐杭 秦圓 陳磊



摘要:針對(duì)部分大學(xué)生自身定位不準(zhǔn)、參加創(chuàng)新活動(dòng)難以找到合適伙伴或團(tuán)隊(duì)等問題,該文通過用戶畫像、數(shù)據(jù)挖掘和推薦算法等概念展開了對(duì)大學(xué)生創(chuàng)新匹配平臺(tái)開發(fā)的探討。利用軟件工程等技術(shù),分析設(shè)計(jì)了平臺(tái)的系統(tǒng)功能模塊、工作流程、軟件架構(gòu)及頁面設(shè)計(jì)等,其內(nèi)容可為我國教育事業(yè)創(chuàng)新性研究提供參考。
關(guān)鍵詞:用戶畫像;大學(xué)生創(chuàng)新平臺(tái);匹配算法;軟件開發(fā)
中圖分類號(hào):TP399? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:B
文章編號(hào):1009-3044(2019)16-0044-03
開放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
1 背景
近年來,隨著時(shí)代和網(wǎng)絡(luò)的發(fā)展,類型多樣的活動(dòng)使得大學(xué)生課余生活變得更加豐富多彩。然而,這些活動(dòng)在提高學(xué)生綜合素養(yǎng)同時(shí)也帶來了一些問題。調(diào)查顯示,由于大多數(shù)活動(dòng)的組隊(duì)賽制、學(xué)生個(gè)人定位不準(zhǔn)確及交際網(wǎng)過窄等,超過三分之一的人不知如何找到合適的隊(duì)友或團(tuán)隊(duì)。
作為日益成熟的數(shù)據(jù)分析工具,用戶畫像能全面細(xì)致地抽象出用戶的信息全貌,了解并跟蹤用戶需求變化并分析探求用戶需求變化的根本原因[1],其在生活中得到了廣泛運(yùn)用。商界內(nèi),以京東、淘寶及亞馬遜等電商平臺(tái)為典型。學(xué)界內(nèi),楊帆[2]在研究中以讀者的行為偏好為中心,實(shí)現(xiàn)了圖書館的個(gè)性化推薦;國外學(xué)者 Iglesias 等[3]對(duì) Web 站點(diǎn)的網(wǎng)絡(luò)日志進(jìn)行了深度挖掘,通過對(duì)用戶行為模式進(jìn)行聚類來刻畫不同群體的用戶畫像等。
盡管如此,在國內(nèi)卻鮮有人基于用戶畫像等概念對(duì)如何促進(jìn)大學(xué)生創(chuàng)新進(jìn)行研究。本項(xiàng)目充分考慮大學(xué)生對(duì)組隊(duì)比賽的需求,旨在通過用戶畫像、數(shù)據(jù)挖掘和推薦算法等技術(shù),開發(fā)一套大學(xué)生創(chuàng)新匹配平臺(tái),以此準(zhǔn)確定位學(xué)生個(gè)人能力,向其推薦心儀的活動(dòng)、團(tuán)隊(duì)和伙伴等,使得團(tuán)隊(duì)效益最大化,為我國創(chuàng)新創(chuàng)業(yè)助力。
2 系統(tǒng)總體設(shè)計(jì)
按照軟件工程的方法,項(xiàng)目首先進(jìn)行了需求分析,重點(diǎn)對(duì)數(shù)據(jù)需求和功能需求進(jìn)行了相關(guān)研究,通過分析,總結(jié)出平臺(tái)主要解決“推薦活動(dòng)”和“推薦人員”兩個(gè)核心問題,由此衍生出多個(gè)為其服務(wù)的功能模塊。如登錄注冊(cè)、信息管理、聊天通知及匹配推薦等,其功能模塊如圖1所示。
圖1中,登錄注冊(cè)、信息管理與通知及聊天為基礎(chǔ)功能模塊。登錄注冊(cè)建立用戶與平臺(tái)的聯(lián)系,為后期收集用戶信息、生成用戶畫像及個(gè)性化服務(wù)做準(zhǔn)備;信息管理高效安全地存儲(chǔ)用戶信息,為精準(zhǔn)推薦匹配功能提供數(shù)據(jù)基礎(chǔ);查詢讓用戶快速獲取所需信息;通知及聊天為用戶相互了解提供渠道,使得人與人之間的合作機(jī)制更加高效。
自動(dòng)打標(biāo)簽與報(bào)名及匹配為平臺(tái)核心功能模塊,前者可根據(jù)信息管理模塊提供的基礎(chǔ)信息,分析和挖掘數(shù)據(jù)間關(guān)系,為實(shí)體標(biāo)注標(biāo)簽,同時(shí)動(dòng)態(tài)更新用戶畫像;后者除實(shí)現(xiàn)報(bào)名外,還可借助前者生成的標(biāo)簽、權(quán)重與用戶畫像,依據(jù)一定的推薦算法進(jìn)行活動(dòng)與人員的推薦。其中,由于人員組成類型的多樣,又可將其分為志趣相投的伙伴、有目標(biāo)活動(dòng)的隊(duì)伍及隊(duì)員三類。
3 核心功能工作流程
圖1給出了系統(tǒng)所包含的主要功能模塊,其中自動(dòng)打標(biāo)簽、報(bào)名和匹配功能模塊的設(shè)計(jì)與優(yōu)化是提升本系統(tǒng)實(shí)用性的關(guān)鍵。其中,雖然報(bào)名與匹配同屬一個(gè)大模塊,但報(bào)名功能相對(duì)較為獨(dú)立,可單獨(dú)進(jìn)行分析。
1)自動(dòng)打標(biāo)簽流程
自動(dòng)打標(biāo)簽?zāi)K分為2個(gè)部分,分別負(fù)責(zé)活動(dòng)和人物的標(biāo)簽分析。
由圖2可知,自動(dòng)打標(biāo)簽?zāi)K由時(shí)間周期觸發(fā)運(yùn)算更新標(biāo)簽操作,系統(tǒng)內(nèi)置計(jì)算規(guī)則決定運(yùn)算標(biāo)簽的權(quán)重及內(nèi)容。而用戶畫像主要由標(biāo)簽組成,一旦實(shí)體標(biāo)注的標(biāo)簽內(nèi)容準(zhǔn)確,畫像的分析則可通過調(diào)用接口實(shí)現(xiàn)。
2)報(bào)名工作流程
報(bào)名工作將意向用戶或活動(dòng)加入匹配池,為后續(xù)匹配工作提供數(shù)據(jù)源。
由圖3知,報(bào)名方式分兩種,若是個(gè)人報(bào)名,在確定之后將加入目標(biāo)活動(dòng)的人員匹配池;若是團(tuán)隊(duì)報(bào)名,則在選擇隊(duì)伍之后加入目標(biāo)活動(dòng)隊(duì)伍匹配池。這2個(gè)池為匹配推薦功能中的隊(duì)員推薦和隊(duì)伍推薦提供基礎(chǔ)。
3)匹配推薦工作流程
匹配推薦分為活動(dòng)、伙伴、隊(duì)伍和隊(duì)員推薦四個(gè)子塊。為了實(shí)現(xiàn)精準(zhǔn)推薦,每個(gè)模塊都將基于實(shí)體的標(biāo)簽表進(jìn)行運(yùn)作。
由圖4知,不同匹配子模塊之間的運(yùn)作流程基本類似,只不過它們所基于的運(yùn)算數(shù)據(jù)源和算法不一樣,從而劃分成了不同子塊。匹配推薦的流程可以抽象概括為:系統(tǒng)先判斷用戶當(dāng)前的匹配類型,再根據(jù)匹配類型獲取所需的數(shù)據(jù)與計(jì)算規(guī)則進(jìn)行運(yùn)算,在得到了相應(yīng)的匹配數(shù)目的集合之后,按照匹配度從高到低的順序從優(yōu)呈現(xiàn)給用戶。其中,推薦隊(duì)員和推薦隊(duì)伍實(shí)質(zhì)上是一個(gè)逆向的計(jì)算過程,僅在數(shù)據(jù)源、結(jié)果集的處理上有所不同,因此它們共用一個(gè)匹配度計(jì)算功能子塊。
4 系統(tǒng)開發(fā)環(huán)境
為優(yōu)化系統(tǒng)性能、提高開發(fā)速率及降低功能耦合等,本系統(tǒng)采用微服務(wù)架構(gòu)提供業(yè)務(wù)服務(wù)。以五臺(tái)微服務(wù)服務(wù)器提供業(yè)務(wù)服務(wù),一臺(tái)數(shù)據(jù)服務(wù)器提供數(shù)據(jù)源,Redis緩存數(shù)據(jù)庫加快訪問速率及Mysql數(shù)據(jù)庫實(shí)現(xiàn)數(shù)據(jù)持久化;利用Jenkins可以監(jiān)控軟件開發(fā)流程等;Docker容器中創(chuàng)建和部署各個(gè)應(yīng)用,以實(shí)現(xiàn)軟件系統(tǒng)服務(wù)隔離等。其具體性能和搭載的服務(wù)組件如表1所示。
在該硬件配置方案下,僅一臺(tái)服務(wù)器負(fù)責(zé)數(shù)據(jù)存儲(chǔ)工作,這容易造成服務(wù)器性能瓶頸。對(duì)此,通過配置及帶寬升級(jí)可在一定程度上解決該問題。基于以上配置和思想,可得系統(tǒng)運(yùn)作基本架構(gòu)如圖5所示。
由圖5可見,微服務(wù)器各負(fù)責(zé)不同的業(yè)務(wù)功能,它們之間可以進(jìn)行通訊服務(wù)。Master DB負(fù)責(zé)數(shù)據(jù)的存取,Nginx實(shí)現(xiàn)服務(wù)器之間的負(fù)載均衡。如此架構(gòu),系統(tǒng)便具有了高擴(kuò)展、松耦合、易部署和易理解等特點(diǎn)。
5 系統(tǒng)實(shí)現(xiàn)主要界面
在總體設(shè)計(jì)和詳細(xì)設(shè)計(jì)的基礎(chǔ)上,進(jìn)行了編程和測(cè)試,下面給出系統(tǒng)開發(fā)的主要功能界面。
1)個(gè)人中心
圖6個(gè)人中心集中展現(xiàn)了目標(biāo)用戶的信息,除本人用戶可對(duì)其進(jìn)行修改外,訪客也可通過此了解目標(biāo)用戶的大致情況。本人用戶可以通過我管理的隊(duì)伍、我參加的活動(dòng)進(jìn)入匹配功能進(jìn)行推薦隊(duì)友、隊(duì)伍等。
2)伙伴推薦
圖7展示了進(jìn)行伙伴推薦之后的結(jié)果頁面,只要向上拉動(dòng)伙伴推薦頁面就可以拉取最新推薦內(nèi)容。其中,科技成就值和可靠度正是通過內(nèi)置算法計(jì)算得出,其數(shù)值可直觀地為用戶提供選擇隊(duì)友或活動(dòng)的依據(jù)。
3)活動(dòng)推薦
圖8展示與伙伴推薦類似,只是此處并沒有更細(xì)節(jié)的展示匹配度,取而代之的是與活動(dòng)相關(guān)的細(xì)節(jié)信息,有助于用戶篩選符合目標(biāo)條件活動(dòng)。
6 結(jié)束語
本項(xiàng)目屬于國家級(jí)大學(xué)生創(chuàng)新訓(xùn)練項(xiàng)目,開發(fā)靈感來源于生活,將用戶畫像等概念運(yùn)用在大學(xué)生創(chuàng)新上,具有較強(qiáng)實(shí)用性。目前該系統(tǒng)正處于系統(tǒng)運(yùn)行與維護(hù)階段,雖然實(shí)現(xiàn)了預(yù)期的目的,但仍然存在一些不足,如推薦算法效率和精度不高等問題,后續(xù)將會(huì)繼續(xù)深入研究。
參考文獻(xiàn):
[1] 王凌霄, 沈卓, 李艷. 社會(huì)化問答社區(qū)用戶畫像構(gòu)建[J]. 情報(bào)理論與實(shí)踐, 2018, 41(1): 129-134.
[2] 楊帆. 以畫像分析為基礎(chǔ)的圖書館大數(shù)據(jù)——以國家圖書館大數(shù)據(jù)項(xiàng)目為例[J]. 圖書館, 2018(2).
[3] IGLESIAS J A, ANGELOV P, LEDEZMA A, et al. Creating evolving user behavior profiles automatically[J]. IEEE Transactions on Knowledge and Data Engineering, 2012, 24(5): 854-867.
【通聯(lián)編輯:謝媛媛】