王佳弘 解博超 張燁青



摘? ?要:智慧校園建設對數據的精準應用提出了便捷、實用、個性化的新要求。當前高校各部門信息化程度參差不齊,對于人員及其身份的管理模式單一,管理效率滯后。建立智能標簽管理系統,管理基礎標簽,挖掘特征標簽,將校內機構、人員、身份進行多維度的標簽化管理,能夠有效解決上述問題。通過特征標簽精確篩選目標群體,可以實現智能推送、師生畫像、智能預警等精準服務應用。
關鍵詞:智慧校園;智能標簽管理;群體特征;個性化
中圖分類號:TP315 文獻標志碼:A 文章編號:1673-8454(2020)19-0085-05
一、 研究背景與意義
隨著智慧校園的普及和數據中心的發展,基于大數據的應用場景與嘗試越來越多地出現在高校的教育教學活動中。現有智慧校園應用需求趨向校園服務升級和校園管理轉型[1],在真實場景中精準應用數據,為師生提供便捷、實用、個性化的服務,是目前高校信息化建設中的重要落腳點。為使高校資源得到充分利用,建設高校社群管理平臺是當務之急。由于高校組織機構復雜、人員身份屬性繁多,建立必要的社群管理體系,將機構、人員、身份進行多維度標簽化管理,成為數據精準應用的重要前提。
對于上述問題,可以基于高校社群特征,在大數據平臺的基礎上建設智能標簽管理系統。系統以標簽的形式對組織機構、人員身份、師生特征等數據進行標記和管理,再通過單維標簽或者多維標簽的方式,精確篩選出群體特征,進而對其進行消息推送、應用推薦等精準服務。這種方式為解決智能推送、師生畫像、智能預警等數據精準應用奠定了堅實的基礎。
二、研究現狀與不足
校園的信息化建設一般經歷四個階段:基礎建設階段、系統集成階段、應用集成階段和信息集成階段。前三個階段的建設統稱為數字化校園建設,第四階段則是在此基礎上,對學校各系統中的數據進行整合和分析挖掘,為師生提供個性化的服務和決策支持,稱為智慧校園建設[2]。我國高校于20世紀80年代開始了信息化建設工作,擁有著極快的發展速度。在發展的過程中,幾乎所有高校都經歷了數字化校園建設階段,提高了高校的信息化水平[3]。但在進一步的智慧校園建設過程中還面臨著不少瓶頸[4-5]。
1.參差不齊的信息化程度
高校各業務部門的信息化建設和應用程度因各自的發展水平和重視程度而參差不齊。對于數據管理,大致可以分為以下三個層次:第一,有數據平臺且與學校數據中心進行數據共享;第二,有數據平臺但暫未與學校數據中心進行數據共享;第三,暫無數據平臺。處于第一層次的部門信息化程度較高,實時的數據共享可以保證數據的時效性,但處于后兩個層次的部門大部分都還只停留在利用電子表格進行下級部門數據信息的統計與上報,造成數據缺乏實時性、準確性,存在信息孤島,沒有跟學校的其他數據共享,導致信息化應用水平受限。
因此,基于高校社群特征,搭建智能標簽管理平臺,以標簽的形式標記和管理機構、身份、特征等數據,實現對高校社群的有效管理,是時代所需。
2.形式單一的管理模式
管理模式的形式單一主要體現在以下兩個方面:
第一,很多高校都意識到社群管理這項工作的重要性,因此對校內人員身份進行了詳細的劃分。然而,僅僅針對人員身份的管理模式太過單一,不能全方位真實地反映人員情況。畢竟人員還有各自的特征,如職級、職稱、年級、性別、偏好等。因此,這種模式雖然也能起到一定的管理作用,但不能滿足要求,無法解決問題,需要形成完善系統的管理才行。
第二,高校中一些人員的身份,不受所在部門機構管理的約束。例如信息員等,這些身份一方面受本部門管理員的直接管理,另一方面還要受其所屬職能部門的管理。各部門的信息員既受本部門院、處、部長的管理,又受學校信息處的管理。傳統的人員縱向管理模式過于單一片面,并不能簡單地套用在這些身份上。
因此,急需形式多樣全面、支持橫向管理的新模式。
3.更新滯后的管理效率
高校中的人員變更一般只有人事處和本部門的管理人員知道,其他部門和系統管理員往往無法詳細了解全校每一個人的變化情況,只能從校內通知公告或者通過打電話咨詢才能了解變動情況。因此,數據更新的滯后大大增加了管理難度與數據的有效性。
因此,基于高校社群特征的智能標簽管理平臺的數據交互接口,通過對更新頻率不同的數據設置各自的同步時間,同步過程中,發現標簽有變動情況的,如部門的名稱發生變化、部門間產生人事變動等,則會在管理員登錄平臺后彈出提示框提醒更新,在管理員確認后方可更新標簽。不僅能夠節省資源,還可以保障數據的準確性與實用性。系統管理員可通過權限設定,將權限下放至各院系、各部門,更能保證人員數據的有效性與準確性。此外,還可通過設置助理的方式,將當前權限完全復制到助理身上,共同管理,以分擔工作壓力并提高管理效率。
三、智能標簽管理平臺的架構設計
基于高校社群特征的智能標簽管理平臺總體框架如圖1所示。平臺的原始數據來源于人事、教務、學工等業務系統,經用戶數據采集、用戶數據處理、用戶數據標簽化以及用戶標簽管理,完成智能標簽管理平臺的構建。該平臺可為智能推送、學生畫像等業務應用提供支撐。
1.用戶數據采集
用戶數據分為靜態用戶數據和動態用戶數據兩類。
(1)靜態用戶數據采集
靜態用戶數據來源于學校業務系統,包括人事系統、教務系統、學工系統、研究生系統、科研系統、工會系統、黨務系統等,可以獲取到用戶的基本信息、行政信息、教學信息、科研信息、工會信息和黨支部信息等數據。這些數據大多屬于結構化數據,不要求實時處理,因此可以通過ETL工具進行數據自動采集,將數據從源數據庫經抽取、轉換、加載一系列操作至終端數據庫。并針對更新頻率不同的數據設置各自的同步時間,不僅能夠節省資源,還可以保障數據的準確性與實用性。
(2)動態用戶數據采集
動態用戶數據來源于用戶行為,包括網絡服務器的用戶行為數據、圖書館的用戶借還數據、校園卡POS機的消費數據、宿舍教學樓的門禁數據等。這部分數據以非結構化數據為主,其特點為數據量龐大、類別繁雜、更新頻率高,因此可采用高可用、高可靠、分布式的海量日志采集、聚合和傳輸的系統Flume 工具進行采集。
2.用戶數據存儲
對智能標簽管理平臺而言,由于歷史數據不能輕易刪除,數據量會越來越多。因此,需要使用海量分布式文件系統,對大量的數據提供在線服務。同時,根據平臺特點,以下三點亦需考慮:首先,對批量數據高速讀取的要求較高,但僅僅需要簡單的“鍵—值”讀取,沒有復雜的連接查詢需求;第二,數據庫的模式依據標簽的動態變化而靈活多變,常有更新列屬性或新增列等需求;第三,為便于開發及應用,需要有良好且語義清晰的高級程序語言接口。
基于上述特點,本文選擇了Apache HBase這一非關系型分布式數據庫存儲清洗后的用戶數據。HBase是一個稀疏、多維度、排序的映射表,面向列族獨立檢索,只有簡單的插入、查詢、刪除、清空等操作,不存在復雜的表與表之間的關系。同時,HBase上的數據模型按行鍵排序存儲,讀取時會一次讀取連續的整塊數據,可以保證批量讀取的速度。
3.用戶數據標簽化
構建智能標簽管理系統的目的是通過不同維度去描述一個人,認識一個人,了解一個人,其最為核心的任務就是將用戶數據進行標簽化,并形成用戶標簽庫。用戶標簽庫是根據用戶特征、習慣和行為而抽象出來的一個標簽化的數據模型,而標簽就是通過對用戶數據分析而得出的高度精煉的特征標識。目前高校各部門間業務關系復雜,高校社群人員身份多重易變、身份屬性繁多,難以管理與使用,因此,本平臺將用戶標簽分為單維標簽和多維標簽兩大類,以便操作。
(1)單維標簽
單維標簽從“機構—身份”標簽和用戶基本特征標簽兩個方面對高校社群用戶進行單維度描述。
①“機構—身份”標簽
“機構—身份”標簽用來描述用戶在校內的各類身份信息,本平臺根據高校的實際教育教學情況,將身份信息分為行政、教學、科研、工會和黨支部五個屬性類別。“機構—身份”標簽由這五個屬性類別下的機構標簽與身份標簽綁定而得,如表1所示。
②用戶基本特征標簽
用戶基本特征標簽用來描述用戶的各類基本信息,包括性別、年齡、教育程度、籍貫、教授課程、學生人數、課時量、學生評價、論文、科研項目、橫向課題、縱向課題、學術會議、專業領域、研究方向、職級職稱、技能證書、閱讀偏好、消費偏好、圖書借閱、校園卡消費、上網流量、搜索偏好等。
(2)多維標簽
多維標簽是對單維標簽的自由組合,以滿足不同目標群體的實際使用需求。根據組合方式的不同,可分為特殊身份標簽、公共標簽和私有標簽三種。
①特殊身份標簽
在高校的行政屬性中,往往存在一些身份不受所在部門機構管理的限制,例如辦公室主任、信息員、資產員、財務員。這些身份一方面受本部門管理員的直接管理,另一方面還要受其所屬職能部門的管理。像各部門的財務員既受本部門院、處、部長的管理,又受學校財務處的管理。為此本平臺提出一種身份標簽跨部門的橫向管理機制,打破固有的機構縱向管理壁壘,在各職能部門中設置特殊身份管理員這一身份標簽,用來對上述特殊身份進行統一的管理。
②公共標簽
為滿足高校教育教學工作中的日常使用,本平臺預設了一些常用的公共標簽,分組合標簽和自定義標簽兩種。
組合標簽的設置,不僅涵蓋當前用戶有使用權限的各類標簽,還充分利用與、或、非等多種數據集的邏輯運算符,通過自由組合的方式,來篩選出常用的目標群體,并設置為標簽,擁有極高的自由度與靈活性。例如2017級本科生、全校女工委員、35歲以下中層領導等。
自定義標簽則有所不同,通過寫SQL語句來實現對目標群體的篩選。這種方式雖然需要對數據庫的表結構、邏輯關系和字段含義有較為透徹的了解,但卻能設置出更具個性化、更具實用價值的標簽,大大提升了用戶使用過程中的體驗。例如2019年碩士學位評審委員會成員等。
③私有標簽
在實際的工作中,平臺中預設的公共標簽可能會出現無法滿足用戶使用需求日益變化的現象。為進一步提高用戶操作滿意度,本平臺允許用戶根據需要設置自己的私有標簽。私有標簽有兩種設置方式:一種與組合標簽的設置過程類似,只不過私有標簽只有當前操作者能使用,并不對外公開;另一種是先設置好標簽名稱,然后通過批量導入人員的方式在該標簽下面添加用戶。
4.用戶標簽管理
智能標簽管理平臺在高校社群特征數據的基礎上,搭建了一個高度精煉的、標簽化的數據標簽體系。該平臺的功能模塊包括標簽綁定、標簽更新、權限設定、數據查詢、消息中心、系統管理。
(1)標簽綁定
該功能模塊是把已設好的標簽綁定到具體的人身上。默認以樹形結構呈現標簽之間的層級邏輯關系。在進行標簽綁定時有兩種方式可以選擇:一種是通過精確搜索給特定的人員貼標簽;另一種是通過導入人員列表批量貼標簽。與常規以人為中心、在人身上貼各種標簽的方式比,這種以標簽體系為中心綁定人的方式,更適用于高校中組織機構相對固定,而人員身份標簽多變的特點。
(2)標簽更新
標簽更新分為管理員手動更新、同步后提示更新兩種方式。管理員手動更新是管理員在日常工作中發現平臺中的標簽結構、標簽名稱、標簽綁定等有缺失或有誤時,進行手動更新的一種方式。同步后提示更新是用來針對在同步過程中發現標簽有變情況時,例如部門的名稱發生變化、部門間產生人事變動等,會在管理員登錄平臺后彈出提示框提醒更新,在管理員確認后方可更新標簽。
(3)權限設定
本平臺將權限分為管理權限和使用權限兩大類。管理權限用來進行標簽綁定和標簽更新等操作,使用權限用來設置用戶的私有標簽和后續發消息等操作。管理員往往無法詳細地了解全校每一個人的變化情況,因此通過權限設定,將標簽的權限下放至各院系、各部門。具體到某一個人的身上來進行管理,更能保證人員數據的實用性與準確性。除此之外,本平臺還可通過設置助理的方式,將當前權限完全復制到自己的助理身上,共同管理以分擔工作壓力。
(4)數據查詢
該功能模塊包括用戶查詢和標簽查詢兩大類。其中,用戶查詢可根據用戶姓名、學(工)號進行查詢,結果頁面顯示的是所查用戶的基本信息、被貼的標簽、可管理的標簽、可使用的標簽。標簽查詢可根據所查標簽,顯示該標簽的從屬類別、使用權限、開放人群。
(5)消息中心
該功能模塊分為普通用戶和管理員兩種展現形式。當普通用戶發現平臺中的標簽結構、標簽名稱、標簽綁定有缺失或有誤時,可向管理員提交修改申請,提交時需填寫問題類別、問題描述和聯系方式,由管理員統一進行標簽修改。所有的問題可分類管理,管理員既可在消息中心中與用戶交互,也可通過用戶留下的聯系方式交流。
(6)系統管理
該功能模塊是本平臺運行的基礎,用于維護后臺用戶基本信息及權限角色的管理,保證用戶不能跨權限操作。包括用戶管理、角色管理和日志管理三個模塊。可以添加、刪除用戶,對指定的用戶進行授權,將同類型的用戶劃歸為同一角色,查看所有用戶的登錄日志。如果靈活度高、自由度大,往往會導致一些安全隱患,因此本平臺對職工號進行隱藏保護,只顯示最后一位。
四、智能標簽管理平臺的應用場景
本平臺的應用場景包括:消息推送、用戶畫像、智能預警、個性化推薦以及分析與預測五個部分,如圖2所示。
1.消息推送
消息推送系統基于智能標簽管理平臺,可以根據需求篩選出目標群體,然后進行實時或定時的消息發送。篩選目標群體時,用戶不僅能對自己有使用權限的標簽進行自由組合,還可通過批量導入的方式得到消息推送的目標群體,有極高的自由度與靈活性。發送消息時,用戶還能對消息文本中的字段進行自定義設置,添加附件、圖片和回執等,以實現消息的定制推送,滿足廣泛多樣的使用需求。
2.用戶畫像
用戶畫像是對現實生活中用戶的數學建模。通過分析和挖掘用戶盡可能多的數據信息而得,用標簽的集合來表示。使用更加直觀、更易理解的標簽形式,來描述用戶或者群組,便于業務的開展和問題的處理,結合用戶的信息,整合用戶標簽,形成用戶的360度畫像。
高校中支持的用戶畫像類型包括學生和教師兩種。通過學生畫像,輔導員、班主任、學院、業務人員等能夠更清晰、準確、全面、快速、便捷、理性地了解學生的情況。教師在進行職業發展規劃時,最重要的前提就是先了解自己,而教師畫像就是一個很好的工具,能夠讓教師客觀地了解自己。它用抽象的數據來描述人物,通過分析挖掘用戶盡可能多的數據信息得到的一個虛擬的人物形象,以此來代表個人的背景、需求、喜好等。
3.智能預警
目前高校中已有的預警系統往往只關注學生的學業、家庭困難等單一方面,并不能滿足教務處、學工等部門實際工作中的多維需求。在與業務部門進行詳細的調研與討論后,本平臺將支持涵蓋不在校學生預警、校外住宿預警、逃課行為預警、在籍在校不選課預警、休學退學不離校預警、晚歸預警以及上網行為預警七方面的智能預警系統。結合需求,可自行對預警的閾值進行設置與調整。產生預警后,管理人員可根據學生的實際情況,進行預警解除或預警確認的操作,有極高的自由度和實用性,同時也符合高校行業經驗。
4.個性化推薦
信息技術和互聯網的迅猛發展把我們帶進了一個信息過載的時代,海量信息的呈現,一方面增大了用戶發現自己感興趣信息的難度,另一方面也使得大量的信息無法被一般用戶獲取。個性化推薦是目前解決信息過載問題最有效的工具。個性化推薦在用戶畫像標簽特征和行為智能預警系統的基礎上,構建推薦模型,選擇推薦算法,推薦感興趣的信息給用戶。例如對于家庭困難的學生,可以推薦一些有關勤工助學崗位申請的信息,通過這種點對點的推薦方式,既可緩解學生的精神壓力,也能從一定程度上緩解學生的經濟壓力。
5.分析與預測
結合用戶畫像的標簽特征和學校教育教學環境,分析學生學習生涯和教師職業發展過程中的方向與目標,并預測是否能達到下一個目標,以及若想達到下一個目標還要進行哪些方面的努力。同時,分析與預測會根據用戶的特征變更進行實時的變化,并以數據的方式總結個人的階段性成果,分析學習生涯和職業發展過程中現實與目標之間的偏差。
五、總結與展望
智能標簽管理平臺一經推出,就得到了大量師生的廣泛關注,師生總體滿意度較高。同時,通過多種途徑不斷了解學校師生的實際需求,將師生關注度高的需求轉化為實際應用進行開發,同樣取得了良好的效果。目前,已經基于該平臺開發了智能消息管理系統,初步實現了高校社群內信息定向精準推送的建設需求。后面將繼續擴大智能標簽管理平臺的適用范圍,推廣至用戶畫像、智能預警、個性化推薦以及大數據分析與預測等多個方面,不斷擴展服務性能,嘗試創新性應用,為師生校園生活帶來更豐富的功能體驗。
參考文獻:
[1]謝幼如,黎佳,邱藝等.教育信息化2.0時代智慧校園建設與研究新發展[J].中國電化教育,2019(5):63-69.
[2]李俊磊.基于數字化校園平臺建設智慧校園的研究[J].信息與電腦(理論版),2018(18):235-236.
[3]黃劍.大數據背景下的高校智慧校園建設研究[J].數字技術與應用,2018,36(5):117-118.
[4]李蔚輝.大數據時代高等教育智慧管理淺談[J].學周刊,2020(9):3-4.
[5]李玉榮.大數據視域下高校智慧校園建設的可行性路徑研究[J].信息技術與信息化,2019(8):146-148.
(編輯:王曉明)