徐艷


(浙江中醫(yī)藥大學 社科部,杭州 310053)
摘 要:以大數據用戶畫像技術(大數據中的核心技術之一)作為出發(fā)點,將其與高校思想政治教育進行有機結合,有效挖掘、分析和利用教與學過程中所形成的海量數據,通過數據清洗,給每位學生真實畫像,打上準確精細的分類標簽,甚至針對異常情況形成自動預警機制,為提高思想政治教育的實效性開啟一扇新的大門,實現可以事實落地的大學生思想跟蹤、預警、分析、預測和處理系統,以助推高校思想政治教育工作從一體化、整體化轉向以個性化的方式服務于每位學生,使思想政治教育工作由宏觀向微觀發(fā)展,精準實現思想政治教育工作的“私人訂制”。
關鍵詞:大數據;用戶畫像技術;高校思想政治教育;創(chuàng)新應用
中圖分類號:G641 文獻標志碼:A 文章編號:1002-2589(2017)07-0241-02
大數據不僅是一場技術革命,一場經濟變革,也是一場國家發(fā)展全局的變革。高校思想政治教育工作事關國家的未來,更是不能設身之外。黨的十八屆五中全會的“十三五”規(guī)劃建議提出:“實施國家大數據戰(zhàn)略,推進數據資源開放共享。”2015年7月,《國務院辦公廳關于運用大數據加強對市場主體服務和監(jiān)管的若干意見》(國辦發(fā)〔2015〕51號)中,明確要在教育文化等領域實施大數據示范應用工程。同年9月,國務院《關于印發(fā)促進大數據發(fā)展行動綱要的通知》(國發(fā)〔2015〕50號)中,更是將教育作為率先實現數據開放的重要領域之一,并明確要探索發(fā)揮大數據對于變革教育方式、促進教育公平、提升教育質量的支撐作用。
因此,與時俱進地運用前沿技術——大數據用戶畫像技術作為出發(fā)點,將大數據的核心技術與高校思想政治教育進行有機結合,有效挖掘、分析和利用教與學過程中所形成的海量數據,通過數據清洗,給每位學生真實畫像,打上準確精細的分類標簽,甚至針對異常情況形成自動預警機制,這必然能夠為高校思想政治教育改革提供新的借鑒。幫助高校思想政治教育工作從一體化、整體化轉向以個性化的方式服務于每位學生,使思想政治教育工作由宏觀向微觀發(fā)展,精準實現思想政治教育工作的“私人訂制”。
一、教育大數據的巨大市場和在思想政治教育領域中的廣闊前景
當前高校思想政治教育工作方式主要包括開設的“思政課”教學及相關實踐活動等,大部分情況下其共通特點是:將學生作為一個整體來進行一體化教育。而當前大學生思想日趨多元化,用一種通用模式來教育所有人,其效果難于達到預期。
在未能及時準確地洞察每位學生真實思想動態(tài)的前提之下,很多個性化、多樣化的教育方案是缺乏事實依據,從而導致這些設定的方案缺乏適用性、靈活性,難以有的放矢,學生的參與度不高,效果不理想。
而身處網絡時代的大學生,除了睡覺、吃飯、上課、自習以外,大部分的時間都在網絡世界中,利用大數據用戶畫像技術,采集觀察他們在網絡中的行為數據,可以真切及時地了解他們在不同時間點的喜好、情緒以及思想動態(tài)。
因此,以大數據用戶畫像技術(大數據中的核心技術之一)作為出發(fā)點,探討利用大數據用戶畫像技術助推高校思想政治教育工作的創(chuàng)新,這不僅涉及思想政治教育的理論更新,更是關涉思想政治教育改革創(chuàng)新的實踐探索,具有很強的拓展性、建設性和實用性價值。
目前,在教育領域,使用大數據用戶畫像技術在實踐層面上還沒有真正意義上的嘗試,主要因為在這方面的實戰(zhàn)人才相當缺乏,特別是在高校當中。加上理論層面,還沒有將大數據用戶畫像技術同高校思想政治教育進行結合的嘗試,更不用說提出具體的整套實施方案。
大數據用戶畫像技術在商業(yè)領域已經帶來了巨大的實際應用價值,而大數據不只是一個產業(yè)這么簡單。它在社會的各個領域中都無所不在,會給各行各業(yè)帶來分析洞察問題的新方式、新方法,也必然會帶來變革創(chuàng)新大勢。高校作為思想最活躍、知識最密集、網絡信息技術運用最充分的前沿陣地,自然不能身處其外。盡管大數據在教育領域的研究和實踐才剛剛開始,我們也能預測并感受到大數據這股洶涌潮流必然會對高校思想政治教育產生巨大影響和沖擊。
大數據用戶畫像技術所擁有的個體深度洞察能力,對于高校及時準確地掌握大學生思想現狀、高效引導大學生思想動向具有巨大價值。大數據用戶畫像技術也可以在高校思想政治教育工作中得以深度地融合和廣泛的應用。至于如何真正將大數據用戶畫像技術完美地應用于思想政治教育工作當中,我們應積極勇敢地進行實踐探索,并自信作為大數據的核心技術——用戶畫像技術能夠為高校思想政治教育工作帶來不遜于商業(yè)領域的巨大價值。
二、大數據用戶畫像技術在高校思想政治教育中的創(chuàng)新應用
如上圖整體思路所示,大數據用戶畫像技術在高校思想政治教育中的創(chuàng)新應用步驟包括以下幾個方面。
(一)大學生基礎信息及上網數據的采集
需要采集的分析數據包括學生基礎信息:姓名、電話、出生年月、生源地、民族、入學年份、學院、班級、專業(yè)、郵箱、 QQ 號、微博賬號、微信號等等。學生上網數據:上網瀏覽的網頁信息、 QQ 群發(fā)言數據、微信群發(fā)言數據等等。
(二)數據的整合清洗、語義分詞
采集獲得的數據需要整合清洗,關聯匹配不同來源的數據,獲得每個學生統一的數據視圖,然后對這些數據進行語義分詞,得到每個學生相關詞語的頻率、權重,為大數據用戶畫像做準備。
(三)大數據用戶畫像技術及分析預測預警模型
利用大數據的用戶畫像技術給每個學生打上基本信息、興趣愛好、思想動態(tài)的標簽,使用大數據算法設計分析、挖掘和預測的模型。
(四)高校思想政治教育理念和大數據用戶畫像技術的有機結合
數據只是基礎,只有結合高校思想政治教育的理念、思路,才能設計出切合實際、解決實際問題的思想教育分析需求、思路與方法,更精準地指導大數據用戶畫像的方向與目標。
(五)基于大數據用戶畫像技術之上的大學生個體思想動態(tài)標簽體系、群體思想動態(tài)標簽體系的研究與建設
大數據用戶畫像技術為高校思想政治教育提供了全新的分析基礎,基于其上的大學生個體、群體思想動態(tài)標簽體系的研究與建設將更符合學生的實際情況,獲得的標簽分類數量也會更為豐富,能夠為后續(xù)的思想動態(tài)預警提供真實有效的數據平臺。
(六)基于大數據用戶畫像技術之上的大學生思想動態(tài)預警研究與建設
自動化、及時的大學生思想動態(tài)預警體系將結合當前國家、社會關注的思想異常點以及由數據分析預測出的思想異常點,形成既覆蓋當前又前瞻未來的大數據思想動態(tài)預警體系。
三、大數據用戶畫像技術應用于高校思想政治教育中所需的技術解決方案
(一)分析數據的采集
1.學生基礎數據可以連接學校的學生檔案系統獲得,或者以文本的形式導入大數據系統,一般為非實時數據。
2.學生的上網瀏覽記錄,如果是通過學校統一部署的寬帶接入上網的,可以部署網絡抓包系統獲得,并考慮實時獲得這些數據。
3.QQ群文本、微信群文本,可以通過網絡爬蟲系統獲得,并考慮實時獲得這些數據。
4.其他數據,包括其他一些能夠幫助用戶畫像的數據,比如學生的成績、活動的記錄等等。這些數據通過數據庫接口或者文本導入的方式獲得,一般為非實時數據。
針對非實時數據用計劃任務調度,將數據抽取到大數據平臺的 HDFS 分布式文件系統中;針對實時數據,使用大數據的 Kafka 及時地分發(fā)到大數據平臺的 Cassandra 數據庫中,大數據 Hadoop 平臺計劃使用 Cloudera。
(二)數據清洗整合、語義分詞
采集獲得的數據來自多個不同的數據源,需要匹配整合到一起,計劃使用大數據工具 KNIME做數據的清洗整合。語義分詞計劃使用 KNIME 調用 R 語言的 Rwordseg 來完成,在正式分詞之前,需要在網上收集大量的詞庫,以提高分詞的準確率。
(三)大數據用戶畫像及分析
如上圖所示,大體分為三個步驟。
1.先針對分詞后的結果進行標簽的預匹配,之后建模。在建模的過程中,需充分結合高校思想政治教育的理念與實踐,設計合適的建模思路,最后得到大學生的用戶畫像。
2.依據大數據輸出的思想動態(tài)標簽,形成切實有效的思想動態(tài)體系、評分預警體系,并生成各類預警的評分數據。
3.結合前面獲得的用戶畫像、思想動態(tài)體系、評分預警體系,設計合適的分析預測模型,對大學生的未來思想進行動態(tài)預測并生成預測數據。計劃使用大數據工具 KNIME 來實現,并將結果數據放入到大數據的數據庫 Impala 中,以供后續(xù)的結果展現及行動。
(四)結果展現及行動
結果將以可視化的動態(tài)圖形來進行展示,既有明確輸出格式的分析報告,例如分區(qū)域生源、學院、班級展示大學生性格、興趣、思想情況的當前狀況圖、歷史趨勢圖;也可選擇需要的分析角度,查看相關的分析指標和結果。計劃使用可視化工具Tableau進行結果展現。
四、大數據用戶畫像技術應用于高校思想政治教育中可能出現的難點
(一)高校思想政治教育理念和大數據用戶畫像技術的有機結合
可預見的是,通過大數據用戶畫像技術獲得的大學生畫像結果維度肯定是非常多的,和我們以前將大學生簡單地分為三五類或者十幾類不同,大學生畫像的基礎維度很可能就會有幾千種類別。這就需要結合思想政治教育的思路,設計合理的類別規(guī)整方法,從而形成切實有效的思想動態(tài)分類標簽系統。在這個過程中,需要對當前高校思想政治教育理念和大數據用戶畫像技術均有深入理解,才能將兩者有機地結合。
(二)基于大數據的大學生思想動態(tài)標簽體系的建立
當前業(yè)界基于大數據針對用戶的興趣愛好性格等標簽體系已經有比較多的案例,但是針對大學生思想動態(tài)的大數據標簽體系幾乎沒有,同時,這個體系不能是靜態(tài)的,而應該是和時間相關的標簽體系,比如當前的思想動態(tài)標簽、歷史時間段的思想動態(tài)標簽、未來三個月的思想動態(tài)標簽等。
(三)加強數據監(jiān)管,保護學生隱私
如何做到既充分挖掘、分析和利用由大學生網絡行為所形成的海量數據,又重視加強數據監(jiān)管,保護學生隱私。在將大數據技術應用到學生思想政治教育工作中的同時,還需考慮這些數據的挖掘和使用是否會侵犯到學生的隱私以及隱私泄露等問題。因此,需嚴格監(jiān)管數據資源服務平臺,規(guī)范各個機構在使用大數據時的流程和方法,同時加強對重點數據庫的日常監(jiān)控和管理,一旦發(fā)現泄密情況,應立即采取預警機制。
以大數據用戶畫像技術作為出發(fā)點,將大數據的核心技術與高校思想政治教育進行有機結合,實現可以真實有效的大學生思想跟蹤、預警、分析、預測和處理系統。這是利用大數據的用戶畫像技術在高校思想政治教育領域的大膽實踐摸索,而這些實踐思路的初設因為有了前沿核心技術的支持,從實踐結果層面上必然能夠事實落地,從而切實有效地助推高校思想政治教育工作的創(chuàng)新發(fā)展。