李 明,吳 迪
(1.安徽汽車職業技術學院,安徽 合肥 230000;2.安徽江淮汽車股份有限公司,安徽 合肥 230000)
大學生是祖國的未來,大學生的健康成長關系到祖國未來的繁榮昌盛。全面、準確、客觀了解大學生的行為動態是開展大學生教育工作的關鍵,高校輔導員要結合大學生的行為動態來具有針對性地開展思想政治教育,才能更好地引導大學生樹立正確的人生觀、世界觀和價值觀。目前大部分輔導員對大學生的思想政治教育主要是以課堂教育為主,不能夠很好地了解大學生的思想及行為動態,特別是在當前的網絡時代背景下,大學生具有思想活躍、好奇心強、內心脆弱敏感等特點,這對高校輔導員的工作提出了更高的要求,大學輔導員的工作面臨巨大的挑戰[1]。聚類分析是將物理或者抽象對象的集合分組為多個類的過程,在計算機科學、社會人文科學、教育學等領域具有十分廣泛的應用。為了大學輔導員全面、及時了解大學生的行為動態,從而更加具有針對性地開展思想政治教育工作,采用網絡爬蟲來獲取大學生微博及微博評論的內容,同時提取關鍵詞,在此基礎上采用FCM聚類算法獲得大學生的行為動態,從而在大學生的思想動態和微博及微博評論之間建立關系。
了解大學生的行為動態可以借助于大學生的QQ空間說說、微博等發布的內容,通過大學生微博發布的內容以及對微博的評價內容來了解大學生的思想動態。建立大學生行為動態評估模型主要包括兩個部分:第一部分是采用網絡爬蟲的手段來獲取大學生微博和微博評論數據,如大學生的學生社團微博、學校的官方微博、各個學院的官方微博、各個班級的微博以及大學生個人的微博等等,同時對抓取的微博數據提取關鍵詞[2];第二部分是采用FCM聚類算法來進行聚類分析,通過聚類分析的結果掌握在某一段時間內大學生的行為動態[3]。聚類分析將抓取的關鍵詞分為若干類別,同時通過對大學生所關心話題類型的分析,高校輔導員就可以更為準確、快速掌握大學生的近期思想動態。建立的基于聚類分析算法的大學生行為動態評估模型流程如圖1所示。
由圖1可見,大學生行為動態評估模型包括三步:首先是采用網絡爬蟲計算機程序對大學生微博及評論的抓取,所抓取的大學生微博及評論應該具有典型性,同時要覆蓋絕大部分的內容和信息,這樣才能確保評估結果的準確性、客觀性,否則評估的結果就不能夠作為高校輔導員開展大學生思想政治教育的參考。其次是對所抓取微博及評論內容的解析,從而獲得相應的關鍵詞。最后是采用FCM聚類算法來進行聚類分析,通過聚類分析來了解當前一段時間內大學生的關注熱點,為大學輔導員開展大學生思想政治教育工作提供參考。
設n個樣本數據x={x1,x2,…,xn},中心點集合為{v1,v2,…,vc},C為聚類的類別數,U為分類矩陣,μik為樣本xi對于類Ak的隸屬度,則目標函數Jb為[5]:
(1)
(2)
(3)
公式(1)(2)(3)中,m為樣本特征數;i=1,2,…,n;δik為樣本xi與第k個樣本中心的歐式距離;b為加權參數。樣本xi對于類Ak的隸屬度為:
(4)
令Ik={i|2≤c (5) FCM聚類過程就是反復調整聚類中心使得目標函數最小的過程。 為了更好地了解安徽省高校大學生2020年1月到2020年6月的思想行為動態,采用URL鏈接與網絡爬蟲抓取了某高校內部的官方微博、社團微博、各個院系的微博以及各個班級的微博,對部分的關鍵詞進行了抓取[6]。本次采用URL鏈接與網絡爬蟲所抓取的關鍵詞有公務員考試、思想政治教育、就業、研究生入學考試、考研、985高校等。 采用所建立的大學生行為動態評估模型可以更好地掌握該高校大學生在2020年1月到2020年6月這6個月時間段的動態,從而更好地幫助大學生克服心理上的困難,對大學生實施更加具有針對性的思想政治教育,使得大學生樹立正確的人生觀、世界觀和價值觀。采用URL鏈接與網絡爬蟲來抓取某高校內部的各種微博,提取所抓取的關鍵詞,同時采用詞云圖的方式將關鍵詞顯示出來,結果如圖2所示。 圖2 詞云圖 由圖2可知,在2020年1月到2020年6月這段時間,出現頻率比較高的關鍵詞是疫情、防控、組織、社會、捐贈等,這反映了這段時間某高校的大學生對新型冠狀病毒和疫情防控給予了廣泛的關注,是這段時間關注的熱點問題。采用詞云圖的方式只能在宏觀上給予展示,不能夠查看在這一段時間內某高校的大學生所關注的熱點話題。采用FCM對獲取的數據進行聚類分析,結果如圖3所示。 圖3 聚類分析結果 由圖3可見,排在前幾位的詞匯分別是疫情、組織、捐贈、社會、協會、肺炎、物資和口罩等,說明這段時間該高校的大學生對新型冠狀病毒疫情的發展、防控、捐贈與組織等內容給予了廣泛的關注。由此可見,該階段大學生重點關注的是新型冠狀病毒疫情,從一個側面反映了大學生關心國家大事、熱愛生命、思想積極向上。作為該高校的輔導員在開展思想政治教育工作的過程中不能夠刻意地回避新型冠狀病毒疫情較為嚴重的問題,而是應該采取科學引導的方式來引導大學生正確認識新型冠狀病毒疫情,積極做好宣傳和科學防護,引導大學生正確看待和分析當前熱點問題,為大學生提供具有針對性的思想政治疏導。 為及時掌握大學生的思想行為動態狀況,本研究建立了基于FCM聚類分析算法的大學生行為動態評估模型。運用網絡爬蟲技術抓取大學生的微博及評論內容,提取微博及評論的關鍵詞,通過FCM聚類分析和詞云宏觀展示大學生的關注熱點,對及時了解和掌握大學生的思想行為動態具有重要意義,為大學思政工作者提供了科學分析大學生思想動態的新方法。然而,大學生思想行為活動較為活躍和復雜,本研究主要通過網絡動態內容了解大學生的思想行為動態,可能內容全面性不夠,后續將從更多方面了解和掌握大學生的思想行為動態。3 大學生行為動態評估實例分析
3.1 爬蟲抓取微博及評論
3.2 大學生行為動態評估結果分析


4 結論