張 露,童穎佳,馬 華
(湖南師范大學信息科學與工程學院,長沙 410081)
自2014 年“課程思政”這一理念提出并在上海的部分高校進行試驗,取得了較好的成效。習近平總書記不斷強調學校作為立德樹人的地方,要牢牢抓住思想政治教育工作。2020 年,教育部印發《高等學校課程思政建設指導綱要》[1],高校思政課改革創新,各高校開始逐步探索課程思政模式。由此誕生的思政教育資源互聯網平臺,為教師提供了一些優質課程思政示范課及其配套資源,協助教師完成專業課和思政教育的有機融合。然而,目前已有平臺仍存在如資源分類粒度大、數量有限、搜索困難等問題。
近年來,學者們對課程思政資源的共享和利用進行了研究,但尚缺乏面向高校課程的思政資源的共享與互助平臺的系統性研究。例如,湯宇軒等[2]提出一種基于知識圖譜的課程思政素材庫的構建方案,對課程思政領域進行本體設計、命名實體識別、關系抽取等方法的研究,構建了面向大學生計算機基礎課程的課程思政素材庫。朱麗等[3]闡述了大數據平臺商建立課程教學資源推薦系統的設計、框架及其應用,表示在大數據平臺的基礎上,課程教學資源推薦系統的建設得到推進。龍丹等[4]以CNKI 數據庫中刊載的課程思政的相關文獻為數據來源,對我國高校課程思政研究的趨勢、熱點、問題進行調查分析。汪路金等[5]從繼續教育思政教學出發,指出思政類網絡課程資源的重要性,并提出建設策略。
針對此現狀,我們引入TF-IDF(term frequencyinverse document frequency)中文分詞算法和眾包協同機制,挖掘和整合網絡上現有的課程思政教育資源,聯結多方平臺和參與者以提供一個高校課程思政教育資源共享和互助的全新系統,構建了一個可動態擴充的智慧型課程思政資源庫,即“智慧思政文庫”。
國內已有一些課程思政教育資源平臺,例如,新華思政(xhsz.news.cn)等。非專業教育學習平臺上也散布有許多有借鑒意義和使用價值的課程思政資源,例如,知乎、微博等。面對目前互聯網上眾多的課程思政資源,我們使用Python 開發數據爬蟲,用Scrapy 框架對不同的網站進行爬蟲定制,對它們進行爬取,并分割保存為JSON 格式數據。這些初始的資源數據被處理后存入MySQL數據庫。
對JSON 格式數據進行初步的處理加工。首先,以本校的院系專業劃分以及課程開設為標準,建立基本的學科大類、專業、課程的樹形結構分類。其后,利用TF-IDF 算法從爬取的資源當中提取出關鍵詞,根據關鍵詞判斷資源所屬類別,從而對資源進行分類。最終,將處理過的數據存入本地數據庫,供平臺后續使用。
使用Spring Boot框架和Vue進行平臺的總體設計和開發。主要的模塊包括協同互助模塊、課程思政模塊、討論區模塊、資源檢索模塊、登錄注冊模塊、個人中心模塊等。通過引入眾包協同機制,平臺允許用戶自主上傳資源和資源互助,以進一步擴充資源庫。通過用戶的自主上傳,資源庫得以不斷擴充,而資源協同互助的創新功能,為教師和創作者的各取所需提供了交流和協作的渠道。
本文從新華思政網站、CNKI、知乎、微博等爬取若干課程思政相關的各類資源,如課件、教學視頻、教案等,作為資源庫的一部分,并為之后的標簽提取提供基礎的數據支持,使用基于Python 語言的Scrapy 爬蟲框架,針對不同網頁開發定制個性化爬蟲程序。對爬蟲抓取的原始Web 頁面進行頁面處理,通過去掉Web 頁面中的大量噪聲數據,將Web 頁面轉化為純凈統一的文本格式和元數據格式。
對初步處理得到的文本格式和元數據格式的數據進行進一步的加工,利用TF-IDF 算法提取數據中的關鍵詞,根據關鍵詞判斷資源所屬類別,從而對資源進行分類,包括資源所包含的思政元素、所屬課程、知識點等標簽,將分類后的數據導入數據庫中,作為資源庫初始數據。
本文使用一種改進的TF-IDF 算法[6]提取關鍵詞。首先,計算類別間離散度,類別間離散度越高,詞語的類別區分能力越強。計算公式如公式(1)所示。

之后,計算類別內信息熵,類別內信息熵越高,詞匯的類別區分能力越強。使用公式(2)和(3)計算。
類別間離散度或類別內信息熵越高,類別區分能力越強。因此,引入公式(4)表示特征項對類別Ci的區分能力,即類別判別:
最終得到TF-IDF 的計算公式如公式(5)所示。
其中:wij為特征項t對類別Ci的權重;tfij為特征項tj的詞頻;CD(tj,Ci)為特征項t對類別Ci的類別判別,可由公式(1)~(4)計算。在改進的TF-IDF 算法中,用類別識別CD(tj,Ci)代替逆文檔頻率IDF,從而彌補了傳統TF-IDF 算法沒有考慮特征項的類別內和類別間分布的缺陷。
一方面,利于設定好的爬蟲程序,定時對目標平臺進行資源爬取,根據內容發布時間,過濾掉已經爬取過的內容,處理存入資源庫中。另一方面,設置“協同互助”模塊,用戶通過該模塊所創作的個性化資源,經用戶同意,也將錄入資源庫并公開展示。同時,用戶也可以通過個人中心自主上傳資源。以上兩方面構成了資源庫動態擴展的數據來源,使得資源庫能夠得到智能自主擴充。
平臺所設置的“協同互助”模塊顯示已經發布的用戶需求列表。教師可以發布相關需求,設定所需資源信息;創作者可以搜索感興趣的需求申請承接。當需求有承接申請,教師可自主選定需求的最終承接者。由此產生的需求訂單,平臺將跟蹤需求的完成狀態,并以進度條的形式展示給相關用戶。創作者可以是有閑暇時間且有相關創作技能的非教師用戶、普通教師用戶等,此機制將各類用戶聚合在一起,共同完成資源的最終產出。另外,平臺利用Java-WebSocket 框架,實現了“私信交流”功能,使得教師與創作者能在系統中進行實時交流,教師可隨時提出修改意見,協助成品的不斷完善,便于需求的更好完成。
3.1.1 基于Spring Boot框架的后端設計
(1)建立實體層,其中課程類包括id、名稱、簡介、一級學科、二級學科、目錄、選課人數等屬性;資源類包括id、類型、簡介、上傳時間、名稱、鏈接、標簽、來源、收藏量、下載量、所屬章節等屬性。
(2)建立數據訪問層,封裝對數據庫的訪問,CourseDao.java 和ResourceDao.java 用于對數據庫中的課程信息表和資源信息表進行增刪改查操作。
(3)建立Spring Boot 配置文件,設置Spring Boot 配置文件中的數據庫連接參數和訪問端口信息等。
(4)建立業務層,存放業務邏輯處理,提供控制器層調用的方法。
(5)建立控制器層,接收前端傳過來的參數進行業務操作,并返回對應的數據。
3.1.2 基于前后端分離的系統框架設計
(1)使用Vue 框架編寫前端頁面,使用Axios向后端發送HTTP請求。
(2)后端控制器層從HTTP 請求中獲取信息,提取參數,將其分發給業務層處理不同的服務。
(3)業務層調用數據訪問層對數據庫進行訪問,并將其處理成JSON格式返回給控制器層。
(4)控制器層將數據返回給前端頁面,前端根據不同的數據所在的位置進行頁面的局部刷新。
基于上述設計,“智慧思政文庫”系統包含了協同互助模塊、課程思政模塊、討論區模塊、資源檢索模塊、登錄模塊、注冊模塊和個人中心模塊。系統的功能模塊結構如圖1所示。首頁的界面設計如圖2所示。課程資源的瀏覽界面設計如圖3所示。

圖1 系統功能模塊

圖2 首頁設計界面

圖3 課程資源瀏覽的設計界面
3.2.1 協同互助模塊
在系統提供的第三方技術保障之下,教師基于自己或者其他用戶上傳的教學思路在此發布互助需求,創作者對于資源創作提供技術支持。教師可根據需求復雜度設置創作者人數及其分工。教師與創作者緊密合作,共同參與到資源的開發過程,教師提供資源設計理念和想法,創作者依據教師提出的需求制作出滿足要求的資源。在整個過程中,創作者和教師在私聊區域進行資源內容開發的深入交流,在交流過程中逐步完善個性化資源的制作。制作完成后,教師對制作出的成品進行驗收,結束整個互助流程。同時,平臺將追蹤資源互助完成進度,推動創作流程的順利進行,促進生成更多優質資源。
3.2.2 課程思政模塊
系統將資源所屬課程根據學科大類進行分類,用戶點擊對應課程可查看相關的資源,資源類型分為課件、教案、思路、視頻、論文。同時平臺內的用戶也可以進行資源上傳操作,實現資源共享,用戶上傳的資源若評分較高,可以提升平臺內的信譽值。
3.2.3 討論區模塊
該模塊功能是發布問題以及回答問題,其中問題分為普通問題以及付費問題,付費問題用于激勵平臺內用戶輸出更為專業的解答,用戶可以在個人中心修改付費問答的基本信息,以及選擇最優回答給予酬金。
3.2.4 資源檢索模塊
檢索的內容包括平臺內的資源、需求、問題以及回答,根據用戶在平臺內資源的瀏覽記錄、資源評分、創作記錄等信息,分析用戶潛在的資源瀏覽偏好,使用混合推薦算法對數據庫中檢索資源進行過濾及排序。
3.2.5 登錄模塊
用戶提交登錄信息后,向Spring Boot 控制器層發送登錄驗證請求,訪問數據庫獲取持久化對象,當對象密碼校驗正確時,用戶成功登錄系統,以便系統對用戶提供資源協同互助的支持及個性化的資源推薦。
3.2.6 注冊模塊
用戶提交注冊信息后,向Spring Boot 的控制器層發送注冊請求,為用戶生成持久化對象存儲于數據庫中。其中注冊信息包括用戶名、密碼、所在專業、感興趣的思政元素及課程等,以解決用戶初始登錄系統資源推薦冷啟動問題。
3.2.7 個人中心模塊
該模塊用于公開展示用戶的個人信息,包括用戶名、所在院校、所在專業、自我介紹、興趣愛好等,并提供用戶的資源訪問入口,包括互助情況、討論情況、所發布的資源等。對用戶本人開放資源制作進度追蹤,確保雙方能在指定時間完成資源制作。
本文開發的基于中文分詞算法和眾包協同的高校思政教育資源共享和互助系統,使用了Python爬蟲、Spring Boot和Vue技術,基于Scrapy爬蟲采集互聯網上的課程思政資源,利用TF-IDF 改進算法提取關鍵詞并將其關聯到知識點,通過用戶的資源協同互助實現資源庫的動態擴充,該系統借鑒了眾包和協同思想,使用界面簡潔清晰,可為從事教學改革的高校教師和從事資源開發的專業技術人員搭建合作共贏的平臺。可為廣大教師提供課程思政教學的輔助支持,具有良好的應用價值。未來研究中,我們擬引入知識圖譜技術對資源所包含的思政元素及知識點間的關聯關系建模,進一步提高用戶資源搜索的滿意度和效率。