摘要:文章以交通大數據分析與處理課程為研究對象,探討了基于知識圖譜的課程知識體系構建,以解決課程資源融合不足、內容更新滯后和資源組織混亂等問題。通過分層結構設計(數據層、模式層、應用層) ,并結合跨學科團隊協作,構建了一個全面、動態且智能化的課程知識圖譜,同時利用Neo4j實現了圖譜的可視化與動態更新。研究結果表明,該知識圖譜有效提升了課程教學效果,推動了高職教育改革與創新,為應對未來社會挑戰提供了有力支持。
關鍵詞:課程體系;知識圖譜;可視化
中圖分類號:TP391" " " 文獻標識碼:A
文章編號:1009-3044(2025)28-0058-04
開放科學(資源服務) 標識碼(OSID)
0 引言
在人工智能、大數據和區塊鏈技術的驅動下,社會進入數據智能時代。如何應對時代變化對社會發展和人才培養的影響,是我國教育亟須轉變傳統人才培養理念與模式的動因[1]。《教育部2022年工作要點》強調了“實施教育數字化戰略行動”的重要性,旨在利用信息化與數字化技術促進教學方式的創新和教學效率的提升,進而以高水平教育數字化引領教育現代化。
知識圖譜作為一種結構化的知識表示方法,可以將課程知識點的層次結構、知識點間的關聯關系以及相關資源等信息進行整合和展示,并挖掘隱藏在其中的知識和潛在價值[2]。同時,借助可視化技術,可以以圖形化的方式呈現知識圖譜,使其更易于理解和應用。這對于課程規劃、學習資源推薦、職業規劃和教學質量評估等方面都具有重要的輔助和指導作用[3]。
因此,研究高職課程知識圖譜的構建是十分必要的。本文以交通大數據分析與處理課程為研究對象,進行基于知識圖譜的課程知識體系研究與構建,以期進一步推動高職教育的改革和創新。
1 課程知識圖譜構建研究
1.1 知識圖譜介紹
2012年,谷歌(Google) 公司正式提出了知識圖譜(Knowledge Graph) 的概念。知識圖譜本質上是一種語義網絡,以有向圖結構描述現實世界中的實體及其關系,并以符號形式呈現。知識圖譜以三元組(實體1—關系—實體2) 的形式表示,圖中的節點代表實體或概念,邊代表實體或概念之間的關系[4]。知識圖譜是一種新的知識表示方法,改變了傳統的信息檢索方式。知識圖譜技術在教育領域發揮著越來越重要的作用。通過建立教育領域的知識圖譜,可以挖掘出課程之間的相關性、依賴關系和概念的先決條件關系,從而促進教育領域的知識組織和管理,提高學習效率。
1.2 交通大數據分析與處理課程存在的問題
交通大數據分析與處理是本校大數據技術專業中一門結合交通行業與大數據技術的專業核心課程。該課程涵蓋大數據技術核心知識和交通行業業務知識,具有跨學科和實踐性要求高的特點。隨著交通行業的快速數字化轉型和大數據技術的迅猛發展,該課程在建設和實施過程中主要存在以下幾方面問題。
1.2.1 缺乏融合交通行業與大數據技術的資源
目前,市面上關于大數據技術的教材較多,但專門針對交通行業的大數據教材較為稀缺。現有教材往往將交通行業知識與大數據技術知識割裂,缺乏系統化的整合與深度融合,難以滿足學生對跨學科知識體系的學習需求。此外,課程資源(如案例庫、實驗數據集、行業標準等) 的匱乏也制約了教學效果的提升。
1.2.2 課程內容更新滯后于行業發展
交通大數據領域的技術更新速度極快,新技術、新工具和新方法層出不窮。然而,課程內容往往滯后于行業發展,難以將最新的技術成果和實踐案例及時納入教學體系。例如,智能交通系統中的實時數據處理技術、基于人工智能的交通預測模型等前沿內容在現有課程中尚未得到充分體現。
1.2.3 課程資源難以有效組織與高效獲取
隨著信息化的發展,交通大數據分析與處理課程資源的形式日益多樣化,包括文本、視頻、案例庫、實驗平臺、在線工具等。然而,這些資源往往分散在不同的平臺和系統中,缺乏統一的組織和管理,導致學生在學習過程中難以高效獲取所需資源。此外,資源之間的關聯性未被充分挖掘,學生難以形成系統化的知識體系。這種資源分散、組織混亂的現狀不僅降低了學習效率,還增加了教師的教學負擔。
2 交通大數據分析與處理課程知識圖譜構建思路
2.1 課程知識圖譜設計思路
在構建交通大數據分析與處理課程的知識圖譜時,本研究針對課程教學問題,依托知識圖譜進行教學改革,基于知識圖譜構建框架,構建流程采用了分層結構,以確保知識的系統性和可擴展性。知識圖譜的設計思路主要包括數據層、模式層和應用層三個部分。通過這三個層次的協同工作,能夠構建一個全面、動態且智能化的課程知識體系。交通大數據分析與處理課程知識圖譜構建思路如圖1所示。
2.1.1 數據層構建
數據層的構建是知識圖譜的基礎,它涉及數據的收集、導入和預處理。數據層涵蓋了課程所需的各種數據類型,包括結構化數據、半結構化數據和非結構化數據。
1) 收集數據。從權威教材、電子教案、微課視頻等來源獲取非結構化數據,同時利用Python工具從網絡平臺(如百度百科、學術數據庫等) 抽取半結構化數據。
2) 數據預處理。使用文字識別工具將紙質教材轉換為電子文本,便于分析處理;對收集的數據進行清洗,包括去除無用信息、修正錯誤、分詞和去停用詞等,以提高數據質量。
2.1.2 模式層構建
模式層的構建是對數據層的抽象和建模,用以定義知識圖譜中的實體、屬性和關系類型及其約束條件。
1) 本體構建。定義課程知識圖譜中的實體、關系和屬性,明確數據層中實體和關系的語義條件。
2) 知識抽取。通過實體識別、關系抽取和屬性抽取等技術,從預處理后的數據中提取知識,形成知識圖譜的底層數據。
2.1.3 知識融合與優化
在數據層和模式層構建完成后,須對抽取的數據進行進一步的融合和優化。
1) 知識融合。通過機器語言標注進行知識融合,包括模式對齊、實體對齊、屬性對齊、指代消解和知識更新等,以解決數據中的模糊和重復問題。
2) 數據庫完善。對構建的數據庫進行完善,確保數據的準確性和嚴謹性,為知識圖譜的構建提供高質量的數據支持。
2.1.4 應用層構建
應用層的構建是將知識圖譜應用于教學和學習過程中,以實現個性化學習和教學效果提升。例如,根據學生的學習數據,利用機器學習或數據挖掘技術推薦適合的學習路徑,實現個性化學習路徑推薦;可利用知識圖譜的可視化特性,采用項目式學習、案例分析等教學方法,提高教學效果,進行課程教學模式創新等。
2.2 組建課程知識圖譜開發團隊
知識圖譜的構建是一項系統性工程,需要跨學科、跨領域的專業知識與技能,因此組建一支高效、協同的課程知識圖譜開發團隊是關鍵環節。本團隊的組建充分考慮了課程特點、知識圖譜構建需求以及各成員的專業背景與能力,旨在打造一個多元化、專業化、協同化的團隊。
1) 課程教學專家。課程教學專家是團隊的核心成員,由具有豐富教學經驗的課程主講教師擔任,根據課程的教學目標、知識體系以及學生的學習特點,為知識圖譜的構建提供教學邏輯和內容支持。其主要職責包括:梳理課程的知識點及其層次結構,確定知識圖譜的核心內容框架;提供教學案例和實踐經驗,確保知識圖譜與教學需求緊密結合。
2) 行業企業專家。行業企業專家是連接課程內容與實際應用的重要橋梁。本研究聘請浙江交通集團、浙江華為通信技術有限公司、浙江中控信息技術有限公司等交通大數據相關企業的專家,為知識圖譜提供行業最新技術動態和實踐案例。其主要職責包括:提供交通大數據領域的實際應用場景和數據資源;協助設計知識圖譜中的實踐教學模塊;參與知識圖譜的實用性評估與優化。
3) 學生代表。學生是知識圖譜的最終使用者,他們的參與能夠確保知識圖譜的設計符合學生的學習需求。從大數據技術專業各年級分別選取優秀學生代表。其主要職責包括:提供學習過程中的痛點和需求反饋;參與知識圖譜的試用與優化;協助設計知識圖譜的用戶界面和交互體驗。
3 交通大數據分析與處理課程知識圖譜構建實施
3.1 知識數據的獲取與組織
課程知識數據的收集是構建交通大數據分析與處理課程知識圖譜的第一步,知識數據的獲取直接關系到圖譜的全面性、完整性及前沿性。課程知識體系包含三個層級,分別為知識領域、知識單元與知識點[5]。知識領域對應課程,知識單元對應教學單元,知識點對應教學知識點。以《高等職業教育專科大數據技術專業教學標準》、學校課程標準等為依據,對交通類企業及信息類企業進行交通大數據分析與處理崗位的能力調研,明確崗位需要掌握的知識內容,并結合網絡前沿知識,將交通大數據分析與處理課程分為6個知識單元,具體如表1所示。
在知識數據獲取過程中,主要從以下幾個來源收集數據:
1) 課程教材與教案。從權威教材和教師提供的電子教案中提取課程的核心知識點、教學內容、實驗資料。
2) 交通數據資源。從學校數字公路應用技術浙江省工程研究中心、校內交通大數據平臺等實驗平臺和數據庫中獲取交通大數據的實驗數據,如交通流量數據、傳感器數據等。
3) 網絡資源。利用Python工具從網絡爬取相關的學術資源,補充課程的前沿知識,并利用人工智能和大模型進行知識的挖掘。
4) 微課視頻與在線資源。依托分院省級教學資源庫“智能交通資源庫”和智慧職教、超星學習通等在線學習平臺獲取教學課件、微課視頻、實驗指導書等教學資源內容,豐富知識圖譜的多媒體資源。
3.2 知識抽取
在本課程的知識圖譜中,實體主要來源于先前梳理的交通大數據相關核心知識點。由課程教學專家和行業企業專家采用人工標注的方式來定義這些實體,以確保實體的準確性。在交通大數據分析與處理課程中,知識點之間的關系主要存在三種類型:前置知識、后置知識和包含關系。其中,前置知識指的是某個知識點是學習另一知識點的前提條件;后置知識則表示某個知識點是在掌握了先前知識點之后進行學習的知識點;包含關系則指一個知識點是另一個知識點的子集或組成部分。課程知識圖譜關系如圖3所示。
3.3 圖譜可視化
圖譜可視化使得復雜的知識關系變得直觀易懂,便于用戶探索和理解。本文采用Neo4j作為圖數據庫來存儲和可視化知識圖譜。Neo4j是一個高性能的圖數據庫,專為處理復雜的網絡數據而設計,它使用節點、關系和屬性來表示和存儲數據[6]。在Neo4j中,根據定義好的本體模型構建圖譜,包括創建節點、定義節點屬性、建立節點間的關系等步驟。構建知識圖譜的第一步是將前面步驟中抽取的實體和關系導入Neo4j數據庫中,須確保所有的數據都符合Neo4j的數據模型,即節點和關系的結構。圖4為交通大數據分析與處理課程知識圖譜,該圖譜展示到了第4層節點,根節點為課程名稱,第二層節點為知識單元。
3.4 知識圖譜的動態更新
知識圖譜的動態更新是確保交通大數據分析與處理課程內容始終保持前沿性和準確性的關鍵過程。隨著交通大數據領域的快速發展,新的理論和實踐不斷涌現,課程知識圖譜需要定期更新以反映這些變化。為了實現知識圖譜的動態更新,須建立一個有效的更新機制,包括以下幾方面:
1) 定期審查。每學期對知識圖譜進行一次審查,以確定哪些內容需要更新或添加。
2) 事件觸發。新知識、新理論的提出或新技術的應用等均可觸發更新流程。
3) 用戶反饋。收集教師和學生的反饋,并根據這些反饋對知識圖譜進行調整和優化。
4 結束語
本文提出了一種基于知識圖譜的交通大數據分析與處理課程知識體系構建方法,實現了知識圖譜的可視化與動態更新,為課程教學提供了直觀、高效的知識呈現方式。該知識圖譜能夠有效提升課程教學效果,促進學生對跨學科知識的理解與應用,推動高職教育的改革與創新。后續工作將進一步完善知識圖譜的動態更新機制,結合更多前沿技術,探索其在其他課程中的應用,為教育數字化轉型提供更廣泛的支持。
參考文獻:
[1] 何克抗. 21世紀以來的新興信息技術對教育深化改革的重大影響[J]. 電化教育研究,2019,40(3):5-12.
[2] 黃恒琪,于娟,廖曉,等. 知識圖譜研究綜述[J]. 計算機系統應用,2019,28(6):1-12.
[3] 劉梅娟,余冰冰,方草. 基于知識圖譜的智能會計課程體系構建研究[J]. 財會通訊,2024(13):160-164,171.
[4] HAO X, JI Z, LI X. Construction and application of a knowledge graph[J]. Remote Sensing, 2021,13(13): 2511.
[5] 潘迪,沈祥春,陳妍. 藥理學課程知識圖譜設計與建設初探[J]. 衛生職業教育,2024,42(18):41-44.
[6] 吳賽賽,周愛蓮,謝能付,等. 基于深度學習的作物病蟲害可視化知識圖譜構建[J]. 農業工程學報,2020,36(24):177-185.
【通聯編輯:王力】