999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于教育部智慧大腦中臺的職業院校數據治理與應用研究

2024-12-12 00:00:00陸穎
電腦知識與技術 2024年29期

關鍵詞:智慧大腦;諾蘭模型;ETL工具;數據倉庫分層;數據孤島

0 引言

黨的二十大報告提出:“推進教育數字化,建設全民終身學習的學習型社會、學習型大國。”這是“推進教育數字化”首次被寫入黨代會報告,標志著教育數字化轉型進入了新的歷史階段。為貫徹落實國家教育數字化戰略行動,進一步推進全國職業院校數字校園建設工作,教育部發布了《全國職業教育智慧大腦院校中臺(高職/中職)數據標準及接口規范(試行)》和《全國職業院校大數據中心建設指南》,為職業院校數字化轉型提供了新要求、新標準、新思路[1]。在人工智能、云計算、機器學習等新一代信息技術的推動下,海量教育數據不斷涌現,教育數字化轉型已成為必然趨勢[2]。然而,當前高職院校在數據管理方面仍面臨著數據標準不統一、數據質量參差不齊、數據匯聚整合困難、數據共享缺乏管控等問題,嚴重制約著學校數字化轉型的進程。

為破解高職院校數據治理難題,本文以常州紡織服裝職業技術學院為例,探索構建基于教育部智慧大腦中臺的校本數據智能采集與推送平臺,為職業院校數據治理提供參考和借鑒。

1 數據管理現狀與問題分析

1.1 數據標準不統一、數據質量參差不齊

在信息化建設初期,高職院校普遍缺乏頂層設計和統籌規劃,導致各類業務管理系統各自為政,形成了典型的“煙囪式”架構。由于各個系統的數據存儲結構不一致,缺乏統一的數據標準[3],導致數據難以關聯匯總和分析,形成“數據孤島”現象。此外,由于功能缺陷、管理缺位、操作不當等原因,數據缺失、格式不統一等數據質量問題普遍存在[4],例如學生籍貫信息填寫不規范等。這種參差不齊的數據質量狀況,嚴重影響了學校基于數據的科學決策和管理效率,給教學質量評估、資源配置等工作造成困擾[5]。

1.2 數據匯聚整合困難、數據共享缺乏管控

各部門獨立運作的信息系統在數據格式、接口標準和存儲方式上存在差異,導致學校數據難以互聯互通,需要進行復雜的數據轉換和適配工作。同時,由于缺乏明確的數據共享政策和規范,數據共享存在較大的隨意性和風險性,容易造成學生個人隱私信息、學校財務信息等敏感數據泄露和濫用。此外,數據共享缺乏有效的監督和評估機制,共享過程中的不當行為難以及時發現和糾正。

2 教育部智慧中臺的研究分析

2.1 頂層設計先行

數據是重要的戰略資產和生產要素,高職院校應高度重視數據治理工作,將其作為一項系統工程來抓。在數據治理過程中,要堅持頂層設計先行,制定科學合理的數據戰略、構建完善的數據治理體系、建立健全的數據全生命周期管理機制。具體而言,在數據戰略方面,院校需要明確數據在學校發展中的定位和作用,確定長期的數據發展目標和方向,并將其納入學校整體發展規劃。在數據治理體系方面,要明確各部門在數據管理中的職責和權限,制定統一的數據標準和規范,建立數據質量控制和數據安全保障機制。在數據全生命周期管理機制方面,要涵蓋數據的產生、采集、存儲、處理、分析、應用和銷毀等各個環節,確保數據在各個環節的安全性和合規性。

2.2 數據標準與數據架構設計

數據標準是數據治理的基礎,統一的數據標準是實現數據共享和互操作的前提。高職院校應在參考國家和行業標準的基礎上,結合學校實際情況,制定統一的數據標準,包括數據元、參考數據、主數據、指標數據等。

數據架構設計是數據治理的藍圖,合理的架構設計能夠有效地組織和管理數據,提高數據的可用性和價值。在數據架構設計方面,可以參考教育部智慧大腦中臺的架構設計理念,構建以數據倉庫為核心的數據管理平臺。數據倉庫可以集中存儲學校各個業務系統的數據,并對數據進行清洗、轉換、整合,為學校提供統一的數據服務[6]。

2.3 數據安全與隱私保護

在數據治理過程中,要高度重視數據安全和隱私保護,建立健全數據安全管理制度,明確數據安全責任,加強數據安全技術防護,防止數據泄露、篡改和濫用。要嚴格遵守國家有關法律法規,加強對學生個人信息的保護,明確數據收集、使用、存儲、傳輸等環節的安全要求,建立數據安全應急預案,定期開展數據安全風險評估和安全審計工作,確保學校數據安全。

3 校本數據智能采集與推送平臺

3.1 功能概述

諾蘭模型[7]是描述信息系統發展階段的抽象化模型,它將信息系統的成長過程劃分為起步、擴展、控制、集成、數據管理、成熟6個階段。參照諾蘭模型的成長階段,職業院校信息化建設過程可劃分為煙囪式建設初期、集成式建設中期和數據管理與智能應用后期,如圖1所示。

參照諾蘭模型,職業院校信息化建設已進入“數據管理與智能應用”階段。面對數據孤島、數據共享困難等問題,該校第一時間組織梳理數據資產,厘清全校業務系統,分析整合現有數據資源,以ETL工具為數據抽取底座,采用數據倉庫分層設計思路搭建校本數據智能采集與推送平臺。

該平臺協助該校完成與教育部全國職業教育智慧大腦院校中臺85張表的數據對接工作,形成常態化數據治理機制,助推學校高質量發展。

3.2 數據采集

1) 界面化填報。針對學生畢業升學、就業、未就業等暫無系統對接的業務情景,該平臺利用低代碼表單引擎靈活定制文本、下拉、日期等格式的數據字段,依據推送要求,完成設置字段是否為必填項,在表單界面完成數據錄入后,通過流程審批的方式對數據層層把關,有效保證填報質量。該采集方式解決了無數據源對接的難題,但填報時效性差。

2) 模板匯總導入。對于產學合作類等暫無系統對接且涉及產教處、教務處等多部門協作的業務情況,該平臺提供采集模板進行數據收集,標準引用代碼在模板中為下拉項。數據歸口部門負責數據收集工作,協作部門配合提供相關數據。這種采集方式提高了部門之間的合作意愿,一定程度上解決了因部門數據標準不統一導致的數據質量偏低問題。但是,采集時效性較差,數據質量受人為因素影響較大。

3) 數據對接。對于教學、科研、服務管理類等可進行數據對接的業務情景,該平臺利用開源KETTLE[8]工具從關系型數據庫、文件、非關系型數據庫等數據源抽取源數據,參照數據集標準,對源數據進行數據清洗、聚合、格式轉換、字段映射以及加解密,最后完成數據裝載,實現全流程自動化數據傳輸,具體工作原理如圖2所示。

數據對接方式顯著提高了采集效率,降低了數據質量受人為因素的影響,但學習成本高,技術難度大,對接過程容易造成數據泄露等安全隱患。

3.3 數據同步

數據同步分為全量同步和增量同步兩種模式。全量同步將數據源中的全部數據一次性傳輸至數據集。增量同步傳輸自上次同步后新增或者修改的數據。全量同步操作簡單,數據不易丟失,但同步時間較長。反之,增量同步耗時短,適用于數據實時性要求較高的場景。

該同步模塊采用B/S 架構,通過SpringBoot+Vue 實現前后端分離。后端采用基于MVVM 模型的SpringBoot 框架搭配RabbitMQ消息隊列的方式保證同步任務有序執行。前端使用Vue+Element-UI的方式開發管理界面,實現可視化配置數據源連接信息與計劃任務功能。

該校使用“首次全量+永久增量”的同步策略。在初次同步時使用全量同步建立基準數據,然后使用增量同步進行日常的數據更新和變化跟蹤。這種混合策略確保了數據一致性、提高了同步效率、降低了資源消耗。

3.4 數據推送

數據推送模塊包含表字段映射、推送規則設置、數據校驗、數據推送、結果查詢等功能,覆蓋了數據推送的全生命周期。

推送平臺對推送表結構與清洗轉換后的表結構進行字段映射,根據預先配置的計劃任務同步85張表數據集合,對待推送數據集進行數據內容與關聯性校驗,最后依據推送規則上報合規數據。

在數據上報過程中,為規避全量數據上報耗時長、能耗大等弊端,該校采用比對特征值的方式增量上報變更數據,特征值計算方法如式(1) 所示:

式中:tzz表示特征值,valuei表示數據子類表中第i 個數據項值,md5[9]對數據項集合進行哈希計算,輸出32位長度數值,利用tzz校驗數據完整性,當tzz變化時表明數據有變更,tzz不變時表明數據未發生更新,平臺上報tzz變化的數據集合。

3.5 數據看板

數據看板通過FineReport技術搭建而成,主要包含數據質量監控、數據分析報表、數據預警等模塊,對多維度數據進行分析展示,直觀反映學校發展現狀,助力院校實現數據驅動的管理和決策。

數據質量監控模塊對照八大數據集指標項對每日推送數據進行質量監測,采用柱狀圖、條形圖、餅圖等圖表方式展示歷史數據推送質量。

同時,參照教育部職教大腦監測大屏,深刻理解各數據指標計算公式,搭建校本數據分析報表,實時呈現數據上報狀況。

數據預警模塊對異常數據進行告警。對在上報周期前尚未完成數據準備的部門進行消息提醒,提高了數據上報的時效性。通過列表方式展示推送失敗數據集合,方便數據歸口部門直觀發現并修正錯誤數據。

3.6 平臺設計架構

1) 數據倉庫分層設計。考慮到院校數據復雜多變、安全性要求高等特點,建立與業務需求、組織結構以及管理流程匹配的數據模型尤為重要。為了提高數據的采集、管理、流轉和使用,實現對數據從接入、存儲、開發、輸出到展示的全生命周期管理,該平臺采用數據倉庫分層模型[10],如圖3所示。

該模型將數據倉庫劃分為ODS、DWD、DWS、ADS 四個層次。其中ODS即操作數據存儲層,用于存儲從學校各業務系統實時或定期抽取最細顆粒度的原始數據,包括學生信息、課程信息、教學活動數據等,形成數據湖;DWD即數據倉庫明細層,對ODS層的數據進行清洗、轉換、規范化、關聯整合等處理,構建出更清晰、準確、一致的明細數據;DWS即數據倉庫匯總層,在DWD層基礎上進行一定程度的聚合和匯總,形成主題相關的、具有一定概括性的數據集合。例如,從學年、專業等維度對學生升學與就業情況進行匯總。ADS即應用數據存儲層,對DWS層數據進一步加工和定制,以直接支持院校特定的業務功能和數據分析場景。

2) 調度中心。該平臺搭建任務調度中心[11],統一管理數據同步、數據集成、數據推送等作業計劃。

調度中心從各數據源抽取教學、科研、黨建類校本數據至本平臺,形成數據湖,統一調度數據處理計劃任務,將清洗轉換后的數據裝載至目標庫,依據字段映射計劃任務將處理后的數據集合映射至推送平臺目標表,最后依據推送規則統籌調配資源完成數據推送作業。

該調度中心實時記錄所有計劃任務的執行狀態,當任務執行失敗時能夠對預先設定的郵箱發送告警信息,以便管理員及時知曉任務執行狀況。同時,能夠在線修改生效cron表達式,在異常作業修復后可快速進行二次執行,顯著提高了運行效率。

該調度中心合理分配系統資源,確保計劃任務運行穩定,同時具備可視化監控與管理功能,能夠實時查看任務列表、任務狀態、執行日志等信息,實現了對定時任務的統一管理。

4 結束語

在深刻剖析教育部智慧大腦中臺建設內容的基礎上,構建出以數據倉庫分層為核心的校本數據智能采集與推送平臺。該平臺解耦數據收集與數據推送功能,提高了數據處理效能。但是,平臺使用的KETTLE工具學習成本高,難以采集非結構化數據。如何利用AI技術采集非結構化數據將是下一步的研究方向,比如利用教室監控收集學生簽到率與認真聽課率;對招聘網站進行爬蟲,計算課程專業市場匹配度;對教學云平臺學生作業進行AI評估,智能分析學生知識薄弱點等。

主站蜘蛛池模板: 超清无码一区二区三区| 国产区在线观看视频| 久草网视频在线| 欧美一区二区精品久久久| 亚洲,国产,日韩,综合一区 | 免费亚洲成人| 久久这里只有精品免费| 视频二区亚洲精品| 91精品亚洲| 国产成人精品亚洲日本对白优播| 亚州AV秘 一区二区三区| 中文字幕丝袜一区二区| 婷婷成人综合| 亚洲乱码精品久久久久..| 欧美色视频网站| 狼友视频国产精品首页| 国产一区在线观看无码| 欧美狠狠干| 亚洲永久色| 亚洲成年人片| 亚洲精品中文字幕午夜| 欧美区一区| 在线色综合| 国产乱子伦手机在线| 综合色在线| 日韩精品久久久久久久电影蜜臀| 国产免费怡红院视频| 国产精品视频公开费视频| 亚洲天堂日韩在线| jizz亚洲高清在线观看| 免费又黄又爽又猛大片午夜| 国产精品三区四区| 97se亚洲| 国产96在线 | 99er精品视频| 亚洲AV一二三区无码AV蜜桃| 久久www视频| 99热这里只有精品5| 国产精品爽爽va在线无码观看| 国产精品成人AⅤ在线一二三四| 国产色婷婷| 国产精品国产三级国产专业不| 欧美激情二区三区| 91www在线观看| 午夜毛片免费看| 国产精品久久久久久久久久98| 久久人搡人人玩人妻精品| 熟女日韩精品2区| 欧美区国产区| 日韩精品欧美国产在线| 久久久亚洲国产美女国产盗摄| 新SSS无码手机在线观看| 国产在线无码av完整版在线观看| 伊人国产无码高清视频| 亚洲嫩模喷白浆| 99这里只有精品在线| 福利小视频在线播放| 2021精品国产自在现线看| 亚洲天堂网站在线| 婷婷激情五月网| 国产成人综合日韩精品无码首页| 精品国产免费第一区二区三区日韩| 亚洲精品视频免费看| 2020极品精品国产| 亚洲欧美日韩成人在线| 国产中文在线亚洲精品官网| 日韩无码真实干出血视频| 欧美综合成人| 亚洲第一黄色网址| 91久久国产综合精品女同我| 狠狠亚洲婷婷综合色香| 凹凸精品免费精品视频| 国产亚洲男人的天堂在线观看| 久久精品欧美一区二区| 色欲色欲久久综合网| av大片在线无码免费| 国产白浆视频| 亚洲丝袜第一页| 国产精品福利尤物youwu| 尤物国产在线| 98精品全国免费观看视频| 国产成人精品第一区二区|