房曉陽(yáng) 肖長(zhǎng)水
(蘇州市職業(yè)大學(xué)信息中心,江蘇蘇州 215000)
隨著疫情的不斷發(fā)展,高職院校常態(tài)化和持久化的防控對(duì)相關(guān)信息化建設(shè)提出了更高的要求,如何采用科技手段進(jìn)行低成本和無(wú)感知的防控是擺在教育信息化工作者面前的一道難題[1-4]。疫情期間的信息化建設(shè)基于以往的智慧校園建設(shè)內(nèi)容,防疫應(yīng)用并非是獨(dú)立于智慧校園體系之外的,而是與前期的建設(shè)相輔相成、密不可分的[5-8]。以蘇州市職業(yè)大學(xué)為例,前期已經(jīng)積累完成了學(xué)工、人事、一卡通、宿舍、輔導(dǎo)員(請(qǐng)假、考勤和查寢)系統(tǒng),對(duì)于人員信息的掌握已經(jīng)能夠達(dá)到常規(guī)的管理要求,不過(guò),要能夠?qū)我蝗藛T的精準(zhǔn)信息管理還需要融合多個(gè)系統(tǒng)的業(yè)務(wù)功能,就之前來(lái)說(shuō),實(shí)現(xiàn)的難度和代價(jià)都是較高的。
因此,本文結(jié)合蘇州市職業(yè)大學(xué)利用信息化手段輔助抗疫的例子,闡述了基于數(shù)據(jù)中臺(tái)構(gòu)建疫情防控應(yīng)用體系的工作,同時(shí)也總結(jié)了其中的不足之處,試圖深入挖掘數(shù)據(jù)中臺(tái)在其中發(fā)揮的價(jià)值和作用,為今后高職院校相關(guān)的應(yīng)用實(shí)踐走向規(guī)范提供借鑒與參考。
信息中心作為統(tǒng)籌信息化建設(shè)的部門,在本次疫情防控中遇到的問(wèn)題主要有:
疫情防控在高職院校內(nèi)是一種綜合性的應(yīng)用,需要整合各個(gè)業(yè)務(wù)條線的數(shù)據(jù),教師和學(xué)生基礎(chǔ)信息、學(xué)生在校狀態(tài)、學(xué)生請(qǐng)假、人員人臉照片、上網(wǎng)數(shù)據(jù)、各種刷卡、打卡記錄。整合后的數(shù)據(jù)需要進(jìn)行清洗和轉(zhuǎn)化,具體來(lái)說(shuō),數(shù)據(jù)整合存在一定困難,體現(xiàn)在幾個(gè)方面:
(1)不同系統(tǒng)存在架構(gòu)不同,部署方式不同(本地、云端)、建設(shè)時(shí)期不同導(dǎo)致的文檔資料完備程度不同、提供數(shù)據(jù)的方式不同等。
(2)疫情期間上線了大量軟硬件項(xiàng)目,需要對(duì)這些軟硬件系統(tǒng)產(chǎn)生的數(shù)據(jù)進(jìn)行采集;同時(shí),這些系統(tǒng)也提出了數(shù)據(jù)的需求,例如校門、宿舍的門禁需要獲取高質(zhì)量的學(xué)生、教師照片來(lái)進(jìn)行人臉識(shí)別算法特征的獲取。
(3)數(shù)據(jù)標(biāo)準(zhǔn)不同,數(shù)據(jù)的質(zhì)量差,如今數(shù)據(jù)作為一種資產(chǎn)已經(jīng)成為共識(shí),但是要真正發(fā)揮數(shù)據(jù)價(jià)值,還需要提高數(shù)據(jù)的易用性,而易用性的基礎(chǔ)就是數(shù)據(jù)的質(zhì)量。
數(shù)據(jù)的使用困難主要是數(shù)據(jù)的共享方式、來(lái)源過(guò)多和數(shù)據(jù)質(zhì)量導(dǎo)致的:
(1)中間庫(kù)與ODI、定時(shí)任務(wù)。以往的系統(tǒng)與系統(tǒng)間的數(shù)據(jù)共享方式大多采用中間數(shù)據(jù)庫(kù)的方式,利用定時(shí)任務(wù)、ODI等集成的產(chǎn)品,進(jìn)行數(shù)據(jù)庫(kù)到數(shù)據(jù)庫(kù)的同步,這種機(jī)制技術(shù)細(xì)節(jié)都掌握在廠商手中,院校的數(shù)據(jù)主管部門很難對(duì)這些同步作業(yè)去進(jìn)行監(jiān)管,出現(xiàn)的問(wèn)題如果沒(méi)有及時(shí)處理導(dǎo)致數(shù)據(jù)的不準(zhǔn)確問(wèn)題積壓,久而久之,使得數(shù)據(jù)變得不可信。
(2)同一個(gè)數(shù)據(jù)項(xiàng),存在多個(gè)備份。由于數(shù)據(jù)的同步過(guò)程缺乏監(jiān)管,導(dǎo)致了同一個(gè)數(shù)據(jù)項(xiàng)可能在多個(gè)系統(tǒng)中都存在備份,會(huì)形成以哪方的數(shù)據(jù)為準(zhǔn)的新問(wèn)題。此外,由于早期數(shù)據(jù)孤島的存在,一些公共數(shù)據(jù)可能在很多系統(tǒng)中都存在備份,而這些備份可能是不完全相同的,這也會(huì)造成數(shù)據(jù)難以利用的問(wèn)題。
(3)質(zhì)量低下,錯(cuò)誤多。以上兩點(diǎn)都會(huì)導(dǎo)致數(shù)據(jù)質(zhì)量低下,數(shù)據(jù)難以利用的問(wèn)題,另外一種常見(jiàn)問(wèn)題就是手工導(dǎo)入導(dǎo)出,由于人工操作不可避免的疏忽,也會(huì)增加數(shù)據(jù)出錯(cuò)的風(fēng)險(xiǎn)。
智慧校園建設(shè)以來(lái),蘇州市職業(yè)大學(xué)積累了海量信息數(shù)據(jù),但現(xiàn)有數(shù)據(jù)相對(duì)分散、標(biāo)準(zhǔn)不完善、共享形式單一、質(zhì)量較差、難以利用。為了提升數(shù)據(jù)共享和數(shù)據(jù)資產(chǎn)管理,我校于2019年啟動(dòng)了數(shù)據(jù)中臺(tái)項(xiàng)目,將各個(gè)業(yè)務(wù)部門的數(shù)據(jù)進(jìn)行匯聚,首先形成ODS(貼源層),經(jīng)過(guò)一定的數(shù)據(jù)清洗、加工后,再按照主題進(jìn)行歸類,形成全校級(jí)的數(shù)據(jù)倉(cāng)庫(kù),最后根據(jù)業(yè)務(wù)場(chǎng)景細(xì)分,建成數(shù)據(jù)門戶。使用方在有數(shù)據(jù)需求的時(shí)候,可以瀏覽數(shù)據(jù)門戶,提出申請(qǐng)或需求,通過(guò)中臺(tái)提供的標(biāo)準(zhǔn)化的方式進(jìn)行接入,方便獲取數(shù)據(jù)。數(shù)據(jù)中臺(tái)架構(gòu)如圖1 所示,包含以下幾個(gè)功能模塊:

圖1 數(shù)據(jù)中臺(tái)架構(gòu)Fig.1 Data center architecture
(1)交換平臺(tái)與數(shù)據(jù)湖:交換平臺(tái)負(fù)責(zé)交換作業(yè)的編排、部署、調(diào)度監(jiān)控、數(shù)據(jù)服務(wù)的定義、路由和監(jiān)控等功能;數(shù)據(jù)湖包含了通過(guò)集成得到的結(jié)構(gòu)化、文件數(shù)據(jù)、日志數(shù)據(jù)等全量數(shù)據(jù)。
(2)資產(chǎn)平臺(tái):資產(chǎn)平臺(tái)是對(duì)采集到的數(shù)據(jù)進(jìn)行數(shù)據(jù)資產(chǎn)編目的過(guò)程、主要體現(xiàn)在對(duì)于元數(shù)據(jù)的采集和管理,數(shù)據(jù)編目后關(guān)聯(lián)到部門,形成數(shù)據(jù)資產(chǎn)。
(3)服務(wù)平臺(tái):服務(wù)平臺(tái)主要是可以針對(duì)資產(chǎn)平臺(tái)和交換平臺(tái)形成數(shù)據(jù)接口服務(wù),針對(duì)服務(wù)可以進(jìn)行權(quán)限管理、版本管理、注冊(cè)管理和認(rèn)證管理等。
(4)數(shù)據(jù)門戶:數(shù)據(jù)門戶是面向一般用戶可以開放的平臺(tái),可以讓管理部門查看自己的數(shù)據(jù)資產(chǎn),也可以將數(shù)據(jù)申請(qǐng)、數(shù)據(jù)需求的流程放置在此平臺(tái)上,門戶的設(shè)計(jì)隱藏了技術(shù)細(xì)節(jié),使用更加能夠讓普通師生可以理解的設(shè)計(jì)方式。
(5)管理規(guī)范:數(shù)據(jù)中臺(tái)能夠發(fā)揮作用,最重要的是形成數(shù)據(jù)的管理規(guī)范,包含了數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)的質(zhì)量規(guī)范、數(shù)據(jù)責(zé)任部門、共享規(guī)則,申請(qǐng)使用流程等內(nèi)容。
人臉識(shí)別由于其無(wú)接觸式的優(yōu)勢(shì),在本次疫情期間被我校廣泛應(yīng)用在校門和宿舍的出入門禁閘機(jī)系統(tǒng)上,取代了傳統(tǒng)的一卡通或人工驗(yàn)證方式。在及時(shí)構(gòu)建人臉識(shí)別應(yīng)用系統(tǒng)中,數(shù)據(jù)中臺(tái)發(fā)揮了很大的作用,依賴于其賦能作用,將底層系統(tǒng)的基礎(chǔ)數(shù)據(jù)快速的共享下發(fā)給應(yīng)用建設(shè)的廠商,而人臉識(shí)別最為關(guān)鍵的人員照片問(wèn)題,也通過(guò)數(shù)據(jù)中臺(tái)的數(shù)據(jù)集成和數(shù)據(jù)處理得以實(shí)現(xiàn)。
以我校建設(shè)的防疫應(yīng)用為例,整體架構(gòu)如圖2所示,可以分為三個(gè)層次,分別為采集層、中臺(tái)層和應(yīng)用層。

圖2 防疫應(yīng)用整體架構(gòu)Fig.2 Main architecture of epidemic prevention application
采集層主要負(fù)責(zé)對(duì)異構(gòu)的數(shù)據(jù)源進(jìn)行采集,涉及到的信息主要是來(lái)源于一卡通、學(xué)工、人事和教務(wù)系統(tǒng)的人員基本信息,采集方式主要是定時(shí)任務(wù)讀取數(shù)據(jù)庫(kù)的方式;而照片數(shù)據(jù)主要來(lái)源于各個(gè)系統(tǒng)中的照片文件,但是這些照片往往質(zhì)量不佳,無(wú)法達(dá)到人臉系統(tǒng)算法讀取特征值的要求,因此在本次疫情期間,上線了照片采集器,可以讓師生自主去拍照傳入系統(tǒng),而采集器的后臺(tái)系統(tǒng)支持通過(guò)增量的API接口提供給數(shù)據(jù)中臺(tái)照片的數(shù)據(jù)。
首先,中臺(tái)層將獲取到的數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗、數(shù)據(jù)集成和數(shù)據(jù)歸約,通過(guò)定時(shí)任務(wù)和數(shù)據(jù)集成工具,綜合幾個(gè)系統(tǒng)提供的數(shù)據(jù)來(lái)源,采集到數(shù)據(jù)倉(cāng)庫(kù)中。
其次,中臺(tái)層需要對(duì)數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)進(jìn)行轉(zhuǎn)化,便于提供給應(yīng)用層使用,照片數(shù)據(jù)可以轉(zhuǎn)化為文件、base64和二進(jìn)制等多分辨率的多種形式;人員數(shù)據(jù)和住宿數(shù)據(jù)只保留在籍學(xué)生和在職教職工的數(shù)據(jù)。
最后,通過(guò)中臺(tái)層開放出去的數(shù)據(jù)接口,對(duì)于用戶(應(yīng)用廠商)來(lái)說(shuō)是不需要知道數(shù)據(jù)來(lái)源的,用戶只需要提出數(shù)據(jù)的需求即可,而中臺(tái)也可以對(duì)數(shù)據(jù)接口的調(diào)用情況、吞吐流量情況進(jìn)行管理和監(jiān)控,對(duì)于出現(xiàn)問(wèn)題的接口及時(shí)進(jìn)行處理,從而保證業(yè)務(wù)的穩(wěn)定。
應(yīng)用層的應(yīng)用可以通過(guò)主動(dòng)方式從接口獲取數(shù)據(jù),也可以提供接口或者數(shù)據(jù)源被動(dòng)接受數(shù)據(jù)。人臉識(shí)別應(yīng)用推薦接入采集器采集到的照片數(shù)據(jù),如果該人員未進(jìn)行過(guò)照片采集,則自動(dòng)降級(jí)為一卡通系統(tǒng)的照片,由于采用中臺(tái)架構(gòu),因此后期如果數(shù)據(jù)源發(fā)生變化,都可以很方便的進(jìn)行無(wú)感知的切換;由于疫情防控要求,本地公安局要求自動(dòng)推送在籍學(xué)生的基本信息,通過(guò)數(shù)據(jù)中臺(tái)已經(jīng)歸集到的數(shù)據(jù),得以快速實(shí)現(xiàn)此需求。
另一方面,門禁系統(tǒng)既是數(shù)據(jù)的消費(fèi)方,也是數(shù)據(jù)的生產(chǎn)方,其本身產(chǎn)生的刷卡數(shù)據(jù)也會(huì)被數(shù)據(jù)中臺(tái)采集,而師生的進(jìn)出數(shù)據(jù)可以用來(lái)作為判斷其是否在校、是否在宿的重要數(shù)據(jù)來(lái)源,結(jié)合其他刷卡設(shè)備、安防攝像頭識(shí)別,更是可以基于校園地理信息系統(tǒng)繪制出校內(nèi)人員的行動(dòng)軌跡圖,為疫情防控提供重要信息化支持。
就本輪疫情以來(lái)的信息化實(shí)踐來(lái)說(shuō),從內(nèi)部和外部?jī)蓚€(gè)方面來(lái)分析不足:
就數(shù)據(jù)中臺(tái)自身來(lái)說(shuō),首先,數(shù)據(jù)中臺(tái)能夠發(fā)揮多大作用,在于其匯聚的數(shù)據(jù)的數(shù)據(jù)編目有多大,更在于數(shù)據(jù)的質(zhì)量的高低,也就是提供出來(lái)的數(shù)據(jù)是否是可用的,要保證這一點(diǎn),需要有一個(gè)有效的數(shù)據(jù)管理規(guī)范和數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn),而信息管理部門需要提升業(yè)務(wù)素質(zhì),畢竟數(shù)據(jù)離開了業(yè)務(wù),也只是無(wú)源之水,無(wú)法發(fā)揮其價(jià)值;其次,作為上游應(yīng)用所依賴的數(shù)據(jù)來(lái)源,數(shù)據(jù)中臺(tái)平臺(tái)自身的穩(wěn)定新毋庸置疑是擺在首位的,平臺(tái)自身的集成任務(wù)、交換任務(wù)包括所提供的數(shù)據(jù)接口都需要提升自我糾錯(cuò)能力,能夠?qū)Πl(fā)生的錯(cuò)誤進(jìn)行及時(shí)的反饋和預(yù)警,便于技術(shù)人員第一時(shí)間干預(yù)解決;最后,數(shù)據(jù)作為一種重要的資源,需要在使用過(guò)程中保障其安全性,防止數(shù)據(jù)泄露,所以數(shù)據(jù)接口需要有驗(yàn)證機(jī)制,防止非法的訪問(wèn),同時(shí)在傳輸過(guò)程中,可以使用加簽機(jī)制,防止數(shù)據(jù)的意外篡改,另外,在一些敏感的隱私數(shù)據(jù)的處理上,可以采取脫敏的處理方法,加強(qiáng)對(duì)特定數(shù)據(jù)的防護(hù)。
對(duì)人員數(shù)據(jù)信息的把控還不夠全面和精細(xì),目前校內(nèi)的認(rèn)證系統(tǒng)主要有三種:(1)一卡通;(2)上網(wǎng)認(rèn)證;(3)通道閘機(jī)(校門、宿舍、圖書館等樓宇),對(duì)于教職工或持有一卡通的其他類別人員來(lái)說(shuō),可以有效通過(guò)上述幾種認(rèn)證方式關(guān)聯(lián)到其真實(shí)的信息,而對(duì)于其他類別的臨時(shí)人員,如快遞人員、臨時(shí)后勤物業(yè)人員,兼課與兼職人員,這些人員的管理主體在不同的業(yè)務(wù)條線上,缺乏統(tǒng)一的系統(tǒng)對(duì)其身份進(jìn)行把控,這一點(diǎn)也凸顯出以往智慧校園統(tǒng)一身份認(rèn)證的一個(gè)盲點(diǎn),也就是對(duì)于一些不需要或少量使用校內(nèi)系統(tǒng)的人員,是沒(méi)有統(tǒng)一身份認(rèn)證賬號(hào)的,他們的身份系統(tǒng)如果在將來(lái)能夠有效進(jìn)行信息化管理,則可以大大加強(qiáng)學(xué)校對(duì)于人員管理的顆粒度。
隨著教育2.0行動(dòng)的不斷深化,智慧校園建設(shè)也面臨著更精細(xì)化的需求,在這種背景之下,本次疫情如同一次測(cè)驗(yàn),真正考驗(yàn)了高職院校的信息化建設(shè)水平。本文探討了基于數(shù)據(jù)中臺(tái)的疫情防控體系建設(shè)的必要性、具體實(shí)施和不足之處,從中可以看出,中臺(tái)架構(gòu)提供了一種技術(shù)上的解決方案,有助于降低管理成本,實(shí)現(xiàn)精準(zhǔn)施策,因此,在未來(lái)的規(guī)劃中,更應(yīng)該側(cè)重于運(yùn)用數(shù)據(jù)中臺(tái)的賦能作用,切實(shí)筑牢高職院校疫情防控銅墻鐵壁,同時(shí)也可以提升人員管理水平。