王加祥
(南京郵電大學(xué) 江蘇 南京 210023)
近年來(lái),隨著大數(shù)據(jù)技術(shù)的發(fā)展,越來(lái)越多的國(guó)家開(kāi)始重視大數(shù)據(jù)對(duì)于提升本國(guó)治理能力和競(jìng)爭(zhēng)力的作用,2015年我國(guó)已將大數(shù)據(jù)提升為國(guó)家層面的戰(zhàn)略資源,2017年國(guó)家主席習(xí)近平強(qiáng)調(diào)要運(yùn)用大數(shù)據(jù)提升國(guó)家治理現(xiàn)代化水平[1]。2018年,教育部發(fā)布《教育信息化2.0行動(dòng)計(jì)劃》,文件指出要完善教育管理信息化的頂層設(shè)計(jì),提升大數(shù)據(jù)在在教育管理及決策等方面的支撐與保障作用[2]。教育宏觀決策大數(shù)據(jù)庫(kù)的建設(shè)和應(yīng)用已成為一項(xiàng)科技智庫(kù)建設(shè)工程,將成為教育決策創(chuàng)新的重要驅(qū)動(dòng)力,同時(shí)這也是一個(gè)龐大而且復(fù)雜的系統(tǒng)工程,其數(shù)據(jù)涉及社會(huì)多領(lǐng)域的眾多業(yè)務(wù)系統(tǒng),要從如此量大且結(jié)構(gòu)復(fù)雜的數(shù)據(jù)中清洗挖掘出有用的教育決策研究信息進(jìn)而轉(zhuǎn)化為智庫(kù)知識(shí),需要建立一套規(guī)范的數(shù)據(jù)標(biāo)準(zhǔn)體系,以標(biāo)準(zhǔn)化的方式規(guī)范和整合資源,為教育決策大數(shù)據(jù)的健康發(fā)展打下基礎(chǔ)。
歐美、日本等發(fā)達(dá)國(guó)家在推進(jìn)本國(guó)經(jīng)濟(jì)發(fā)展、提升社會(huì)治理水平等方面,都非常重視大數(shù)據(jù)的應(yīng)用,大數(shù)據(jù)在提升其綜合競(jìng)爭(zhēng)力方面起著很重要的作用。大數(shù)據(jù)的采集和應(yīng)用離不開(kāi)大數(shù)據(jù)標(biāo)準(zhǔn)化的制定,標(biāo)準(zhǔn)化工作需要科學(xué)的頂層設(shè)計(jì),其中ISO/IEC JTC1、ITU-T、IEEE BDGMM、NIST等大數(shù)據(jù)研究組織,專門成立了大數(shù)據(jù)標(biāo)準(zhǔn)化的研究小組,研究制定和協(xié)調(diào)大數(shù)據(jù)領(lǐng)域的關(guān)鍵技術(shù),包括大數(shù)據(jù)參考模型、大數(shù)據(jù)元數(shù)據(jù)框架和概念模型、大數(shù)據(jù)治理和元數(shù)據(jù)管理、大數(shù)據(jù)互操作性框架以及大數(shù)據(jù)安全等,旨在規(guī)范大數(shù)據(jù)的具體應(yīng)用和保護(hù)信息安全。
我國(guó)同樣非常重視大數(shù)據(jù)標(biāo)準(zhǔn)體系的研究工作,首先,在政策方面,相繼出臺(tái)了《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》、《大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃(2016-2020年)》等文件,均明確指出要建立和推進(jìn)大數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范體系建設(shè),加強(qiáng)大數(shù)據(jù)標(biāo)準(zhǔn)化頂層設(shè)計(jì),逐步完善標(biāo)準(zhǔn)體系,發(fā)揮標(biāo)準(zhǔn)化對(duì)產(chǎn)業(yè)發(fā)展的重要支撐作用的重點(diǎn)任務(wù)。其次,在機(jī)構(gòu)建設(shè)方面,2014年12月全國(guó)信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會(huì)大數(shù)據(jù)標(biāo)準(zhǔn)工作組正式成立,并有100多家單位申請(qǐng)參與標(biāo)準(zhǔn)制定。近年來(lái),該工作組積極開(kāi)展標(biāo)準(zhǔn)化研究工作,其中有6項(xiàng)國(guó)家標(biāo)準(zhǔn)已完成并發(fā)布,處于報(bào)批階段的有3項(xiàng),正在研制中的為15項(xiàng),并在2018年正式發(fā)布大數(shù)據(jù)安全標(biāo)準(zhǔn)化白皮書(shū)(2018版)[3]。這些措施和成果為加強(qiáng)我國(guó)大數(shù)據(jù)體系架構(gòu)研究和標(biāo)準(zhǔn)化工作提供了重要的政策保障和技術(shù)基礎(chǔ)。
目前我國(guó)的教育宏觀決策大數(shù)據(jù)庫(kù)建設(shè)還處于初期研究階段,在數(shù)據(jù)標(biāo)準(zhǔn)體系建設(shè)方面主要存在以下兩方面難點(diǎn)。
教育宏觀決策大數(shù)據(jù)不同于一般教育實(shí)踐數(shù)據(jù),其涉及面廣,首先,基礎(chǔ)數(shù)據(jù)方面,涵蓋學(xué)前教育、基礎(chǔ)教育、職業(yè)教育、高等教育、繼續(xù)教育等各階段基本信息,如學(xué)生人數(shù)、師資情況、教育經(jīng)費(fèi)等數(shù)據(jù),教育政策和研究方面涵蓋各層級(jí)教育發(fā)展戰(zhàn)略、教育體制機(jī)制改革研究、教育政策研究、以及教育比較研究等方面的數(shù)據(jù)。其次,教育宏觀決策還涉及經(jīng)濟(jì)、人口、就業(yè)等社會(huì)管理及公共服務(wù)數(shù)據(jù),需要與多部門進(jìn)行數(shù)據(jù)同步。此外還包含來(lái)自教育政策執(zhí)行者在政策實(shí)踐后的實(shí)時(shí)反饋信息,以及目前國(guó)家十分重視的網(wǎng)絡(luò)媒體發(fā)出的關(guān)于教育政策的輿情信息數(shù)據(jù)。這些數(shù)據(jù)既有諸如統(tǒng)計(jì)數(shù)據(jù)的結(jié)構(gòu)化數(shù)據(jù),同時(shí)也存在各種文檔、報(bào)表、圖形、音視頻文件等非結(jié)構(gòu)化數(shù)據(jù),而非結(jié)構(gòu)化數(shù)據(jù)因其格式類型繁多,與結(jié)構(gòu)化數(shù)據(jù)相比更難標(biāo)準(zhǔn)化和理解。
大數(shù)據(jù)建設(shè)離不開(kāi)對(duì)數(shù)據(jù)的采集,除了對(duì)互聯(lián)網(wǎng)數(shù)據(jù)的采集,還有一部分?jǐn)?shù)據(jù)需要通過(guò)數(shù)據(jù)共享來(lái)獲取,但目前數(shù)據(jù)共享仍存在一定障礙,一方面,長(zhǎng)期以來(lái)國(guó)家級(jí)、省級(jí)、市縣級(jí)各層級(jí)的教育業(yè)務(wù)信息系統(tǒng)多數(shù)只運(yùn)行在本組織內(nèi)部,相關(guān)數(shù)據(jù)的跨領(lǐng)域、跨部門、跨平臺(tái)安全共享以及數(shù)據(jù)系統(tǒng)之間的接口尚未打通、互操作尚未實(shí)現(xiàn),導(dǎo)致沉積的海量歷史數(shù)據(jù)只能在有限范圍內(nèi)共享,造成數(shù)據(jù)資源不能完全發(fā)揮其價(jià)值。另一方面,在這些應(yīng)用系統(tǒng)建設(shè)過(guò)程中并未建立統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn),數(shù)據(jù)格式不一致、系統(tǒng)異構(gòu)的現(xiàn)象較為普遍,要重新建立統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn),必然需要調(diào)動(dòng)各級(jí)業(yè)務(wù)部門進(jìn)行統(tǒng)一協(xié)作,不僅工作量大耗時(shí)長(zhǎng),且調(diào)動(dòng)難度大。
通過(guò)對(duì)教育宏觀決策大數(shù)據(jù)標(biāo)準(zhǔn)化建設(shè)需求和數(shù)據(jù)特點(diǎn)分析,結(jié)合當(dāng)前其他領(lǐng)域大數(shù)據(jù)標(biāo)準(zhǔn)化設(shè)計(jì)和應(yīng)用的實(shí)踐及發(fā)展趨勢(shì),本文將主要從基礎(chǔ)標(biāo)準(zhǔn)、數(shù)據(jù)標(biāo)準(zhǔn)、技術(shù)標(biāo)準(zhǔn)、管理標(biāo)準(zhǔn)等幾方面對(duì)教育宏觀決策大數(shù)據(jù)標(biāo)準(zhǔn)體系進(jìn)行研究,并構(gòu)建標(biāo)準(zhǔn)體系框架模型(如圖1)。各類標(biāo)準(zhǔn)之間互相聯(lián)系,也互為補(bǔ)充,是一個(gè)完整的體系。同時(shí),該標(biāo)準(zhǔn)體系符合開(kāi)放、共享和可擴(kuò)展的原則,在對(duì)教育宏觀決策數(shù)據(jù)庫(kù)建設(shè)進(jìn)行規(guī)范化的同時(shí),也能夠?yàn)榻逃I(lǐng)域其他業(yè)務(wù)平臺(tái)的數(shù)據(jù)庫(kù)建設(shè)起到指導(dǎo)作用,并隨著教育領(lǐng)域數(shù)據(jù)應(yīng)用的深入和拓展而不斷細(xì)化和完善。

圖1 教育宏觀決策大數(shù)據(jù)標(biāo)準(zhǔn)體系框架模型
4.2.1 基礎(chǔ)標(biāo)準(zhǔn)
基礎(chǔ)標(biāo)準(zhǔn)是對(duì)教育宏觀決策大數(shù)據(jù)標(biāo)準(zhǔn)體系建設(shè)的工作規(guī)范和適用范圍進(jìn)行說(shuō)明,包括基本術(shù)語(yǔ)、標(biāo)準(zhǔn)編制規(guī)范、標(biāo)準(zhǔn)體系構(gòu)建原則等。其中,術(shù)語(yǔ)類標(biāo)準(zhǔn)用于規(guī)范和統(tǒng)一數(shù)據(jù)庫(kù)中常用的技術(shù)術(shù)語(yǔ)和應(yīng)用系統(tǒng)中的業(yè)務(wù)術(shù)語(yǔ)等。建立術(shù)語(yǔ)規(guī)范有利于業(yè)務(wù)人員和技術(shù)人員在數(shù)據(jù)采集調(diào)用、系統(tǒng)設(shè)計(jì)、使用維護(hù)等方面對(duì)術(shù)語(yǔ)的含義形成統(tǒng)一的理解。標(biāo)準(zhǔn)編制規(guī)范用于明確大數(shù)據(jù)標(biāo)準(zhǔn)化的工作規(guī)程、標(biāo)準(zhǔn)編制、實(shí)施和修改的基本要求,對(duì)標(biāo)準(zhǔn)制定起指導(dǎo)作用。
4.2.2 數(shù)據(jù)標(biāo)準(zhǔn)
數(shù)據(jù)標(biāo)準(zhǔn)是對(duì)教育數(shù)據(jù)資源的數(shù)據(jù)來(lái)源和數(shù)據(jù)共享進(jìn)行規(guī)范,對(duì)元數(shù)據(jù)參考模型,數(shù)據(jù)分類與編碼規(guī)范,基礎(chǔ)教育、高等教育、教育政策等主題數(shù)據(jù)庫(kù)元數(shù)據(jù)規(guī)范,在數(shù)據(jù)管理過(guò)程中,采用數(shù)據(jù)字典和元數(shù)據(jù)管理,可以方便地規(guī)范數(shù)據(jù)資源。通過(guò)建立數(shù)據(jù)共享及數(shù)據(jù)服務(wù)評(píng)價(jià)標(biāo)準(zhǔn),提升數(shù)據(jù)服務(wù)質(zhì)量。
4.2.3 技術(shù)標(biāo)準(zhǔn)
技術(shù)標(biāo)準(zhǔn)包括數(shù)據(jù)采集與存儲(chǔ)、數(shù)據(jù)清洗、數(shù)據(jù)接口、互操作技術(shù)規(guī)范、數(shù)據(jù)質(zhì)量控制、數(shù)據(jù)溯源、數(shù)據(jù)安全等技術(shù)規(guī)范。如網(wǎng)絡(luò)教育輿情數(shù)據(jù)采集規(guī)范,公共服務(wù)數(shù)據(jù)庫(kù)數(shù)據(jù)的采集整合管理規(guī)范,元數(shù)據(jù)訪問(wèn)服務(wù)接口規(guī)范,數(shù)據(jù)跨域互操作技術(shù)規(guī)范,用戶統(tǒng)一認(rèn)證接口規(guī)范等。數(shù)據(jù)安全作為大數(shù)據(jù)標(biāo)準(zhǔn)體系的重要部分,保障了數(shù)據(jù)不被非法冒充、竊取、篡改[4]。安全規(guī)范是對(duì)數(shù)據(jù)全生命周期提出安全防護(hù)要求,包括數(shù)據(jù)安全技術(shù)實(shí)施規(guī)范、安全評(píng)估標(biāo)準(zhǔn)及方法等。
4.2.4 管理標(biāo)準(zhǔn)
管理標(biāo)準(zhǔn)是用于規(guī)范教育宏觀決策數(shù)據(jù)庫(kù)應(yīng)用與維護(hù)過(guò)程中涉及的各種標(biāo)準(zhǔn),在數(shù)據(jù)的整個(gè)生命周期中發(fā)揮著重要管理支撐作用。包括數(shù)據(jù)質(zhì)量管理標(biāo)準(zhǔn)、運(yùn)維管理標(biāo)準(zhǔn)、數(shù)據(jù)共享管理標(biāo)準(zhǔn)等,確保數(shù)據(jù)庫(kù)中的數(shù)據(jù)正確性,為不同來(lái)源數(shù)據(jù)分類管理,明確數(shù)據(jù)運(yùn)維工作指南,對(duì)數(shù)據(jù)共享內(nèi)容、范圍、對(duì)象、級(jí)別等作出明確界定,以確保數(shù)據(jù)庫(kù)中的數(shù)據(jù)安全和可持續(xù)發(fā)展。
在國(guó)家層面,雖然已經(jīng)出臺(tái)了針對(duì)促進(jìn)數(shù)據(jù)公開(kāi)、開(kāi)放共享及保障數(shù)據(jù)安全等方面的政策法規(guī)與制度,但由于數(shù)據(jù)割據(jù)、數(shù)據(jù)孤島等現(xiàn)象的存在,教育相關(guān)數(shù)據(jù)的共享效果并不及預(yù)期,仍需加強(qiáng)政策保障力度,鼓勵(lì)地方出臺(tái)相應(yīng)細(xì)則,加大宣傳和培訓(xùn),提高相關(guān)機(jī)構(gòu)和部門的數(shù)據(jù)共享意愿,加快數(shù)據(jù)共享的步伐,為推動(dòng)標(biāo)準(zhǔn)體系的制定和實(shí)施提供更有力的政策支持。
教育宏觀決策大數(shù)據(jù)標(biāo)準(zhǔn)編制工作難度大,應(yīng)保持與國(guó)家大數(shù)據(jù)標(biāo)準(zhǔn)委員會(huì)相關(guān)工作組的溝通,在遵循國(guó)家標(biāo)準(zhǔn)的基礎(chǔ)上,結(jié)合教育行業(yè)數(shù)據(jù)特點(diǎn),有針對(duì)性地進(jìn)行標(biāo)準(zhǔn)體系的建設(shè),并積極與大數(shù)據(jù)應(yīng)用已成功落地的行業(yè)進(jìn)行交流,汲取成功經(jīng)驗(yàn)和先進(jìn)理念,推動(dòng)教育決策大數(shù)據(jù)標(biāo)準(zhǔn)體系建設(shè)[5]。
應(yīng)充分重視人才在教育宏觀決策大數(shù)據(jù)建設(shè)和應(yīng)用中的重要作用,抓緊設(shè)立專門數(shù)據(jù)管理崗位,通過(guò)與高校及科研單位合作,定向培養(yǎng)教育決策研究和大數(shù)據(jù)技術(shù)方面的跨學(xué)科復(fù)合人才隊(duì)伍,為實(shí)現(xiàn)教育宏觀決策大數(shù)據(jù)庫(kù)的綜合發(fā)展利用、輔助科學(xué)決策做好數(shù)據(jù)人才儲(chǔ)備。
標(biāo)準(zhǔn)體系建設(shè)作為教育宏觀決策大數(shù)據(jù)庫(kù)建設(shè)的基礎(chǔ)工作,在編制過(guò)程中,既要考慮存量數(shù)據(jù)資源特點(diǎn)和數(shù)據(jù)服務(wù)的成熟技術(shù),又要兼顧數(shù)據(jù)標(biāo)準(zhǔn)和技術(shù)標(biāo)準(zhǔn)的新進(jìn)展和新趨勢(shì),確保標(biāo)準(zhǔn)體系框架的相對(duì)穩(wěn)定性。標(biāo)準(zhǔn)體系制定不可能一蹴而就,應(yīng)兼顧近期需求和長(zhǎng)遠(yuǎn)規(guī)劃,避免閉門造車,并隨著研究的深入不斷完善,以保障教育宏觀決策大數(shù)據(jù)庫(kù)的可持續(xù)發(fā)展。