孫云霞
(神木職業(yè)技術(shù)學(xué)院 管理工程系, 陜西 神木 719300)
當前,世界范圍內(nèi)對學(xué)前教育的重視度普遍提升,學(xué)前教育發(fā)展速度與辦學(xué)規(guī)模持續(xù)提升[1],同時學(xué)前教育機構(gòu)的構(gòu)建模式更加多樣性。國家對學(xué)前教育的引導(dǎo)方向隨著重視度的提升更加明確[2],在提升學(xué)前教育發(fā)展速度,改善學(xué)前兒童學(xué)前教育難問題的基礎(chǔ)上,更加重視學(xué)前教育質(zhì)量[3],因此,研究一種系統(tǒng)、科學(xué)、完整的學(xué)前教育機構(gòu)教育質(zhì)量評估方法具有重要意義。
作為機器學(xué)習(xí)領(lǐng)域的重要組成部分,深度學(xué)習(xí)網(wǎng)絡(luò)基于構(gòu)建、模擬人腦分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)描述數(shù)據(jù)[4],其主要優(yōu)勢體現(xiàn)在建模能力強、表征精度高等,可有效解決普遍使用的淺層學(xué)習(xí)網(wǎng)絡(luò)在有限樣本與計算單元條件下對復(fù)雜函數(shù)的表達能力與泛化能力受到限制的問題[5-6]。基于此,研究基于深度學(xué)習(xí)網(wǎng)絡(luò)的學(xué)前教育質(zhì)量評估方法。
學(xué)前教育質(zhì)量評估指標體系構(gòu)建是學(xué)前教育質(zhì)量評估的基礎(chǔ)[7]。構(gòu)建由學(xué)前教育環(huán)境創(chuàng)設(shè)、學(xué)前教育保教質(zhì)量和幼兒發(fā)展三個一級指標構(gòu)建的學(xué)前教育質(zhì)量評估指標體系,如圖1所示。

圖1 學(xué)前教育質(zhì)量評估指標體系
學(xué)前教育環(huán)境創(chuàng)設(shè)包括學(xué)前教育機構(gòu)創(chuàng)建體制、學(xué)前教育機構(gòu)創(chuàng)建條件兩個二級指標,兩者分別描述學(xué)前教育機構(gòu)采用的辦學(xué)模式和學(xué)前教育教學(xué)活動所使用的硬件和軟件設(shè)施。學(xué)前教育機構(gòu)創(chuàng)建體制中包含學(xué)前教育機構(gòu)創(chuàng)建思想和管理機制兩個主要內(nèi)容;學(xué)前教育機構(gòu)創(chuàng)建條件中包含基礎(chǔ)設(shè)施設(shè)備、人員配備、規(guī)模與班級三個主要內(nèi)容。
學(xué)前教育保教質(zhì)量包括教師素質(zhì)、人際交往和安全衛(wèi)生三個二級指標。教師素質(zhì)所指的是從事學(xué)前教育人員的工作能力,其中包含教師資格、教學(xué)技能、職業(yè)道德和課程管理四個主要內(nèi)容[8]。人際交往所指的是從事學(xué)前教育人員同學(xué)前兒童和家長溝通互動的能力。安全衛(wèi)生所指的是學(xué)前教育機構(gòu)滿足學(xué)前兒童最基本的生理與安全需求的能力,包括教育/保健管理、交通安全管理與膳食管理三個主要方面。
幼兒發(fā)展包括體質(zhì)與動作、行為習(xí)慣、溝通能力和藝術(shù)認知四個二級指標。體質(zhì)與動作所指的是學(xué)前兒童生理機能的正常發(fā)展水平;行為習(xí)慣是指學(xué)前兒童日常生活中的自理能力;溝通能力是指學(xué)前兒童通過累計詞匯量傳達自己情緒情感的能力;藝術(shù)認知是指學(xué)前兒童基于基礎(chǔ)知識的掌握對周邊簡單自然現(xiàn)象的審美與藝術(shù)表現(xiàn)能力。
1.2.1 深度學(xué)習(xí)網(wǎng)絡(luò)
深度學(xué)習(xí)網(wǎng)絡(luò)內(nèi)具有一個輸入層、多個隱含層和一個輸出層[9],其分層結(jié)構(gòu)與人類大腦結(jié)構(gòu)極為相似。深度學(xué)習(xí)網(wǎng)絡(luò)內(nèi)僅相鄰節(jié)點間存在連接[10],相同層或不同層內(nèi)節(jié)點間不存在連接,可將深度學(xué)習(xí)網(wǎng)絡(luò)內(nèi)的各層定義為一個logistic回歸模型。深度學(xué)習(xí)網(wǎng)絡(luò)模型內(nèi)的隱含層包含數(shù)個受限玻爾茲曼機,通過疊加數(shù)個受限玻爾茲曼機,能夠構(gòu)建深度玻爾茲曼機學(xué)習(xí)網(wǎng)絡(luò),如圖2(a)所示。當距離可視層較近的結(jié)構(gòu)和較遠的結(jié)構(gòu)分別使用貝葉斯信念網(wǎng)絡(luò)和受限玻爾茲曼機構(gòu)建時,所構(gòu)建的網(wǎng)絡(luò)為深度信息網(wǎng)絡(luò),如圖2(b)所示。

(a) 深度玻爾茲曼機

(b) 深度信息網(wǎng)絡(luò)圖2 深度玻爾茲曼機與深度信息網(wǎng)絡(luò)結(jié)構(gòu)
圖2內(nèi),v和h分別表示可視層和隱層。利用由下至上的方式逐層訓(xùn)練受限玻爾茲曼機,通過預(yù)訓(xùn)練得到權(quán)值W。
利用無監(jiān)督的預(yù)訓(xùn)練模型優(yōu)化深度學(xué)習(xí)網(wǎng)絡(luò)各層的權(quán)值,可將簡單特征抽象畫。可視層的輸入為學(xué)前教育質(zhì)量評估指標體系內(nèi)的各二級指標Ai,設(shè)定輸入層以及輸出層的節(jié)點數(shù)量,隱含層h1、h2、h3的節(jié)點均為100。可視層與隱含層的聯(lián)合概率分布描述為式(1)。
P(Ai,h1,h2,h3)=P(Ai|h1)·P(h1|h2)·P(h2|h3)P(h3)
(1)
由下至上的非監(jiān)督學(xué)習(xí)過程,將各層均定義為一個受限玻爾茲曼機,利用貪婪學(xué)習(xí)方法由下至上逐層訓(xùn)練各層權(quán)重,第一層和其余層分別構(gòu)建高斯-二進制受限玻爾茲曼機和二進制-二進制受限玻爾茲曼機。受限玻爾茲曼機內(nèi)各可視層節(jié)點與隱含層節(jié)點均不存在相關(guān)性,描述受限玻爾茲曼機內(nèi)各層的條件概率分布與聯(lián)合概率分布,如式(2)、式(3)。
(2)
(3)
其中,N(·)和logistic(·)分別表示高斯密度函數(shù)和邏輯函數(shù);c表示可視層偏置;b表示隱含層偏置。
輸出層依照輸入的DMOS(平均主觀得分差,Differential mean opinion score)值對各層參數(shù)實施整體優(yōu)化。經(jīng)由無監(jiān)督訓(xùn)練與有監(jiān)督優(yōu)化能夠獲取各層的權(quán)值與偏執(zhí),構(gòu)建輸出的抽象一級指標與DMOS值間的回歸模型,測試階段依照回歸模型預(yù)測獲取學(xué)前教育質(zhì)量的客觀評估結(jié)果。
1.2.2 評量評估過程

(4)

(5)
(6)
(7)
選取某城市內(nèi)規(guī)模不等的146家學(xué)前教育機構(gòu)為測試對象,利用本文方法對測試對象的學(xué)前教育質(zhì)量進行評估。以統(tǒng)計學(xué)前教育質(zhì)量評估方法的客觀評估結(jié)果與主觀評估結(jié)果間的相關(guān)系數(shù)(線性相關(guān)系數(shù)與等級相關(guān)系數(shù)),對本文方法實施客觀評估。用于判斷主觀評估結(jié)果與客觀評估結(jié)果兩個質(zhì)量評估結(jié)果間線性相關(guān)性的指標,即為線性相關(guān)系數(shù)Xij,如式(8)。
(8)

用于判斷一種質(zhì)量如何能夠被表示為另一種質(zhì)量的單調(diào)函數(shù)的指標,即為等級相關(guān)系數(shù)Cij,如式(9)。
(9)

Cij值取值范圍為0-1,其值越大表示本文方法評估結(jié)果越準確。
以文獻[5]中CLASS視角下的評估方法和文獻[6]內(nèi)基于用戶滿意度的評估方法為對比方法,對比本文方法與對比方法中構(gòu)建的教育質(zhì)量評估指標體系的專家認同度(指標選取的全面性與科學(xué)性),以此判斷不同方法中評估指標體系構(gòu)建的質(zhì)量。不同評估方法內(nèi)評估指標體系的專家認同度對比結(jié)果,如表1所示。

表1 評估指標的專家認同度對比
由表1中不同方法評估指標體系的專家認同度對比結(jié)果可以看出,本文方法所構(gòu)建評估指標體系內(nèi)各級指標的專家認同度均顯著高于兩種對比方法,由此說明本文方法所構(gòu)建的學(xué)前教育質(zhì)量評估指標體系更全面更科學(xué)。
在深度學(xué)習(xí)網(wǎng)絡(luò)內(nèi)包含較多參數(shù),因此有必要分析深度學(xué)習(xí)網(wǎng)絡(luò)內(nèi)各項參數(shù)對網(wǎng)絡(luò)性能的影響。以下從輸入指標數(shù)量和隱層數(shù)量兩個參數(shù)出發(fā),分析深度學(xué)習(xí)網(wǎng)絡(luò)參數(shù)對網(wǎng)絡(luò)性能的影響。
2.2.1 輸入指標數(shù)量對深度學(xué)習(xí)網(wǎng)絡(luò)性能的影響
不同輸入指標數(shù)量條件下,本文所建深度學(xué)習(xí)網(wǎng)絡(luò)評估結(jié)果與主觀評估結(jié)果之間的線性相關(guān)系數(shù)與等級相關(guān)系數(shù),如圖3所示。

圖3 輸入指標數(shù)量對深度學(xué)習(xí)網(wǎng)絡(luò)性能的影響
分析圖3得到,輸入不同數(shù)量的評估指標對于本文方法深度學(xué)習(xí)網(wǎng)絡(luò)性能的影響并不顯著,由此說明深度學(xué)習(xí)網(wǎng)絡(luò)對于輸入指標數(shù)量并不敏感。
2.2.2 隱層數(shù)量對深度學(xué)習(xí)網(wǎng)絡(luò)性能的影響
不同隱層數(shù)量條件下,本文構(gòu)建的深度學(xué)習(xí)網(wǎng)絡(luò)評估結(jié)果的線性相關(guān)系數(shù)與等級相關(guān)系數(shù),如圖4(a)所示。不同隱層數(shù)量條件下,本文所建的深度學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練時間,如圖4(b)所示。
分析圖4(a)得到,本文方法評估結(jié)果的線性相關(guān)系數(shù)與等級相關(guān)系數(shù)整體上隨著隱層數(shù)量的提升而提升。當隱層數(shù)量由1個提升至3個時,本文方法評估結(jié)果的線性相關(guān)系數(shù)與等級相關(guān)系數(shù)提升速度較快;當隱層數(shù)量由3個提升至5個時,本文方法評估結(jié)果的線性相關(guān)系數(shù)與等級相關(guān)系數(shù)提升幅度較小。分析圖4(b)得到,本文方法中深度學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練時間隨著隱層數(shù)量的提升而顯著提升,且隱層數(shù)量越大,訓(xùn)練時間提升幅度也越大。綜合圖4(a)與4(b)的評估結(jié)果說明,隱層數(shù)量為3時,本文方法的評估性能最佳。

(a) 線性相關(guān)系數(shù)與等級相關(guān)系數(shù)

(b) 訓(xùn)練時間圖4 隱層數(shù)量對深度學(xué)習(xí)網(wǎng)絡(luò)性能的影響
在所選測試對象中任意選取12個,對比本文方法與對比方法評估結(jié)果與主觀評估結(jié)果之間的線性相關(guān)系數(shù)與等級相關(guān)系數(shù),結(jié)果如表2所示。

表2 不同測試對象的評估結(jié)果統(tǒng)計
分析表2得到,采用本文方法對測試對象學(xué)前教育質(zhì)量進行評估,所得評估結(jié)果與主觀評估結(jié)果的線性相關(guān)系數(shù)與等級相關(guān)系數(shù)顯著高于兩種對比方法,由此說明本文方法評估結(jié)果更為準確。
本文研究基于深度學(xué)習(xí)網(wǎng)絡(luò)的學(xué)前教育質(zhì)量評估方法,將學(xué)前教育質(zhì)量評估指標輸入所構(gòu)建的深度學(xué)習(xí)網(wǎng)絡(luò)中進行訓(xùn)練,利用訓(xùn)練好的深度學(xué)習(xí)網(wǎng)絡(luò)能夠獲取較為準確的學(xué)前教育質(zhì)量評估結(jié)果。在后續(xù)研究過程中,將繼續(xù)針對本文方法進行優(yōu)化,逐步提升學(xué)前教育機構(gòu)教學(xué)質(zhì)量,實現(xiàn)教育強國夢。