張西亞,高德東,王 珊,林光偉,高俊偉
(1.青海大學(xué)機(jī)械工程學(xué)院,西寧 810016; 2.陽光能源(青海)有限公司,西寧 810000)
在直拉硅單晶生長過程中,等徑階段的硅單晶是后期加工利用的有效部分。在這個(gè)階段,穩(wěn)定的直徑控制可以有效減少晶體缺陷的產(chǎn)生,并且可以減少后續(xù)加工的浪費(fèi)[1]。目前,直拉硅單晶的直徑控制主要有PID控制和基于模型控制兩種,其中PID控制有基于稱重的PID控制方法和基于光學(xué)測(cè)徑的PID控制方法[2-3],但是傳統(tǒng)的PID控制方法存在調(diào)節(jié)時(shí)間長、控制精度低、參數(shù)整定復(fù)雜和控制回路抗干擾能力差等問題,并且難以適應(yīng)高質(zhì)量、大尺寸單晶的生長要求[4]。隨著控制理論的迅速發(fā)展,許多學(xué)者提出了基于模型的控制方法應(yīng)用在單晶硅生長過程控制中。基于模型的控制方法控制精度高,可以滿足晶體質(zhì)量的低缺陷指標(biāo),是生長高質(zhì)量大尺寸單晶的有效策略[5]。因此,基于模型的控制方法已成為直拉單晶硅控制方法研究的主要方向。
基于直拉法硅單晶生長的建模方法有數(shù)據(jù)驅(qū)動(dòng)建模和機(jī)理建模兩類。其中,機(jī)理建模是依據(jù)單晶硅生長系統(tǒng)的內(nèi)部機(jī)理建立數(shù)學(xué)模型,Zheng等[6]建立了以提拉速度和加熱器功率為輸入,晶體生長速度和晶體半徑為輸出的集中參數(shù)模型。王海龍[7]使用子空間辨識(shí)算法來獲得等徑階段的分段熱場(chǎng)溫度模型,并利用改良的貝葉斯概率加權(quán)多模型預(yù)測(cè)控制策略控制整個(gè)拉晶過程的熱場(chǎng)溫度;梁炎明等[8]利用T-S模糊模型獲得了直拉硅單晶晶體直徑、提拉速度和熱場(chǎng)溫度之間的集總參數(shù)數(shù)據(jù)模型,并在集總參數(shù)數(shù)據(jù)模型的基礎(chǔ)上,使用模型預(yù)測(cè)控制算法對(duì)晶體直徑進(jìn)行控制;Rahmanpour等[9-10]根據(jù)生長界面熱量變化和彎月面幾何關(guān)系,建立了輸入為加熱器功率和提拉速度,輸出為熔體溫度和半徑的非線性狀態(tài)空間模型;Winkler等[11]基于能量守恒和流體動(dòng)力學(xué)等理論,建立了Cz硅晶體生長過程的機(jī)理模型。張誠[12]在溫度串級(jí)和提拉速度控制系統(tǒng)的基礎(chǔ)上,利用時(shí)變參考軌跡的動(dòng)態(tài)矩陣和史密斯預(yù)估器控制算法控制晶體直徑。雖然上述基于機(jī)理建模的控制方法具有較高的控制精度,但建立高精度的晶體直徑數(shù)學(xué)模型是實(shí)現(xiàn)其精確控制的前提條件[13],且Cz硅單晶的非線性、大時(shí)滯等特性仍然是影響其控制精度的主要原因。
數(shù)據(jù)驅(qū)動(dòng)建模[14-16]是根據(jù)拉晶過程中實(shí)測(cè)的輸入、輸出數(shù)據(jù),提取出其內(nèi)包含的深層次有效信息,進(jìn)行參數(shù)估計(jì)、過程辨識(shí)后得到的模型。梁炎明等[17]研究了T-S模糊自組織算法,選取晶體硅生長過程中熱場(chǎng)溫度和加熱器功率的特定數(shù)據(jù)段,并使用所研究的算法識(shí)別出熱場(chǎng)溫度和加熱器功率之間的非線性模型;Shah等[18]用自回歸滑動(dòng)平均數(shù)據(jù)模型描述晶體生長過程,與機(jī)理模型相比,此方法更加簡(jiǎn)單,更適合于實(shí)際控制;嚴(yán)博濤[19]采用最小二乘法及其變形算法對(duì)單晶硅直徑與加熱器溫度之間的階躍響應(yīng)模型參數(shù)進(jìn)行了辨識(shí);景坤雷[20]根據(jù)改進(jìn)的蟻獅算法構(gòu)建了硅單晶等徑階段熱場(chǎng)溫度與加熱器功率之間的非線性動(dòng)態(tài)模型,該方法考慮了硅單晶生長過程的特點(diǎn),建立了分段等徑階段的模型,并成功地將所建立的模型應(yīng)用于熱場(chǎng)溫度控制。但以上基于數(shù)據(jù)驅(qū)動(dòng)建模的控制方法都使用單一因素控制,忽略了晶體生長過程中其他主要參數(shù)對(duì)晶體直徑的影響,以及其他主要參數(shù)隨時(shí)間緩慢變化的問題只適用于生長過程中的特定階段。因此,本文提出一種多輸入、單輸出的BP(back propagation)神經(jīng)網(wǎng)絡(luò)晶體直徑辨識(shí)模型,以用于直拉單晶硅生長過程中單晶硅棒直徑的預(yù)測(cè),以期能夠?yàn)榫w直徑的控制提供一種更為精確的晶體直徑辨識(shí)模型。
在直拉硅單晶生長過程中,單晶硅生產(chǎn)條件比較復(fù)雜,需要大量的傳感器來監(jiān)測(cè)單晶爐的環(huán)境參數(shù),每次拉晶都將產(chǎn)生大量的生產(chǎn)數(shù)據(jù),如若能夠提取出其內(nèi)包含的深層次有效信息,必將大幅提高晶體直徑控制精度,進(jìn)一步提高晶體質(zhì)量。由于所能測(cè)量的拉晶參數(shù)較多,而以與晶體直徑相關(guān)度高的參數(shù)作為特征值必定能夠提高神經(jīng)網(wǎng)絡(luò)的訓(xùn)練效率與準(zhǔn)確性,故先利用關(guān)聯(lián)性分析尋找最佳特征值。
采用相關(guān)分析法對(duì)晶體直徑與各拉晶參數(shù)之間的關(guān)聯(lián)性進(jìn)行定量計(jì)算。相關(guān)分析是研究?jī)蓚€(gè)或多個(gè)變量之間的相關(guān)程度,并用一定的函數(shù)表示這種關(guān)系的一種方法。相關(guān)變量間不存在確定性關(guān)系,一般使用相關(guān)系數(shù)R來表示兩個(gè)變量間的密切程度,R的絕對(duì)值越接近于1表示相關(guān)性越好,計(jì)算公式為:
(1)


表1 晶體直徑與各拉晶參數(shù)的相關(guān)系數(shù)Table 1 Correlation coefficient of crystal diameter and each crystal pulling parameter
由表1可以看出21個(gè)拉晶參數(shù)與晶體直徑的相關(guān)系數(shù),線性相關(guān)按強(qiáng)弱程度可劃分為三級(jí):
|R|<0.4為低度線性相關(guān);0.4<|R|<0.7為顯著性相關(guān);0.7<|R|<1為高度線性相關(guān)。本文為了提高神經(jīng)網(wǎng)絡(luò)的訓(xùn)練效率與準(zhǔn)確性,將與晶體直徑呈高度線性相關(guān)的12個(gè)拉晶參數(shù)作為特征值,用以訓(xùn)練神經(jīng)網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)訓(xùn)練所使用的特征值如表2所示。

表2 神經(jīng)網(wǎng)絡(luò)訓(xùn)練所使用的特征值Table 2 Feature values used in neural network training
由于12個(gè)特征值的單位不同,且數(shù)量級(jí)不統(tǒng)一,若將所采集獲得的拉晶參數(shù)樣本數(shù)據(jù)直接輸入BP預(yù)測(cè)算法會(huì)降低晶體直徑預(yù)測(cè)的準(zhǔn)確性和算法的收斂性,直接降低算法的效率。因此,必須對(duì)所采集的樣本數(shù)據(jù)進(jìn)行單位和數(shù)量級(jí)上的預(yù)處理,使12個(gè)特征值在數(shù)量級(jí)和單位上達(dá)到一致。本文采用數(shù)據(jù)歸一化進(jìn)行各參量的單位和數(shù)量級(jí)的統(tǒng)一,數(shù)據(jù)歸一化是一種最簡(jiǎn)單實(shí)用的歸一化方法,通過數(shù)據(jù)歸一化可以很好地統(tǒng)一12個(gè)參量的單位和數(shù)量級(jí),其計(jì)算公式為:
(2)
式中:Xn為原始參量數(shù)據(jù);Xmax、Xmin分別為原始參量數(shù)據(jù)中最大值和最小值;Pn是歸一化后的參數(shù)數(shù)值。在利用BP預(yù)測(cè)算法進(jìn)行訓(xùn)練和測(cè)試時(shí),必須使用相同最大值和最小值。
基于神經(jīng)網(wǎng)絡(luò)的晶體直徑預(yù)測(cè)模型的工作流程如圖1所示,具體分為三大模塊:數(shù)據(jù)準(zhǔn)備、網(wǎng)絡(luò)訓(xùn)練和網(wǎng)絡(luò)計(jì)算。其中,數(shù)據(jù)準(zhǔn)備主要是獲取單晶硅生產(chǎn)車間里的CL120-97單晶爐拉晶數(shù)據(jù),對(duì)拉晶數(shù)據(jù)進(jìn)行分析處理確定神經(jīng)網(wǎng)絡(luò)的輸入和輸出,并將拉晶數(shù)據(jù)分為訓(xùn)練數(shù)據(jù)以及驗(yàn)證數(shù)據(jù),為神經(jīng)網(wǎng)絡(luò)的訓(xùn)練做準(zhǔn)備;網(wǎng)絡(luò)訓(xùn)練主要是通過確定神經(jīng)網(wǎng)絡(luò)的輸入、輸出、隱藏層數(shù)、隱藏層節(jié)點(diǎn)數(shù)和訓(xùn)練函數(shù),來構(gòu)建神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),通過訓(xùn)練函數(shù)調(diào)整神經(jīng)網(wǎng)絡(luò)各層間的權(quán)系數(shù),權(quán)系數(shù)w能夠反映訓(xùn)練過程中輸入和輸出之間的映射關(guān)系,訓(xùn)練后即可得到滿足精度要求的神經(jīng)網(wǎng)絡(luò);網(wǎng)絡(luò)計(jì)算主要是將拉晶數(shù)據(jù)作為訓(xùn)練后神經(jīng)網(wǎng)絡(luò)的輸入,經(jīng)神經(jīng)網(wǎng)絡(luò)計(jì)算后得到晶體直徑,實(shí)現(xiàn)對(duì)晶體直徑的預(yù)測(cè)。具體流程如圖1所示。

圖1 晶體直徑預(yù)測(cè)模型工作流程圖Fig.1 Work flow chart of crystal diameter prediction model
本文用歸一化之后的特征值組成的12元組Xi=(X1,X2,X3,…,X11,X12)作為BP神經(jīng)網(wǎng)絡(luò)輸入,使用晶體直徑Y(jié)i作為BP神經(jīng)網(wǎng)絡(luò)輸出。
三層神經(jīng)網(wǎng)絡(luò)模型能夠很好地解決一般的函數(shù)擬合和逼近問題,其網(wǎng)絡(luò)拓?fù)湟话阌奢斎雽印㈦[藏層和輸出層組成[21]。當(dāng)神經(jīng)網(wǎng)絡(luò)的隱藏層數(shù)為1層時(shí),神經(jīng)網(wǎng)絡(luò)可以逼近任意連續(xù)函數(shù),而增加神經(jīng)網(wǎng)絡(luò)的隱藏層個(gè)數(shù)有利于模型預(yù)測(cè)精度的提升,綜合考慮模型精度及復(fù)雜程度,選取隱藏層為2層的神經(jīng)網(wǎng)絡(luò)。
對(duì)于隱藏層節(jié)點(diǎn)的選擇,假如在設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)的過程中,隱藏層神經(jīng)元的節(jié)點(diǎn)數(shù)較多,則容易導(dǎo)致數(shù)據(jù)過度擬合,使模型所提取的特征值缺乏代表性,反之,如果隱藏層神經(jīng)元節(jié)點(diǎn)數(shù)過少,則容易導(dǎo)致神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力較弱,使模型所提取的特征值表達(dá)能力較低。因此,在本文的實(shí)驗(yàn)中,借鑒其他設(shè)定經(jīng)驗(yàn),同時(shí)使用主觀設(shè)定法去嘗試隱藏層的節(jié)點(diǎn)數(shù),其中隱藏層節(jié)點(diǎn)數(shù)設(shè)置的參考公式為:
(3)
式中:m表示隱藏層的節(jié)點(diǎn)數(shù);n表示輸入層中神經(jīng)元的節(jié)點(diǎn)數(shù);l表示輸出層中神經(jīng)元的節(jié)點(diǎn)數(shù);a是介于[1,10]之間的常數(shù)。
根據(jù)公式(3)可以計(jì)算出隱藏層神經(jīng)元數(shù)的取值范圍為[4,13],隱藏層神經(jīng)元數(shù)目在[4,13]范圍內(nèi)的平均相對(duì)誤差,可以通過逐漸增加隱藏層神經(jīng)元數(shù)目并試算后得到,如圖2所示。由圖2可以看出,當(dāng)隱藏層中神經(jīng)元數(shù)為10時(shí),預(yù)測(cè)值與測(cè)試值之間的平均相對(duì)誤差(ARE)最小。因此,隱藏層神經(jīng)元數(shù)取10。

圖2 不同神經(jīng)元數(shù)和平均相對(duì)誤差的關(guān)系Fig.2 Relationship between the number of different neurons and the average relative error
以Sigmoid型函數(shù)中的Logistic函數(shù)作為神經(jīng)網(wǎng)絡(luò)隱藏層神經(jīng)元傳遞函數(shù),以線性傳遞函數(shù)purelin作為輸出層中神經(jīng)元的傳遞函數(shù),以Levenberg-Marquardt算法的訓(xùn)練函數(shù)trainlm作為訓(xùn)練函數(shù)[22]。設(shè)定神經(jīng)網(wǎng)絡(luò)的參數(shù)后,即可得到硅單晶直徑預(yù)測(cè)模型的BP神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),如圖3所示。

圖3 神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)Fig.3 Neural network topology diagram
根據(jù)以上輸入輸出形式,將在單晶硅生產(chǎn)車間采集的CL120-97單晶爐拉晶數(shù)據(jù),分為訓(xùn)練數(shù)據(jù)和驗(yàn)證數(shù)據(jù)。訓(xùn)練數(shù)據(jù)(占總量90%以上)用于訓(xùn)練神經(jīng)網(wǎng)絡(luò),驗(yàn)證數(shù)據(jù)用于驗(yàn)證訓(xùn)練后的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的準(zhǔn)確性。圖4為驗(yàn)證數(shù)據(jù)經(jīng)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型計(jì)算后所得結(jié)果圖,結(jié)合圖4(a)和4(b)可以看出該模型對(duì)前80個(gè)直徑樣本的預(yù)測(cè)具有很高的準(zhǔn)確性,其后樣本的直徑預(yù)測(cè)效果相對(duì)較差,200個(gè)直徑樣本預(yù)測(cè)的平均相對(duì)百分比誤差為0.140 94%。

圖4 BP神經(jīng)網(wǎng)絡(luò)晶體直徑預(yù)測(cè)結(jié)果。(a)預(yù)測(cè)值與真實(shí)值的對(duì)比;(b)預(yù)測(cè)值與真實(shí)的平均相對(duì)誤差Fig.4 Crystal diameter prediction results of BP neural network. (a) Comparison between predictive value and actual value; (b) average relative error between predictive value and actual value
BP神經(jīng)網(wǎng)絡(luò)算法[23]雖然具有較強(qiáng)的局部搜索能力,但其預(yù)測(cè)結(jié)果還取決于神經(jīng)網(wǎng)絡(luò)的原始狀態(tài),容易陷入局部最小值,降低對(duì)晶體直徑的預(yù)測(cè)精度。因此,本文使用擅長全局搜索的遺傳算法(genetic algorithm,GA)優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值[24-25],并在眾多解空間中找到最佳的搜索空間,然后使用BP算法在此解空間中搜索最優(yōu)解,實(shí)現(xiàn)對(duì)直拉硅晶體直徑的精確預(yù)測(cè)。
遺傳算法是借鑒生物界優(yōu)勝劣汰、適者生存的進(jìn)化規(guī)律演變而來的啟發(fā)式隨機(jī)搜索算法,具有良好的隱并行性和全局尋優(yōu)能力,其學(xué)習(xí)近似最優(yōu)解不需要誤差函數(shù)的梯度信息,它適用于求解復(fù)雜的非線性問題。遺傳算法包括編碼、適應(yīng)度函數(shù)計(jì)算、種群初始化、復(fù)制、交叉和變異,本文將遺傳算法與BP神經(jīng)網(wǎng)絡(luò)算法相結(jié)合,將BP神經(jīng)網(wǎng)絡(luò)隱藏層節(jié)點(diǎn)的閾值和權(quán)值作為遺傳算法的輸入信息,并對(duì)其進(jìn)行編碼生成種群,然后利用遺傳算法的復(fù)制、交叉和變異算子生成新的子代,作為BP神經(jīng)網(wǎng)絡(luò)算法進(jìn)行網(wǎng)絡(luò)訓(xùn)練的初值,隨后用遺傳算法檢驗(yàn)個(gè)體是否達(dá)到適應(yīng)度標(biāo)準(zhǔn),不達(dá)標(biāo)的個(gè)體進(jìn)行復(fù)制、交叉和變異操作,直到個(gè)體滿足精度要求或適應(yīng)度標(biāo)準(zhǔn)為止。基于遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)算法流程如圖5所示。

圖5 基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)算法流程圖Fig.5 Flow chart of BP neural network based on genetic algorithm
3.2.1 遺傳算法部分
首先將BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值、閾值作為遺傳算法的初始群落進(jìn)行初始化處理,然后進(jìn)行復(fù)制、交叉、變異操作,并將種群中的新種群帶到BP神經(jīng)網(wǎng)絡(luò)中進(jìn)行迭代,尋找最佳權(quán)值和閾值。具體操作方式如下:
(1)初始化種群。將輸入層與隱藏層、隱藏層與隱藏層、隱藏層與輸出層之間的權(quán)值和閾值組成的實(shí)數(shù)串,作為遺傳算法的初始化群落。
(2)適應(yīng)度函數(shù)的確定。預(yù)測(cè)晶體直徑和實(shí)際晶體直徑之間的誤差的絕對(duì)值作為個(gè)體適應(yīng)度值F,則適應(yīng)度的計(jì)算方式如下:
(4)
式中:F表示個(gè)體的適應(yīng)度值;m表示BP神經(jīng)網(wǎng)絡(luò)的輸出層節(jié)點(diǎn)數(shù);di表示BP神經(jīng)網(wǎng)絡(luò)第i個(gè)節(jié)點(diǎn)的實(shí)際晶體直徑;pi表示BP神經(jīng)網(wǎng)絡(luò)第i個(gè)節(jié)點(diǎn)的預(yù)測(cè)晶體直徑。
(3)對(duì)優(yōu)秀個(gè)體進(jìn)行復(fù)制。采用各個(gè)個(gè)體被選中的概率與其適應(yīng)度大小成正比的選擇策略,即比例選擇方法,其選擇算子的計(jì)算方式如下:
(5)
式中:si表示選擇算子;N表示種群中的個(gè)體總數(shù);fi=k/Fi;Fi表示個(gè)體i的適應(yīng)度值。
(4)交叉。種群中的兩個(gè)個(gè)體按一定的概率進(jìn)行隨機(jī)交叉,在j點(diǎn)的兩個(gè)個(gè)體pk和pl的交叉方式為:
(6)
式中:pkj和plj表示在j點(diǎn)兩個(gè)個(gè)體;α是(1,0)之間的隨機(jī)數(shù)。
(5)變異。隨機(jī)將種群中的兩個(gè)個(gè)體按照一定的概率進(jìn)行變異,在j點(diǎn)個(gè)體pi的變異方式如下:
(7)
式中:pij表示在j點(diǎn)個(gè)體pi變異后所得到的個(gè)體;pmax為個(gè)體中的最大值;pmin為個(gè)體中的最小值;v為當(dāng)前進(jìn)化次數(shù);vmax為最大進(jìn)化次數(shù);μ為介于(0,1)之間的隨機(jī)數(shù)。
(6)判斷新的個(gè)體是否滿足最佳個(gè)體標(biāo)準(zhǔn)。若不能滿足標(biāo)準(zhǔn),則返回步驟(2);若滿足,則將最優(yōu)個(gè)體分成BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值,重新調(diào)整網(wǎng)絡(luò)參數(shù),再次學(xué)習(xí)訓(xùn)練,直到達(dá)到學(xué)習(xí)的上限或所需精度為止。
3.2.2 BP神經(jīng)網(wǎng)絡(luò)部分
將遺傳算法部分優(yōu)化后的個(gè)體,解碼獲取權(quán)值、閾值,使用訓(xùn)練數(shù)據(jù)訓(xùn)練BP神經(jīng)網(wǎng)絡(luò),然后使用遺傳算法檢驗(yàn)個(gè)體是否滿足適應(yīng)度標(biāo)準(zhǔn),不滿足標(biāo)準(zhǔn)的個(gè)體進(jìn)行復(fù)制、交叉和變異等操作,隨后重新進(jìn)行網(wǎng)絡(luò)訓(xùn)練,直到個(gè)體達(dá)到適應(yīng)度標(biāo)準(zhǔn)或精度要求為止。具體操作方式如下:
(1)BP神經(jīng)網(wǎng)絡(luò)的初始化。X、Y分別為輸入、輸出層神經(jīng)元的輸入和輸出向量,輸入層節(jié)點(diǎn)數(shù)為n;輸出層節(jié)點(diǎn)數(shù)為m。
(8)
式中,輸入向量代表晶體直徑與拉晶參數(shù)呈高度線性相關(guān)的特征值,輸出向量代表晶體直徑,二者都根據(jù)歸一化公式(2)進(jìn)行量化處理。
(2)計(jì)算第一層隱藏層輸出。第一層隱藏層的節(jié)點(diǎn)個(gè)數(shù)為q,輸入層和隱藏層之間的權(quán)值和閾值分別為ωij、λa,隱藏層的輸出值為Ha,其計(jì)算公式如下:
(9)
式中:Haj為第一層隱藏層輸出;f為激勵(lì)函數(shù)。
(3)計(jì)算第二層隱藏層輸出。第二層隱藏層的節(jié)點(diǎn)個(gè)數(shù)為q,第一層隱藏層和第二層隱藏層之間的權(quán)值和閾值分別為ωik、λb,第二層隱藏層的輸出值為Hb,其計(jì)算方式如下:
(10)
式中:Hbk為第二層隱藏層輸出。
(4)計(jì)算輸出層輸出。隱藏層和輸出層之間的閾值和權(quán)值分別為ωil、λc,輸出層的輸出值為Hc,其計(jì)算方式如下:
(11)
式中:Hcl為輸出層輸出。
(5)計(jì)算誤差并驗(yàn)證。預(yù)測(cè)輸出Hc與實(shí)際輸出Y之差的絕對(duì)值,即為誤差e,其計(jì)算方式如下:
e=|Y-Hcl|
(12)
模型達(dá)到標(biāo)準(zhǔn)的誤差最小值設(shè)為e0,如果min(e) 將BP神經(jīng)網(wǎng)絡(luò)所用訓(xùn)練集與測(cè)試集數(shù)據(jù)輸入到GA-BP神經(jīng)網(wǎng)絡(luò),進(jìn)行訓(xùn)練與測(cè)試。圖6為計(jì)算后所得結(jié)果圖,由圖6(a)可以看出該模型預(yù)測(cè)值與真實(shí)拉晶數(shù)據(jù)具有很高擬合性,由6(b)可以看出預(yù)測(cè)模型各點(diǎn)的平均相對(duì)誤差較低,其平均相對(duì)百分比誤差為0.029 42%。 圖6 GA-BP神經(jīng)網(wǎng)絡(luò)晶體直徑預(yù)測(cè)結(jié)果。(a)預(yù)測(cè)值與真實(shí)值的對(duì)比;(b)預(yù)測(cè)值與真實(shí)值的平均相對(duì)誤差Fig.6 Crystal diameter prediction results of GA-BP neural network. (a) Comparison between predictive value and actual value; (b) average relative error between predictive value and actual value BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型與GA-BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的性能對(duì)比如表3所示,由表中可以看出GA-BP神經(jīng)網(wǎng)絡(luò)的最小相對(duì)誤差、最大相對(duì)誤差、平均絕對(duì)誤差和平均相對(duì)誤差均明顯低于BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,而代表擬合優(yōu)越度的絕對(duì)系數(shù)R2,GA-BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的絕對(duì)系數(shù)0.876 41優(yōu)于BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的絕對(duì)系數(shù)0.470 27,因此GA-BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型相對(duì)于BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型在晶體直徑預(yù)測(cè)方面具有更高的預(yù)測(cè)精度。 表3 兩種神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型性能對(duì)比Table 3 Performance comparison of two neural network prediction models 本文所用訓(xùn)練數(shù)據(jù)與驗(yàn)證數(shù)據(jù)均來自同一臺(tái)單晶爐的拉晶數(shù)據(jù),此預(yù)測(cè)模型對(duì)其他同型號(hào)單晶爐預(yù)測(cè)精度如何,仍需要繼續(xù)驗(yàn)證。因此,為了進(jìn)一步驗(yàn)證預(yù)測(cè)模型的準(zhǔn)確性和穩(wěn)定性,隨機(jī)選擇8臺(tái)CL120-97單晶爐做作為實(shí)驗(yàn)對(duì)象,將其完整拉晶數(shù)據(jù)分為八組,分別用所搭建的晶體直徑預(yù)測(cè)模型進(jìn)行仿真實(shí)驗(yàn),圖7為預(yù)測(cè)值與真實(shí)值的對(duì)比圖,從圖中可以看出,該模型對(duì)這8臺(tái)單晶爐的預(yù)測(cè)性能,比用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)的單晶爐的預(yù)測(cè)性能差,但仍有較高的擬合性。表4為這8臺(tái)單晶爐預(yù)測(cè)值與真實(shí)值的平均相對(duì)百分比誤差,平均值為0.095 71%,且其值均在0.05%~0.15%范圍內(nèi),表明該晶體直徑預(yù)測(cè)模型具有比較高的穩(wěn)定性和準(zhǔn)確性,能夠用于晶體直徑預(yù)測(cè)。 圖7 預(yù)測(cè)值與真實(shí)值的對(duì)比圖Fig.7 Comparison chart of predicted value and autual value 表4 預(yù)測(cè)值與真實(shí)值的平均相對(duì)百分比誤差Table 4 Average relative percentage error between predicted value and actual value 本文針對(duì)傳統(tǒng)的PID控制方法存在調(diào)節(jié)時(shí)間長、控制精度低以及基于大量假設(shè)的機(jī)理模型難以實(shí)際應(yīng)用的問題,以現(xiàn)有CL120-97單晶爐拉晶車間的長期、海量晶體生長數(shù)據(jù)為基礎(chǔ),建立了一種基于BP神經(jīng)網(wǎng)絡(luò)的晶體直徑預(yù)測(cè)模型,隨后用遺傳算法對(duì)預(yù)測(cè)模型進(jìn)行優(yōu)化,將實(shí)際拉晶數(shù)據(jù)對(duì)此模型進(jìn)行訓(xùn)練,任選8臺(tái)單晶爐驗(yàn)證模型,得出以下結(jié)論: (1)所建立BP神經(jīng)網(wǎng)絡(luò)晶體直徑預(yù)測(cè)模型對(duì)晶體直徑預(yù)測(cè)的平均相對(duì)百分比誤差為0.140 94%。 (2)預(yù)測(cè)模型使用遺傳算法優(yōu)化后,提高了對(duì)晶體直徑的預(yù)測(cè)精度,對(duì)晶體直徑預(yù)測(cè)的平均相對(duì)百分比誤差為0.029 42%。 (3)預(yù)測(cè)模型對(duì)隨機(jī)抽取的8臺(tái)單晶爐進(jìn)行直徑預(yù)測(cè),平均相對(duì)百分比誤差為0.095 71%,且其值均在0.05%~0.15%范圍內(nèi),表明該晶體直徑預(yù)測(cè)模型具有比較高的穩(wěn)定性和準(zhǔn)確性,能夠用于晶體直徑預(yù)測(cè)。3.3 GA-BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練


4 實(shí)驗(yàn)驗(yàn)證直徑預(yù)測(cè)模型


5 結(jié) 論