(西安工程大學電子信息學院 陜西 西安 710048)
自2002年德國Munich研究小組通過控制光晶格[1]的阱深,實現了將超冷原子從超流態向Mott絕緣態的相變[2]。在傳統的超冷原子研究計算中,對于一維光晶格中的玻色愛因斯坦凝聚體的波函數的計算,通常采用托馬斯-費米近似和高斯近似模型求得[3,4]。通過波函數的疊加[5]再做傅里葉變換,最后得到在實驗上觀測到的動量分布。本文建立改進的條件生成對抗網絡研究一維光晶格中稀薄氣體玻色-愛因斯坦凝聚體的相位與出其動量分布。
生成式對抗網絡是Goodfellow在2014年提出的[6],其原理基于博弈論的思想,通過將生成網絡與判別網絡作為兩位博弈方,即一方獲得,另一方就會有損失。通過雙方不斷地博弈最終達到一種平衡。其模型如圖1所示:

圖1 生成式對抗網絡模型
其數學表達式如公式1所示:
(1)
D表示判別網絡,G表示生成網絡,z表示隨機噪聲。其含義就是判別網絡最大化分辨真實數據與生成數據,而生成網絡則是要不斷減小生成數據與真實數據的差距。相較于其他神經網絡模型,生成判別網絡可以生成更好的結果,但是由于生成網絡的輸入來自隨機噪聲,這樣會導致生成網絡的訓練過于緩慢,所以在Mirza提出在通過加入一個條件變量來約束輸入噪聲,于是就有了條件生成對抗網絡[7],其數學表達式如下
(2)
y表示為條件變量用來約束隨機噪聲z,我們對條件生成對抗網絡的內部結構進行了設計,生成網絡我們采用3層卷積層[8]和2層循環層[9]組成,判別網絡用3層卷積層以及兩層的全連接層組成,其結構如圖2所示:

圖2 條件生成式對抗網絡
(一)實驗數據集及網絡模型參數
實驗中,我們通過托馬斯費米理論進行計算得到波函數的兩個特征,即相位信息與原子密度信息,生成106組值作為一維光晶格中106個格點的波函數特征,其每組數據維度為106*2,我們生成了5000組數據作為實驗數據,其中將4500組作為訓練數據集,250組作為驗證數據集,250組作為測試數據集。條件生成對抗網絡的超參數如表1所示:

表1 生成網絡的超參數

表2 判別網絡的超參數
循環網絡層選用Relu[10]作為激活函數,卷積層選用的激活函數選用LeakyRelu[11],LeakyRelu可以保留卷積層輸出的負值相位特征,其表達式為:
y=max(0.2x,x)
(3)
(二)實驗結果
我們用平均誤差來評估模型的效果,網絡模型不能根據測試數據集的結果進行調整且測試數據集絕對未知,所以測試集的結果可以作為最終的評估結果,其結果如表2所示。圖3是在訓練過程中,卷積循環網絡模型在驗證數據集上的平均誤差,圖4是訓練完成后,卷積循環神經網絡在測試數據集上的結果。
表3驗證集和預測集下的神經網絡的平均誤差
Table3.AverageErrorofNeuralNetworksbasedonVerificationSetandPredictionSet

神經網絡模型驗證數據集平均誤差測試數據集平均誤差7層卷積神經網絡2.242.27條件生成對抗網絡0.590.59

圖3 生成網絡在驗證數據集上的平均誤差

圖4 網絡模型在測試數據集上的結果
(三)實驗結果分析
通過表3可以看出,條件生成對抗網絡模型的效果不管是在測試集上,還是驗證測試集上平均誤差都有明顯的下降,其誤差結果為0.59,相較于7層卷積神經網絡,誤差降低了74%。通過圖4可以看出訓練完成的模型能比較明顯的預測出一維光晶格中的超冷凝聚體在動量空間中的幾個峰值以及位置。
本文從數據科學的研究角度出發,將機器學習的方法,運用到冷原子物理中,建立卷積循環網絡模型,通過一維光晶格中的玻色-愛因斯坦凝聚體的波函數預測其動量空間的分布,不僅對基礎研究有開拓性的意義,甚至是對高精密測量,量子信息處理方面都有積極的意義。