華北電力大學 李慶哲 李 斌
當今時代尋找煤、石油、天然氣等傳統能源的代替品已經成為社會發展的主流,各國政府逐漸參與到開發新能源的項目中,而太陽能的利用更是新能源開發中必不可少的一環。目前,我國太陽能發電技術在不斷發展,2021年,我國新增光伏裝機規模達5488萬kW,連續9年位居世界第一,累計光伏裝機容量達3.06億kW,連續7年位居全球第一。
光伏行業快速發展的同時產生了許多問題,其中光伏組件積灰屬于嚴重問題。光伏組件安裝在室外且長時間運行不更換,導致光伏組件多數情況下處于覆灰蒙塵狀態,積灰引起的遮光效應、熱斑效應等嚴重影響了光伏發電的經濟性和安全性。在德黑蘭的70d 無降雨試驗中,光伏組件積灰密度達到6.0986g/m2,導致輸出功率降低21.47%[1]。為了清潔組件表面積灰,現場工作人員依靠經驗決定清洗日期,但這樣無法保證光伏電站運行經濟效益,因此,積灰損失預測是制定合理清洗策略的基礎依據。
Yazdani 等[2]根據試驗采集數據,利用指數模型,對每日功率損失百分比與光伏組件自然積灰天數進行擬合,根據光伏組件暴露在戶外時間計算功率損失,該類方法計算簡單,但受外界因素影響較大,計算結果存在較大誤差。居發禮[3]通過灰色模型依據歷史平均積灰數據建立積灰預測模型,然而在無大量歷史數據時無法預測,且未考慮具體氣象參數。王中豪[4]、Wasim[5]利用改進型相似性建模、人工神經網絡等方法進行積灰損失的診斷工作,但這些研究結果的準確度較低。考慮已有研究的不足,本文基于LSTM 在處理時序數據的優越性,利用貝葉斯算法LSTM 進行優化,開發了BO-LSTM 算法。通過光伏電站現場光伏組件積灰監測試驗,獲取積灰對光伏發電影響的試驗數據,對BO-LSTM算法的積灰預測效果進行驗證。
循環神經網絡(Recurrent Neural Network,RNN)是用于時間序列信號分類的最傳統的深度學習方法,但RNN 對于長序列數據常常存在梯度消失的問題,難以學習和保存長期信息。Hochrieter 和Schmidhuber 在1997年提出的長短期記憶(Long Short-Term Memory,LSTM)神經網絡可以解決RNN 在長序列訓練過程中存在的梯度消失和梯度爆炸問題。LSTM 模型的單元結構如圖1所示,LSTM的神經元也被稱為細胞,神經元中包含輸入門、輸出門和遺忘門,內部信息傳遞主要通過門進行傳遞,可以對關鍵信息進行選擇性“記憶”與“遺忘”,將多個LSTM 單元相互鏈接后形成LSTM 網絡。

圖1 LSTM 單元結構
信息進入神經元的第一步就是進入sigmoid 層組成的遺忘門,選擇性遺忘輸入的信息,輸入為上一神經元輸出的隱藏層狀態ht-1和這一神經元的輸入xt,經sigmoid 函數后為Ct-1中的值輸出一個0~1的值,表示數據的保留狀態。
式中:ft為遺忘門;σ為激活函數;Wxf為輸入與遺忘門之間的連接權重矩陣;Whf為遺忘門前一時刻狀態與當前狀態的連接權重矩陣;bf為遺忘門的偏差值。
式中:it為輸入門,判斷該數據流是否記錄到當前細胞狀態;Ct為單元狀態,用于保留當前輸入的特征;bi和bc為偏差值。
式中:ot代表輸出門,控制Ct影響這一神經元輸出的程度;ht代表隱藏層狀態;bo為輸出門的偏差值。
在構建神經網絡模型前,需要確定構建模型所需的超參數,模型的最終預測效果很大程度上受超參數的影響,對模型超參數的調整常常參考用于其他問題超參數取值,然后反復嘗試人工尋找最佳值,這樣的操作將會消耗大量計算資源,而且最終獲得的超參數可能不是最優,使得模型精度受限。因此為進行高效的超參數調優,常用方法包括網格搜索、隨機搜索以及貝葉斯優化(Bayesian Optimization,BO)等。超參數調化是一個黑箱問題,用黑箱的輸出對機器學習模型進行定義,然后對定義的模型進行訓練,當誤差滿足條件時停止尋優確定超參數。
網格搜索通過查找搜索范圍內的每一個點從而確定最優值,計算時長和資源占用大。隨機搜索算法通過在搜索范圍中隨機取樣本點來尋找全局最優點,但這種方法無法保證所得結果一定是最優值。貝葉斯優化算法和網格搜索、隨機搜索不同,在進行新一輪參數選取時綜合考慮之前的結果信息,確定參數優化方向,從而能夠快速得到最優值。
貝葉斯在初始化階段,由先驗概率模型產生先驗分布,并生成n 維參數向量代入目標函數,通過觀測模型評估參數是否能夠使目標函數取得最佳值,若不能則將信息向下傳遞,更新得到后驗分布。在逐次迭代中,通過每次的信息傳遞不斷更新先驗分布,隨著信息量的增加,概率模型得以修正,從而得到最優參數組向量的優化方向。
BO-LSTM 的光伏積灰損失監測模型算法實現過程如圖2所示。

圖2 BO-LSTM 算法流程
步驟一:采集數據作為樣本數據集。
步驟二:剔除無效數據并利用歸一化函數處理原始數據,并將樣本數據集分為訓練樣本集和測試樣本集。
步驟三:通過貝葉斯算法產生初始超參數組合后訓練模型,檢驗模型的預測精度,若不滿足精度要求,則由貝葉斯優化算法經更新后產生一組新的超參數,重復迭代,直到滿足精度要求得到最佳的模型訓練效果。
步驟四:滿足精度要求后,輸出相應超參數及測試樣本集的預測結果,并保存模型。
研究中,采用了4種常用的統計誤差指數,即均方誤差(MSE)、均方根誤差(RMSE)、平均絕對誤差(MAE)和回歸系數(R2),用以確定所用模型的精度水平和性能。
式中:n為總樣本個數;i為樣本編號(1~n);Pi為第i個樣本的真實值;為第i個樣本的預測值,Pi為樣本的平均值。
在2021年9月29日至2023年2月26日期間,對內蒙古自治區庫布奇沙漠光伏電站實際運行的32塊光伏組件進行積灰監測試驗。試驗現場如圖3所示,選取同一組串上的光伏組件為研究對象,左側16塊光伏組件每日由清灰機器人進行清潔,視為清潔組串;右側共16塊光伏組件保持自然積灰狀態,視為積灰組串;清潔組串和積灰組串分別與一個并網逆變器相連,由逆變器在最大功率點條件下測量直流功率、電壓、電流。氣象數據由安裝在試驗區的氣象站測量。上述電氣參數及氣象數據均為每分鐘采集一次,由網橋將數據傳輸至場站數據中心。

圖3 試驗現場
試驗系統中光伏組件型號為億晶EG-330P72-C,標準測試條件下的具體參數詳見表1。氣象站采用中科能慧NHQXZ607氣象站,可精準測量環境溫度、氣壓、相對濕度、風速、風向、降雨量、太陽總輻射、PM10、PM2.5。氣象站參數詳見表2。

表1 億晶EG-330P72-C 光伏板參數

表2 氣象站參數
為分析氣象因素對光伏組件積灰的影響,隨機選取了三個月的數據進行研究。圖4為2022年3月1日至2022年5月31日期間,積灰造成的光伏組串日發電量損失百分比,以及實測的輻照度、空氣溫度、相對濕度、風速、PM2.5和降水等氣候條件。在此期間,16塊積灰光伏組串共損失發電量88.58kWh,平均每天積灰造成光伏組件發電性能下降2.891%。2022年3月1日至2022年5月31日期間積灰損失和氣象參數的變化趨勢如圖4所示。

圖4 2022年3月1日至2022年5月31日期間積灰損失和氣象參數的變化趨勢
由圖4可知,空氣中的顆粒物濃度對光伏組件積灰存在促進作用,當PM2.5濃度高時,組件功率損失高。另外,降雨對光伏組件表面積灰有很大影響,每當出現降雨情況時,光伏組件功率損失有顯著降低。從整體看,多個降雨周期內光伏組串的功率損失隨自然積灰天數增加而增加,然而部分降雨周期內的積灰損失在經歷初期的增長后保持在一個相對穩定的狀態,如3月26日至4月8日期間,在降雨后的第三天功率損失增長到3.834%,隨后在這一值附近波動,觀察發現,這一時間段的平均風速在5m/s 以上且較低的環境濕度使光伏組件表面處于干燥狀態,較高的風速可以提供充足的能量用以吹離粒徑在10μm 以上的顆粒,而粒徑小于10μm 的微粒由于受到的粘附力非常強無法通過風從表面去除,因此光伏組件表面積灰量處于動態平衡狀態。
2022年3月1日至2022年5月31日期間積灰損失與氣象因素的皮爾遜相關系數詳見表3。統計分析結果反映各氣象條件對光伏組件積灰損失的影響,由表3可以發現,PM2.5與光伏組件功率損失呈正相關,促進組件的積灰。氣溫、風速、日輻照量與光伏組件積灰呈負相關。濕度與積灰損失相關性很小,造成此現象主要是高濕度情況下容易在組件表面結露清潔積灰,而低濕度下對灰塵顆粒的黏附性降低使灰塵易被吹起,間接促進了灰塵的減少。

表3 2022年3月1日至2022年5月31日期間積灰損失與氣象因素的皮爾遜相關系數
樣本數據集由設計搭建的積灰監測系統所采集的2022年9月29日至2023年2月26日數據。通過分析發現日輻照量、氣溫、濕度、風速以及PM2.5對光伏組件積灰損失及組件發電量存在較大影響,因此在構建預測模型時可將氣象數據作為輸入量。降雨對組件積灰損失的影響更為嚴重,因此為了充分考慮降雨的影響,引入自然積灰天數這一變量,即出現降雨情況時自然積灰天數記為1,并隨時間的增加而增加,直到出現下一次降雨重新歸為1。最終確定BO-LSTM 預測模型采用日輻照量、溫度、相對濕度、風速、PM2.5以及自然積灰天數作為輸入量,輸出變量為積灰造成的日發電量損失值。
通過貝葉斯優化LSTM 模型,無須給出具體的超參數組合,在訓練時可以設置較大的超參數搜索范圍,因此,在訓練BO-LSTM 模型時,學習率搜索范圍為10-6~10-1,神經元層數為1~30,訓練批次為2~400,定型周期為10~150。將數據集劃分訓練樣本集和測試樣本集,帶入BO-LSTM 中進行建模和預測。使用訓練樣本集訓練模型,再從數據集中抽取20%的數據作為測試集,利用測試集數據驗證模型的有效性。
BO-LSTM 最優超參數組合詳見表4。

表4 BO-LSTM 最優超參數組合
BO-LSTM 模型預測結果如圖5所示。

圖5 BO-LSTM 模型預測結果
BO-LSTM 模型預測結果誤差詳見表5。

表5 BO-LSTM 模型預測結果誤差
表4給出了BO-LSTM 訓練時的最優超參數組合。圖5與表5分別為最優超參數組合的模型預測結果與誤差,從預測效果來看,研究模型精度較高,對比同類型研究精度已有較大提升,文獻[4]中利用氣象數據預測光伏組件積灰程度,其精準度最高的改進型相似性建模方法的回歸系數(R2)僅有0.53,文獻[5]預測光伏積灰程度的人工神經網絡的回歸系數(R2)為0.537。
基于光伏電站現場積灰監測試驗臺采集數據,本文通過對光伏積灰特性進行分析,探索在光伏電站工作過程中對光伏積灰影響較大的環境參數,發現日輻照量、氣溫、濕度、風速、PM2.5對光伏組件積灰損失及組件發電量存在較大影響。提出基于BO-LSTM 的光伏積灰損失預測模型,并與前人研究對比,證明了本研究模型精度高,光伏電站工作人員可結合此模型對清洗計劃進行優化決策。