胡雪凱,時 珉,胡文平,尹 瑞,張 乾,常 杰
(1.國網河北省電力有限公司電力科學研究院,石家莊 050021;2.國網河北省電力有限公司,石家莊 050021;3.國網河北省電力有限公司檢修分公司,石家莊 050070)
隨著光伏發電技術的不斷發展,在電力需求中所占比例也越來越大,致使光伏發電對電網的影響越來越明顯。光伏發電本身所特有的間歇性和不確定性,增加了電網計劃和調度的難度[1-2]。為了解決其發電量不穩定的問題,必須加大系統的旋轉備用容量。旋轉備用容量的增加間接地增加了光伏發電的運營整體成本,所以有必要對其輸出功率進行預測。
通過對光伏電站發電量進行短期和中期的準確預測,將其從未知變為基本已知,調度運行人員可根據預測的波動情況,合理安排應對措施,提高電網的安全性和可靠性;而將功率預測與負荷預測相結合,還有利于調度運行人員調整和優化常規電源的發電計劃,改善電網調峰能力,增加光伏的并網容量[3-6];根據預測結果,只需增加對應預測誤差的旋轉備用容量,可以顯著降低額外增加的旋轉備用容量,對改善電網運行經濟性具有重要意義;光伏功率預測還可以增強風電、光伏在電力市場中的競爭力,提高上網電價。另外,功率預測有助于合理安排檢修計劃、減少棄風棄光,提高企業的盈利能力[7-9]。
為保障電力系統安全穩定運行,落實國家可再生能源政策,規范光伏發電并網調度運行管理,華北能源監管局制定了《華北區域光伏發電站并網運行管理實施細則》。NB/T 32031-2016《光伏發電功率預測系統功能規范》要求,短期光伏功率預測應能預測次日零時起至未來72 h的輸出功率,時間分辨率為15 min;超短期功率預測應能預測未來15 min~4 h的輸出功率,時間分辨率不小于15 min。誤差評估指標為短期預測月均方根誤差應小于0.15,超短期預測第4 h預測值月均方根誤差小于0.10。
光伏發電的主要預測方法如圖1所示。

圖1 光伏發電功率預測方法
根據提前預測時間長短,分為超短期預測、短期預測和中長期預測。
超短期光伏功率預測可采用物理方法和統計預測方法。其中物理方法主要是對云圖進行圖像處理,結合數值天氣預報(N WP)[10-14]或地面觀測站數據,進行光伏功率預測;統計預測方法主要采用自回歸滑動平均(ARMA)算法、人工智能算法、持續預測法等進行預測。
相比之下,短期功率預測需要氣象數據的時空分辨率要求相對較低,可利用精細化的N WP數據進行預測而不必采用云圖數據[15]。
中長期光伏功率預測主要是根據地區歷史光資源數據等估計未來較長時間段內的光伏功率。
將預測方法按對于歷史數據的需求量劃分,可分為物理模型法、統計方法、學習法。
物理模型法不需要大量歷史數據,適用于新建的光伏電站,但需要光伏電站詳細的地理信息和組件參數等數據,建模過程復雜,且難以模擬一些極端異常天氣情況和環境及光伏組件參數隨時間發生的緩慢變化,模型抗干擾能力較差,魯棒性不強。
統計方法基于預測模型輸入、輸出因素之間的統計規律,通過分析獲得預測模型。利用光伏發電的歷史數據與相關因素數據進行統計分析。常用的統計預測方法有自回歸移動平均算法(ARMA)、自回歸積分移動平均算法(ARI MA)、多元線性回歸法、指數平滑算法等。
學習方法主要包括模糊推理系統、遺傳算法、人工神經網絡和支持向量機(SV M)等。其中人工神經網絡具有大規模數據處理、自適應學習、容錯性強等特點。網絡主要包括三層:輸入層、隱含層與輸出層。ANN適用于解決一些隨機非線性的問題,誤差較小,且可以隨時更換樣本數據,不斷注入新的測試數據,提高預測精度。但容易陷入局部最小問題,得不到最優解,且泛化能力不強。以上缺點對預測的精度都有一定的影響。
光伏功率預測系統是一個集氣象站實時氣象信息、數值氣象預報數據和實時功率數據接入和展示、光伏電站和區域功率預測、數據上報、預測結果動態統計評估為一體的光伏功率預測系統平臺。系統須實現自動采集光伏電站運行數據、自動氣象站監測數據,對所采集數據信息進行分析與挖掘,準確判定發電效率的影響因子及其變化規律,實現光伏發電站有功功率超短期、短期、長期的高精度預測,實現誤差統計、相關性分析等功能,為運行人員提供可靠參考。光伏電站功率預測系統硬件拓撲結構如圖2所示[15]。
光伏電站的各運行數據、氣象站實測數據、從數值天氣預報中心得到氣象數據結合通過通信交換機交給含數據處理和預測功能的預測工作站做計算,將預測結果上傳至各直屬調度數據網和光伏電站監控系統。

圖2 光伏電站功率預測系統硬件拓撲結構
光伏預測系統除需在場站區域配置自動氣象監測站外,還需要部署專用的應用服務器、數據庫服務器、預測工作站和外網工作站,實現光伏電場各光伏組件運行數據、自動氣象站實測數據接入、N WP數據解析、光伏出力預測結果計算功能,并將預測結果上傳至各直屬調度機構。此外為了保障系統和電網安全,還需配置相應的防火墻和硬件隔離設備。
表1描述了光伏電站功率預測系統各部分作用分析。

表1 光伏電站功率預測系統各部分作用
光伏電站功率預測系統設計為模塊化設計,可方便按照用戶的需求去增減某些功能,系統必須靈活性和可擴展性。系統主要模塊包括氣象數據采集模塊、功率數據采集模塊、數值天氣預報采集模塊、數據通信模塊、功率預測模塊、統計分析模塊、人機交互模塊等。
數據采集模塊主要包括電站運行數據、氣象站數據、數值天氣預報數據、發電單元運行數據、數值天氣預報校驗設置和氣象站數據校驗設置等。
數據通信模塊主要包括數據傳遞、專網上傳、信息流通等功能。
功率預測模塊主要包括預測設置、手動預測、日功率曲線圖、停機設置、預測結果查看、預測日志查看等。
統計分析模塊主要用來統計實際功率與預測功率的誤差情況,并計算考核電量,誤差統計指標包括均方根誤差、平均絕對誤差、相關性系數、合格率、考核電量。
人機交互模塊主要包括系統的人機界面,系統擴展性和便利性。
光伏功率預測是以數值天氣預報數據和實測運行數據為基礎,結合光伏電站地理坐標及具體地域特點的參數化方案,建立預測模型及算法,實現對未來一段時間內光伏電站輸出功率的預測。光伏功率預測的關鍵在于確定不同時空尺度下影響光伏功率的主要因素及其作用機理,并選擇恰當的算法建立預測模型。
影響光伏發電功率預測性能的主要環境因素是太陽輻射和環境溫度、電池溫度。實際上,清潔度指數和日照時間是通過改變達到光伏面板的太陽輻射量來影響光伏系統輸出功率。在光伏發電功率預測中,晴空指數和日照時間也常常作為影響因素之一。
灰塵覆蓋光伏面板,將減少光伏面板吸收太陽輻射的比例,最終降低光伏面板的輸出功率。不同于輻射、云、溫度、風速等因素,灰塵對光伏功率輸出的影響是一個長期且平穩的過程,因為灰塵的沉降、積累和自然清除是一個持續且穩定的過程?;覊m對光伏面板性能的影響具有緩慢性和漸進性,不能反映在超短期或短期預測當中,但可以根據其影響特性進行補償。
風速和云也明顯地影響光伏系統的功率輸出,但是很少被考慮到,因為它們的屬性變化很大且很快,在幾分鐘內甚至幾秒鐘內使光伏發電輸出具有很陡的斜坡,這超出了大多數人工智能方法處理龐大數據量的響應時間。而在數小時、數天或數周時間水平的短期或中期預測中,這種急劇的變化可以被視為異常而忽視。但是在超短期預測中,影響預測精度的最重要因素是云。云只有很小甚至沒有慣性,所以云變幻莫測,它的形狀、大小、速度和方向都在改變。云的變化會立即改變光伏面板接收到的太陽輻射量,并迅速引起光伏系統輸出功率的變化。有研究人員采用天空成像儀和太陽跟蹤攝像頭探測和跟蹤影響光伏發電輸出功率的云朵變化,但其算法的時間分辨率還不能達到預期的精度。
傳統的物理預測方法根據太陽能輻射模型、電站模型、光伏轉換模型、電路模型和逆變器模型來預測輸出功率。但受輻射的不確定性、云的變化、雨水和環境、電池溫度等因素的影響,會導致短期預測不夠準確。
基于統計和人工智能技術的輸出功率預測方法可以綜合考慮并補償上述各種因素的影響。不過,這些方法需要充分的歷史數據支持,以供給統計處理和人工神經網絡的訓練。通常,至少需要光伏系統輸出功率一年連續且完整的數據進行統計回歸。神經網絡相關的算法不僅需要光伏發電系統輸出功率的歷史數據,且與氣象和數值天氣預報的歷史數據緊密相關。歷史數據的缺少會使相關的統計數據和人工智能預測方法無效。同時,不完整的歷史數據可能導致很大的預測誤差。
除歷史數據外,數值天氣預報,如云、風、溫度、濕度和降雨等實時數據,也有助于在線訓練和調整內部參數以獲得更高的預測精度。
除歷史數據的完整性,數據本身也值得關注。數據的采樣間隔、準確性、收集、預處理、數值天氣預報的選擇和本地傳感器指標特性等都從不同方面決定著數據本身的特性,也將很大程度上影響預測的準確性。有研究表明,更準確的天氣預報可以將光伏發電功率預測精度提高10%左右。
3.3.1 廠區逆變器等送電設備
如果逆變器出現頻率異常、溫度過高等原因使其自動脫網關機,導致部分組件發電不能并網,即電站的投運總容量減少,影響到光功率預測系統的電站開機容量參數與實際不相符,勢必影響預測的準確率。
同樣,如果有匯流箱、直流配電柜、箱式變壓器、開關柜等設備停運,或電纜頭爆掉等原因導致一部分組件發電不能并網,最終都會影響預測的準確率。
3.3.2 廠區通信管理機
廠區通信管理機主要負責轉換通信網絡,如果通信管理機出現損壞、死機、工作不穩定或者收發信息能力較弱,會導致電站綜合自動化系統采集逆變器實際出力數據不準確、不及時,影響光功率預測中的出力曲線與實際不相符,預測準確率是依次計算,進而影響準確率這個值的準確性。
3.3.3 廠區通信網絡
廠區通信網絡分為兩部分:一部分是廠區通信管理機之間、廠區通信管理機與中控室通信機之間的通信,通過光纖串聯成一個環網;另一部分是廠區通信管理機和需要通信發電設備之間的通信,基于成本考慮大多采用RS485來組成網絡。
對于第一部分,只要光電轉換設備不掉電、未損壞,光纖通信網絡則較穩定;而第二部分RS485通信,雖然采用的是帶鎧裝屏蔽層的線纜,但是由于其技術及協議的局限,其具有通信距離短、通信容易被干擾、通信量小等缺點。
對于RS485通信網絡,設計時可能通信線路長度是合格的,但在施工時有可能為了預留電纜頭、布線線路調整、線路埋地深度等影響使得通信比設計變長而不合格,或者施工時使得通信線路和電力線路、電力設備之間的距離過小,再或者線纜的屏蔽層沒有有效接地,等其他原因造成通信網絡被干擾,通信不順暢,導致逆變器采集出力值不準確,影響準確率。
3.4.1 硬件設備
光功率預測系統構成見圖3,包括的硬件設備有:天氣預報數據采集服務器、光功率預測系統服務器、反向隔離裝置、硬件防火墻、路由器、交換機等設備。這些設備能否正常運行是關系功率預測系統正常工作的前提。

圖3 光功率預測系統構成
比如天氣預報數據采集服務器影響天氣預報數據的下載、處理并通過反向隔離裝置發送到光功率預測系統服務器上,硬件防火墻、路由器、交換機都是光功率預測系統中數據傳輸的必經設備,影響傳輸數據的效率及成功率。
3.4.2 軟件系統
光功率預測系統中的軟件包括:運行在天氣預報數據采集服務器和光功率預測系統服務器上的操作系統,固嵌于反向隔離裝置、硬件防火墻、路由器、交換機等的嵌入式程序,運行在操作系統上的光功率預測軟件、反向隔離裝置文件收發軟件、預測文件上傳調度的傳輸軟件、數據庫軟件、環境采集儀軟件等。
這些軟件不能有自動脫網、自動退出程序、自動重新啟動等bug,否則都會影響功率預測。
3.4.3 環境采集儀
環境采集儀一般安裝在中控室屋頂,主要檢測電站當前環境下的關照強度、氣溫、濕度、風速、風向等數據,用于超短期的光功率預測。采集數據的準確度、分辨率,以及數據及時傳輸到光功率預測系統服務器上,都直接影響到超短期的光功率預測。
提高預測準確率是光伏功率預測的核心問題,目前研究主要聚焦在通過數據預處理提升輸入數據品質以及深度挖掘數據特性提高模型精確性兩方面,前者如壞數據剔除、缺失數據重構、數據歸一化和去趨勢化等;后者如數據樣本篩選和輸入數據優選。另外,針對光伏發電功率預測的實際需求,以常用的預測目標參數為考察指標,制定綜合的評估評價標準體系,也能有效督促光伏電站提高其預測的準確率。
光伏數據質量參差不齊,通信、測量環節的問題都可能導致壞數據產生及數據缺失;不同類別的數據具有不同的量綱和數值范圍,因此,對光伏數據進行預處理操作是高精度預測的必要環節。應加強數據的完整性和有效性設計,注重數據采集、處理和存儲積累各環節的設計,從數據來源、數據類型、數據精度、數據密度、時間分布、數據關聯性等方面保證數據的完整性和有效性,保證預測的準確性和可重復性。
4.1.1 壞數據剔除
通常依據物理規律或數據采集質量控制要求剔除壞數據。但由于光伏數據本身具有較大的分散性,對壞數據的定義是一個難點,定義不準確會導致誤判。
4.1.2 缺失數據處理
當要求數據具有連續性或者數據樣本較小時,剔除缺失數據段會給預測精度帶來較大影響,因而重構缺失數據很有必要。
插值法是最簡單的數據重構方法之一,如采用插值法提高NWP數據的時空分辨率。但由于光伏數據的波動性和隨機性顯著,插值法可能無法較好地還原數據序列。采用已知數據建立特征空間,利用SVM分類模型實現歷史缺失數據的恢復。
輻照度和氣象因素都具有較強的空間連續性和相似性,由此產生了基于空間相關性的數據還原技術。采用空間相關性理論,利用目標光伏電站周邊光伏電站的數據和主成分分析法,實現對目標光伏電站輻照度或功率缺失數據的重構。這種方法不僅能還原數據序列,而且可用于光伏功率預測。
4.1.3 數據歸一化和去趨勢化
對光伏數據實行歸一化操作是為了避免不同數據的量綱和大小范圍導致的預測結果不準確問題。
光伏數據序列具有較明顯的季節、時間變化趨勢,而統計方法如ARMA等不能適應具有趨勢的數據,需要對光伏數據進行去趨勢化操作。去趨勢化常通過將輻照度數據標準化或轉化為晴空指數進行。
光伏數據樣本篩選的研究主要包括光伏數據分類/聚類和預測模型輸入參數選擇。分類/聚類方法研究是當前研究熱點,常采用“相似日”的概念。光資源特性和光伏發電特性的研究是實現光伏數據樣本篩選的基礎,可以用相關性分析和多元回歸方法進行特性分析。
4.2.1 樣本分類篩選
所謂樣本分類篩選,即通過分類或聚類的方法尋找相似樣本,用于預測模型的訓練,不僅可以防止小容量樣本的規律性被遮蓋,還可使預測模型對目標樣本更有針對性。
分類篩選研究可分為以下兩類。
a.將光伏數據按不同的天氣類型劃分。劃分依據通常是季節與天氣類型,也可用輻照度和云量作為指標,將光伏樣本劃分為如晴天、陰天、雨天等。此類劃分指標選取簡單、實現方便,但劃分結果粗糙,不能給出精確的物理、數學解釋。
b.選擇特征指標構造特征空間,并通過K means聚類、自組織神經網絡(SOM),以及SV M和CART等方法實現樣本的分類/聚類。選擇區分度顯著的特征指標和有效的分類/聚類方法是這類研究的重點。特征指標的獲取方式有:①直接從N WP中獲取,如溫度、云量等;②提取直接可得參數序列的某個統計指標作為特征指標,如晴空指數、輻照度三階導數最大值、輻照度方差、輻照度與理論值偏差值等;③變換直接可得參數,形成特征指標,如采用主成分分析法將現有的相互相關的參數轉換成互不相關的主成分。
4.2.2 輸入數據選擇
輸入數據選擇是通過物理分析和數學方法,選擇目標預測條件下的主導因素。
在不同預測時空尺度、天氣模態下,對地面輻照度和光伏功率產生主要影響的因素不同,直接輻照度、總輻照度、散射輻照度的主要影響因素也不同,如在長預測時間尺度上氣象要素的重要性比短預測尺度小;對地面直接輻照度影響最明顯的因素是云層覆蓋率、氣溶膠光學厚度、對流層大氣成分和平流層大氣,而對地面總輻照度影響最明顯的因素是降雨量和太陽天頂角。隨著氣象研究的發展和測量技術的升級,還出現了一些與地面輻照度和光伏功率相關的新參量,如液態水深、空氣質量系數、氣溶膠光學厚度等。
輸入數據選擇的方法有多元線性回歸法、主成分分析法、相關系數計算法、靈敏度分析法、伽馬測試(GT)和遺傳算法(GA)等。
如果沒有長時間應用測試數據或在相同條件下對比實驗、應用驗證,僅通過算法、仿真結果或孤立的實驗結果來評價光伏發電功率預測方法是不嚴謹的。在這個領域至今還沒有統一的預測方法評價標準。隨著光伏系統的大面積推廣,光伏發電系統的部署、設計和應用需要光伏發電功率預測標準。此外,功率預測標準將為電網接納光伏系統提供決策依據。
綜合考慮各方面的因素,應在光伏發電功率預測的評價標準中明確以下信息:
a.光伏電站相關數據,包括:①電站信息:經度、緯度、海拔高度、氣候類型等:②電力系統信息和模型:光伏面板、逆變器、存儲系統、傳感器等。
b.歷史數據,包括數據源、數據類型、數據采樣間隔、數據精度、數據的完整性及合理性。
c.誤差指標,包括幾種常用的誤差計算方法,如:均方根誤差、平均絕對誤差百分比、平均相對誤差、最大平均誤差和相關系數等。
d.時間尺度和時間分辨率,預測時間尺度可以是小時、天、周或月,時間分辨率可以是秒、分鐘或小時。
e.算法復雜度,即在預測方法中所使用的計算方法和計算資源的成本。
f.時間復雜度,預測方法的時間成本。
g.經濟性,預測方法及其實施的經濟性分析。
從光伏功率預測方法的分類及其預測系統整體框架出發,分析了影響光伏功率預測準確率的主要因素,包括數據因素、環境因素、光伏廠區、中控室軟硬件設備等,并從光伏數據預處理及數據樣本分類篩選兩個方面介紹了提升準確率的途徑。
為進一步提升光伏功率預測的準確率,切實貫徹落實《華北區域光伏發電站并網運行管理實施細則》,對各光伏電站的執行落實情況做好監督,對預測準確率不達標的場站加強考核。技術上,考慮從以下幾個方面著手。
a.多種預測方法相結合。組合預測方法分為兩類,一種是將幾種預測方法所得的結果進行比較,選取誤差最小的模型進行預測;另外一種是將幾種結果按一定的權重進行加權平均。
b.拓展功率預測評估指標,除均方根誤差指標外,引入日極大誤差、日峰谷誤差等指標,對各光伏電站進行綜合評估。
c.在經濟成本可以接受的范圍內,盡量增加場站的氣象測量裝置,為預測模型提供更加準確的氣象輸入信息。
d.通過數據預處理技術,剔除壞數據、還原殘缺數據集,增強數據的完整性、有效性。