楊 旭,易 坤,楊 浪
(中國電建集團貴州工程有限公司,貴陽 550003)
光伏發電是通過將照射到光伏組件上的太陽輻射轉換為直流電來發電的方式。由于單塊光伏組件轉換的直流電的電壓較低,所以需要將一定數量的光伏組件串聯,形成高電壓,然后通過逆變器轉換為一定頻率的正弦交流電注入到電網,進而為客戶提供綠色清潔的電力。
隨著全球光伏行業的競爭日益激烈,為了提高光伏電站的發電量,降低光伏電站的度電成本,對光伏電站的設計及設備的要求越來越高,光伏電站的設計必須從精細化、定制化出發。影響光伏電站發電量的因素眾多,不同因素之間的相互影響及其交互影響極其復雜。由于每一項系統損失都將直接反映到光伏電站的發電量損失中,因此以往的研究大多是針對光伏電站單一的系統損失。
本文引入粗糙集,在粗糙決策模型的基礎上,采用遺傳算法對光伏電站發電量屬性和屬性值的約簡進行了診斷,以此來尋找光伏電站發電量的主要影響因素。遺傳算法是模擬生物在自然環境中的遺傳和進化過程而形成的一種自適應全局的優化搜索算法,具有廣泛適用性。本研究選取了8個參數作為條件屬性,建立了光伏電站發電量的診斷模型,通過計算分析,得到了影響光伏電站發電量的決策規則,為尋找光伏電站發電量的主要影響因素提供了一種新的方法。
在模型設計過程中,由于存在較多的干擾因素,眾多因素聯合進行優化設計的過程復雜且計算量大。為此,需要對參數進行初步的篩選,以確定對輸出結果影響較大的因素組合,然后在此基礎上進行進一步的優化設計,從而可以大幅減小工作量。
粗糙集理論[1]是由波蘭數學家PAWLKA于1982年提出的,該理論對于處理研究中的不確定性問題具有顯著的優勢,其能夠在無任何數據預備或額外信息的情況下對數據進行處理,然后得到數據之間的潛在關系。粗糙集是一種處理模糊性和不確定性問題的新的數學方法,通過信息壓縮、不確定信息的識別和評估來揭示數據之間的潛在規律性[2]。
與概率統計、證據理論、模糊集等數學方法相比,粗糙集與這些方法有一定的聯系,但同時也具有不可替代的優勢。在粗糙集處理過程中不需要對參數的概率分布進行求解,而概率統計需要獲得概率分布才可以求解;粗糙集處理過程中不需要對參數的概率進行賦值,而證據理論[3]要求參數必須具有概率值;同時,粗糙集處理過程中也不需要獲得隸屬函數,而模糊集[4]則需要事先獲得隸屬函數。
粗糙集理論[5]是在保持信息庫分類能力不變的前提下,可以導出問題的決策和分類規則的數學工具。在粗糙集理論中,知識用信息系統來表示,信息系統的屬性進一步可分為條件屬性和決策屬性。屬性約簡是粗糙集理論中的重要問題,其是在保持分類能力不變的前提下,刪除冗余信息的過程,最終將決策表中的知識簡化成少量的決策規則。
粗糙集理論的基本概念主要包括信息系統的屬性、決策屬性關于條件屬性的正域、決策屬性對于條件屬性的依賴度3個方面。
1)信息系統的屬性。設信息系統S為[6]:

式中,U為全體樣本集(論域),U={x1,x2,…,xn},n為樣本集的個數;A為全體屬性集,A=C∪D,其中,C為條件屬性子集,D為決策屬性子集,C∪D=φ;V為全部屬性的值域;設a是任意一個屬性,a∈A,xi是任意一個對象,xi∈U,i=1, 2,…,n,則f(xi,a)表示xi在a屬性的取值,f(xi,a)∈Va。
2)決策屬性關于條件屬性的正域。決策屬性d關于條件屬性c的正域posc(d)可表述為:

3)決策屬性對于條件屬性的依賴度。決策屬性d對于條件屬性c的依賴度rc(d)可表述為[7]:

本文介紹的粗糙集理論算法主要包括連續屬性離散化法和遺傳算法屬性約簡。
1.3.1 連續屬性離散化法
所有的參數變化區域是連續的,粗糙集處理數據需要設立若干個閾值,將連續的區域劃分為離散區間;然后在此基礎上,使用不同符號或數值進行命名或替代。在此過程中會將輸入的條件屬性劃分成有限的區域,每個區域中的決策值一致。例如,條件屬性空間為1~M,對每個條件屬性進行離散,離散區分為1、2或1、2、3等。
1.3.2 遺傳算法屬性約簡
屬性約簡問題屬于多項式復雜程度的非確定性(NP-hard)問題,肖厚國等[8]提出了基于遺傳算法約簡冗余條件屬性得到簡化決策表的具體算法。NP-hard問題中最繁雜的問題是屬性的組合爆炸問題,一般需要采用啟發式算法來解決該問題,這也是引入遺傳算法的原因。遺傳算法屬性約簡主要涉及到染色體編碼、適應度函數和遺傳算子的確定。
1)染色體編碼。根據條件屬性的個數,對每個個體進行編碼。由于遺傳算法不能直接處理條件屬性數據,因此必須通過編碼將數據表示成遺傳空間的基因型的串結構數據;編碼使用固定長度的二進制字符串表示群體中的個體,其等位基因是由二值符號{0,1}組成。二進制字符串的長度等于條件屬性的個數,個體與編碼一一對應。例如“11110000”表示1個個體,該染色體長度為8,其中每一位對應1個條件屬性;若取值為“1”,表示選擇其對應的條件屬性;若取值為“0”,則表示不選擇其對應的條件屬性。
2)適應度函數。通過適應度函數來控制算法的進化方向,保證進化向著最小約簡進行。
適應度函數F(s)可以表示為:

式中,ls為染色體s中基因為1的個數;l為條件屬性的個數。
3)遺傳算子的確定。選擇算子采用輪盤賭策略,變異算子采用均勻變異算子,交叉算子采用單點交叉算子;當迭代步數達到最大或reduct(C)=rc(d)時終止。
本研究基于遺傳算法對粗糙決策模型進行優化,建立了光伏電站發電量診斷模型,該模型的流程圖如圖1所示。

圖 1 光伏電站發電量診斷模型的流程圖Fig. 1 Flow chart of diagnosis model of power generation of PV power station
光伏電站發電量診斷的主要步驟為:
1)確定條件屬性和決策屬性。根據研究對象確認以光伏電站發電量作為決策屬性;以光伏組件安裝傾角、光伏陣列間距、光伏組件串聯數、光伏組件和逆變器容配比、熱交換系數、直流線損、交流線損、光致衰減(light induced degradation,LID)這8個參數作為條件屬性。
2)連續屬性離散化。該步驟是采用各種方法將連續的區間劃分為小的區間,并將這些小區間與離散的值關聯起來。常見的方法包括等寬法、等頻法、基于聚類分析的方法等。本研究采用等寬法對條件屬性和決策屬性進行離散化,根據數值將條件屬性和決策屬性分別劃分為大、小2個部分,并用不同代碼表示。
3)根據決策表計算決策屬性關于條件屬性的依賴度rc(d)。
4)令reduct(C)=φ,逐個去掉條件屬性,任意條件屬性ci∈C,并重新計算決策屬性關于剩余條件屬性的依賴度,若此時得到的依賴度與完整屬性依賴度一致,則終止計算;若不一致,則進入第5)步。
5)隨機產生長度為l的二進制字符串作為初始種群,并按前文介紹的基本算法來計算初始種群每個個體的適應度。
6)按輪盤賭策略選擇個體,交叉概率為PC,變異概率為PM,得到新一代種群中每個個體的適應度。
7)判斷是否達到最大迭代次數或連續t代不進化(設置的收斂標準)。若結論為“是”,則終止計算;若結論為“否”,則返回第6)步,直到結論為“是”為止。
本文以烏克蘭某148 MW光伏電站為例對建立的光伏電站發電量診斷模型進行應用分析。該光伏電站的參數取值主要為:光伏組件的安裝傾角為15°~35°,光伏陣列的間距為5~15 m,光伏組件串聯數為15~29塊,光伏組件和逆變器容配比為1:1~1.5:1,熱交換系數為15~29 W/(m2?K),直流線損為0.8%~2.2%,交流線損為0.5%~1.2%,LID為1%~3%。該光伏電站每kWp裝機容量的年發電量為1095~1265 kWh。
按光伏電站發電量診斷主要步驟中的第2)步對該光伏電站的條件屬性和決策屬性進行離散處理。其中,選擇的條件屬性的8個參數分別為光伏組件安裝傾角(c1)、光伏陣列間距(c2)、光伏組件串聯數(c3)、光伏組件和逆變器容配比(c4)、熱交換系數(c5)、直流線損(c6)、交流線損(c7)、LID(c8)。以平均值為界,條件屬性按數值大小分為大、小2個區域,分別用代碼“0”和“1”表示;決策屬性按數值大小均分為小、大2個部分,分別用代碼“2”和“3”表示。從所有組合中隨機抽取12組數據,離散處理后的光伏電站發電量的決策規則如表1所示。

表1 離散處理后的光伏電站發電量的決策規則Table 1 Decision rules of power generation of PV power station after discrete processing
選取PC=0.7、PM=0.01、最大代數為150,得到最優解為00101010,即條件屬性c3、c5、c7保留。因此,可得到條件屬性約簡后的光伏電站發電量的決策規則,如表2所示。

表2 條件屬性約簡后的光伏電站發電量的決策規則Table 2 Decision rules of power generation of PV power station after conditional attribute reduction
根據條件屬性約簡后的決策規則結果,去掉冗余和重復屬性后,得到最終的光伏電站發電量的決策規則如表3所示。

表3 最終的光伏電站發電量的決策規則Table 3 Final decision rules of power generation of PV power station
從表3中可以看出,在所研究的影響因素中,對光伏電站發電量影響最大的是光伏組件串聯數、熱交換系數及交流線損這3個因素。這3個因素的關系主要為:
1)當光伏組件串聯數、熱交換系數及交流線損這3個影響因素均較大時,光伏電站的發電量較低;
2)當光伏組件串聯數、交流線損較大,而熱交換系數較小時,光伏電站的發電量較低;
3)當光伏組件串聯數、熱交換系數均較小,而交流線損較大時,光伏電站的發電量均較低;
4)當光伏組件串聯數較小,而熱交換系數和交流線損較大時,光伏電站的發電量均較高;
5)當熱交換系數較大且交流線損較小時,無論光伏組件串聯數如何,光伏電站的發電量均較高;
6)當光伏組件串聯數及熱交換系數較大,而交流線損較小時,光伏電站的發電量較高。
由于實際運行中的大型地面光伏電站的熱交換系數均較大,因此上述決策表可以進行進一步地約簡,即去掉熱交換系數c5。進一步約簡后發現,若要保證光伏電站的發電量較高,則需保證交流線損較小,或交流線損較大時光伏組件串聯數不宜過大。
本文在粗糙決策模型的基礎上,引入遺傳算法來尋找光伏電站發電量的主要影響因素。以光伏電站發電量作為決策屬性、選取了8個參數作為條件屬性,建立了光伏電站發電量的診斷模型,并通過計算分析,最終得到了影響光伏電站發電量的決策規則。研究結果表明:
1)在本研究中光伏電站所處的地區,所有光伏電站發電量的影響因素中,光伏組件串聯數、熱交換系數及交流線損這3個影響因素對光伏電站的發電量情況起到了決定性作用。
2)對熱交換系數較大的大型地面光伏電站而言,降低交流線損,或在交流線損較大時選擇較小的光伏組件串聯數對提高光伏電站的發電量有益。