洪晨威,劉其輝,張怡冰
(1.華北電力大學(xué) 新能源電力系統(tǒng)國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京102206;2.國(guó)網(wǎng)北京市電力有限公司,北京100031)
電動(dòng)汽車(chē)(electric vehicle,EV)的大量上網(wǎng)帶來(lái)的大規(guī)模負(fù)荷增長(zhǎng)進(jìn)一步加劇了配網(wǎng)的負(fù)荷峰谷差,對(duì)配網(wǎng)的安全運(yùn)行產(chǎn)生了負(fù)面影響。文獻(xiàn)[1]—文獻(xiàn)[2]對(duì)EV接入對(duì)電網(wǎng)產(chǎn)生的影響進(jìn)行了詳細(xì)的綜述,如何對(duì)EV進(jìn)行有效調(diào)控是當(dāng)前的研究熱點(diǎn)。
目前國(guó)內(nèi)外學(xué)者在解決EV有序充電的問(wèn)題上已展開(kāi)了一系列研究。目前比較可行的思想是對(duì)EV進(jìn)行分層分區(qū)管理。文獻(xiàn)[3]引入了EV分層分區(qū)調(diào)度的概念,構(gòu)建了基于雙層優(yōu)化模型的EV充放電調(diào)度模型;文獻(xiàn)[4]建立了以系統(tǒng)總負(fù)荷平方差最小和可轉(zhuǎn)移充放電量最大為目標(biāo)的兩階段優(yōu)化模型,并采用yalmip進(jìn)行求解。文獻(xiàn)[5]—文獻(xiàn)[6]構(gòu)建了含EV與可再生能源的雙層協(xié)調(diào)優(yōu)化模型,并采用遺傳算法求解整個(gè)模型。分層分區(qū)管理方式有效降低了各代理商所調(diào)度的EV的規(guī)模,大大減少了模型求解的計(jì)算量和計(jì)算時(shí)間。上述文獻(xiàn)提出的算法均是一種確定性局部?jī)?yōu)化算法,僅能考慮當(dāng)前已接入的EV及電網(wǎng)狀態(tài),求解結(jié)果也僅是該時(shí)段的局部最優(yōu)解,從當(dāng)日全局負(fù)荷層面考慮,其結(jié)果還存在一定的優(yōu)化空間。
考慮到電網(wǎng)負(fù)荷及EV充電負(fù)荷為時(shí)間序列數(shù)據(jù),且在一定時(shí)間尺度下呈現(xiàn)周期性規(guī)律。而深度長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(long short-term memory,LSTM)是一種基于循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)改進(jìn)的深度學(xué)習(xí)算法,對(duì)處理時(shí)序數(shù)據(jù)有很好的效果[7]。可以有效地學(xué)習(xí)歷史序列數(shù)據(jù)中的規(guī)律信息。
因此,提出一種基于LSTM網(wǎng)絡(luò)深度學(xué)習(xí)的EV 3層能量管理系統(tǒng)。以電網(wǎng)負(fù)責(zé)的調(diào)度中心(電網(wǎng)層)、代理商負(fù)責(zé)的區(qū)域能量管理系統(tǒng)和充電站能量管理系統(tǒng)組成的3層能量管理架構(gòu)為依托,利用電網(wǎng)歷史基礎(chǔ)負(fù)荷及EV歷史負(fù)荷數(shù)據(jù)求解出歷史調(diào)度優(yōu)化任務(wù)最優(yōu)解,用于訓(xùn)練學(xué)習(xí)網(wǎng)絡(luò),并利用該網(wǎng)絡(luò)快速高效的指導(dǎo)當(dāng)前實(shí)時(shí)EV調(diào)度任務(wù)的優(yōu)化。最后通過(guò)仿真計(jì)算驗(yàn)證了提出方法的有效性、靈活性和優(yōu)越性。
基于文獻(xiàn)[8]提出的包括電網(wǎng)層、區(qū)域能量管理系統(tǒng)和充電站能量管理系統(tǒng)的EV充電能量管理3層架構(gòu)模型,結(jié)合LSTM學(xué)習(xí)網(wǎng)絡(luò)進(jìn)行進(jìn)一步的改進(jìn),架構(gòu)模型如圖1所示。

圖1 電動(dòng)汽車(chē)3層管理架構(gòu)Fig.1 Three-tier management structure of electric vehicles
由于EV 3層架構(gòu)管理系統(tǒng)各層的主要功能與現(xiàn)有研究類(lèi)似,其中電網(wǎng)層策略的關(guān)鍵在于制定引導(dǎo)電價(jià)或者制定充電功率閾值,目前已有較多的研究成果[9—10],因此本文研究重點(diǎn)為能量管理系統(tǒng)如何構(gòu)建最優(yōu)指導(dǎo)充電功率深度學(xué)習(xí)網(wǎng)絡(luò)、基于該學(xué)習(xí)網(wǎng)絡(luò)制定指導(dǎo)充電功率的方法以及充電站能量管理系統(tǒng)對(duì)指導(dǎo)充電功率的分配策略。
3層能量管理流程圖如圖2所示。

圖2 3層架構(gòu)能量管理流程Fig.2 Three-tier architecture management flow
在每日調(diào)控開(kāi)始前,區(qū)域管理系統(tǒng)需執(zhí)行3個(gè)步驟:
(1)接收調(diào)度層下達(dá)的基于歷史負(fù)荷制定的該日引導(dǎo)電價(jià)c(t),元/kWh;區(qū)域充電負(fù)荷功率上限M(t),kW;該日調(diào)度目標(biāo)等信息;
(2)根據(jù)歷史EV負(fù)荷模擬優(yōu)化過(guò)程,計(jì)算在已知全日EV準(zhǔn)確接入時(shí)間及充電需求條件下的各站級(jí)管理系統(tǒng)指導(dǎo)充電功率最優(yōu)解(目標(biāo)函數(shù)與調(diào)度層下達(dá)的調(diào)度目標(biāo)一致);
(3)以計(jì)算得到的歷史每日的指導(dǎo)功率最優(yōu)解為學(xué)習(xí)目標(biāo),基于歷史負(fù)荷數(shù)據(jù)及歷史電價(jià)信息構(gòu)建指導(dǎo)功率深度學(xué)習(xí)網(wǎng)絡(luò),準(zhǔn)備開(kāi)始該日的調(diào)控。
在收到調(diào)度層下達(dá)的電價(jià)信息及功率限額后,由區(qū)域管理系統(tǒng)與站級(jí)管理系統(tǒng)配合,對(duì)EV充電進(jìn)行實(shí)時(shí)控制。將1天劃分為96個(gè)控制時(shí)段(每個(gè)時(shí)段時(shí)長(zhǎng)為15 min),將每個(gè)控制時(shí)段末端作為該時(shí)段的優(yōu)化計(jì)算點(diǎn),對(duì)等待充電的EV的充電行為進(jìn)行優(yōu)化計(jì)算。
假設(shè)在某個(gè)控制時(shí)段中區(qū)域內(nèi)所有充電站中共接入了n輛EV(均未充滿),則在該控制時(shí)段末端對(duì)這n輛EV進(jìn)行優(yōu)化,計(jì)算它們?cè)谙乱豢刂茣r(shí)段的充電功率,該過(guò)程需要經(jīng)歷3個(gè)步驟:
(1)各站級(jí)管理系統(tǒng)統(tǒng)計(jì)n輛EV中仍有優(yōu)化裕度的m輛車(chē)輛的電池型號(hào)及狀態(tài)信息(當(dāng)前電池狀態(tài)SOCi,j,t及電池容量Bi,j)、到達(dá)時(shí)刻所在時(shí)段Ti,j,0、離開(kāi)時(shí)刻所在時(shí)段Ti,j、充滿所需時(shí)段數(shù)、該車(chē)輛所屬的充電樁類(lèi)型(直流充電樁或交流充電樁)及其相應(yīng)的充電額定功率PDC和PAC,并計(jì)算各充電站內(nèi)車(chē)輛的平均緊急程度系數(shù)Ri,j(t),如式(1),并將這些信息上傳給區(qū)域管理系統(tǒng)


(2)區(qū)域管理系統(tǒng)收到轄區(qū)內(nèi)各站級(jí)管理系統(tǒng)提交的信息后,將該控制時(shí)段及之前時(shí)段的區(qū)域基礎(chǔ)負(fù)荷數(shù)據(jù)、電價(jià)、EV數(shù)量及緊急程度信息輸入深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),由該網(wǎng)絡(luò)計(jì)算得出各充電站在下一控制時(shí)段的指導(dǎo)充電功率,并下達(dá)給相應(yīng)的站級(jí)管理系統(tǒng)。
(3)站級(jí)管理系統(tǒng)接收指導(dǎo)充電功率指令,以此為參照分別對(duì)本站內(nèi)m輛車(chē)中的EV進(jìn)行充電功率分配,計(jì)算得到各EV在下一控制時(shí)段的充電功率,并下發(fā)到對(duì)應(yīng)的充電樁。
由于各充電站的指導(dǎo)充電功率實(shí)際上為一組時(shí)間序列,而深度學(xué)習(xí)模型中的LSTM模型恰好具有記憶能力,可以有效地學(xué)習(xí)歷史序列數(shù)據(jù)中的信息,因此采用長(zhǎng)短期記憶深度神經(jīng)網(wǎng)絡(luò)模型。LSTM的單元結(jié)構(gòu)如圖3所示[11]。

圖3 LSTM單元結(jié)構(gòu)Fig.3 LSTM unit structure
圖3中Ct-1為前一個(gè)單元的記憶;ht-1為前一個(gè)單元的輸出;Xt為當(dāng)前單元的輸入;Ct為當(dāng)前單元的記憶;ht為當(dāng)前單元的輸出;函數(shù)ft為遺忘門(mén),用于選擇遺忘ht-1中的參數(shù)信息;it和C?t構(gòu)成輸入門(mén),用來(lái)讀取和修正參數(shù),并創(chuàng)建候選向量Ct添加到單元記憶中;Ot為輸出門(mén),用于選擇輸出部分單元記憶信息,計(jì)算公式為[12]

式中:W和b分別為對(duì)應(yīng)門(mén)的權(quán)重系數(shù)矩陣和偏置項(xiàng);σ為sigmoid激活函數(shù),用于將實(shí)數(shù)映射到[0,1]內(nèi);tanh為雙曲正切函數(shù),用于將實(shí)數(shù)映射至[-1,1]內(nèi)。
在處理序列數(shù)據(jù)時(shí),每個(gè)時(shí)間步對(duì)應(yīng)一個(gè)LSTM單元。每個(gè)單元通過(guò)考慮當(dāng)前輸入、前一個(gè)單元的輸出和記憶來(lái)作出決定,同時(shí)它會(huì)產(chǎn)生一個(gè)新的輸出并改變它的記憶。當(dāng)存在多個(gè)LSTM層時(shí),第一層各時(shí)間步的單元輸出將作為第二層對(duì)應(yīng)時(shí)間步的單元的輸入,第一層最后的時(shí)間步的記憶將作為第二層的初始記憶。
本文構(gòu)建的LSTM模型包括輸入層、2個(gè)LSTM隱藏層、兩個(gè)全連接層、一個(gè)Dropout層和輸出層。輸入矩陣進(jìn)入輸入層后,經(jīng)過(guò)LSTM隱藏層和Dropout層后,通過(guò)全連接的輸出層得到最終預(yù)測(cè)值,LSTM模型如圖4所示。

圖4 LSTM網(wǎng)絡(luò)模型Fig.4 LSTM network model
LSTM層的作用是為了篩選出重要的信息,同時(shí)遺忘不重要的信息。Dropout層在正向傳遞和權(quán)值更新的過(guò)程中對(duì)LSTM神經(jīng)元的輸入和遞歸連接進(jìn)行概率性失活,能夠避免某一個(gè)網(wǎng)絡(luò)被過(guò)分的擬合到訓(xùn)練集,出現(xiàn)“過(guò)學(xué)習(xí)”,本文將失活概率設(shè)置為0.5。完全連接層的作用是將高維輸入轉(zhuǎn)變?yōu)榈途S輸出,同時(shí)保留上一層的信息。圖4中完全連接層2的輸出維度需要與預(yù)測(cè)結(jié)果維度相同。
2.2.1 網(wǎng)絡(luò)訓(xùn)練集輸入數(shù)據(jù)
選取以下因素作為輸入特征,分別為:各時(shí)段的基礎(chǔ)負(fù)荷、電價(jià)、停留EV數(shù)量、EV平均緊急程度系數(shù),t-1、t-2時(shí)段的EV數(shù)量及平均緊急程度系數(shù)。每組訓(xùn)練數(shù)據(jù)包含96個(gè)時(shí)段數(shù)據(jù)。訓(xùn)練集具體輸入數(shù)據(jù)如表1所示。

表1 訓(xùn)練集輸入數(shù)據(jù)Table 1 Input data of training set
表1中,在全日負(fù)荷情況已知的條件,根據(jù)尋優(yōu)算法求得區(qū)域管理系統(tǒng)轄內(nèi)各充電站在第t時(shí)段的指導(dǎo)充電功率最優(yōu)解,其目標(biāo)函數(shù)的選取與調(diào)度層的指令保持一致,以96個(gè)控制時(shí)段中該區(qū)域內(nèi)M個(gè)充電站整體充電成本最小為目標(biāo)[8],即

2.2.2 實(shí)時(shí)輸入輸出數(shù)據(jù)
在實(shí)時(shí)優(yōu)化調(diào)度時(shí),網(wǎng)絡(luò)需要的輸入數(shù)據(jù)及相應(yīng)的輸出數(shù)據(jù)如表2所示。

表2 實(shí)時(shí)輸入輸出數(shù)據(jù)Table 2 Real time input and output data
2.2.3 訓(xùn)練流程
為提高訓(xùn)練速度,同時(shí)兼顧訓(xùn)練精度,采用mini-batch技術(shù)[11],并選取batchsize=20,即將20組訓(xùn)練數(shù)據(jù)作為一個(gè)整體訓(xùn)練,具體訓(xùn)練過(guò)程如下:
(1)對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,由表1可知每組數(shù)據(jù)包含6個(gè)輸入量,1個(gè)目標(biāo)值,且時(shí)段數(shù)為96,因此每組輸入數(shù)據(jù)矩陣大小為7×96;
(2)將訓(xùn)練集的輸入量輸入到LSTM網(wǎng)絡(luò)模型中,得到初步的預(yù)測(cè)值,并計(jì)算得到與目標(biāo)值的誤差;
(3)采用Adam反傳播算法,更新網(wǎng)絡(luò)權(quán)重,實(shí)現(xiàn)LSTM網(wǎng)絡(luò)的監(jiān)督學(xué)習(xí);
(4)訓(xùn)練完成后,將測(cè)試集的數(shù)據(jù)實(shí)時(shí)輸入到LSTM網(wǎng)絡(luò),得出該充電站的實(shí)時(shí)指導(dǎo)充電功率。
本文的充電站能量管理系統(tǒng)按照各車(chē)輛的緊急程度系數(shù)對(duì)區(qū)域能量管理系統(tǒng)下達(dá)的指導(dǎo)充電功率進(jìn)行分配,系數(shù)越高,分配的充電功率越高。
交流慢充EV分配到的充電功率為0或額定功率PAC,直流快充的EV充電功率可以在0到PDC之間連續(xù)調(diào)節(jié)[13]。
假設(shè)第i個(gè)充電站在第t個(gè)控制時(shí)段內(nèi)接入的EV中交流充電EV的集合為ACt,直流充電EV的集合為DCt,則交流充電電動(dòng)汽車(chē)分配的充電功率為

直流充電EV分配的充電功率為

假設(shè)某個(gè)區(qū)域能量管理系統(tǒng)下有3個(gè)充電站(M=3),分別設(shè)置在辦公區(qū)、商業(yè)區(qū)和居民區(qū)[8]。直流額定充電功率為45 kW,交流額定充電功率為7 kW,EV的電池容量有兩種,分別為24 kWh和32 kWh。收集101組某地區(qū)實(shí)測(cè)基礎(chǔ)負(fù)荷數(shù)據(jù)及電價(jià)信息,同時(shí)按照文獻(xiàn)[14]提出的基于蒙特卡洛方法的電動(dòng)汽車(chē)出行鏈進(jìn)行模擬,得到101組EV的出行數(shù)據(jù),共計(jì)101組初始數(shù)據(jù)。選取其中一組作為測(cè)試數(shù)據(jù)用于驗(yàn)證最終結(jié)果,其余數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)訓(xùn)練LSTM學(xué)習(xí)網(wǎng)絡(luò)。圖5為該日基礎(chǔ)負(fù)荷曲線,表3為該日各充電站接入的EV信息,表4為該日調(diào)度層下達(dá)的引導(dǎo)電價(jià)。
2層LSTM層的隱藏單元數(shù)量分別設(shè)置為200、100,迭代次數(shù)為300次。

圖5 該日基礎(chǔ)負(fù)荷Fig.5 The base load of the day

表3 該日各充電站接入的電動(dòng)汽車(chē)信息Table 3 EV information of each charging station of this day

表4 各時(shí)段電價(jià)信息Table 4 Electricity price of each period
將本文方法與其他文獻(xiàn)提出的局部?jī)?yōu)化算法(滾動(dòng)優(yōu)化策略)進(jìn)行對(duì)比。圖6為該區(qū)域管理系統(tǒng)轄內(nèi)3個(gè)充電站的實(shí)際充電功率,圖7為該地區(qū)的基礎(chǔ)負(fù)荷曲線與不同控制方法下的全部負(fù)荷曲線,對(duì)應(yīng)的充電費(fèi)用及峰谷差如表5所示,圖8為不同策略下不同時(shí)段的平均充電功率。

圖6 各充電站的實(shí)際充電功率Fig.6 Actual charging power of each charging station

圖7 不同策略下的負(fù)荷曲線對(duì)比Fig.7 Comparison of load curves under different strategies

表5 峰谷差、充電成本與優(yōu)化耗時(shí)對(duì)比Table 5 Comparison of peak-valley、charging cost and optimization duration

圖8 不同控制策略下各時(shí)段的平均充電功率Fig.8 Average charging power of each period under different control strategies
結(jié)合圖6、圖7、圖8和表5可以看出,若電動(dòng)汽車(chē)進(jìn)行無(wú)序充電,不僅充電成本高,且大幅增加了電網(wǎng)的日負(fù)荷峰谷差,不利于電網(wǎng)的安全穩(wěn)定。而本文策略和滾動(dòng)優(yōu)化策略均能合理的協(xié)調(diào)各充電站的指導(dǎo)充電功率,盡可能減少在高電價(jià)時(shí)段(10:00—14:00,18:00—23:00)的充電功率,將充電負(fù)荷轉(zhuǎn)移至電價(jià)相對(duì)較低的時(shí)段,對(duì)比即時(shí)充電方式,大大降低了充電成本。
同時(shí),由圖8可以看出,本文提出的方法在負(fù)荷高峰時(shí)段充電功率更低,在負(fù)荷低谷時(shí)段充電功率顯著增加,負(fù)荷轉(zhuǎn)移效果更加顯著。對(duì)比表5不同算法下的全日峰谷差,本文的策略的峰谷差更小,削峰填谷的效果更優(yōu)。另一方面,在對(duì)測(cè)試數(shù)據(jù)96個(gè)時(shí)段的實(shí)時(shí)仿真中,滾動(dòng)優(yōu)化策略用時(shí)2 min,而本文提出的方法用時(shí)僅30 s,計(jì)算效率更高。
綜上,本文提出的策略從最終優(yōu)化結(jié)果來(lái)看確實(shí)取得了較一般算法更優(yōu)的結(jié)果,實(shí)時(shí)計(jì)算效率更高,且當(dāng)管理的EV數(shù)量更加龐大時(shí),普通的尋優(yōu)算法計(jì)算速度將進(jìn)一步下降,甚至可能出現(xiàn)維數(shù)災(zāi),但對(duì)本文提出的策略則依然可以保持較高的求解效率,充分體現(xiàn)了策略的有效性及優(yōu)越性。
本文建立了包括調(diào)度層,區(qū)級(jí)管理層,站級(jí)管理層的3層EV充電負(fù)荷實(shí)時(shí)優(yōu)化管理模型,在此基礎(chǔ)上重點(diǎn)研究和提出了基于深度學(xué)習(xí)的區(qū)級(jí)能量管理策略,并通過(guò)仿真算例進(jìn)行了驗(yàn)證。主要結(jié)論如下:
(1)本文提出的基于深度學(xué)習(xí)網(wǎng)絡(luò)的區(qū)域管理系統(tǒng)管理策略可以充分利用歷史負(fù)荷數(shù)據(jù),深度挖掘歷史優(yōu)化任務(wù)的信息用于指導(dǎo)在線實(shí)時(shí)優(yōu)化,優(yōu)化效果相較于一般的局部?jī)?yōu)化策略更好。
(2)本文策略?xún)?yōu)化變量數(shù)較少,不會(huì)出現(xiàn)維數(shù)災(zāi)的問(wèn)題,求解難度較低,實(shí)時(shí)計(jì)算效率更高,適用于大規(guī)模電動(dòng)汽車(chē)接入的情形。