胡澤洲, 于仲安, 張軍令
(江西理工大學(xué)電氣工程與自動(dòng)化學(xué)院, 贛州 341000)
隨著電動(dòng)汽車市場近年來需求率不斷地提高,電動(dòng)汽車充電[1]逐漸成為車主重點(diǎn)關(guān)心的問題。大規(guī)模電動(dòng)汽車無序充電的行為會(huì)給電網(wǎng)帶來沖擊,同時(shí)車主充電時(shí)間、充電費(fèi)用也會(huì)隨之增加,嚴(yán)重影響用戶充電體驗(yàn)。因此,電動(dòng)汽車充電調(diào)度[2]問題成為近年來的研究熱點(diǎn)。文獻(xiàn)[3]利用粒子群算法設(shè)計(jì)調(diào)度優(yōu)化模型;文獻(xiàn)[4]利用差分進(jìn)化算法設(shè)計(jì)成本模型解決新能源汽車充電調(diào)度問題;然而上述各學(xué)者研究的智能算法均存在收斂性能不足,算法精度不夠等缺點(diǎn)。Mirjalili等[5]受到灰狼狩獵行為的啟發(fā),模擬灰狼的社會(huì)等級、包圍、捕獵行為,提出了灰狼優(yōu)化算法(grey wolf opotimizer, GWO),并且也通過一系列的檢驗(yàn)測試證明了GWO算法比其他算法收斂速度更快,穩(wěn)定性更強(qiáng)。目前已被廣泛應(yīng)用于神經(jīng)網(wǎng)絡(luò)優(yōu)化、機(jī)車調(diào)度、控制器參數(shù)制定等多個(gè)領(lǐng)域。
由于灰狼算法具有容易陷入局部最優(yōu),收斂精度不高的缺點(diǎn),因此,中外學(xué)者提出許多改進(jìn)措施來提高算法性能。張孟健等[6]提出多種非線性控制參數(shù)的組合,探索控制因子的變化對算法的影響和最佳參數(shù)值;徐松金等[7]提出了一種隨機(jī)收斂控制因子的策略;Banaie-Dezfouli等[8]提出一種具有代表性的狩獵方法,通過建立代表性檔案提高解的多樣性;Saremi等[9]提出用動(dòng)態(tài)進(jìn)化種群提高算法的搜索能力;Zhu等[10]引入差分進(jìn)化算法和灰狼算法相結(jié)合方法改善算法的收斂性能。
雖然上述各種改進(jìn)的措施可以改善GWO算法的性能,但是其收斂速度較慢、易早熟陷入局部最優(yōu)、收斂精度不高的特點(diǎn)依然存在。因此,現(xiàn)提出一種改進(jìn)的灰狼算法,以精英反向?qū)W習(xí)初始化種群為基準(zhǔn)使種群保持多樣性,采用非線性控制因子策略提高算法的收斂速度,利用差分進(jìn)化算法思想和粒子群算法思想更新了灰狼的位置方程公式增加算法魯棒性。仿真結(jié)果表明改進(jìn)的灰狼算法能顯著地提高優(yōu)化性能。
灰狼優(yōu)化算法(GWO)是受到了灰狼捕食獵物活動(dòng)的啟發(fā)而開發(fā)的一種優(yōu)化搜索方法,它具有較強(qiáng)的收斂性能、參數(shù)少、易實(shí)現(xiàn)等特點(diǎn)。該算法具體可分為以下幾點(diǎn)。


圖1 社會(huì)制度等級Fig.1 Social system hierarchy
灰狼圍捕獵物的行為定義為
D=|CXp(t)-X(t)|
(1)
X(t+1)=Xp(t)-AD
(2)
式(1)表示個(gè)體與獵物間的距離,式(2)是灰狼的位置更新公式,其中,t為當(dāng)前的迭代次數(shù),A為收斂因子,C為擺動(dòng)因子,Xp為獵物位置,X為灰狼的位置;A=2ar1-a,C=2r2,a為控制因子,其值是由2線性一直遞減到0的,具體公式為
(3)
式(3)中:t為當(dāng)前的迭代次數(shù);Tmax為最大迭代值。
灰狼能夠識別獵物的位置并且包圍它們,當(dāng)領(lǐng)頭的灰狼α識別獵物位置之后,β狼和δ狼由α狼帶領(lǐng)著狼群向目標(biāo)發(fā)動(dòng)攻擊(狩獵),灰狼攻擊獵物的數(shù)學(xué)模型描述如下:
(4)
(5)
式中:Xα、Xβ、Xδ分別為三條領(lǐng)袖的位置;Xi為灰狼個(gè)體的位置;式(5)為灰狼位置更新公式。

(6)
式(6)中:δ為(0,1)的動(dòng)態(tài)系數(shù);lbj和ubj分別為動(dòng)態(tài)邊界的下界和上界。

(7)
式(7)中:rand為0~1中的隨機(jī)變量。
由式(2)可知,灰狼算法的搜索能力由收斂因子A決定。|A|≥1時(shí),狼群擴(kuò)大搜索范圍,進(jìn)行全局搜索;|A|<1時(shí),狼群縮小范圍,進(jìn)行局部搜索。A的取值取決于控制參數(shù)a,因此a起著調(diào)節(jié)灰狼算法尋優(yōu)能力的作用。初始GWO算法中控制參數(shù)的值是由2隨迭代次數(shù)遞減到0的,但是原始公式是線性的,而GWO算法屬于非線性搜索,所以本文引入sigmoid函數(shù)[11]結(jié)構(gòu)[式(8)]修改了控制參數(shù)的遞減過程,并且與其他文獻(xiàn)進(jìn)行了對比。
(8)
式(8)中:abeigin和afinal分別代表控制因子的起始值2和終值0;a1為本文提出的控制因子;t為迭代次數(shù);Tmax為最大迭代次數(shù)。
本文另外引進(jìn)了傳統(tǒng)GWO算法的控制因子a2,參考文獻(xiàn)[12]的控制因子a3,參考文獻(xiàn)[13]的控制因子a4。
(9)
(10)
(11)
對4種控制參數(shù)的仿真如圖2所示。

圖2 控制參數(shù)a的變化曲線Fig.2 Variation curve of control parameter a
由圖2可看出傳統(tǒng)GWO算法屬于線性遞減,而本文提出的改進(jìn)控制參數(shù)方法屬于非線性遞減,并且相比其他非線性收斂方式,本文的方法可以使得在初期讓狼群保持一定時(shí)間以較大的步長進(jìn)行全局搜索,速率相對較慢,保證種群多樣性的同時(shí)增強(qiáng)了全局搜索能力;中期速率加快,提升收斂速度;后期保持一定時(shí)間以較小的步長搜索,速率相對變緩慢,可以加強(qiáng)算法的局部搜索能力,提高算法的求解效率。
粒子群優(yōu)化算法將每一個(gè)粒子隨機(jī)分布在解域空間內(nèi),設(shè)粒子的位置為X,根據(jù)適應(yīng)度值設(shè)置局部最優(yōu)Xpbest和全局最優(yōu)Xgbest,根據(jù)局部最優(yōu)和全局最優(yōu)可以得到

(12)
根據(jù)式(12),更新粒子群中的每一個(gè)粒子,其表達(dá)式為
(13)
GWO算法在位置更新過程中考慮了灰狼個(gè)體位置信息與種群的最優(yōu)解、優(yōu)解、次優(yōu)解位置信息;但是通過三條領(lǐng)袖狼反映個(gè)體位置的更新公式并未考慮三條領(lǐng)袖狼的影響值,實(shí)際上α狼、ω狼、δ狼具體的影響值是不一樣的,學(xué)習(xí)對象不同進(jìn)而影響力也不同;而且GWO算法缺少一定的記憶能力,易陷入局部最優(yōu)。
因此本文受差分思想和粒子群的記憶思想[14]啟發(fā),更新了GWO算法的位置更新公式,公式為
(14)

(15)
式(15)中:ΔXi分別為灰狼個(gè)體與α狼、β狼、δ狼的位置差值,表示灰狼個(gè)體的移動(dòng)方向;ri為0~1的隨機(jī)數(shù);bi為學(xué)習(xí)因子,是參考粒子群思想引入的學(xué)習(xí)因子,表達(dá)各領(lǐng)袖狼所占的權(quán)重;根據(jù)學(xué)習(xí)的對象不一樣也隨之改變,α狼是最優(yōu)狼,所以占比最大。根據(jù)反復(fù)的實(shí)驗(yàn)結(jié)果對比分析,本文設(shè)定的因子具體如下:b1=0.5,b2=0.3,b3=0.2。通過引入學(xué)習(xí)因子可以更好地平衡算法的全局以及局部搜索能力。
算法步驟如表1所示。

表1 PSO-GWO算法的偽代碼Table 1 Pseudo code of pso-gwo algorithm
表1的步驟1中利用精英解和反向解進(jìn)行初始化,復(fù)雜度為o(N2);步驟3中,計(jì)算灰狼個(gè)體的適應(yīng)值,復(fù)雜度為o(N×D);步驟7中更新新位置,復(fù)雜度為o(N×D)。PSO-GWO算法具體的復(fù)雜度為o(N2)+o(N×D)。改進(jìn)的算法雖然在初始化過程中時(shí)間復(fù)雜度有些許增加,但是實(shí)驗(yàn)的收斂速度和精度卻得到了很大的提高。
為了測試改進(jìn)灰狼算法(PSO-GWO)求解優(yōu)化問題的能力,本文選取國際上通用的10個(gè)基本測試函數(shù)驗(yàn)證算法的性能具體如表2所示。測試函數(shù)分為單峰值函數(shù)(F1~F4),多峰值函數(shù)(F5~F8);F9、F10為固定維度多峰函數(shù)。單峰函數(shù)只有1個(gè)最優(yōu)值,適合檢測算法的局部搜索能力;多峰函數(shù)有多個(gè)最優(yōu)解,便于檢測算法的全局探索能力。
本文是利用MATLAB進(jìn)行編碼完成的,實(shí)驗(yàn)運(yùn)行環(huán)境為Intel(R)Core(TM)i5-4210H CPU @2.90 GHz 2.90 GHz,內(nèi)存8.00 GB,Windows10系統(tǒng),運(yùn)行軟件為MATLAB R2019a。從已有文獻(xiàn)中選取10個(gè)基準(zhǔn)測試函數(shù)做仿真實(shí)驗(yàn),并且與差分進(jìn)化算法(DE),粒子群算法(PSO),基本灰狼算法(GWO),文獻(xiàn)[10]提出的改進(jìn)灰狼算法(AGWO)的優(yōu)化結(jié)果進(jìn)行比較并分析本文算法的性能。為保證公平性,本文具體的實(shí)驗(yàn)參數(shù)設(shè)置如下:種群規(guī)模均設(shè)置為:N=30;種群維數(shù)設(shè)置為30;最大迭代次數(shù)均設(shè)置為Tmax=500;差分進(jìn)化算法的變異算子F=0.4,交叉算子CR=0.1;粒子群算法的學(xué)習(xí)因子設(shè)置為c1=c2=2;傳統(tǒng)灰狼算法的控制參數(shù)設(shè)置為abegin=2,afinal=0;文獻(xiàn)[15]提出的改進(jìn)灰狼算法控制參數(shù)設(shè)置為abegin=2,afinal=0;本文提出的改進(jìn)灰狼算法設(shè)定的因子為:b1=0.5,b2=0.3,b3=0.2。
為了測試改進(jìn)灰狼算法(PSO-GWO)的收斂性能,表3展示的是用各算法在不同的測試函數(shù)下測試30次分別計(jì)算得到的最優(yōu)值,平均值,標(biāo)準(zhǔn)差。其中最優(yōu)值、平均值反應(yīng)算法的精度;標(biāo)準(zhǔn)差反應(yīng)算法的魯棒性。

表2 基礎(chǔ)測試函數(shù)Table 2 Benchmark test function

表3 不同算法的尋優(yōu)結(jié)果Table 3 Optimization results under different algorithms
由于傳統(tǒng)灰狼算法控制參數(shù)是線性變化的以及位置方程并未考慮三條領(lǐng)袖狼的影響值,易陷入局部最優(yōu),所以本文采取了非線性參數(shù)以及加入權(quán)重影響的位置方程對灰狼算法進(jìn)行改進(jìn)。由表3可看出本文提出的改進(jìn)灰狼算法(PSO-GWO)在函數(shù)F1、F2、F3、F6、F8、F9、F10上均找到了理論最優(yōu)解(0、-1.031 2、3),而傳統(tǒng)的灰狼算法只能在函數(shù)F6、F8、F9、F10上找到最優(yōu)值;粒子群算法和差分進(jìn)化算法除F9、F10外均無法收斂到最優(yōu)解;相較文獻(xiàn)[10]的改進(jìn)灰狼算法,本文提出的優(yōu)化算法在函數(shù)F1、F2、F3、F6、F8、F9上均得到了更優(yōu)解。可見本文提出的改進(jìn)的灰狼算法提高了函數(shù)求解的性能;面對復(fù)雜的多峰函數(shù)(Rosenbrock函數(shù))F5,雖然各種智能算法無法找到最優(yōu)解0,但是相比之下本文的改進(jìn)的灰狼算法得到的解是最小的,更靠近最優(yōu)解,并且標(biāo)準(zhǔn)差更小,展現(xiàn)了算法的魯棒性,也說明本文提出的改進(jìn)算法能有效地平衡局部搜索和全局搜索能力,從而避免PSO-GWO算法在搜索過程中提前收斂出現(xiàn)停滯現(xiàn)象。為了更直觀地反映改進(jìn)算法的收斂速度,本文給出了各算法在不同測試函數(shù)下的收斂曲線圖(圖3)。

圖3 不同函數(shù)下的算法收斂曲線圖Fig.3 Convergence curves of algorithms under different functions
由收斂曲線(圖3)不難看出,在單峰函數(shù)F1上,PSO-GWO算法在迭代次數(shù)200左右就找到了最優(yōu)值,而其余算法均未能找到最優(yōu)解;面對復(fù)雜的Quatic函數(shù),改進(jìn)算法搜索到了更精確的解,同時(shí)收斂速度相比其余算法也更快;在多峰函數(shù)F7上,PSO-GWO算法在20代左右收斂到了最小值,其收斂速度,收斂精度均優(yōu)于其他算法;Ackley函數(shù)F8,PSO-GWO和傳統(tǒng)GWO算法都搜索到了最優(yōu)解,但是改進(jìn)算法收斂速度更快。PSO-GWO算法在迭代前期不易陷入局部最優(yōu),且收斂到最優(yōu)值或者相同精度最優(yōu),收斂到最優(yōu)值或者相同精度所需要的迭代次數(shù)更小。總體來說,與其他智能算法相比,PSO-GWO算法具有良好的收斂速度、尋優(yōu)能力以及魯棒性。
為了驗(yàn)證改進(jìn)灰狼算法(PSO-GWO)在實(shí)際問題上運(yùn)用,本文針對電動(dòng)汽車充電調(diào)度[16-17]問題,運(yùn)用改進(jìn)算法進(jìn)行分析。
電動(dòng)汽車充電耗時(shí)模型如圖4所示,其具體優(yōu)化目標(biāo)函數(shù)為
(16)
(17)
(18)
(19)
式中:n為電動(dòng)汽車數(shù)目;Xi,j為電動(dòng)汽車i選擇充電樁j充電的決策變量;tdrive為行駛時(shí)間;tcharge為充電時(shí)間;twait為等待時(shí)間;λi,j為道路的擁堵系數(shù);Si,k為行駛路程;vi為行駛速度;SOCset為預(yù)設(shè)電量;SOCremian為剩余電量;SOCRate為充電倍率;qj為等待充電的電動(dòng)汽車數(shù)目;C為充電樁總數(shù)目。

圖4 電動(dòng)汽車充電時(shí)間模型Fig.4 Electric vehicle charging time model
約束條件如下。
(1)電動(dòng)汽車用戶每個(gè)人選擇一個(gè)充電樁進(jìn)行充電。
(20)
(2)剩余電量均能至少夠電動(dòng)汽車到達(dá)一個(gè)充電站。
SOCremain>SOCset-SOCremain
(21)
(3)充電樁型號與電動(dòng)汽車型號都能相互匹配。
Si∈Sj
(22)
式(22)中:Si為電動(dòng)汽車的型號;Sj為充電樁的型號。
位置向量的每一維度對應(yīng)于車輛的編號,每一維保存的值為充電樁的編號,一個(gè)位置向量長度為n的灰狼,保存了n輛車與充電樁的匹配關(guān)系。調(diào)度方案中首先在路網(wǎng)中隨機(jī)生成300輛電動(dòng)汽車的位置,然后運(yùn)用灰狼算法和改進(jìn)的灰狼算法,以式(17)為目標(biāo)函數(shù)為前提,輸出最優(yōu)匹配關(guān)系即每個(gè)電動(dòng)汽車對應(yīng)的充電樁編號,然后控制中心通過第三方平臺反饋給車主信息,引導(dǎo)電動(dòng)汽車進(jìn)行有序充電。電動(dòng)汽車充電調(diào)度過程具體如圖5所示。

表4 對應(yīng)關(guān)系Table 4 Correspondence between vehicle and pile

圖5 電動(dòng)汽車充電調(diào)度流程Fig.5 Electric vehicle charging scheduling process
選取贛州章貢區(qū)5公里內(nèi)的20個(gè)充電站進(jìn)行研究,實(shí)驗(yàn)對象為300輛出行間待充電的電動(dòng)汽車,211個(gè)快充樁;電動(dòng)汽車型號均為比亞迪E6,電池容量為80 kW·h,充電倍率采取的是快充樁40 kW,擁堵系數(shù)和平均速度均采用的12:00的實(shí)時(shí)路況數(shù)據(jù)。
灰狼算法的控制參數(shù)abegin=2,afinal=0;改進(jìn)灰狼算法設(shè)定的因子如下:b1=0.5,b2=0.3,b3=0.2。為保證實(shí)驗(yàn)公平性,種群規(guī)模統(tǒng)一設(shè)置為:N=30;最大迭代次數(shù)設(shè)置Tmax=500;位置限制[Xmin,Xmax]=[1,211]。
充電站與充電樁具體分布如表5所示。電動(dòng)汽車充電調(diào)度具體優(yōu)化結(jié)果如表6所示,收斂曲線如圖6所示。
從圖6和表6可看出,灰狼算法可運(yùn)用于電動(dòng)汽車充電調(diào)度之中,并且改進(jìn)的灰狼算法比傳統(tǒng)算法所得到的結(jié)果上無論是平均時(shí)間還是總時(shí)間都更短,可以減少電動(dòng)汽車出行需要充電所耗費(fèi)的時(shí)間,減輕用戶對時(shí)間上的焦慮。

表5 充電站分布情況Table 5 Distribution of charging stations

表6 不同方案下的充電時(shí)間Table 6 Charging time under different schemes

圖6 目標(biāo)函數(shù)適應(yīng)度值收斂曲線Fig.6 Objective function fitness value convergencecurve
為了進(jìn)一步提高算法的尋優(yōu)能力和收斂精度,提出了一種改進(jìn)的灰狼算法(記為PSO-GWO)。其思路為利用精英反向?qū)W習(xí)機(jī)制初始化種群,保證種群多樣性;利用非線性函數(shù)更新原控制因子去更好地權(quán)衡算法的局部和全局搜索能力;最后基于差分思想和粒子群思想更新了灰狼位置方程,使其帶有記憶能力和權(quán)重占比,從而提高算法的收斂速度。為驗(yàn)證算法有效性,先對10個(gè)基準(zhǔn)測試函數(shù)進(jìn)行仿真實(shí)驗(yàn),結(jié)果顯示為PSO-GWO算法相比于DE算法、PSO算法、傳統(tǒng)的GWO算法、AGWO算法均能更快搜索到全局最優(yōu)解,而且具有一定的魯棒性,穩(wěn)定性。又將改進(jìn)的智能算法運(yùn)用到電動(dòng)汽車充電調(diào)度之中,結(jié)果顯示相比較于調(diào)度之前,改進(jìn)的算法總體降低了用戶315.3 h的充電時(shí)間,相較于傳統(tǒng)灰狼算法,總體降低了用戶9.5 h的充電時(shí)間。下一步將繼續(xù)圍繞著新算法在電動(dòng)汽車充電調(diào)度的費(fèi)用需求,及目標(biāo)需求的運(yùn)用中展開。