陳莎莎
(廣東一方環保科技有限公司,廣東 廣州 510000)
為完成對區域內碳排放的有效預測,國內外相關研究人員提出了較多的預測模型。在碳排放影響因素解析方面,現階段常用的模型算法主要有LDMI(對數平均迪式分解法)、Kaya(卡亞不等式)等,為碳排放量的預測奠定了基礎。在碳排放預測方面,相關研究人員提出了CSO(雞群算法)、FLN(快速學習網)等很多模型算法,但單一的模型存在預測精度方面的缺陷,為解決該問題,該文對CSO與FLN兩種算法模型進行組合應用,旨在解決區域內碳排放的精準預測難題。
碳排放的計算涉及的碳源包括能源消費、秸稈燃燒、工業生產、廢水排放、糞便發酵以及甲烷排放等內容,需要核算的碳匯包括城市綠地、耕地林與果園等區域,碳排放結果即為碳源與碳匯的差值,相關技術參數見表1、表2。

表1 各類能源碳排放的相關系數

表2 秸稈燃燒碳排放計算主要參數
為研究影響區域內碳排放的影響因素,該文通過STIRPAT模型進行評估分析。該模型能夠對環境壓力、技術、富裕度以及人口之間的聯系進行分析,如公式(1)所示。

式中:為常數;為誤差;為估算指數。通過兩邊取對數得到公式(2)。

基于STIPRAT模型對上述公式進行擴展,將產業結構、能源結構、對外開發納入模型,如公式(3)所示。

式中:即為碳排放量;為能源結構;為產業結構;為對外開放;人口為年末常住人口;技術取決于能源強度;富裕度為人均GDP。
對外開放取決于外商投資比重,能源結構取決于煤炭消費量占比,產業結構取決于第二產業GDP增加比重。相關數據需要從國家統計局網站、統計年鑒、能源平衡表等獲取。
CSO算法具有較高的全局尋優能力,但在小樣本碳排放預測精度和方面存在一定問題。在CSO算法模型應用過程中,假設個體在種群中的數量為,食物搜索空間及優化問題維度為維;公雞數量為,母雞為,小雞為,媽媽母雞為。第次迭代時,用表示第個個體的位置;為個體數量,數值為1~;為維度,數值為1~。適應度值為,在優化過程中,適應度最差的個體劃分為小雞,最好的為公雞,其余為母雞。公雞適應度最優,占據主導地位,位置更新情況如式(3)所示。

式中:表示第個個體第次迭代時的位置;(0,) 即標準差與均值分別為和0的高斯分布隨機數;為適應度,與分別表示公雞和公雞,均為個體;為常數,用于避免公式分母為0。
母雞根據子群的公雞或種群的母雞、公雞進行食物尋找工作,隨著迭代次數增加,位置受時刻的影響將持續降低,其位置更新情況見式(4)。

式中:為二次非線性遞減權重函數;與為影響因子權重,分別與子群公雞以及種群母雞或公雞存在關聯;與為個體,分別表示子群公雞和種群母雞或公雞,兩者不會為同一個體;即為[0, 1]的隨機數;如公式(5)所示。

式中:為迭代的最大次數;設定為0.9,即為慣性權重最大值;反之,數值設定為0.4。小雞位置跟隨媽媽母雞移動,位置更新情況見式(6)。

式中:為媽媽母雞,由小雞跟隨;為[0, 2]內的系數;含義參考母雞位置更新公式。
為提升算法應用效果,須對母雞與小雞的位置更新公式進行改進,具體如下。




小雞可以跟隨子群里的公雞或母雞尋找食物,而非單獨跟隨母雞,如公式(9)所示。

式中:為子群公雞;為[0, 2]的系數。
FLN算法適用于小樣本高精度預測工作,但在樣本取值過程中難以保證所隨機樣本的實用性。FLN算法應用過程中,假設樣本數量為,樣本用{(X,T)}(=1, 2, …,)表述;X=[x,x, …,x]即為樣本的維輸入向量,屬于R;取值范圍為~,即為樣本輸出值,取值范圍為R。
在碳排放預測過程中,只需要一個輸出層節點。隱含層節點數量設定為1,激勵函數為g(x),閾值向量用 [,…,b]表述。輸入權重矩陣即為W=[,…,W],輸入與輸出層連接權重用α表述,隱含層與輸出層連接權重用表述,=[,…,α]且=[,…,β]。則FLN算法模型如下。

式中:為輸入;為輸出;取值范圍為1~。
轉化為矩陣如下。

式中:輸出權值矩陣、期望輸出矩陣與隱含層輸出矩陣分別為、T、H。


在() 可微的情況下,隨機分配b與W,能夠取得矩陣,FLN模型的訓練即為G·=這一線性系統最小二乘解的求解,G=[,],見式(13)。

式中:即為的廣義逆矩陣。具體計算過程為先將閾值與權值隨機生成,再求解和,最終將分解為和Т。
FLN模型訓練期間存在閾值或權值隨機數值為0的情況,為避免出現隨機過程過于盲目的情況,選擇利用CSO算法迭代的方式選擇最優的隱含層閾值和輸入權值,以此來強化FLN模型的預測準確性。在CSO算法中將權值與閾值視為個體,均方根誤差為適應度值,數值越低則選擇的閾值與權值越優,如公式(14)所示。


通過調查數據對某區碳排放情況進行計算,如圖1所示。

圖1 1995—2019年某區碳排放量及碳排放強度圖
為掌握序列數據平穩性情況,規避偽回歸問題,該文采用EVIEWS軟件通過單位根、協整兩方式檢驗各變量,結果表明,各變量二階差分后均得到平穩的序列,且各變量間的關系穩定均衡。通過SPSS對各影響因素、碳排放量進行多重共線性檢驗和最小二乘回歸分析,結果表明各變量均具有超過10的VIF方差膨脹銀子,變量直接的多重共線性問題較為嚴重,不利于對影響因素進行分析。為此,該文選擇利用擴展STIRPAT 模型嶺回歸計算進行分析。計算結果見表3,結果表明,碳排放量與、、三種影響因素呈負相關,與、、三種影響因素呈正相關;產業結構對碳排放起到較強的促進作用,、、的影響程度則無明顯差異。

表3 擴展STIRPAT模型嶺回歸結果
采取歸一化處理的方式解決各類原始數據存在較大量級差別的情況,如公式(14)所示。


在訓練過程中,假定CSO模型個體數量為100,迭代次數最大值為500,每10次迭代更新一次關系,rpercent=0.5,hpercent=0.65,mpercent=0.5。影響因素數量即輸入層神經元為6,輸出為碳排放量,隱含層4個神經元。激勵函數()=1/(1+-),從所調查的1995—2014年數據中選擇20個樣本作為訓練樣本,預測樣本選取2015—2019年中的5個樣本,以此來檢驗組合模型的預測結果準確度。通過訓練發現,組合模型的適宜度數值在迭代次數持續增加的過程中不斷降低,達到最大迭代次數后,適應度數值達到1.3466這一最優值,結果表明雞群算法能夠有效解決FLN算法在閾值與權值隨機過程中存在的局部最優或過早收斂問題。
以某區2015—2019年的碳排放量已知數值作為參考,對比CSO-FLN組合預測模型與FLN模型之間的精度,具體需要從、與3種誤差指標入手,各誤差指標如公式(15)所示。

在設定相同參數、樣本數值、輸入變量的情況下,分別利用2種算法進行50次的數據運算,取平均值作為預測結果,2種模型的誤差指標結果見表4。

表4 各模型誤差指標計算結果
結果表明,組合預測模型相對FLN模型具有更高的預測精度,相對實際值之間的誤差更小,即CSO算法有效改善了FLN算法的預測精度,利用組合預測模型能夠更好地解決碳排放預測精度難題。
研究結果表明,自1998年來,研究區域內的碳排放量處于上升趨勢,但排放強度逐年降低,碳減排工作依然面臨嚴峻挑戰。通過擴展STIRPAT模型對碳排放量的影響因素進行研究,結果表明,碳排放量能夠隨產業結構、富裕度以及人工規模的提升而增加,隨著能源結構、技術水平以及對外開放程度的提升而降低;CSO-FLN組合預測模型在精度方面比單一的FLN等模型更具優勢,能夠有效解決區域內小樣本碳排放預測難題,對研究碳排放發展趨勢具有參考意義。