李 蓋,鄭克行,楊斌浩,沈 杰
(1.國網浙江省電力有限公司樂清市供電公司,浙江 樂清 325600; 2.國網溫州供電公司,浙江 溫州 325028)
產業鏈是產業經濟學中的一個概念,是各個產業部門之間基于一定的技術經濟關聯,并依據特定的邏輯關系和時空布局關系客觀形成的鏈條式關聯關系形態。產業鏈是一個包含價值鏈、企業鏈、供需鏈和空間鏈四個維度的概念。產業鏈中存在著大量上下游關系和相互價值的交換,上游環節向下游環節輸送產品或服務,下游環節向上游環節反饋信息。從經濟視角對產業鏈所作的研究工作相當豐富,但一個不可避免的瓶頸和制約在于,產業鏈研究需要基于經濟統計數據,而經濟統計數據存在較大的時滯,長達1~2個月甚至一個季度,對管理和決策部門來說,達不到提前預判的時效性需求,從用電量的視角來分析產業鏈顯得十分必要。結合先驗的產業鏈經濟特征,著重挖掘用電量的關聯強度和集群關系,建立合理模型,借助可視化的手段探索得出產業鏈拓撲結構以及子結構,通過網絡節點相對位置和邊的長度,體現出產業鏈關鍵特征,透視產業結構的規律及其隨時間的演化趨勢。
對于電力網絡的研究主要有3大分支。一是使用真實的電力物理運輸網絡,通過研究復雜網絡線路的拓撲結構的改變,來研究電力網絡在停電事故中表現出的脆弱性[1]。文獻[2]基于復雜系統理論對電網故障的時空分布特性和結構脆弱性進行了研究;文獻[3]針對電力系統故障診斷問題的特征對因果網絡進行了擴展,構建了一種新的時序因果網絡,并提出了基于時序因果網絡的故障診斷方法[3]。第二種是分析電力市場價格時序網絡。文獻[4]運用復雜網絡理論分析了2007—2012年13個歐洲(歐盟)電力現貨價格的代表性樣本的相互作用,其構建的網絡包含7 651個動態變量,其中節點對應于不同的歐盟國家,節點的連邊加權了各個電價變化之間的格蘭杰(Granger)因果關系[4];文獻[5]將動態網絡分析應用于電力部門,考察澳大利亞國家電力市場(NEM)中區域現貨電價之間的關系, 通過交互連接的網絡區域市場表現出更強的依賴性,而Granger因果關系的方向可能與區域間貿易有關。第三種主要是考察不同行業、地區或企業用電量之間的邏輯聯系,包括因果關系和相關關系等,通過最小生成樹(MST)、層次樹(Hierarchical Tree)、聚類分析等方法,考察用電量網絡的多種結構和特性。文獻[6]使用上海市不同行業的用電量數據建立行業用電量關系網絡,并利用最小生成樹和復雜網路的社團發現對不同行業網絡進行聚類分析,以此揭示行業間的聯系;文獻[7-8]分別采用皮爾遜相關性和偏相關關系建立因果關系,檢驗行業用電量間的動態關系;文獻[9]使用層次結構法對南方各省的電力消耗網絡進行了網絡拓撲結構分解[9];文獻[10]對歐洲電力市場建立因果關系網絡,并使用方差分解的思想,來判定影響歐洲用電量結構穩定的因素。
本文溯源時間序列的Granger因果推斷的初始想法[11],在前述文獻的基礎上,創新性地建立了以灰色關聯度為基礎的因果網絡,并用多維標度法合理降維,使得原始信息得到最大比例的保留,從而得到性質更優良、分析更便捷、時間動態更顯性化的因果網絡。
本項目研究數據主要是溫州市2019年以來的分行業日用電量時序數據。來源為網上電網、中國政府網以及中國歷史氣象網站。時間區間為2019年1月1日至2021年6月30日。數據內容可概括為以下幾個方面。
(1) 全行業日電量數據。主要是依照國民經濟行業分類(GB/T 4754—2017)所形成的133個行業大類的日用電量數據以及企業級用戶數據。后者包含字段:用戶編號、額定容量(kVA)、電壓等級、行業類型、用電地址、用戶狀態、用戶類別、用電量(kWh)、立戶日期、銷戶日期、管理單位、日期等。
(2) 溫州市每日氣溫數據。包含字段:日期、星期、日最高氣溫、日最低氣溫、天氣、風力風向、空氣質量指數等。
(3) 節假日安排表。根據2019—2021年這3年的《國務院辦公廳關于部分節假日安排的通知》,將節日標簽添加一列嵌入到時序數據中。
數據預處理按照慣例流程,先將原始用電量數據的多個表格拼接,組成完整時間序列。然后對用電量數據進行行業匯總,并刪除缺失值較多的行業,行業分類中的四級子行業予以刪除。對行業進行編號,并建立編號與行業名稱的對照表。氣象數據的最高溫和最低溫字段轉換為數值型。行業用電量受氣溫變化影響會在冬夏兩季包含控溫負荷,將行業用電量的氣溫因素排除。根據行業用電特性,先要依據行業氣溫與用電量呈現二次函數的特征篩選出受影響的行業,再具體建立二次回歸模型去除這些行業的溫控用電量。
行業用電量與氣溫變化時序如圖1所示。

圖1 行業用電量與氣溫變化時序圖
本文先將日用電量時序數據,通過灰色關聯度體現選取時段的相關關系,再結合以該相關關系構建的距離矩陣,通過多維標度(MDS)法降維至二維平面上的點陣。在盡可能少地損失信息的前提下,能將原始行業用電量時序的相關關系保留。技術路線圖如圖2所示。

圖2 技術路線圖
灰色關聯分析法(GRA),是指對于兩個系統之間的因素,其隨時間或不同對象而變化的關聯性大小的量度。在系統發展過程中,若兩個因素變化的趨勢具有一致性,即同步變化程度較高,即可謂二者關聯程度較高;反之,則較低。因此,灰色關聯分析方法,是根據因素之間發展趨勢的相似或相異程度,亦即“灰色關聯度”,作為衡量因素間關聯程度的一種方法。時間序列波動的相似性如圖3所示。

圖3 時間序列波動的相似性
通過灰色關聯分析,可以得出兩個影響因素之間的關聯性。具體到本文的行業用電量時間序列,通過所述方法去掉周末和溫度影響,構建行業用電量波動的相似性。具體步驟如下。
(1) 確定反映系統行為特征的參考數列和影響系統行為的比較數列。
(2) 確定各個指標的權重,可用層次分析法。
(3) 確定參考數列與比較數列的灰色關聯系數ξ。
灰色關聯系數的計算公式如下:

(1)
ξ0i(k)為比較數列xi對參考數列x0在第k個指標上的關聯系數,其中ρ∈[0,1]為分辨系數。一般來講分辨率會隨分辨系數ρ同步變化。目前大多數研究在利用Granger因果檢驗進行實證研究時都取分辨系數為0.5。
多維標度法(Multidimensional Scaling,簡稱MDS)是一種多元統計方法,它是一種在低維空間展示“距離”數據結構的多元數據分析技術。多維標度法起源于心理測度學,用于理解人們判斷的相似性。Torgerson拓展了Richardson及Klingberg等人的研究,突破性地提出了多維標度法,后經Shepard和Kruskal等人進一步發展完善。
多維標度法解決的問題是:當n個對象(object)中各對對象之間的相似性(或距離)給定時,確定這些對象在低維空間中的表示(感知圖Perceptual Mapping),并使其盡可能與原先的相似性(或距離)“大體匹配”,使得由降維所引起的任何變形達到最小。多維空間中排列的每一個點代表一個對象,因此點間的距離與對象間的相似性高度相關。也就是說,兩個相似的對象由多維空間中兩個距離相近的點表示,而兩個不相似的對象則由多維空間兩個距離較遠的點表示。多維空間通常為二維或三維的歐氏空間,但也可以是非歐氏三維以上空間。多維標度法的具體步驟如下。
(1) 建立距離矩陣D;若為相似性矩陣C,則需要通過變換dij=1-cij得到距離矩陣。相似度越高,距離越近,反之越遠。

(3) 求原始數據的高維距離結構的低維擬合構圖。記λ1≥λ2≥L≥λr為B的正特征根,λ1,λ2,L,λr對應的單位特征向量為e1,e2,L,er,Γ=(e1,e2,L,er)是單位特征向量為列組成的矩陣,則:
(2)
矩陣X中每一行對應空間中的一個點。其中n為行業數,r一般取2或3.這里要投射成二維擬合構圖,設定r為2。相當于將每一個行業變成了一個二維平面上的點,點之間的距離體現了行業用電量的相似性。該相似性將在其后得到的因果網絡圖中得以保留。
對于用電波動相關性強的行業,只能得到在時間上的繼起性,兩者電量波動更可能同時發生,而無法判斷因果方向,也就是得不到哪個行業是用電量視角的先導性產業。要得到這種關系,本文借助于統計學中的Granger因果檢驗的方法來實現。
(3)
(4)
式中的X和Y為差分平穩后的時間序列,式(3)表示子自回歸,式(4)表達的含義是X是否受到Y的滯后項的影響。其理論依據在于:在僅有一個變量(X)的預測系統中,如果增加另一個變量(Y)能提高系統的預測精度,則認為Y是X的Granger原因。Y行業影響X行業并不是以同步增減的方式進行,而是以循序漸進的累積效應而驅動它的發展。這符合實際的產業發展特征。
Granger因果檢驗的步驟如下。
(1) ADF單位根檢驗,看變量序列是否為平穩序列,若平穩,可構造回歸模型等經典計量經濟學模型;若非平穩,進行差分,當進行到第i次差分時序列平穩,則服從i階單整(注意趨勢、截距不同情況選擇,根據P值和原假設判定)。
(2) 若所有檢驗序列均服從同階單整,構造VAR模型,做協整檢驗。根據AIC和BIC指標最小化原則確定最佳滯后期。
(3) 確定好滯后期,可以構造VEC模型或者進行Granger因果檢驗,檢驗變量之間是否存在“誰引起誰變化”,即因果關系是否存在。因果檢驗的F值可以理解為概率上的顯著性,是因果關系成立的強弱指標。
根據Granger因果檢驗結果,建立有向圖網絡,箭頭表示因果方向。對于兩個行業而言,存在互為因果的可能,比如“電氣制造業”的用電量波動是“金屬冶煉行業”電量波動的原因,這種關系也可以反過來。基于Granger因果關系的有向圖網絡,以長期(如一年)的時間序列的灰色關聯矩陣的MDS二維構圖點設定相對位置,以顯著性水平F值作為網絡中邊的權值,以邊的粗細來體現。F檢驗的統計量公式如下:
(5)
式(5)中的RSS0和RSS1分別是xi系數為0的帶約束回歸平方和不帶約束的回歸平方和,n是樣本數,p為滯后期數。通過兩兩關聯的時序因果分析,最后能得出帶權重的因果網絡有向圖,該圖可以分析出行業間的相互驅動關系。
對133個行業作預處理刪除后還剩下96個行業,這96個主導行業所形成的因果網絡如圖4所示。該因果網絡的顯著特征是其中每一個節點代表一個特定時間段的行業用電量時序,并且節點間的距離反映了行業間用電量的相關性。距離越近,相關性越強,反之則越弱。箭頭的出發端表示原因,箭頭指向端表示結果,邊的粗細反應因果關系的顯著性程度,邊越粗越顯著。該網絡可以隨時間變化而動態調整,考慮到行業間用電量的相互影響傳導周期,這里體現的時間段以180天為基準。

圖4 全行業用電量的因果網絡圖
對圖4的全局因果網絡,可以很容易計算主要的復雜網路特征,度值排序在前10位的行業節點特征見表1所示。按出度排序是“紡織業”“食品制造業”“采礦業”居前,按總度值和入度排序是“食品制造業”“汽車制造業”“非金屬礦采選業”居前。

表1 因果網絡的度值特征
從全局網絡中,可以摘取局部子網絡進行分析。是以醫藥制造業、軟件和信息技術服務業以及金屬制品業為中心節點的子網絡分別見圖5~7。

圖5 醫藥制造業子網絡

圖6 軟件和信息技術服務業的子網絡

圖7 金屬制品業的子網絡
從圖7可以看出,“儀器儀表制造業”“計算機、通信及其他電子設備制造業”“橡膠與塑料制品業”“金屬制品業”“有色金屬冶煉和壓延加工業”和“電氣機械和器材制造業”構成了一個關聯緊密的產業集群,“計算機、通信及其他電子設備制造業”的用電波動會引發“金屬制品業”的用電波動,“電氣機械和器材制造業”的用電波動會引發“儀器儀表制造業”“橡膠與塑料制品業”以及“有色金屬冶煉和壓延加工業”的用電波動。
本文采用溫州市2019年1月1日至2021年6月30日的行業日用電量數據和其他輔助數據,結合統計模型和復雜網絡原理,構建了帶權重值的有向因果網絡。該網絡基于時序相似性的灰色關聯度,以及多維標度的降維方法,可以對全市用電關聯情況作可視化呈現,對全市用電關聯有全局性的了解,并可以捕捉隨時間推移的動態變化規律。因果網絡不僅可以凸顯出網絡中的關鍵節點(行業),還可以對行業之間的經濟聯系作預判。用電樞紐節點的用電量發生大幅下降,會影響到全局網絡的脆弱性。借助層次分析法,還對行業進行層次聚類,可以將所有行業得到不同的行業集群。因果網絡是基于Granger因果檢驗方法,對最近一年以來的行業用電時序作統計上的因果推斷,根據因果方向以及F檢驗的強度,得出帶權重的有向圖。該有向圖反映了行業用電波動的傳播途徑,即一個行業的用電波動會引發另一行業的用電波動,形成鏈條式的產業鏈圖譜。因果網絡不同于相關網絡,相關網絡反映同時性的用電相關關系,即用電量同時朝同一方向呈力度相近的趨勢變化,可以用來作趨勢預判。因果網絡則適用于邏輯關聯,該邏輯關聯不一定會馬上呈現彼此間的驅動關系,但存在內在邏輯聯系,在時間上通過一段時滯的傳導,能對另外的行業產生影響。