丁 松, 黨耀國, 徐 寧, 王俊杰
(1. 南京航空航天大學經濟與管理學院, 江蘇 南京 211106; 2. 滑鐵盧大學系統設計工程系, 安大略 滑鐵盧 N2L 3G1; 3. 南京審計大學管理科學與工程學院, 江蘇 南京 211815)
多變量灰色預測模型是灰色系統理論中最重要的模型之一,該模型包含了一個系統行為特征序列和N-1個影響因子(又稱驅動因素)序列,通過將已知因素作為驅動項和將未知因素作為灰作用量,建立微分方程描述驅動因素、灰作用量與系統行為間的關系,對系統行為進行預測。多變量灰色預測模型能夠相對準確地描述系統與因素之間的關系,更符合灰色系統“部分信息已知,部分信息未知”的“小樣本”“貧信息”不確定性系統結構特征。因此,該模型一直受到眾多學者的關注。文獻[1]提出了把驅動項作為灰常量來處理的思路,解決了傳統GM(1,N)模型的模擬預測問題,并獲得了廣泛應用。文獻[2]利用灰色關聯度探討了GM(1,N)模型的擬合度與變量的選擇關系,說明變量選擇在灰色模型建模過程中的重要性。文獻[3]將自記憶性準則融入到多變量模型構建中,提出了SMGM(1,m)模型。文獻[4]利用采樣定理和狀態轉移矩陣分析了GM(1,N)模型差分方程和微分方程的關系,探索該模型的離散化結構解。文獻[5]對傳統模型的背景值進行了優化,并利用遺傳算法對參數進行求解,提升了模型的適應能力。文獻[6]利用非線性優化方法對GM(1,N)模型進行了拓展研究,結合BP神經網絡進行優化求解,取得較好的應用效果。文獻[7]對傳統模型的背景值和殘差進行了優化,使得新模型能夠適應多種建模序列,豐富了灰色建模理論。文獻[8]構建了新型GMC(1,N)模型,利用非線性優化技術進行參數估計,進一步提升模型的可靠性和適應性。文獻[9]將系統變化趨勢融入到GM(1,N)建模,使得新模型具有更強的適應能力和外推能力,進一步提升了模型對小樣本系統的管控能力。
為了進一步改善模型的建模預測效果,提升傳統GM(1,N)的適應能力和可靠性,許多學者從模型結構、參數估計、融合其他方法等角度開展了研究,已經取得一系列有價值的應用成果。文獻[10]將影響因素的變化趨勢融入到傳統模型建模,構建了TGM(1,N)模型。文獻[11]分析了傳統模型的缺陷,并通過引入線性修正項和灰作用量項,構建了較為合理的建模過程和結構,并在實例中證明了其有效性和實用性。文獻[12]對該新模型的性質進行了拓展研究,并利用該模型對北京市機動車數量進行了預測。文獻[13]針對傳統模型背景值選取存在的問題,構建含有插值系數的背景值,并利用遺傳方法對參數進行估計,取得了較好的建模效果。文獻[14]提出了反向累加多變量預測模型,并結合滾動機理對金磚國家的CO2排放量與能源消費、城市人口和經濟增長的關系進行了系統分析和預測。文獻[15]充分利用卷積積分技術的優勢,提出了GMC(1,N)模型。文獻[16-17]針對多種應用場景,提出了兩種改進模型,拓展了GMC(1,N)模型的應用領域。文獻[18]基于索洛余值法提出了FDGM(1,h)模型,并給出了反饋控制方程和參數估計方法??v觀以上文獻可知,其對傳統模型改進和拓展的方面還是以系統行為特征序列和驅動因素序列同期變化為基礎。
另外,對于多變量系統的建模預測,其影響因素對系統行為特征序列產生作用效果可能會存在一定時滯現象,例如從城市交通擁堵到環境污染的產生、從科技投入到產出等均存在延遲。針對這類問題,一些學者也進行了研究。文獻[19]針對輸入和輸出存在時滯現象的系統建模問題,構建了GM(1,N|τ,r)模型。文獻[20]在此基礎上利用分數階累加算子,提出了基于分數階累加的時滯GM(1,N,τ)模型。文獻[21]將時滯控制因子引入到多變量離散模型的驅動因素控制項中,利用灰色擴維識別方法和灰色關聯分析工具研究時滯參數的估計,具有十分重要的研究意義。文獻[22]從時滯累積角度研究相關因素對主系統行為序列的累積影響效果,構建了時滯GM(1,N)的基本模型和拓展模型。
上述模型的改進與拓展在很大程度上提升了GM(1,N)模型的建模精度和動態預測能力,但考察多變量灰色預測模型的研究現狀可以發現,現有模型往往只考慮了多個驅動因素對系統的獨立影響,而忽略了多個因素之間的相互作用對系統特征的影響。事實上,兩個系統影響因素同時作為驅動變量時,某一因素的變化會影響另外一因素對系統的作用,它們之間存在相互制約、相互依賴的關系。如對于高新技術企業產出而言,研究人力和研究經費投入是企業持續發展的基本動力,兩者之間有著密不可分的交互關系;對于研究人力投入而言,其對企業產值的影響依賴研究經費的持續投入來保障研究人員的全身心投入;對于研究經費投入而言,其對企業產值的影響受到研究人員的調控。再如,CO2的排放量受到GDP增長和能源使用量的影響,一方面GDP的增長受能源使用量的制約,另一方面能源使用量的需求來源于GDP的增長,兩者之間有著相互調控的作用,這類實例在經濟生活中還有很多。因此,兩者之間的交互關系需要引入模型的構建當中去。本文在對傳統多變量模型基本原理研究的基礎上,不僅考慮各影響因素的獨立作用效果,還將它們之間的交互作用項引入模型構建當中去,針對不同數據特征,構建基于交互作用的GM(1,N)模型,最后通過案例說明本文建模的有效性。

(1)


(2)

則參數列的最小二乘法估計滿足:

證畢

交互作用,反應的是兩個或兩個以上影響因素變量之間相互依賴、相互制約,共同對主系統變量的變化產生影響。當某影響因素對系統行為的作用效應的大小會因另一個影響因素的水平不同而有所差異時,則表示兩個影響因素之間存在交互作用。常用的處理交互作用的方法是使用乘積項,可以通過以下簡單的代數方程展現交互項的內在邏輯。若E(X1)表示系統行為特征序列,驅動因素用X2,X3表示,則傳統獨立的雙因素灰色預測模型可以表示為
E(X1)=β1X2+β2X3+β4
(3)
如果驅動因素X2對系統的影響通過式(3)中的驅動系數β1來反映,且被認為驅動因素X3在X2對系統行為施加影響時有調節作用,那么當X2發生變化時,β1的取值也會產生相應的變化,通常情況下用線性方程說明X3對β1產生的影響,即β1=β3X3+α,則將該式代入式(3)并變形后,可得到包含乘積項的交互作用模型,即
E(X1)=β1X2+β2X3+β3X2X3+β4
(4)
式中,E(X1)表示系統行為特征序列,β3X2X3為交互作用項。當交互作用項為零時,表明X2和X3獨立對系統行為序列產生影響,兩影響因素不存在交互作用,反之則存在交互作用,如圖1所示。

圖1 兩因素的交互作用示意圖Fig.1 Schematic diagram of interaction between two factors
由圖1可知,上述邏輯闡述過程過于簡單,因為其他類型的交互模型會產生同樣的方程,而其他類型的交互模型可以從不同的交互方程中演化而來。在此,本文僅給讀者提供乘積項表示交互作用的背后邏輯,反映兩個驅動因素間的雙向線性調節作用。當然,在實際應用中,涉及驅動因素變量的可能函數關系也可能是非線性的,理想的函數形式應當通過數據分析驅動因素間的內在調節機理,構建適當的調節方程來反映因素間的交互關系對主系統行為的影響。
另外,也可能會存在3個及以上驅動因素間存在交互影響關系,需要進一步提煉交互驅動項。3個及以上驅動因素間的交互關系,除了兩兩因素間的雙向交互作用,還存在三向交互作用,甚至多向交互作用,此類交互項形式往往可使用乘積項的多項式表示。以三向交互作用為例,其交互形式為
E(X1)=β1X2+β2X3+β3X3+β4X2X3+
β5X3X4+β6X2X4+β7X2X3X4+β8
(5)
可見,三因素間的交互作用更加復雜,包括主效應、雙向交互作用和三向交互作用,分別由3個驅動因素自身(X2,X3,X4)、成對項(X2X3,X3X4,X2X4)、共同的乘積項(X2X3X4)表示。三向交互作用的顯著性主要由共同乘積項體現,若β7=0,則不存在三向交互作用,該模型則退化為上文中的雙向交互作用模型。對于4個及以上因素的交互作用,采用類似的推理方式,模型結構形式將更加復雜。
對于交互作用的識別,在經典的統計學研究里,交互作用的識別是通過F檢驗或者標準t檢驗來推斷兩影響因素間的交互效應是否顯著,進而判斷是否需要引入交互作用項,而統計建模的最大特點就是大樣本大數據,這一點在現實生活中存在的“貧信息,小樣本”數據類型則不太適用。因此,本文依據交互作用的現實含義,通過專家經驗分析并利用灰色系統理論中的灰色關聯分析方法對兩個相關因素間的邏輯關系加以研究,確定驅動因素間是否存在交互作用關系。
為了能夠有效解決傳統模型沒有考慮交互作用項的缺陷,將影響因素的交互作用項引入經典GM(1,N)模型的灰作用量,構建基于交互作用的IEGM(1,N)(interaction effect grey model ofNvariables)模型及其拓展模型,以反映不同輸入變量間的交互作用關系對系統行為變量的影響,并通過江蘇省高新技術產業產值的案例分析,驗證本文模型的有效性和實用性。

(6)
為基于交互作用的GM(1,N)模型,記為IEGM(1,N)

(7)
為IEGM(1,N)模型的白化微分方程。


則參數列的最小二乘法估計滿足:

證畢
在估計出參數列之后,可以參照文獻[1]中GM(1,N)求解過程,對IEGM(1,N)模型進行求解,便可得到以下求解步驟。

(1) 白化方程(7)的解為
(8)
(2) 當驅動項及交互項變化幅度很小時,可視驅動項和交互項為灰常量,則IEGM(1,N)模型的近似時間響應式為
(9)
(3) 累減還原式為
(10)
(4) IEGM(1,N)差分模擬式為
(11)
證明(1)由白化微分方程(7)可得通解公式為
(12)

(13)
再將式(13)代入式(12)便可得到式(9),定理得證。
證畢
式(2)~式(4)將驅動項和交互項看作灰常量,類似看成是GM(1,1)模型證明過程便可得證。
定理2和定理3分別給出了IEGM(1,N)模型參數估計和模擬值計算公式,當主系統行為和驅動因素交互項作用機制已知時,便可通過上述定理進行計算。




其中


(14)

其中


(15)

證明由定理4和定理5的證明過程可知,這3種模型均是在經典建模的基礎上,代入背景值和累減還原公式進行化簡得到,它們之間可以相互轉化推導,因此是等價的。

高新技術產業是提升國家創新能力的重要載體,是國家之間經濟、科技競爭的制高點,代表了國家未來技術與產業的發展方向。從高新技術產業本身來看,人力投入和經費投入是創新產出的重要影響因素,它們之間相互影響、相互制約。在人力資本投入方面,科技人才是高新技術產業持續發展的基本動力,擁有高質量的科技人才和高規模的人力投入,才能保證企業研發創新活動的高效持續進行,進而提升企業創新產出,而人才投入多少,對產業產值貢獻度的大小受到資金投入的調節作用。在資金投入方面,研發經費投入能夠反映高新技術產業研發創新的基礎能力和潛在產出,并為高新技術產業研發創新活動的順利完成提供基礎保障,但資金效益的產生依賴人才優勢的發揮。因此,從經驗分析角度看,增加和合理利用科技人員和研發經費,明晰兩者間的交互作用關系,會直接促進高新技術產業產值的增加,提升高新技術產業的創新產出。
為了能驗證本文模型在實際應用中的有效性,擬通過多種模型的對比分析,對江蘇省高新技術產業產值進行預測分析。江蘇省十分重視高新技術產業的發展,近些年對該產業的發展投入了大量的精力,主要包括科技人員投入和研發經費投入。在變量選擇方面,本文以我國高新技術產業產值為產出指標(系統行為變量),以科技活動人員數(萬人)和研發經費內部支出(億元)為投入指標(驅動因素變量),2005-2015年這3個指標的數據如表1所示,其數據來源于江蘇省統計年鑒和2015年江蘇省高新技術產業主要數據統計公報。

表1 江蘇省高新技術產業產值及影響因素
為了避免不同數量級、量綱給模型帶來病態性誤差,本文將原始數據進行初值化,并在現價的基礎上,計算出3種變量的增長速度,結果如表2所示。

由表3中4種模型計算結果可知,傳統GM(1,N)的平均相對誤差高達33.01%,其兩步外推誤差也高達25.71%,已經基本失去模擬和預測的意義。產生那么大誤差的主要原因是驅動因素變化幅度較大,不滿足作為灰常量的建模基礎,而且該模型沒有考慮到人員投入與資金投入之間的交互作用關系,因此傳統模型模擬和預測效果不理想。為了作為參照,本文還將GM(1,1)模型用于高新技術產值的單變量建模,基于模擬效果還不錯,誤差為6.25%,但是不能保證具有較好的外推效果,兩步外推平均誤差高達27.51%,主要是因為GM(1,1)僅適用于低速增長的準指數序列建模,對于波動增長序列建模效果較差。

表2 各變量初值化后的數值增長速度

表3 各種模型模擬和預測結果


則關聯度計算公式為

[1] 劉思峰,黨耀國,方志耕.灰色系統理論及其應用[M].北京:科學出版社,2010:149-157.
LIU S F, DANG Y G, FANG Z G. Grey system theory and its application[M]. Beijing: Science Press, 2010: 149-157.
[2] 尹子民,羅麗兮.灰色模型GM(1,n)的變量選擇及擬合度分析[J].系統工程理論與實踐,1999,19(11): 81-83.
YIN Z M, LUO L X. Variable selection and error analyzing of GM(1,n)[J]. Systems Engineering-Theory & Practice, 1999, 19(11): 81-83.
[3] GUO X J, LIU S F, WU L F, et al. A multi-variable grey model with a self-memory component and its application on engineering prediction[J]. Engineering Applications of Artificial Intelligence, 2015, 42(C): 82-93.
[4] 仇偉杰, 劉思峰. GM(1,N)模型的離散化結構解[J]. 系統工程與電子技術, 2006, 28(11): 1679-1681.
QIU W J, LIU S F. Dispersed structure solve of model GM(1,N)[J]. Systems Engineering and Electronics, 2006, 28(11): 1679-1681.
[5] PEI L L, CHEN W M, BAI J, et al. The improved GM (1,N) models with optimal background values: a case study of Chinese high-tech industry[J].The Journal of Grey System,2015,27(3): 223-234.
[6] 周偉, 方志耕. 非線性優化GM(1,N)模型及其應用研究[J]. 系統工程與電子技術, 2010, 32(2):317-320.
ZHOU W, FANG Z G. Nonlinear optimization method of model GM(1,N) and application[J]. Systems Engineering and Electronics,2010, 32(2): 317-320.
[7] GUO H, XIAO X P, FORREST J. A research on a comprehensive adaptive grey prediction model CAGM(1,N)[J]. Applied Mathematics and Computation, 2013, 225(1): 216-227.
[8] WANG Z X, HAO P. An improved grey multivariable model for predicting industrial energy consumption in China[J]. Applied Mathematical Modelling, 2016, 40(11): 5745-5758.
[9] DING S, DANG Y G, LI X M, et al. Forecasting Chinese CO2emissions from fuel combustion using a novel grey multivariable model[J].Journal of Cleaner Production,2017,162:1527-1538.
[10] 丁松, 黨耀國, 徐寧. 基于驅動變量增長趨勢的TGM(1,N)預測模型[J]. 系統工程, 2015, 33(3): 149-153.
DING S, DANG Y G, XU N. TGM(1,N) prediction model based on trends of driving variables[J]. Systems Engineering, 2015, 33(3): 149-153.
[11] ZENG B, LUO C, LIU S, et al. Development of an optimization method for the model GM (1,N)[J]. Engineering Applications of Artificial Intelligence, 2016, 55: 353-362.
[12] ZENG B, LUO C, LIU S, et al. A novel multi-variable grey forecasting model and its application in forecasting the amount of motor vehicles in Beijing[J]. Computers & Industrial Engineering, 2016, 101(C): 479-489.
[13] HSU L C. Forecasting the output of integrated circuit industry using genetic algorithm based multivariable grey optimization models[J].Expert Systems with Applications, 2009, 36(4): 7898-7903.
[14] WU L, LIU S, LIU D, et al. Modelling and forecasting CO2 emissions in the BRICS (Brazil, Russia, India, China, and South Africa) countries using a novel multi-variable grey model[J]. Energy, 2015, 79(79): 489-495.
[15] TIEN T L. The indirect measurement of tensile strength of material by the grey prediction model GMC(1,N)[J]. Measurement Science Technology 2005, 16(6): 1322-1328.
[16] TIEN T L. Forecasting CO2 output from gas furnace by grey prediction model IGMC(1,N)[J]. Journal of the Chinese Society of Mechanical Engineers, 2010, 31(1): 55-65.
[17] TIEN T L. The indirect measurement of tensile strength by the new model FGMC(1,N)[J]. Measurement, 2011, 44(10):1884-1897.
[18] XIE N M, ZHU C Y, ZHENG J. Expansion modelling of discrete grey model based on multi-factor information aggregation[J]. Journal of Systems Engineering and Electronics, 2014, 25(5): 833-839.
[19] 黃繼.灰色多變量GM(1,N|τ,r)模型及其粒子群優化算法[J].系統工程理論與實踐,2009, 29(10):145-151.
HUANG J. Grey GM(1,N|τ,r) model and its particle swarm optimization algorithm[J].Systems Engineering-Theory & Practice, 2009, 29(10): 145-151.
[20] 毛樹華,高明運,肖新平. 分數階累加時滯GM(1,N,τ)模型及其應用[J]. 系統工程理論與實踐, 2015, 35(2):430-436.
MAO S H, GAO M Y, XIAO X P. Fractional order accumulation time-lag GM(1,N,τ) model and its application[J]. Systems Engineering-Theory & Practice, 2015, 35(2): 430-436.
[21] 張可,曲品品,張隱桃.時滯多變量離散灰色模型及其應用[J].系統工程理論與實踐,2015,35(8): 2092-2103.
ZHANG K, QU P P, ZHANG Y T. Delay multi-variables discrete grey model and its application[J]. Systems Engineering-Theory & Practice, 2015, 35(8): 2092-2103.
[22] 王正新. 多變量時滯GM(1,N)模型及其應用[J]. 控制與決策, 2015, 30(12):2298-2304.
WANG Z X. Multivariable time-delayed GM(1,N) model and its application[J]. Control and Decision, 2015, 30(12): 2298-2304.