吳思翰,樓文高,2
(1.上海理工大學 光電信息與計算機工程學院,上海 200093;2.上海商學院 校長辦公室,上海 200235)
改革開放至中共十八大之前,中國經濟一直保持著較高速增長態勢。但是在高投入、高消耗和高增長的背景下,能源過度消耗、環境質量下降、經濟發展不均衡以及創新驅動不足等問題越來越明顯[1]。為了解決上述問題,中共十八屆五中全會提出了五大發展理念,并且在十九大報告中指出“我國經濟已由高速增長階段轉向高質量發展階段”,說明中國經濟步入質量為首的新篇章,高質量發展成為中國當前以及未來經濟建設的核心[2]。
大多數學者對高質量發展的研究主要包括基本內涵、評價體系和水平測度3 個方面。師博等[1]采用均等權重賦值法評價了中國東部、中部以及西部地區的經濟增長質量;Frolov 等[3]基于矩陣方法,結合年均生產率增長率和人均發展指數構建區域經濟增長質量評價體系;劉干等[4]從居民生活水平、產業結構等5 個方面構建經濟高質量發展評價指標體系,通過模糊綜合評價法和熵值法進行實證研究;周吉等[5]采用主成分分析法(PCA)對江西省經濟高質量發展水平進行實證研究;馬茹等[6]采用線性加權法對區域經濟高質量發展水平進行綜合評價研究;魏敏等[7]采用熵權TOPSIS 法對我國經濟高質量發展水平及其空間分布規律進行實證研究。
上述研究中采用的評價方法都存在局限性;如采用均等權重法對權重賦值,令增長基本面(α)和社會成果(β)的權重均為0.5,但通過研究發現,經濟高質量發展過程中社會成果的權重要大于增長基本面的權重,故均等權重法賦值并不合理;主成分分析法要求樣本數量相對較多,至少是指標數的3~5 倍以上,否則結果不穩定;TOPSIS 法屬于逼近理想解的綜合評價方法,需要采用變異系數法、信息熵等方法事先確定指標權重,而這本身就是經濟高質量發展綜合評價的關鍵內容之一。傳統的統計方法主要適用于正態分布的數據,對于處理非正態分布的數據可能會出現無法合理解釋的結果或者結果的可靠性和有效性難以保證。綜上所述,高質量經濟發展綜合評價仍然是一個需要深入研究的問題。
同時,由Friedman 等[8]提出的非線性、高維、非正態分布數據建模的投影尋蹤分類(PPC)模型已廣泛應用于各種研究領域,并取得較好效果,如于曉虹等[9]采用PPC 模型對省際普惠金融發展水平進行綜合評價、排序和分類;虞玉華等[10]運用PPC 模型對體育期刊學術水平進行綜合評價與研究;郭倩等[11]運用PPC 模型對水資源承載力進行綜合評價并分析其投影特征值的歷年變化特征;Liu 等[12]運用PPC 模型對區域地表水環境進行評價。因此,本文基于高質量發展理念及PPC 模型原理,建立相應的評價指標體系,通過PPC 模型對中國30 個省市2015-2018 年的高質量發展水平進行綜合評價、排序和分類,并且與采用PCA 法、TOPSIS 法的評價結果進行對比,結果表明PPC 模型更加合理有效。
梳理有關文獻發現,不同學者從自身知識結構及對高質量發展內涵的不同理解,建立了相應的評價指標體系。師博等[1]構建了由6 個子系統組成的省際經濟高質量發展指標體系;魏敏等[7]則構建了包括經濟結構優化、創新驅動發展等10 個子系統53 個測度指標的測度體系;王竹君等[13]通過福利變化與成果分配、生態環境保護以及居民經濟素質3 個方面7 個二級指標17 個三級指標,構建指標體系結構;劉麗波等[14]根據經濟高質量發展內涵和不同階段特征,構建了由動能轉換、產業結構化、需求轉型、投入產出效率以及優化發展環境5 個特征29 個指標組成的評價體系;詹新宇等[15]從創新、協調、綠色、開發、共享五大發展理念的角度構建了31 個三級指標的經濟增長質量指標體系。綜合以上學者建立的經濟高質量發展評價指標體系,再從高質量發展內涵的角度出發,考慮到評價指標體系的實用性、可比性、獲得數據的便捷性以及可操作性等原則,本文建立了由6 個方面、27 個指標構成的評價體系,具體指標及含義如表1 所示。

Table 1 High-quality development level evaluation index system表1 高質量發展水平評價指標體系
由于港澳臺地區和西藏自治區測度指標數據缺失較多,故只研究了其他具有完整數據的省市。所有數據均來源于2016-2019 年《中國統計年鑒》《中國科技統計年鑒》《中國能源統計年鑒》,個別數據采集于各省《國民經濟和社會發展統計公報》和歷年統計年鑒。
由于所收集到的部分數據值較大并且計算量復雜度較高,因而建模前要對樣本數據進行歸一化處理,公式為:Yij=(Xij-Xjmin)/(Xjmax-Xjmin);對于樣本數據的負向指標均進行正向化處理,公式為:Yij=(Xjmax-Xij)/(Xjmax-Xjmin)。其中,Xij和Yij分別表示原始指標值和歸一化處理后的指標值,Xjmin為第j 個指標的最小值,Xjmax為最大值。
投影尋蹤就是將m維數據綜合成以(a1,a2,…,am)為投影方向的投影特征值,如式(1)所示。

PPC 模型的最有效一維模型目標函數就是Sz與Dz乘積的最大化,即:

其中,Sz為zi的標準差,其值越大說明投影點在整體上越分散;Dz為其局部密度值,其值越大表示投影點局部越密集。Sz和Dz分別如式(4)、式(5)所示。

其中,E(z)為zi的平均值;ri,k為樣本i與k距離差的絕對值;R為局部密度的窗口半徑,最優化結果的參數取決于R值大小,從樓文高等[17]研究結果可知,R的合理取值范圍應為max(ri,j)/5≤R≤max(ri,)j/3;u(R-ri,k)為單位階躍函數,如果u(R-ri,k)>0,則其值為1,否則為0。
由于式(3)是以aj為變量的高維復雜非線性優化問題,因而采用群搜索算法(GSO)[18-19]對式(3)中的最佳投影向量a→及其系數aj(權重)進行優化求解。根據樓文高等[17]提出的定理1 求得全局最優解。根據最終求得的指標權重對其重要性進行排序,同時根據各樣本投影值的大小進行分類排序。
群搜索算法(GSO)是由發現者、加入者和游蕩者模型所產生的算法。在每次迭代中,當前最優個體為發現者,它會根據自身位置向周圍尋找更好的位置。其他個體按比例分為加入者和游蕩者,加入者在跟隨發現者的同時進行搜索,游蕩者則朝任意方向隨機移動。本文將采用張雯雰等[18]提出的帶趨勢預測的GSO 算法求解上述式(3),算法簡述如下:
在n維空間中,第i個成員在第k次迭代時的位置為,經驗為。在迭代開始之前,成員的位置隨機分布,經驗值為0。
在k次迭代時,將位置最好的成員設為發現者,記作。當時,隨機選取成員的20%以(6)式為基準進行經驗積累,再通過式(7)預測位置。

其中,r1和r2為(0,1)內的均勻隨機數,c1和c2為常量系數。再隨機選擇剩余成員的70%隨機選擇加入者,加入者通過一個隨機步長靠近發現者如式(8)所示。

其中,r3為(0,1)內的均勻隨機數。剩余成員作為游蕩者向任意方向隨機游蕩,如式(9)所示。

其中,r4和r5為(0,1)內的均勻隨機數;step為步長常量;mutationprobability為分量變異概率,其值為,迭代次數越多,值越小。“<”運算是衡量算式左右兩邊的大小,返回值為布爾值,用0、1 表示。
在27 個指標中,x15、x20、x21、x22、x25以及x26均為負向指標,故采用負向指標的歸一化方式處理,其他指標采用正向指標的歸一化方式處理。數據的直方圖分布表明,幾乎所有指標的數據都不服從正態分布規律。
將歸一化后的數據導入GSO 投影尋蹤程序中,令窗口半徑R=max(ri,j)/5,根據上述定理,求得真正的全局最優解,其中投影值標準差Sz=0.761 3,局部密度Dz=295.094,目標函數Q(a)=224.661,窗口半徑R=0.735 7,其中各評價指標的最佳投影向量系數(權重)aj=(0.322 2,0.254 9,0.252 8,0.299 6,0.131 8,0.210 4,0.267 8,0.131 5,0.022 3,0.159 1,0.234 9,0.209 7,0.246 2,0.186 6,0.109 6,0.070 4,0.243 0,0.154 2,0.192 8,0.204 0,0.056 8,0.185 1,0.249 9,0.045 6,0.098 5,0.188 1,0.013 8)。最后得到30個省的PPC 投影值以及排名結果如表2 所示。

Table 2 30 provinces and cities’high-quality development level PPC projection value and its ranking in China during 2015-2018表2 2015-2018 年我國30 個省市高質量發展水平PPC 投影值及其排名
3.3.1 評價指標特性解析
PPC 投影值與各指標之間呈線性關系,權重越大的指標對高質量發展水平的影響越明顯。將這些評價指標的最佳投影向量系數從大到小排序為x1、x4、x7、x2、x3、x23、x13、x17、x11、x6、x12、x20、x19、x26、x14、x22、x10、x18、x5、x8、x15、x25、x16、x21、x24、x9、x27。在該評價指標體系中通過6 個方面權衡高質量發展水平,權重占比依次為23.82%、15.64%、13.20%、18.05%、16.72%、12.57%,可以看出,每個方面所占權重比較平均,盡管創新驅動發展指標不是最多,但其權重占總權重的比例最大,說明發展創新驅動是決定省際高質量發展水平高低的最重要特征,應該優先得到保證并且要高度重視。因此,要提升各省市高質量發展水平,必須改進權重大的指標(如R&D 人員投入力度等),這樣才能取得事半功倍的效果。
3.3.2 省際高質量發展水平分類排序
由于PPC 模型所求得的投影值均為一維實數,因而既可以區分出各省市類型,又可以對同一類型的不同省市進行詳細的排序研究。根據表2 歷年排名情況,本文將30 個省市按2017 年高質量發展水平好壞分成三大類:第一類為超前型,包括北京和上海等6 個省市;第二類為中庸型,包括山東等15 個省市;第三類為落后型,包括山西等9 個省市。
對于綜合評價而言,確定合理的權重最為關鍵。本文采用基于變異系數法[20]、信息熵法[21]權重的TOPSIS 法和PCA 法[22]分別求得27 個指標數據的權重及其排序結果如表3 所示。采用PCA 法建模時,KMO 值等于0.458,小于0.5,說明該樣本數據不太適合用PCA 進行綜合評價。根據表4 可知,由于每個方法賦權重的原理不盡相同,因而最后求得的各方法權重及排名也會有所差異。其中,只有PPC方法的建模基本思想與人類開展綜合評價、排序和分類研究的思維方式是一致的,又可適用于非線性、高維、非正態分布的數據分析,可以避免PCA 法要求數據近似正態分布、存在“維數禍根”等問題,同時不必像TOPSIS 法需要利用其他方法提前確定各指標權重。

Table 3 Comparison of weights obtained by different evaluation methods and their ranking表3 不同評價方法得到的權重及其排序比較
本文基于構建的中國省際高質量發展水平評價指標體系,采用以群搜索算法優化的PPC 模型對中國30 個省市進行高質量發展水平綜合評價及排序分類研究。研究結果表明:①在本文研究的指標體系中,創新驅動發展對高質量發展水平影響最大,經濟成果共享相對其他方面影響最小;②將30 個省市按投影值從高到低進行了排序并且將其分為三大類,北京等6 個省市為超前型,山東等15 個省市為平庸型,山西等9 個省市為落后型;③不同方法賦權重的原理不同,得到的權重值就會有所差異。可以根據權重值最大的指標,提出有利于提升各省市高質量發展水平的措施和建議;④相比于PCA 等其他方法,PPC 模型建模過程簡潔,適用于分析高維、非正態的數據,為研究高質量發展水平提供一種更加科學、合理的新評價方法。