楊 亮,杜紅梅,張 鐳,王秀同
(裝備學院 a.研究生院;b.航天指揮系,北京 101416)
科技項目評審專家績效評價涉及多個評價指標,屬于高維數據處理問題。傳統的方法多采用加權評判,即對各項指標人為賦予權重,來進行模糊綜合評判。評判過程中不可避免地涉及權重選取上的人為干擾,導致評價結果有出入。論文將基于實數編碼的加速遺傳算法(RAGA)與投影尋蹤模型(PPE 模型)有機結合,通過RAGA 優化PPE 模型中的投影方向參數,完成高維數據向低維空間的轉換,即將每個樣本的多個評價指標擬1 個綜合指標,然后按投影值進行排序與識別,從而實現對專家的績效評價。與常規綜合評價模型過于形式化、數學化的特點相比,投影尋蹤聚類具有可直接由樣本數據驅動來探索數據的優點,即在評價過程中不必預先給定評價指標的權重,即可以自行搜索產生,這樣就能有效解決傳統評價活動中主觀賦權的弊端,最大限度地避免傳統評判中權重取值的人為干擾,使評價結果更為準確客觀。
確定合理的科技項目評審專家績效評價指標是對專家進行績效評價的關鍵。在閱讀相關文獻[1 -5]的基礎上,結合科技項目評審同行專家、專家管理人員和科技項目完成人3 個層次人員的意見初步構建了專家績效評價指標體系,其指標如下。
1)專家基本能力指標,包括工作年限A1、學位/學歷A2、專業技術職稱A3、科研課題量A4、發表論文量A5、出版著作量A6、獲獎情況A7、專利申請數量A8、科研成果的經濟效益和社會效益A9、分析與判斷綜合能力A10、對本科學領域前沿問題研究的方向把握A11和對專業領域相關法律法規及政策的熟悉程度A12。
2)專家工作績效指標,包括參與評議項目累計數B1、橫向離散率B2、縱向離散率B3、綜合離散率B4、命中率B5、成功率B6、工作態度B7、溝通合作B8和評估評審工作的科學性B9。
3)專家信譽度指標,包括保密性C1、職責履行C2、同行贊譽度C3和課題完成人的信任度C4。
專家績效評價的RAGA-PPE 模型分析過程主要有以下4 個步驟[6-8]。
步驟1 評價指標集數據的處理。設科技項目評審專家績效評價的樣本指標集為{x*(i,j)|i =1,2,…,n;j =1,2,…,m}。其中:{x*(i,j)}為第i 個樣本的第j 個指標值;n、m分別為樣本的個數和指標的數目。為消除指標體系中指標量綱不同對評價模型準確性的影響,還需要對指標輸入進行處理,即對這些數值進行歸一化處理??刹捎孟率竭M行極值歸一化處理。
對于越大越優的指標

對于越小越優的指標

其中:xmax(j),xmin(j)分別為第j 個指標值的最大值和最小值;x(i,j)為指標特征值歸一化后的序列。
步驟2 構造投影指標函數F(a)。投影尋蹤方法就是把m 維數據{x*(x,j)|i=1,2,…,n;j=1,2,…,m}綜合成以為投影方向的一維投影值z(i)

式中:a 為單位長度向量。確定綜合評價指標{z(i),i =1,2,…,n}的關鍵是能找到反映高位數據特征結構的最優投影方向向量a*。此問題可轉化為求有約束投影指標函數F(a)的極值問題。投影指標函數可表達為

式中:Sz為類間散開度,即投影值z(i)的標準差;Dz為類內密集度,即投影值z(i)的局部密度。

式中:E(z)為序列{z(i)|i =1,2,…,n}的平均值;R 為局部密度的窗口半徑,選取時既要使包含在窗口內投影點的平均個數不能太少,以避免滑動平均偏差太大,又不能使其隨n值的增大而增加太高,建議取值為0.01SZ或者0.001SZ,本文選取0.1SZ;r(i,j)表示樣本之間的距離;μ(t)為一單位階躍函數,當t≥0 時,其值為1,當t <0 時,其值為0。
步驟3 優化投影指標函數,確定最佳投影方向。當指標樣本數據確定時,投影指標函數F(a)只隨投影方向a 的變化而變化。不同的投影方向反映不同的結構數據特征,最佳投影方向就是最大可能暴露高維數據某類特征結構的投影方向。因此可通過求解投影指標函數最大化問題來估計最優投影方向,求解出F(a)的最大值,也就同時找到了最優投影方向a*。最大化目標函數

約束條件

這是1 個以m 個變量{a(j)|j=1,2,…,m}為優化變量的復雜非線性優化問題,根據μ 函數和r(i,j)的定義,目標函數在某些點是不連續的或不可微的,用傳統的優化方法較難處理。模擬生物優勝劣汰規則與群體內部染色體信息交換機制的基于實數編碼的加速遺傳算法(RAGA)是一種全局優化方法,用他來求解上述問題十分簡便和有效。對投影尋蹤技術而言,無疑是1 項關鍵的技術突破。目標函數達到極值時即可得到最佳投影方向a*。關于加速遺傳算法請參考文獻[9 -10]。
步驟4 綜合評價分析。將模型中投影指標函數F(a)求最大后作為目標函數,各指標的投影a(j)作為優化變量,運行步驟3,可求得最優投影方向向量a*。a*反映了各指標的不同重要程度,他是單位投影方向向量,滿足平方和為1,故可將其作為各評價指標的權重,代人式(3),得到各評價樣本點的投影值z(i),即各樣本綜合評價得分。比較樣本投影指標函數z(1),z(2),z(3)…z(n),對投影值進行排序,則可得到科技項目評審專家績效的優劣排名。RAGA-PPE 模型建立流程如圖1。

圖1 RAGA-PPE 模型建立流程
以某領域科技項目評審專家管理機構對專家績效進行評估為例,選取10 個評審專家為評價對象。在進行指標值的確定時,對于定量指標,根據一定的標準(調查人設計的公式標準)進行打分(由于篇幅有限,這里不做詳細介紹);對于定性指標,通過發放調查問卷進行打分。結合里克特的5級量表分析法,本文規定(9、7、5、3、1)=(好、較好、一般、差、很差),2,4,6,8 介于上述評分之間。本次研究發放問卷30份,其中科技項目評審同行專家、專家管理機構和科技項目完成人各發放問卷10 份,回收問卷30 份,有效率為100%。科技項目評審同行專家、專家管理人員和科技項目完成人各占不同的權重,本文規定分別為0.5,0.25,0.25。經匯總加權平均得表1 中所示的各指標值。然后根據指標類型對評價指標樣本集進行歸一化處理。對歸一化后的樣本集,采用Matlab 進行編程,構造RAGA-PPE 模型對專家績效進行評價。相關參數設置如下:父代初始種群規模為p =300,優秀個體數目s=20,交叉概率pc=0.8,變異概率pm=0.2,加速次數z=7,得到最佳投影方向為將a*帶入式(3)即可求得不同密度形式下各專家綜合評價的投影值即各專家的綜合得分,如圖2 所示。通過比較專家績效的綜合評價得分,排名如下:專家8 >專家1 >專家3 >專家10 >專家5 >專家2 >專家9 >專家7 >專家6 >專家4。



表1 專家績效評價指標得分表

圖2 各專家的投影值散布圖
投影尋蹤在綜合評價中已經得到了廣泛應用,并被實踐證明了是1 種科學、合理的評價方法。該方法的核心在于目標函數的確定,難點在于計算。論文將基于實數編碼的加速遺傳算法(RAGA)與投影尋蹤相結合,解決了高維數據全局尋優的難題,大大減少了尋優工作量,結合科技項目評審專家績效評價指標體系對專家的績效進行綜合評價,取得了較為理想的結果,為相關的績效工作提供了參考。
[1]李瑩,李燕萍.我國評估評審專家評價體系的構建問題研究[J].科技進步與對策,2005,22(1):42-45.
[2]趙黎明,徐孝涵,張衛東.對同行評議專家的反評估分析[J].中國科學基金,1995,9(1):62-66.
[3]趙黎明,徐孝涵,張衛東.選擇同行評議專家的指標體系[J].科研管理,1994,15(6):17-21.
[4]鄭稱德.同行評議專家工作業績測評及其模型研究[J].科研管理,2002(2):41-45.
[5]楊素娟.科技項目立項同行評議評審專家反評價體系構建[D].沈陽:沈陽理工大學,2009.
[6]Michael D S. Statistical modeling of high—dimensional nonlinear systems:a projection pursuit solution[D].Atlanta:Georgia Institute of Technology,2005.
[7]付強.投影尋模型原理及其應用[M].北京:科學技術出版社,2006.
[8]金菊良,魏一鳴,丁晶.水質綜合評價的投影尋蹤模型[J].環境科學學報,2001,21(4):431-434.
[9]金菊良,楊曉華,丁晶.標準遺傳算法的改進方案—加速遺傳算法[J]. 系統工程理論與實踐,2001,21(4): 8-13.
[10]金菊良,楊曉華.基于實數編碼的加速遺傳算法[J].四川大學學報:工程科學版,2000,32(4):20-24.