毛歆+楊悅+張河戰
[摘要] 本文以“能力”和“評價或評估”為關鍵詞,檢索醫藥衛生領域的文獻,按照指標體系的構建步驟對能力評價工具進行研究,包括指標的篩選確定、指標權重的確定以及數據分析及統計三個方面。目前以德爾菲法和層次分析法組合最為廣泛使用。應根據待評價對象選擇最合適、最高效的評價工具。
[關鍵詞] 能力;評價;指標;權重;研究
[中圖分類號] R195 [文獻標識碼] A [文章編號] 1673-7210(2017)09(a)-0046-05
[Abstract] "Capacity" and "evaluation" being the key words, literatures in medicine and health field have been searched and the evaluation tools of capacity have been studied according to the steps of the establishment of indicator system, including selection and establishment of the indicators, determination of the weights and data analysis and statistics. The combination of Delphi method and analytic hierarchy process is currently most widely used. The most appropriate and most efficient evaluation tool should be selected based on the object.
[Key words] Capacity; Evaluation; Indicator; Weights; Research
能力評價是綜合考量個體、組織或系統為達成某項目標或任務所具備的素質。在自然科學及社會科學的各個領域,對能力的評價通常不是簡單的評判與打分,而是通過構建一個綜合的評價指標體系來完成。指標體系構建是根據專業知識和行業經驗選取科學適用的指標對評價對象進行描述,是做好評價工作的基礎。指標體系的構建不僅包括評價指標的確立和篩選,也包括指標權重的確定以及相關的數據統計技術。
本文以“能力”和“評價或評估”為關鍵詞,檢索中國知網和萬方數據庫,篩選醫藥衛生領域的文獻,按照指標體系的構建步驟對該領域能力評價工具的研究現狀進行綜述。
1 評價指標的確立和篩選
在指標體系的確立和篩選階段,德爾菲法是目前應用最廣泛的方法,主要是由調查研究人員制訂調查問卷,以郵件的方式向專家進行咨詢,專家將意見填寫在問卷中返回,由于專家并不知道其他專家的情況,所以不會互相討論,而只與調查人員有聯系。經過幾輪咨詢后,指標體系得以修訂最終達成意見一致。
德爾菲法中使用的調查問卷主要包括以下內容:前言,專家的一般情況,指標的特性評分,專家的熟悉程度和判斷依據自評表。
在構建指標體系的過程中,學者們廣泛使用德爾菲法進行指標的篩選和確立。
王珩等[1]遴選了35名從事醫院管理工作的相關專家,采用Likert五級評分法,按指標的重要程度分別賦值9、7、5、3、1,確立了醫院技術創新能力評價指標體系。
宋俐等[2]根據農村基本公共衛生服務工作內容,參考有關文獻建立備選評價指標庫,以函詢的方式開展兩輪德爾菲專家咨詢,確立了農村基本公共衛生服務評價指標體系。
漆莉等[3]采用兩輪德爾菲專家咨詢法,確定了疾病控制系統應對突發公共衛生事件應急能力綜合評價指標體系所包含的指標。
賁智強等[4]應用兩輪德爾菲法評價縣級公共衛生應急反應能力,將指標的重要性與可行性轉化為數值“100、75、50、25、0”,并通過計算得分均值將指標排序。
談曄等[5]在評價中山市基層預防保健所突發公共衛生事件應對能力時,運用系統分析法建立初篩指標集后,用德爾菲法確定指標集,請專家對每個指標從重要性、代表性和可行性三個方面做出1~5的評分,回收后計算專家的均分、權威系數和專家意見的協調程度。
閆夢青等[6]在構建市級疾病控制機構應急能力評價指標體系時,選用德爾菲法,由專家對指標系統里各個指標的可操作性與重要性進行評估,并對指標體系的構成提出其他建議與意見。
由于德爾菲法能充分吸收行業專家的學識和經驗,因此在能力評價領域應用廣泛。但實施德爾菲法的前提是必須已經具備一個指標體系的草案,在之后的專家咨詢中,專家通常只對其中的細節提出建議。因此德爾菲法的實施過程中,指標體系草案的擬定和專家的選擇是關鍵。
德爾菲法中也需要引入一些質控評價指標,如專家積極系數:常用問卷回收率表示,反映專家對項目研究的關心、重視程度和參與意愿。一般不能低于0.5的標準,一般認為>0.7為好[7-8];專家權威程度:為判斷系數和熟悉系數的算術平均值,一般認為專家權威系數>0.7的咨詢結果可靠[9];專家意見的協調系數:數值介于0~1之間,越接近1,說明專家意見越協調,當χ2檢驗有統計學意義時,結果可信。
指標的確立過程包含著對指標的篩選,通常依據德爾菲法中專家對指標的評分進行篩選,如申錦玉等[10]在研究疾控機構突發公共衛生事件應急能力時,選取專家評分均值在3分以上的指標。此外,界值法也是常用的篩選指標的方法。
宋俐等[2]以每項指標的滿分率、加權均數、變異系數、等級和、峰度系數、偏度系數等為依據篩選指標;對不同的指標設置不同的界值,如以滿分率的均數與標準差的差值為判斷界值,數值>界值的指標入選,以變異系數的均數與標準差的和為界值,數值<界值的指標入選;峰度系數<5入選,偏度系數在-3~+3之間的入選。endprint
賈瑩等[11]將每項指標的重要性和可行性得分分別計算變異系數、加權平均數和等級和。變異系數界值=均數+標準差,得分低于界值的入選;加權平均數和等級和界值=均數-標準差,得分高于界值的入選。
2 評價指標權重的確定
在確立了指標后就需要對權重進行確定。權重,也稱權重系數,是指某一指標在整體評價中的相對重要程度量值,權重系數設置得是否合理將直接影響評價的結果。
權重系數可分為主觀權重系數和客觀權重系數兩大類:主觀權重系數是指人們對各個指標按其重要程度,依照經驗主觀確定的權重系數,缺點是缺乏嚴格的科學分析,容易受到人為、主觀因素影響;客觀權重系數是指基于實際資料如數據分布特征或離散變異信息體現指標重要性,通過計算和分析算得權重,缺點是完全依賴于數理運算確定權值的大小,可能會與客觀實際脫節[12]。因此,每種確定權重的方法都有相對合理的一面,又有局限的一面,重要的是,無論采用哪種方法確定權重,都應當依賴較為合理的專業解釋。
2.1 層次分析法
層次分析法是Saaty于20世紀70年代提出的一種在處理復雜的決策問題時進行方案比較排序的系統分析方法,是一種定性和定量相結合、主觀與客觀相結合的分析方法[13]。其基本原理是把一個結構復雜、決策準則多且不易量化的問題按照因素間的相互關系和隸屬關系,分解成一個有序的遞階結構模型,在指標體系遞階分層和專業偏好認識基礎上,專家由高向低逐層對指標的重要性進行兩兩比較打分,將結果轉化為判斷矩陣,從而計算指標權重[14]。該方法具有數學分析模型的嚴謹性,將專家的主觀判斷結果形式化、定量化地表達和處理,逐步剔除主觀性,通過一定模式使決策思維過程規范化,從而盡可能地轉化成客觀描述。
層次分析法的實施步驟主要分為建立遞階層次模型,構造判斷矩陣,一致性檢驗,層次總排序等。建立遞階層次模型時一般要求以Saaty的1~9比例標度作為比較的標準。引入一致性檢驗的概念主要是用于評判決策者構造出來的判斷矩陣是否可以接受,對未通過一致性檢驗的判斷矩陣需剔除,對通過一致性檢驗的判斷矩陣進行計算。常用的計算方法有和法、冪法和根法。
武之更等[15]在構建公立醫院創新能力評價模型時,采用層次分析法計算指標權重,定量分析和綜合判斷公立醫院的創新能力。
張學軍等[16]在進出口食品檢驗檢疫核心能力指標的評價研究中,從責任落實、風險防范、基礎保障、工作機制4個方面形成了4個一級指標以及19個二級指標,并用層次分析法確定了指標權重,建立了評價體系。
楊莉[17]建立了醫院軟實力評價指標體系后,運用網絡分析法建立評價模型。網絡分析法是在層次分析法基礎上發展形成的一種適應非獨立遞階層次結構的決策方法,它適用于存在內部關聯和反饋的復雜系統決策。
2.2 百分權重法
百分權重法是在專家對各評價指標排序的基礎上通過統計計算,獲得各權重系數的數值。具體方法為①確定權距值:權距值即各項指標按其重要性排序,評分時采用其位序間的間距值,通常采用等權距1.0,最高評分值與指標數相等;②計算每項指標得分值:按指標的重要性排序時,每項指標被排在各位次上的概率都是存在的,因此將每項指標在各位次上所獲得的頻數,與其相應的分值相乘并取其和,即為該項指標得分值;③計算各項指標總得分值;④計算指標權重值:即將某一項指標的得分值被各項指標總得分值除,其商即為該項指標之權重。百分權重法計算簡便,且對數據沒有特殊要求。
孟雪暉等[18]采用百分權重法確定廣西縣級醫院突發公共衛生事件應對能力評價指標體系的指標權重。
丁昌慧等[19]在測量衛生服務評價中的權重系數時,分別采用了層次分析法和百分權重法計算,并認為對于一般的綜合評價工作,多用百分權重法計算權重系數。
類似的方法還有比例分配法。如宋軼等[20]在對疾控機構應急能力評估中,采用比例分配法計算三級指標權重,將三級指標重要性均值與其所屬的二級指標下包含的所有三級指標重要性均值之和相比,比值即為該項三級指標的權重。
2.3 主成分分析法
主成分分析法是從多個數值變量之間的相互關系入手,利用降維的思想,將多個變量轉化為少數幾個互不相關的綜合變量的統計方法[21]。原始指標體系經過降維后被濃縮為主成分指標,樣本集的指標數據被轉化為主成分得分,將方差貢獻率作為客觀權重,加權合成后計算綜合得分及樣本排序。常用的選擇原則是累計貢獻率≥85%,因此不至于因為節省了工作量卻把關鍵指標漏掉而影響評估結果。該法能對多項指標進行綜合評價,且不需要人為主觀地確定權重系數[22]。
王衛軍[23]在評價疾病預防控制機構應急能力時,采用主成分分析方法,以縣(區)級為單位,計算出得分值,再綜合評價分析各地區疾病預防控制機構的衛生應急能力。
吳學智等[24]對某醫院13個手術科室醫療工作質量進行綜合評價時,選取了具有代表性的18項指標,提取出5個主成分,運用主成分分析法得出了各科室的綜合得分及排名,結果與實際情況相符。
主成分分析法也有一定的使用局限性:①在該法中應保證所提取的前幾個主成分的累計貢獻率達到一個較高的水平,且對這些被提取的主成分必須都能夠給出符合實際背景和意義的解釋;②主成分的含義不像原始變量的含義那么清楚、確切,因此,提取的主成分個數應明顯小于原始變量個數。
2.4 因子分析法
因子分析法是一種數據簡化的技術,它通過研究眾多變量之間的內部依賴關系,探求觀測數據中的基本結構,并用少數幾個假想變量來表示其基本的數據結構。一個合理的評價模型中,各個指標最好能獨立地反映被評價對象某一維度的特征,但當維度之間有一定相關性時,則適宜選擇因子分析法,確定與各維度關系密切、但相互獨立的潛在公因子及其權重系數,以此建立綜合評價模型,可避免維度之間的相關性對評價結果的影響,但不能分析定性指標。在做因子分析之前,要先檢驗數據是否適合,多采用KMO(Kaiser-Meyer-Olkin)值法和巴特利特(Bartlett)球度檢驗。endprint
張瑩等[25]在對我國28個省市區醫藥制造業技術創新能力評價時,采用因子分析法對28個省市區的醫藥制造業的相關數據進行分析,得出綜合評分及排名。
張素珍等[26]采用因子分析的方法構建了包頭市綜合醫院傳染病防控能力綜合評價模型。
張慧等[27]以13個應對能力維度的得分作為原始變量,采用因子分析法建立醫院突發公共衛生事件應對能力綜合評價模型。
2.5 模糊綜合評價法
模糊綜合評價法是基于模糊數學的方法對一些帶有模糊概念或模糊變量的復雜問題加以定量刻畫或綜合評價的理念或方法,其實施基礎為模糊數學理論,即運用數學方法,通過構建模糊集合,處理或計量模糊概念或模糊變量的方法,其基本思想是通過隸屬程度來代替是否隸屬于某一概念[28]。可以分析定量和定性指標,但需由專家或相關專業人員依據評價等級進行打分從而確定權重,所以評價結果受主觀因素的影響較大。
張宏哲等[29]選擇模糊綜合評價法作為工具,以危機管理理論為基礎,評測和分析了廣州、哈爾濱、蘇州3座城市醫療建筑環境對突發性傳染病的防控能力。
2.6 熵值法(熵權法)
熵值法是一種客觀賦值法,不受主觀判斷影響,因此決策者的主觀意向和指標重要性易被忽視。熵值法各指標的權重依賴于樣本的離散程度大小,指標數據差異小賦予較小權重,差異顯著賦予較大權重。對于多級指標體系,某一指標的下級指標越多,算得的權重就越多,因此可能會出現跟客觀現實不符的情況,不適合單獨用于多級復雜指標體系的權重賦值。
代吉亞等[30]在疾控機構應急能力評估中,比較了層次分析法和熵值法兩種方法所得的結果,兩者相關性很高,綜合評分排名非常接近。但由于熵值法忽視了決策者的主觀意向,因此對于應急能力評估體系而言,宜采用主觀賦權的層次分析法,或者采用主觀賦權法和客觀賦權法相結合的統計方法。
2.7 秩和比法
秩和比法是根據編秩變換思想將原始數據轉化為秩次信息,是一種非參數和參數統計相結合的綜合評價方法,集合多種不同維度的指標進行綜合分析,通過秩次代換將多個指標加工成一個能夠反映綜合信息的統計量——秩和比,避免單個指標的片面性。其最突出的優點為可分檔管理,但由于計算時并不直接利用原始數據導致原始信息利用不充分,且對于離群數值不敏感。
季夢婷等[31]應用加權秩和比法綜合評價浦東新區社區護理相關政策的落實效果。
竇蕾等[32]篩選出4個一級指標和18個二級指標,利用定性排序與定量轉化法計算經驗權重系數,并通過加權秩和比法校正,從而建立了中醫藥服務能力評價指標體系。
馮欣等[33]應用德爾菲法和系統聚類法相結合篩選了13個指標,運用加權秩和比法對江西省10個縣級健康教育機構的服務能力現況進行綜合評價。
除上述方法外,學者們也采用其他一些方法。如將灰色關聯分析法與秩和比法聯合使用,郭芬芬等[34]在對基層醫療衛生機構服務能力進行評價時,運用秩和比法測算各指標的權重系數,運用灰色關聯分析法得出排序結果;尹占春等[35]在評價天津市濱海新區城市社區衛生服務機構綜合運營能力時,運用秩和比法和德爾菲法測算各指標的權重系數,運用灰色關聯分析法得出排序結果。此外,也有用TOPSIS法得到所有樣本優劣排序情況[36],用平衡積分卡評估績效,數據包絡分析法評估效率等。此外,秦佳等[37]在國際旅行衛生保健中心核心能力及技術支撐能力建設評價體系的建立研究中,對指標賦權的具體操作上力求簡單、直觀,避免人為因素干擾,設因素i在相關文獻中的出現頻數為Ti,令其權重Wi。依據指標在文獻中出現的頻數計算其權重,指標權重為該指標出現的頻數除以總頻數。
在通過上述方法獲得指標權重后,通常采用綜合評分法將權重和每個指標的實際測量數據乘積后加權合成,也稱加權線性和法,通過加法和乘法計算,將指標數據信息逐項累積,簡單快速。但對于復雜層級指標體系,合成算法缺乏解釋性。
3 數據庫的建立及統計分析
使用較多的是采用Excel/Foxpro建立數據庫,SPSS軟件進行數據的統計分析,也有用其他軟件如Matlab等。建立指標體系后還需對其進行信度和效度進行檢測,此處不再贅述。
綜上所述,目前德爾菲法與層次分析法相結合的方式在國內應用比較多,值得借鑒。如呂吉云[38]在構建軍隊傳染病防控能力生成模式評估指標體系時,魏巍等[39]在構建四川省醫院科研能力評價指標體系時,均采用德爾菲法與層次分析法相結合以確定指標及權重的方式。
也有學者不通過構建指標體系來評價對象。如張雪等[40]在設計藥品安全監管能力評價問卷時,采用360度評價模式,通過收集與受評者有密切工作關系的、來自不同層面人員的評估信息,全方位地評估受評者的工作行為與表現,但需要針對不同的評價主體設計不同的調查問卷。該模式能夠從不同的角度全面反映受評者,因此評價結果更為公正、真實、客觀、準確和可信,不失為一種科學的績效評價模式。
周偉等[41]采用密切值(Ci)法對江西省11地市村衛生室的服務能力進行評價,密切值越小,表明評價對象越優。密切值法基于多個目標設定的抽象空間,將每個樣本數組視為該空間上的點,確定“最優點”和“最劣點”后,計算其他樣本點與它們之間的距離,從而確定樣本點的密切值,獲得比較優劣程度的單個指數。
綜合評價是一個不斷完善的過程,評價指標體系也是一個開放的體系。從指標篩選確定工具、指標權重的確定工具到數據分析及統計工具,每一種工具都不是完美的,都有其各自的優勢及局限性,因此,應根據待評價對象選擇最合適、最高效的評價工具。同時,隨著待評價對象的變化及發展,已經確立的指標體系也會出現一些新的、更好的指標,因此不斷更新完善指標體系有利于更有針對性的評價能力。
[參考文獻]endprint
[1] 王珩,張勤,周典.醫院技術創新能力評價指標體系研究[J].中國科技論壇,2010,10:25-28.
[2] 宋俐,羊海濤.應用德爾菲法建立農村基本公共衛生服務評價指標體系[J].江蘇預防醫學,2011,22(2):10-13.
[3] 漆莉,賈慶良,孫軍,等.疾病控制系統應對突發公共衛生事件應急能力評價指標體系研究[J].檢驗醫學與臨床,2010,7(22):2443-2445.
[4] 賁智強,張美菊.應用德爾菲(Delphi)法評價縣級公共衛生應急反應能力[J].河南預防醫學雜志,2007,18(6):480-482.
[5] 談曄,夏敏,羅小銘,等.中山市基層預防保健所突發公共衛生事件應對能力的綜合評價[J].中國農村衛生事業管理,2011,31(6):605-608.
[6] 閆夢青,常煜博,賈曉燦,等.市級疾病控制機構應急能力評價指標體系構建[J].中華疾病控制雜志,2015,19(9):926-929.
[7] Sanjeev K,Gilbert H. An elementary introduction to statistical learning theory [M]. Hoboken:Wiley,2011.
[8] 李偉良.社會研究的統計應用[M].北京:社會科學文獻出版社,2001.
[9] 關勛強,李瑞興,劉運成.醫學研究生教育評價研究與實踐[M].北京:軍事醫學科學出版社,2000.
[10] 申錦玉,牛建軍,陳敏,等.疾控機構突發公共衛生事件應急能力評價指標探討[J].現代預防醫學,2011,38(1):64-66.
[11] 賈瑩,李菁,尹愛寧,等.構建社區中醫藥服務能力評價指標體系研究[J].吉林中醫藥,2014,11:1093-1095.
[12] 韋余東,張人杰,張新衛,等.層次分析法在疾控機構應急能力評價指標權重確定中的應用[J].中國預防醫學雜志,2015,16(10):770-773.
[13] 鄉志忠,郭刪,趙鵬圖,等.層次分析法在醫療高危模式與結果分析風險評估的運用[J].中國醫院管理,2009,8(29):13-14.
[14] 吳華氽,黃曉光,陳美玲,等.南京市三級綜合醫院創新能力評價指標體系研究[J].醫學與社會,2014,27(9):18-21.
[15] 武之更,韓玉珍.公立醫院創新能力評價模型構建研究[J].中國醫院管理,2012,32(12):92-94.
[16] 張學軍,張連軍,劉天鴻,等.進出口食品檢驗檢疫核心能力指標的評價研究[J].食品工業,2015,36(2):208-212.
[17] 楊莉.基于網絡分析法的醫院軟實力評價研究[J].管理探索,2015,10:10-11.
[18] 孟雪暉,崔仕臣,陳其偉,等.廣西縣級醫院突發公共衛生事件應對能力評價指標體系構建[J].中國醫院,2015, 19(11):27-28.
[19] 丁昌慧,祁新輝,蔡輝.衛生服務評價中權重系數的測量[J].交通醫學,2001,15(5):484-486.
[20] 宋軼,代吉亞,吳發好,等.基于德爾菲法和層次分析法的疾控機構應急能力評估[J].華南預防醫學,2014,40(1):1-6.
[21] 韋英婷,吳志錦.用主成分分析法綜合評價某院醫療質量[J].中國病案,2012,13(1):48-49.
[22] 宗文萍,梁實.主成分分析法在同綴醫院綜合比較中的運用[J].中國衛生統計,2012,29(5):711-716.
[23] 王衛軍.主成分分析法在疾病預防控制機構應急能力評價中的應用[J].實用預防醫學,2015,22(4):505-507.
[24] 吳學智,鄭娟,柳俊,等.用主成分分析法綜合評價手術科室醫療工作質量[J].中國病案,2015,16(4):46-48.
[25] 張瑩,陳玉文.我國28個省市區醫藥制造業技術創新能力評價[J].中國藥房,2013,24(17):1539-1542.
[26] 張素珍,王英,賈恩厚,等.包頭市綜合醫院傳染病防控能力評價[J].現代預防醫學,2014,41(7):1231-1234.
[27] 張慧,黃建始,段杰.醫院突發公共衛生事件應對能力綜合評價體系[J].中國公共衛生,2007,23(12):1505-1508.
[28] 馬強.模糊綜合評價法用于公立醫院績效考核的理論架構[J].南通大學學報:社會科學版,2015,31(3):145-152.
[29] 張宏哲,張姍姍.城市醫療建筑環境對突發性傳染病的防控能力評測研究[J].黑龍江大學工程學報,2015,6(2):52-57.
[30] 代吉亞,宋鐵,郭汝寧,等.層次分析法和熵值法在疾控機構應急能力評估中的應用比較[J].中國衛生統計,2014,31(6):1051-1053.
[31] 季夢婷,周嫣,馮芳茗,等.應用加權秩和比法綜合評價浦東新區社區護理相關政策的落實效果[J].護理學雜志,2015,30(3):50-52.
[32] 竇蕾,唐淑云,尹愛田.基于秩和比法對山東省縣級中醫院中醫藥服務能力綜合評價研究[J].中國衛生統計,2013,30(3):377-378.
[33] 馮欣,袁兆康,王希.加權秩和比法綜合評價健康教育機構服務能力現狀[J].中國健康教育,2013,29(2):147-150.
[34] 郭芬芬,劉冬梅.基于灰色RSR法的基層醫療衛生機構服務能力評價[J].中國衛生統計,2014,31(6):1012-1014.
[35] 尹占春,劉冬梅.基于灰色RSR法的城市社區衛生機構綜合運營能力研究[J].中國農村衛生事業管理,2014, 34(11):1334-1336.
[36] 張利平,李望晨.基于多指標評價適配算法的危機事件應急能力測評研究[J].中國衛生統計,2015,32(2):283-285.
[37] 秦佳,章琪,楊柳,等.國際旅行衛生保健中心核心能力及技術支撐能力建設評價體系的建立與研究[J].檢驗檢疫學刊,2015,4:44-51.
[38] 呂吉云.軍隊傳染病防控能力生成模式評估指標體系構建及應用研究[J].管理評論,2015,27(5):114-120.
[39] 魏巍,甘華平,力曉蓉,等.四川省醫院科研能力評價指標體系的構建[J].中華醫學圖書情報雜志,2014,23(7):21-25.
[40] 張雪,林志健,董玲.基于360度模式的藥品安全監管能力評價問卷設計[J].中國藥事,2014,28(7):700-705.
[41] 周偉,牛文柯,袁兆康.基于密切值法的村衛生室服務能力評價[J].中國全科醫學,2014,17(4):389-391.
(收稿日期:2017-05-05 本文編輯:李亞聰)endprint