陳桂月,陳宣男
中國醫學科學院北京協和醫學院醫學科技體系與核心基地建設辦公室,北京 100007
公立醫院評價自20世紀末成為我國醫藥衛生領域改革的重點工作,探索建立科學合理、公平公正的評價方法和指標體系是推動公立醫院改革的重要抓手[1]。多年來,我國及地方衛生主管部門及多方機構開展對醫院的評價和排名,這些排行榜采取的評價方法及得出的結果雖然不盡相同,也飽受質疑[2-3],但排行榜在評估醫院在行業中的定位,以及為促進醫院在臨床服務、社會責任、科學研究、人才培養及科技創新等方面發揮醫療衛生行業國家隊的主體作用,同時也強化了學科建設、助推全國優質醫療均等化,為人民群眾提供更好、更多、更便捷的優質醫療服務方面發揮了重要的作用[4]。該文通過梳理我國醫院排行榜發展歷程,分析主流排行榜的穩定性與差異性,指出所在問題,為以后更好優化評價指標及衡量醫院各方面發展水平提供參考。
自2010年起,我國有關衛生主管部門及三方機構等開始對醫院綜合水平及專科水平進行有關評價,三方機構對醫院評價的綜合榜單及專科排行榜始現。諸如中國醫院排行榜、中國公立醫院社會貢獻度排行榜、中國醫院競爭力報告、中國醫院科技量值、中國最佳臨床學科評估排行榜等[5-8]。部分省市開展區域性的醫院評價工作,例如遼寧省醫院協會向社會發布“遼寧省三級甲等醫院運行與管理排行榜”;深圳市衛健委發布深圳市公立醫院綜合評價排名等[9]。2019年,國家三級公立醫院績效考核工作正式啟動,得到全行業的高度重視。國家衛生健康委組織開展的三級公立醫院績效考核工作按照年度實施,考核數據時間節點為上一年度1—12月。考核指標體系由醫療質量、運營效率、持續發展、滿意度評價等4個方面的指標構成[10]。我國三方機構排行榜發展如下。
中國醫院排行榜單由復旦大學醫院管理研究所發布,在2010年首次發布2009年的“中國醫院最佳專科聲譽排行榜”和“中國最佳醫院排行榜(綜合)”,2017年后正式改為“中國醫院排行榜”和“中國醫院專科聲譽排行榜”。此排行榜借鑒美國“最佳醫院排行榜”的評價方法,堅持以臨床學科水平、專科聲譽為核心,并兼顧當年的科研產出[16]。中國醫院排行榜評價方式采用“專科聲譽”與“科研分數”兩個指標,分別占比80%和20%。首先建立同行專家數據庫,再隨機抽取,要求專家綜合考慮醫院的學科建設、臨床服務水平及質量、科研能力等因素進行評價。此外統計SCI論文得分,并將醫院獲得的部分重要獎項轉化為可持續發展能力指標得分。由于評價方法的科學性,排行榜的評選結果得到醫療行業廣泛認可[11-15]。
由香港艾力彼醫院管理研究中心自2011年起發布,其構建了中國醫院綜合競爭力的定量評價指標體系—“第三方醫院分層評價體系”。從最初推出中國醫院競爭力縣級醫院排行榜,發展到2020年包括中日韓醫院、東盟醫院、粵港澳大灣區醫院、頂級醫院100強、省單醫院、地級城市醫院、縣級醫院、中醫院、腫瘤醫院、婦產醫院、兒童醫院等的“四橫八縱兩國際”排名榜單。中國醫院競爭力評價方式以專家咨詢法與探索性因子分析法相結合方式確定指標權重,用加權TOPSIS分析法定量評分,從醫療技術、資源配置、醫院運營、誠信服務和學術科研5大維度進行評估[16]。
由中國醫學科學院于2014年發布,評價結果于2014—2021年連續8年發布。起初名為“中國醫院科技影響力”,2018年變更為“中國醫院科技量值(Science and Technology Evaluation Metrics,STEM)”,它圍繞科技活動全過程,覆蓋創新活動全鏈條的綜合測算值,是國家衡量醫學科技進步的標尺,是機構衡量自身科技發展水平的量尺,代表機構科技綜合實力水平,是機構科技創新和可持續發展能力的體現[17]。中國醫院科技量值評價指標包含科技產出、學術影響、科技條件3個方面,評價體系完全基于客觀數據,采用統計數據源,創建基礎數據庫,并對數據采集、處理和分析整個流程進行標準化管理,建立數據加工處理系統,執行嚴格的數據核查機制。2020年對我國1 600余家三級醫院開展研究,分為綜合科技量值和學科科技量值兩部分,涵蓋麻醉學、心血管病學、消化病學、呼吸病學等共31個臨床醫學二級學科及部分三級學科,進一步確保評價的準確性和科學性[18]。
2015年,國家醫療數據中心在北京大學醫學部掛牌,負責全國醫療機構數據收集、整理和分析工作。借此大數據與定性評價相結合,評估發布中國最佳臨床學科評估排行榜。基于病案首頁,充分利用大數據平臺,數據來源相對透明可靠、公平客觀[19]。在大數據統計分析基礎上評判衡量醫院臨床醫療的水平和服務能力,側重定量評價,其中醫療服務的病案數據占比70%,同行評議的專科聲譽數占比30%[20-21]。評價內容為學科臨床水平,評價指標包括醫療質量、臨床能力、醫療績效、學科聲譽。2015年首次參評臨床學科包括婦產、耳鼻喉等6個一級學科以及包括呼吸內科、內分泌內科等13個二級學科,共計19個[22],排名只展示各學科前15名醫院。此榜單僅2015年發布了一次,無連續性可言,但是至今仍可參考,有借鑒意義。
由四川大學中國公立醫院社會貢獻度研究所在2012年首次公布。為促進中國公立綜合醫院在面向社會服務水平、科研能力、人才培養等方面發揮醫療衛生行業國家隊的主體作用,其每年發布中國公立綜合醫院社會貢獻度前50位的排行榜。此排行榜數據來源為政府相關機構和各綜合性醫院公布的相關數據,有關學術刊物數據庫等,并確立了客觀反映綜合性醫院社會貢獻度的2個一級指標體系(醫療水平和社會服務能力,學術貢獻與醫學人才培養),11個二級核心指標進行評估。本榜單充分考慮了醫院社會服務能力,為患者等就診提供參考[23]。但是該榜單2017年后不再發布。
選取連續發布的且已經在社會上產生一定影響力的面向全國綜合醫院排名的中國醫院科技量值、中國醫院排行榜、中國醫院競爭力·頂級醫院100強3個排行榜單,以2021年發布的2020年評價數據為基礎,發現同時進入3個排行榜單的共有57家醫院。同時進入兩個榜單及以上的有89家醫院。
3個排行榜單重合數見表1。從以上對比中可以看出,中國醫院排行榜和中國醫院科技量值數據重合度最高,76家醫院重合。中國醫院排行榜與中國醫院競爭力·頂級醫院100強重合度最低,61家醫院重合。

表1 3個排行榜單前100名醫院的重合數
通過SPSS 26.0統計學軟件對中國醫院科技量值、中國醫院排行榜與中國醫院競爭力·頂級醫院100強2021年數據和2020年數據進行相關分析見表2;再對數據的差異性進行檢測,見表3。結果顯示,中國醫院科技量值、中國醫院排行榜與中國醫院競爭力·頂級醫院100強3個排行榜單2021年排名數據和2020年排名數據具有相關性且沒有差異性,說明3個排行榜單近兩年各自評價指標、評價體系、評價方法等方面并未發生顛覆性變革。

表2 3個排行榜2021數據與2020數據相關性檢測

表3 3個排行榜2021數據與2020數據差異性檢測
以2021年中國醫院科技量值排行榜單中的醫院為基準,將醫院在中國醫院排行榜和中國醫院競爭力·頂級醫院100強做對比,發現三大排行榜單波動幅度較大,同一醫院在不同排行榜單中具有較大排名差異。見圖1。

圖1 2021年中國醫院科技量值、中國醫院排行榜、中國醫院競爭力·頂級醫院100強排名對比
對2021年發布的中國醫院科技量值、中國醫院排行榜及中國醫院競爭力·頂級醫院100強三大榜單排名進行斯皮爾曼相關性分析及差異性分析(威爾科克森檢驗),結果見表4和表5,發現三大排行榜單排行趨勢具有一致性,中國醫院科技量值排行榜與中國醫院排行榜差異性不顯著,兩者榜單與中國醫院競爭力·頂級醫院100強榜單有較大差異性。

表4 3個排行榜相關性分析

表5 3個排行榜漸進顯著性性雙尾值
中國醫院科技量值排行榜單和中國醫院排行榜單重合數最多,且排名沒有顯著差異,兩大榜單與中國醫院競爭力·頂級醫院100強榜單有顯著性差異。這不僅是由于指標體系的不同,更在于評價方法的差異。中國醫院科技量值注重科研產出及客觀評價,強調“第一手”指標,在構建的三維評價體系中,科研產出涵蓋論文相關、專利、標準等方面;學術影響涵蓋科技獎勵、學術任職等方面;科技條件涵蓋科研項目、科研平臺等方面,以科研產出為量化指標,其在科研產出和科研影響力上有一定的權威性。復旦大學排行榜綜合考慮了專科聲譽和學術貢獻,以學科建設的能力和學術影響力為主要指導方向,這兩個排行榜均圍繞“科研”,雖權重不同。中國醫院競爭力·頂級醫院100強榜單主要綜合考慮醫療技術、資源配置、醫院運營、誠信服務學術科研5大方面,但學術科研方面“第一手指標”占比較小,總體更偏重于臨床投入-產出方面指標。
中國醫院排行榜單側重定性評價,該排行榜的突出特點是借鑒美國醫院排行榜“唯聲譽排名”的方法[1],基于同領域專家對醫院最佳專科聲譽進行評價。在此基礎上,再結合科研學術水平進行最佳醫院(綜合)排名,排行公布后業內普遍反映排名結果與心目中的設想比較一致。該榜單還實行七大區域性分區排名機制,可有效反應片區內醫院質量,讓更多的醫院出現在榜單上,為區域性患者就診起到指導作用。而局限性在于大量依據主觀判斷,客觀性較差,同行專家信息掌握若有滯后性則會出現評價不公正的情況,且主觀評價并未充分吸取普通醫生和患者的評價;另外限于數據的可及性和真實性,排行榜缺乏醫療質量和醫療安全的客觀指標,沒有考慮服務和產出的效率問題。
中國醫院競爭力·頂級醫院100強榜單側重結構、過程、結果評價,評價內容包括醫院結構質量、過程質量、運營規模、醫療技術和經濟運行等。開展多層次評價,包含國內外、地級、縣級、民營等醫院的評價,能全方位綜合的比較醫院之間的差距。但對包括醫療安全、醫療費用可負擔性等在內的醫療結果質量關注較少;但在構建指標體系中也有不科學之處,比如采用醫院運行以外的指標“常住人口”和“人均GDP”這兩個指標,不能客觀、公正地評價醫院運行;排行榜由商業機構主導,與商業價值或多或少關聯在一起,客觀性值得商榷,此外沒有充分體現“以患者為中心”的評價理念。
中國醫院科技量值榜單優勢在于突出客觀定量評價,數據依托中國醫學科學院醫學信息研究所,來源透明,公正客觀。此評價方法側重科研能力,在醫院內強調學術科研成果,可以激勵國內醫學科研能力的提高和更多大師級醫學專家的誕生。但此評價方式也有一定局限性,如缺少臨床上的醫療服務質量、醫療安全等指標,另外沒有醫療服務投入及產出的效率指標,沒有體現“以患者為中心”等。
醫院排行榜對促進醫院學科建設、提升醫院服務水平、促進分級就診、為患者提供就診引導等方面發揮重要作用。全國醫院排行榜百花齊放,由于評價體系、評價方法、評價維度等差異,各排行榜結果及意義也不盡相同,各有優勢不足。應鼓勵允許各類排行榜共存,鼓勵用不同評價手段體現各醫院學科建設、學術水平和臨床能力及患者服務水平等方面內容,也需要建立需求導向性信息披露制度[24],加強對獨立的、專業的醫療服務質量第三方評價機構的創建培育[25]。
三大榜單2021年排名和2020年排名沒有顯著差異性,說明近2年三大排行榜指標選取、評價手段、評價維度等方式未發生明顯變革,具有很好的一致性。但隨著國家政策不斷調整,科技評價指標、體系等也應有相應的調整變革。今后,中國醫院科技量值排行榜應在側重定量評價分析基礎上,將會不斷完善評價模型和賦權方法的研究,努力糾正評價中產生的主觀性問題,努力做到科學公平公正,并逐步完善評價指標體系,多層次、多類別、分區域的排行榜,推動地區醫療臨床能力和學科學術水平建設,更為患者在區域內就診選擇起到指導作用。復旦排行榜和艾力彼排行榜應該避免過度主觀評價或優化主觀評價方式。均應不斷完善現有評價體系,探索機制,真正發揮“科技評價”指揮棒作用,使評價更加客觀公正,為患者提供服務、為醫院了解醫學科研能力、學科發展水平及競爭態勢、引進優秀人才提供信息支撐。