邢荔函,潘宇寧,賈 倩,牛 越,許明璐,景匯泉
(1.首都醫科大學公共衛生學院,北京 100069;2.沈陽醫學院,遼寧 沈陽 110034)
流行病學調查主要是研究疾病和健康狀態在人群中的分布及其影響因素,目的在于確定高危人群,評價預防、控制和消滅疾病及促進健康的策略和措施效果的調查[1,2]。對于流行病學調查而言,保證數據真實性是重中之重[3,4]。目前,國內外關于流行病學調查項目質量管理的相關研究中,學者們主要側重于立項選擇問題和項目完成后的績效評估管理,關于項目執行的過程與質量控制研究相對較少。在本研究中,“外部質量控制”是相對于“內部質量控制”而言的,指引入第三方質量控制團隊對流行病學調查全過程進行監督和評價。根據質量管理學科中“全面質量管理”的思想[5],本研究設計的指標體系細化至流行病學調查的每個步驟,使流行病學調查的外部質量控制可量化,更好地明確責任,發現數據收集過程中問題,及時整改,從而提高流行病學調查數據的真實性與可靠性,保證調查質量。
本研究基于國家衛生計生委2016年國家公益性行業科研專項項目“常見消化系統疾病流行病學調查”。該調查采用分層多階段隨機抽樣方法,抽取涵蓋全國不同地域及不同級別城市/農村的18~64歲常住人口共約2.76萬例作為研究對象,開展社區為基礎的常見消化系統疾病及幽門螺桿菌感染的分布頻率及危險因素調查。該研究將為制定我國消化系統疾病防治策略和專家共識提供科學依據。本研究是站在第三方質量控制的角度,研究對象為流行病學調查全過程。
本研究通過Delphi專家咨詢,經過兩輪征詢及反饋,篩選出專家公認重要的各級指標。一級指標包括現場質控、錄音質控、實驗室質控、對資料核查、回訪、數據等環節的控制評價。根據這些指標建立質量控制體系,并得出各個指標的權重系數。
在第二輪函詢中,利用層次分析法來確定指標權重。本研究采用Saaty標度[6]對重要性程度復賦值。與B指標對比,A指標得分極端重要=9、強烈重要=7、明顯重要=5、稍微重要=3、同等重要=1、稍微不重要=1/3、明顯不重要=1/5、強烈不重要=1/7、極端不重要=1/9。層次分析法在同級指標間兩兩對比重要性,按照綜合重要程度分配權重[7]。
此次研究共邀請20位專家參與調查,其中學位為碩士的占比15%,博士的占比85%;正高級的占比20%,副高級的占比65%,中級的占比15%;從事相關專業工作年限為10年以下的占比10%,10~20年的占比60%,20年以上的占比30%。問卷回收率為100%。
專家權威程度(Cr)由專家熟悉程度(Cs)和專家判斷系數(Ca)兩個因素決定,且Cr=(Ca+Cs)/2[8]。此次研究專家判斷系數(Ca)為0.93,專家熟悉程度(Cs)為0.71,即專家權威系數為0.82。一般認為,專家權威程度Cr≥0.70為可接受[9],說明此次研究所選專家的權威程度較高,結果比較可靠。
專家協調系數(W)是用來衡量專家對指標重要性評價的分歧大小的系數,可以反映專家意見的一致性[10]。通過KendallW協調性檢驗可以進一步評價函詢結果的一致性。第一輪函詢結果中一級指標W=0.199、P<0.05,二級指標W=0.200、P<0.05,三級指標W=0.205、P<0.05,說明專家對指標重要性的觀點不存在分歧,專家意見協調性較好。
2.4.1 第一輪專家咨詢結果
在第一輪函詢問卷中,對指標的重要程度分5個重要等級,打分從5到1重要性依次減弱。在專家對各指標的評分中,“3.3 錄音核查軟件”“3.1.2 無關內容太多的錄音比例”“3.2.1 過于嘈雜的錄音比例”3個指標的重要性評分小于4.00,但沒有出現變異系數過高的指標。針對這3項錄音相關指標,進行了重新討論。錄音核查軟件作為一個平臺,雖然對錄音核查過程有影響,但對錄音結果正確性沒有影響,因此將“3.3 錄音核查軟件”刪除;同時錄音無關內容太多也只是延長了核查時間,對結果正確性無影響,因此“3.1.2 無關內容太多的錄音比例”也刪除。然而,在實際操作中,過于嘈雜的錄音會影響核查員的判斷,對結果產生偏差,因此“3.2.1 過于嘈雜的錄音比例”予以保留。
2.4.2 第二輪專家咨詢結果
在第二輪函詢問卷中,主要涉及到的內容是同級指標間的兩兩重要性比較。如表1所示,以一級指標為例展示權重系數計算過程,二級、三級指標的計算方式同理。

表1 第二輪問卷一級指標判斷矩陣
根據該矩陣可得7個一級指標的初始權重系數、歸一化權重系數及其特征向量,結果如表2。

表2 第二輪問卷一級指標層次分析結果
對判斷矩陣進行一致性檢驗,是為了確保判斷矩陣的一致性可以接受,在數學上體現為一致性比率CR≤0.1。一致性比率CR=CI/RI。對一級指標的判斷矩陣進行一致性檢驗,CI=0.03,RI=1.32,CR=0.02,一級指標通過一致性檢驗。在本研究中,所有二級指標和部分三級指標的矩陣階數小于2,總是具有一致性,對三階及以上的三級指標進行一致性檢驗,結果全部通過。
對層次分析法所得結果做進一步處理,可得修改后各級指標的權重分布,令權重總和為100,結果如表3。

表3 流行病學調查外部質量控制評價指標體系及權重

續表3
本研究建立的指標體系包含7個一級指標、14個二級指標和38個三級指標。下級指標是將外部質量控制的評價工作具體化,做到量化比較。其中,三級指標主要分為兩類:一類是判斷指標,用以判斷調查過程中某一步驟是否符合標準。例如“1.1.1 有無問卷設計缺陷”,這類指標在記錄時分為“有”或“無”兩類回答。另一類是數值指標,記錄的是通過質控過程得到的數據進行計算的數值,如“5.1.3 樣本置換率”,填寫這個指標前應先統計置換人數,然后記錄置換人數與受訪人數的比值。
在完成一項流行病學調查的外部質量控制時,首先需要按要求填寫所有三級指標的項目,其次統計該調查在每個三級指標上的得分情況。所有三級指標的滿分和是100。不同的流行病學調查在這樣一套統一的評價指標體系的度量下,也具有了相互之間的可比較性。運用該體系進行評價,得分較高的調查項目,可以認為項目舉辦方進行了合理的質量控制,使得結論數據有更高的科學性。
通過本次研究可以發現,流行病學調查涉及步驟多,需要關注許多細節問題。因此,只有擁有嚴格公正的質控監督團隊,才能有效發揮該指標體系的作用。此次建立的指標體系通過“2016年常見消化系統疾病流行病學調查”進行了實證研究,驗證了指標體系的可行性。通過此次指標體系的構建,研究發現流行病學調研質控最重要的環節是現場調查采樣,其次是實驗室樣本化驗分析和數據錄入處理,這與一般的印象相符合。而且這三部分內容的質量控制工作更為具體,提高其工作質量的措施具有可行性。另一方面,在資料核查的過程中,人員基本信息的核查也較為重要。以往文獻和此次研究專家認為失訪、置換等情況的發生,對流行病學調查的結論會產生較大影響[12]。這是因為流行病學調查一般會以嚴格的標準選取樣本,樣本選取的合理性,是整個調查具有合理性的先決條件,這就要求流行病學調查的組織者需要在選取樣本的同時,更要嚴格核查身份信息,盡量防止失訪、置換的發生,如不可避免,則應如實記錄。現有的評價指標體系中可能還存在描述不清或內涵交叉的現象,仍需進一步研究。
通過外部質量控制的方式,研究者可以站在更加客觀的角度評價調查過程和調查結果[11],在發現質量問題時進行實時動態監控,及時糾正,最終提高流行病學調查質量。另外,相對于內部控制而言,外部控制是由第三方團隊進行的,與調查團隊利益相關小,調查過程更加客觀公正,外部控制的結論也更有說服力。
本研究建立了評價流行病學調查外部質量控制的指標體系,這使得流行病學調查的質量控制工作有了可以依照的準則,突出工作重點,把握工作細節,并能更好地評價質控工作。在實際運用中,可以使流行病學調查質量控制工作更加規范,使調查所獲取的數據具有更高的科學性和可靠性。