何亞楠 王 霞 伍曉玲 孫麗君 尚 磊 徐勇勇△
疾病負擔統計的數據模型與統計元數據*
何亞楠1王 霞1伍曉玲2孫麗君1尚 磊1徐勇勇1△
目的 建立我國統一的疾病負擔統計的數據模型、統計元數據框架和統計元數據的描述內容。方法 依據我國現行的死因統計、疾病統計的工作規范和數據集、數據元標準,參照世界衛生組織疾病負擔統計的死因及疾病(傷害)的統計分類標準,用統一建模語言(UML)的類圖表達數據模型和元數據框架。結果 (1)建立了包括微觀數據和宏觀數據的疾病負擔統計的數據模型;(2)建立了包括9類28個元數據項的統計元數據框架;(3)創建了一個疾病負擔統計指標的統計元數據實例。結論 建立疾病負擔統計指標的數據模型和元數據框架能夠為指標相關的數據收集、表示、交換及整合提供所需的信息技術規范,有利于指標的跨域比較和信息共享。
健康指標 疾病負擔 統計元數據 元數據框架
疾病負擔(burden of disease)也稱疾病負荷、病殘負荷,是用患病率、就診率、住院率、因病離職時間、治療費用、死亡率和其他一些專門的衛生統計指標綜合反映疾病(傷殘)導致的失能(disability)和過早死亡(premature death)對一個國家(地區)所造成的社會負擔[1]。1990-2010年,世界衛生組織(WHO)發布了289類疾病(傷害)的傷殘調整壽命年(disability-adjusted life years,DALY)、減壽年(years of life lost,YLL)和帶病(失能)生存年(years lived with disability,YLD)[2]。2012年,中 國 每 年 損 失 的 DALY 為36551.8萬年,其中減壽 24290.2萬年,帶病生存12261.6萬年,即每人平均減壽0.175年(64天),帶病存活0.059年(21天)。由于我國尚未建立覆蓋全人口的死因登記系統,WHO采用我國145個死因監測點的死因數據(覆蓋一千一百萬人口,每年約5萬人的死因分類)推論全國[3],缺乏地區代表性。為了獲得我國不同地區(省(市)、自治區)疾病負擔數據,我國擬建立具有省級代表性、覆蓋各省20%人口的605個死因監測點[4]。因此,無論是疾病負擔統計所需的人口死亡數據還是患病數據,都需要一個統一的數據模型、統計元數據框架和統計元數據的描述內容。
1.死亡的個案數據,如死者標識(姓名、證件號)、性別、出生日期、死亡日期、死因的ICD編碼等,以現行死因登記報告規范、《居民死亡醫學(推斷)書》和WS數據集標準為依據[5-8]。
2.患病(傷害)的個案數據,如患者標識(姓名、證件號)、性別、出生日期、就診日期、診斷日期、診斷名稱、ICD編碼等,以現行門診摘要、住院摘要、傳染病報告、傷害監測報告、職業病報告等WS數據集標準為依據[6-9]。
3.GBD的死因及疾病(傷害)的統計分類、傷殘調整權重(效用值)及疾病死亡模式采用WHO推薦的標準 [10-12]。
4.數據模型和元數據框架用統一建模語言(UML)的類圖表達。
1.數據模型
GBD的主要統計指標(宏觀數據,macro data),包括期望壽命及按照病種分類的死亡率、患病率、YLL、YLD、DALY等。匯總數據包括人口數據及按照病種分類的死亡人數、患病人數、平均健康損失(通過效用值、平均患病時間及測量工具計算),數據模型的類圖見圖1。圖1中的死亡個案登記、患病(傷害)個案登記為微觀數據(micro data),數據采集遵循WS發布的數據元和分類代碼標準。

圖1 疾病負擔統計的數據模型
2.統計元數據框架
用于描述圖1中的各個統計指標。統計元數據框架包括9類29個元數據。9個類分別是概念、總體代表性、分組模式、微觀數據集、宏觀數據(變量)、維度、數據質量、數據發布與擴散、其他,見圖2。
3.元數據內容
圖2中29個元數據定義見表1。
4.實例
圖1中疾病負擔統計的所有統計指標(包括匯總數據),都需要按照表1的29個元數據一一描述。表2是統計指標YLD元數據描述的實例。

圖2 疾病負擔統計元數據框架

表1 疾病負擔統計元數據定義

表2 統計元數據實例(YLD)

序號 元數據名稱 元數據描述15 估計方法 采用人口普查數據、疾病(傷害)監測數據、國家衛生服務調查等歷史數據或抽樣調查數據,建立統計模型估計人口數、死亡人數、患病人數及當年新發病例人數。16 匯總方法 建制縣(市)按月匯總17 計量單位 年18 WHO GBD維度 WHO GBD的大類與細類19 WHO監測與評估框架維度 衛生投入與產出的效果評價20 死亡漏報率 實測數據評估結果21 患病漏報率 實測數據評估結果22 死因垃圾編碼比率 實測數據評估結果23 診斷垃圾編碼比率 實測數據評估結果24 數據發布機構 國家、省(市)、縣(區)衛生與計劃生育委員會部門25 數據發布頻率 年26 局限性 依賴人口數據、死亡數據、患病數據的準確性和完整性。尤其是各病種的患病人數的登記與報告。27 相關鏈接 http://www.who.int/healthinfo/global_burden_disease/gbd/en/28 備注 按病種分類的指標集29聯系人 中國衛生信息學會衛生信息標準專業委員會
疾病負擔統計的復雜性源于數據收集、匯總的復雜性,如死因登記僅20%~30%發生在醫院,患病記錄則散落在各個醫療機構。信息技術(如區域衛生信息平臺)雖然可以連接所有醫療衛生機構,但不能保證匯總數據的質量,即使像英國這樣有悠久歷史的覆蓋全人口的生命統計國家,死因分類還有6%~8%的垃圾編碼[10]。因此,通過數據模型和統計元數據開發,可以理清疾病負擔統計 “統計目的-統計設計-工具開發-數據收集-數據處理-數據分析-結果發布-效果評估”8個階段,從微觀數據(如死亡醫學證明書)到宏觀數據(如死亡人數、死亡率、DALY)應遵循數據的工作規范、業務標準和數據標準,并將所有統計指標的元數據以知識庫的方式發布在區域衛生信息平臺,促進我國疾病負擔統計及相關健康測量指標的研究與應用。
[1]尚磊主編.衛生管理統計學.統計出版社,2014,14-18.
[2]Vos T,Flaxman AD,Naghavi M,et al.Years lived with disability(YLDs)for 1160 sequelae of 289 diseases and injuries,1990-2010:a systematic analysis for the Global Burden of Disease Study 2010.The Lancet,2012,380:2163-2196.
[3]WHO.DALY estimates,2000-2012.Available at http://www.who.int/healthinfo/global_burden_disease/estimates/en/index2.html.
[4]國家衛生計生委.衛生計生統計信息工作2013年度“十件大事”2014-03-18.Available at http://www.nhfpc.gov.cn/mohwsbwstjxxzx/s8555/201403/a6c13325493 049f4ad780b12d1c94092.shtml.
[5]國家衛生計生委,公安部,民政部.關于進一步規范人口死亡醫學證明和信息登記管理工作的通知(國衛規劃發〔2013〕57號,2013-12-31).Available at http://www.moh.gov.cn/guihuaxxs/s10741/201401/aadf7c912ca14ccaa28db315487d49a9.shtml.
[6]WS 375-2012疾病控制基本數據集.北京:中國標準出版社,2012.
[7]WS 376-2013兒童保健基本數據集.北京:中國標準出版社,2013.
[8]WS 377-2013婦女保健基本數據集.北京:中國標準出版社,2013.
[9]WS 373-2012醫療服務基本數據集.北京:中國標準出版社,2012.
[10]WHO.WHO Methods and Data Sources for Country Level Causes of Death 2000-2012.WHO/HIS/HSI/GHE/2013.4.Available at http://www.who.int/healthinfo/global_burden_disease/GlobalCOD_method.pdf.
[11]Global Burden of Disease 2004 Update:Disability Weights for Disease and Conditions.Available at http://www.who.int/healthinfo/global_burden_disease/GBD2004_DisabilityWeights.pdf.
[12]Murray CJL,Ezzati M,Flaxman AD,et al.2012a.GBD 2010:design,definitions,and metrics.The Lancet,2012,380:2063-2066.
[13]王霞,劉丹紅,徐勇勇,等.衛生統計調查元數據概念模型的建立.中國衛生統計,2008,(4):338-342.
Data Model and Statistical Metadata in the Statistical Measurement on the Burden of Disease
He Yanan,Wang Xia,Wu Xiaoling,et al.
(Department of Health Statistics,Faculty of Preventive Medicine,Fourth Military Medical University(710032),Xi′an)
Objective To establish a unified statistical data model in the statistical business process on the estimate of burden of disease,a statistical metadata framework and statistical metadata descriptive content.Methods Based on the present China's specifications of cause of death registration,disease report,data set standards,data element standards,WHO cause of death and disease statistical classification standard in burden of disease(injury),unified modeling language(UML)diagrams were used to express data model and metadata framework.Results (1)the established data model includes micro data and macro data related to the statistical estimates of burden of disease,(2)the statistical metadata framework includes 9 kinds of 28 metadata items,(3)a statistical metadata instance was created.Conclusion The building of the data model and metadata framework of the disease burden statistical indicator can provide the information needed to technical specifications for indicators related to data collection,representation,exchange and integration,which is helpful for index of cross-domain comparison and information sharing.
Health indicators;Burden of disease;Statistical metadata;Metadata framework
陜西省科學技術研究發展計劃項目(社發攻關2013K12-19-02);國家衛生計生委統計信息中心課題(中外衛生統計指標體系比較研究)
1.第四軍醫大學軍事預防醫學系衛生統計學教研室(710032)
2.國家衛生計生委統計信息中心
△通信作者:徐勇勇,E-mail:xuyongy@fmmu.edu.cn
劉 壯)