廣東工業大學CIMS中心 陳俊玲 陳冠全 陳文戈
廣東省藥品不良反應監測中心 張業象 鄧劍雄
藥品能治病但也可能有有害的反應,我們常常把這類有害的反應叫藥品不良反應(Adverse Drug Reaction,ADR)。國際上給藥品不良反應下的定義為:藥品不良反應是指藥品在預防、診斷、治病或調節生理功能的正常用法用量下,出現的有害的和意料之外的反應。它不包括無意或故意超劑量用藥引起的反應以及用藥不當引起的反應。隨著醫藥衛生科技的不斷進步,制藥與醫療器械工業也得到迅猛發展,大量化學藥品及高新技術產品不斷涌現,使人們在疾病的預防、治療、診斷及康復方面受益很大。但同時,藥品的廣泛、大量使用,所引起的藥品安全事件數目也呈急劇上升趨勢,藥品安全性日益受到國內外藥物研究領域的重視,藥品不良反應(ADR)已成為全世界共同關注的話題。
ADR數據挖掘研究是從自發呈報ADR報告的系統數據中,運用數據挖掘技術,及時、快速、準確地挖掘藥品ADR發生規則和信號,以應用于實際ADR監測工作,從而最大限度的減少藥品對人類的危害。本文通過收集廣東省內上報到廣東省藥品不良反應網絡管理平臺的ADR報告,利用數據挖掘技術,對日益增長的ADR數據進行分析,最終得到ADR與患者性別、年齡、藥品屬性之間的相關性,為研究ADR的發生規律提供參考。
數據挖掘[1](Data Mining,簡稱:DM),是數據庫知識發現中的最重要一個環節和步驟,一般是指從大量的數據中自動搜索隱藏于其中的有著特殊關系性的信息的過程。
數據挖掘通常和數據倉庫協同工作。一方面,可以迎合和簡化數據挖掘過程中的重要步驟,提高數據挖掘的效率和能力,確保數據挖掘中數據來源的廣泛性和完整性;另一方面,數據挖掘技術已經成為數據倉庫應用中極為重要和相對獨立的方面和工具。
數據挖掘在ADR中已經廣泛應用。國際上常用的ADR數據挖掘方法有報告比例比法(PRR)、報告比值比法(ROR)、綜合標準法(MHRA)、貝葉斯判別可信區間遞進神經網絡法(BCPNN)和相對比值法(RR)。目前,這些算法在世界上廣泛應用,并在ADR信號檢測方面取得了明顯的成效。WHO設在瑞典烏普薩拉的國際藥物監測合作中心(UMC)采用的就是BCPNN,美國食品藥品監督管理局(FDA)則采用MGPS進行數據挖掘分析[2]。
數據挖掘技術在我國ADR監測方面的應用也日趨廣泛。廣東省ADR中心使用數據挖掘技術實現了ADR信號的檢測與發現[3-5],并使用BCPNN算法實現了ADR信號的檢測與自動預警[6]。吳嘉瑞等使用決策樹算法挖掘雙黃連注射劑ADR發生類型與患者年齡、藥品劑型之間的相關性[7]。王越等收集中藥注射劑ADR報告,使用PRR法檢測ADR信號[8],為中藥注射劑ADR信號檢出以及建立中藥注射劑ADR預警機制提供了依據。
數據挖掘技術在國內其他行業的發展也如火如荼,尤其在保險、金融、電信、零售等行業,具有很多經典的案例,也取得了很好的效果,這為數據挖掘技術在醫藥行業的發展提供了借鑒,具有重要的現實意義。
本文研究的數據,來源于廣東省ADR中心的藥品不良反應網絡管理平臺從2002年至2011年收集到的共12210份頭孢曲松鈉ADR報告。經過數據整理后,剔除信息不全、記錄不規范的報告和無法進行有效分析的報告共1081份,對信息較完整的10129份ADR報告進行關聯規則數據挖掘分析,以期發現頭孢曲松鈉ADR的發生與患者年齡、性別、藥品劑型及給藥途徑等屬性之間的相關性。
本文使用SQL Server 2008 建立藥品不良反應數據倉庫;使用SPSS Modeler軟件對數據進行建模和統計分析,并基于Apriori算法對數據進行挖掘分析。對ADR數據倉庫中的以下字段:ADR名稱,性別,年齡段,系統損害,劑型,給藥途徑,ADR結果等信息進行分析。
按照軟件對數據的要求,對已經獲得的數據進行數據清理及屬性篩選。數據預處理的方法如下:
數據篩選。剔除記錄不詳或者不完全的數據。
規范ADR術語。由于多采集的數據書寫不規范,將不規范的ADR術語進行標準化處理,如藥品不良反應名稱中出現“*”、“**”、“/”等,在分析時軟件無法識別這些字符。針對這種情況,將不規范的字段和規范的ADR術語進行匹配,以去除無意義字符。
統一ADR命名。使用ADR術語統一命名,如“寒戰”和“寒顫”,統一命名為“寒戰”;“*頭昏”和“*眩暈”,統一命名為“頭暈”。
使用離散的屬性代替原始的連續性數據,如年齡,對年齡進行分段。得到數據較完整的不良反應報告共10129份。
本文研究的數據屬性及其數據如下:
年齡段:1天-1歲,1歲-3歲,4歲-6歲,7歲-14歲,15歲-18歲,19歲-29歲,30歲-39歲,40歲-49歲,50歲-59歲,60歲-69歲,70歲-79歲,>79歲;

圖1 SPSS Modeler軟件工具流

圖2 不同ADR與年齡段支持度/置信度分析
性別:男,女;
ADR影響系統:全身性損害,神經系統,消化系統,循環系統,皮膚及其附件損害等;
不良反應結果:治愈,好轉,有后遺癥,死亡;
不良反應名稱:皮疹,瘙癢,寒戰,潮紅,斑丘疹,惡心,嘔吐,過敏樣反應等。
圖1為SPSS Modeler 軟件的工作流,每一個節點實現一定的數據處理功能,箭頭指定數據的方向,第一個節點從數據庫讀取數據,流中的數據審核節點,用來將所有的字段包含在報告中,制表節點用來輸出表格查看數據。類型節點指定數據類型(集,有序集合,標志等),選擇節點選擇藥品,這里選擇的藥品為通用名是頭孢曲松鈉的藥品,過濾節點選擇要進行關聯挖掘分析的字段,Apriori算法關聯分析節點實現關聯分析,將制表節點添加到流,并連接Apriori算法的挖掘結果,方便數據挖掘結果查看。
設置年齡對A D R的支持度≧5.75,置信度≧8.25。

圖3 不同ADR與患者年齡、性別的支持度/置信度分析

圖4 不同ADR影響系統與患者年齡、性別的支持度/置信度分析
結果顯示如圖2所示,頭孢曲松鈉ADR患者的年齡段差異較大,19歲-29歲的患者支持度最高,不良反應為皮疹、瘙癢;1歲-3歲的患者置信度顯著高于其他年齡段患者,不良反應為皮疹。這些數據表明,19歲-29歲的患者中使用頭孢曲松鈉引起皮疹、瘙癢不良反應的較多。
設置關聯規則的支持度≧2.75,置信度≧3.15。
如圖3所示可見,性別為男的患者發生皮疹的不良反應的支持度、置信度明顯高于其他的不良反應,患者為男性且發生ADR為皮疹的患者占47.25%,置信度為29.148%;19歲-29歲的女性發生ADR為皮疹的患者置信度為26.761%,女性發生皮疹的支持度為52.75%,置信度為26.259%,樣本中分析表明,19歲-29歲的女性很可能發生皮疹的不良反應較多。
設置關聯分析的支持度≧10.75,置信度≧6.25。
如圖4所示中數據可見,發生皮膚及其附件損害ADR的女性占為52.75%,置信度為70.372%,男性占47.25%,置信度為69.87%;其中19歲-29歲女性患者置信度顯著高于其他ADR,說明19歲-29歲的女性患者較易發生皮膚及其附件損害的ADR。
由圖5中數據可見,頭孢曲松鈉的ADR結果中治愈例數共7209例,占71.17%;好轉例數共2898例,占28.61%,有后遺癥及死亡患者較少。
將頭孢曲松鈉ADR分別與患者的年齡段、性別、影響系統進行關聯分析后,得出以下結論:(1)頭孢曲松鈉ADR主要表現為皮疹、瘙癢等,主要影響系統為皮膚及其附件損害和全身性損害。其中,主要表現為皮疹、瘙癢。(2)頭孢曲松鈉的使用中,19歲-29歲的女性很可能發生皮疹不良反應。
隨著藥品的大量使用,研究ADR與其他因素的相關性尤為重要。本文考慮性別、年齡、影響系統等因素對ADR的影響,以便在用藥時盡量避免ADR的發生。對樣本的研究表明,它們之間具有較為顯著的關系,為進一步分析ADR的發生規律,提供了借鑒。由于藥品自身的特點及患者個體的差異,本文研究受多方面因素的影響,還有待進一步的驗證。

圖5 ADR結果統計分析
[1]Jiawei Han and MichelineKanber. Data Mining Concepts and Techniques[J]. Morgan Kaufmann Publishers,Inc,2001:153-156.
[2]畢玉俠,吳春福,楊靜玉.美國食品與藥物管理局藥品不良反應信號的定量評價方法概述及啟示[J].中國藥房,2010,21(18):1640-1642.
[3]李嬋娟.藥品不良反應信號檢測方法理論及應用研究[D].第四軍醫大學博士論文,2008.
[4]Chen Wenge,DengJianxiong. A Study on Signal Detection and Automatic Warning Algorithm for Adverse Drug Reaction[J].International Conference on Computer Science and Software Engineering. 2008:202-205.
[5]Chanjuan Li,Jielai Xia,Jianxiong Deng,Jing Jang. A Comparison of Measures of Disproportionality for Signal Detection on Adverse Drug Reaction Spotaneous Reporting Databases of Guangdong Province in China[J].Pharmacoepidemiology and Drug Safety,2008.
[6]陳文戈,李嬋娟,江靜,鄧劍雄.基于BCPNN法的藥品不良反應信號檢測與自動預警技術研究[J].計算機應用研究,2009,26(4):1394-1397.
[7]吳嘉瑞,張冰.雙黃連注射劑不良反應文獻的數據挖掘研究[J].藥物警戒,2008,5(3):139-143.
[8]王越,吳抒藝,徐厚明,余伯陽,肖詩鷹.中藥注射劑不良反應報告和信號監測分析[J].中國藥物警戒,2007,4(6):335-347.