999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種可簡化臨床試驗數據分析的SAS數據結構轉換方法*

2016-06-24 02:48:28東南大學公共衛生學院流行病與衛生統計學系210009承曉華王詩遠
中國衛生統計 2016年2期
關鍵詞:程序

東南大學公共衛生學院流行病與衛生統計學系(210009) 承曉華 王詩遠 劉 沛

?

一種可簡化臨床試驗數據分析的SAS數據結構轉換方法*

東南大學公共衛生學院流行病與衛生統計學系(210009) 承曉華 王詩遠 劉 沛△

數據管理標準臨床數據交換標準協會(the clinical data interchange standards consortium,CDISC)建立了一系列標準來規范藥物臨床試驗中的數據結構和分庫方式以支持數據采集、交換、遞交和儲存臨床試驗數據[1]。數據結構的標準化是臨床試驗數據管理的規范化和自動化的前提,在CDISC標準的支持下根據臨床試驗數據采集特點進行規范化的數據管理為大勢所趨。現今臨床試驗原始數據收集過程中,為方便病例報告表(case report form,CRF)的錄入常常將同一受試者的各種觀察結果,如基本信息、各階段訪視信息、實驗室檢查數據、不良反應和合并用藥等列于同一行中,得到同一條記錄內具有多個觀察指標(變量)的數據結構。這種結構因其與CRF的順序一致而具有錄入速度快和符合人們閱讀習慣,方便研究者觀察等諸多優點,但給不良事件、合并用藥以及不同時間段實驗室數據的SAS編程造成了較大困難。基于原數據結構編寫分析程序需要將涉及到的變量全部寫入程序中,過程繁復易出錯。目前對此問題的解決方法常常是采用數據結構轉換,將這種橫向結構的數據轉換為縱向結構,本文基于此提出一種可簡化臨床試驗數據分析的SAS數據結構轉換方法,可大大簡化臨床試驗數據集預處理過程,并為后續的統計分析提供方便。

方法介紹

從實現數據結構轉換、盡可能減少人工操作成分和擴大程序通用性角度出發,利用SAS宏的字符運算功能,實現僅修改個別宏參數達到不同域的原始橫向數據向縱向數據結構的轉換。編程的基本思想為:通過對規則化命名的變量識別,從原始數據集提取所需變量信息并處理成各功能列表,將其應用于列表處理和數組提取。具體編程的各個步驟思路介紹如下。

1.定義宏參數,這些宏參數是本程序應用過程中唯一需要手工添加的部分。主要包含原始數據集、提取的變量和輸出數據集等。各個宏參數的名稱和含義見表1。

表1 程序中使用的宏參數

2.有效性驗證,驗證數據集參數是否合法,是否存在對應數據集,操作變量是否存在于數據集中,外部路徑是否有效,并獲取變量信息。提取原始數據集每個變量的變量名,標簽,長度和格式等信息并將其保存到新的數據集中。篩查非數據集變量并剔除。

3.通過Scan函數[2]提取原始數據集中前綴符合Targetlist的全部變量,并通過截取尾墜相同的變量組,循環賦值獲得儲存目標變量的宏變量。在此步驟中讀取目標變量的順序即為Targetlist中宏參數的順序,因此最后輸出的數據集中的變量順序可以按照要求和目的不同而改動,且不用考慮變量的具體屬性。

4.通過SAS Proc SQL過程[3-4]提取變量的類型(Type)、標簽(Label)、縱向維數,以及日期變量,并將各個變量名儲存至列表型宏變量中。這一步是后續實現自動化的關鍵,提取出的變量屬性用于之后變量的分類和定義,正是因為這一步使得定義宏參數時可以不再需要對數據進行預處理以分別列出字符型和數值型兩個組。

5.定義AddValueList,添加原始數據集中未包含的行信息。

6.對整理好的變量按順序分別整理至字符型和數值型兩個數組,并保留變量原本的屬性,使用Compbl函數[2]將之前步驟中多余的空格去除。

7.最后將之前制作好的數組和變量組合起來完成行×列的對應賦值,形成縱向結構的新數據集,見表2。表2程序先判斷是否存在字符型變量,若存在則進行排列,數值型變量同理。然后再將原始數據集中的值賦值進去,并使用自定義標簽變量Tag判斷每條記錄是否為空,見程序第16行,以此輸出到兩個不同的數據集,分別為包含記錄的數據集和不包含記錄的數據集,方便之后的統計分析。

表2 數據結構轉換數組讀取宏程序

應用實例

以某乙肝疫苗合并用藥數據結構變換為例,說明程序應用結果,原始數據集結構如表3。

為了直觀展示宏程序功能,表3省略了一些中間變量,僅保留NA(藥物名稱)、FO(藥物劑量)和RO(給藥途徑)的前三條信息。由表3可知,原數據結構將每個受試者合并用藥的信息列于不同的列中,形成眾多變量,這使得后續合并用藥率等的統計分析編程較為復雜。執行如下程序:

%TableFormTransform(DataIn =CRF,TargetList =%bquote(CM1NA,CM1FO,CM1RO),DataOut =CM,DataBlank =CM_Blank,Keeplist =,AddValueList=)

這里原始數據集為CRF,目標變量為字符型的CM1NA,和數值型的CM1FO和CM1RO,輸出的轉換后包含記錄的數據集為合并用藥數據集(concomitant medications,CM),不包含記錄的為CM_Blank,并保留原始數據集中記錄編號。這里這個數據集要做的是合并用藥的內容,因而AddValueList沒有需要拼接的癥狀名稱,所以為空。運行程序后則得到轉換后的數據集CM,如表4。

比較表4和表3的數據結構可知,本文給出的方法將位于不同列中的同屬性變量轉化為位于同列的一個變量,同時結構轉換后的數據集中變量的排列順序即為TargetList中目標變量的順序,這為后續合并用藥率等統計分析提供了方便。

表3 某乙肝疫苗合并用藥原始數據結構

討 論

將同一受試者的不同觀察指標(多個變量)作為一條記錄列于同一行上的橫向數據結構廣泛存在于臨床試驗的數據庫中。誠然,這種數據結構有利于數據管理者的數據錄入、數據核查和研究者對數據的認識和觀察。但必須指出的是,這種“通用”的“標準”數據結構常常給后續的統計分析帶來困難。使用這種數據結構進行統計分析,編寫的程序在不同的臨床試驗中很難重復利用。縱向數據結構在統計分析時具有很高的效率,有著工作量小、能減少多變量編程過程中可能引起的失誤,并且有著程序更普遍適用性等優點。在CDSIC標準中,研究數據表格模型(study data tabulation model,STDM)提交的數據格式也為縱向數據;分析數據庫模型(analysis data model,ADam)模塊中基本數據結構(basic data structure,DBS),每例受試者不同時點、不同分析指標有一條或多條記錄,支持參數和非參數分析,這里的數據同樣也是縱向數據格式。藥物臨床試驗中的數據管理方法多樣,實現數據結構轉換,通常有兩種思路,一是通過循環運算,二是通過數組排列。這個過程往往需要對變量進行一個個判斷,將其歸類或者重新定義屬性,若處理多個數據集,則需要較長時間,且易發生錯誤。因而,尋找一種高效方法對原始橫向數據結構進行轉換具有實際意義。

本文所介紹的方法通過識別變量屬于字符型還是數值型后,直接將其原本的屬性即標簽、格式、長度,通過SQL過程繼承下來,一步到位,不需要人為地對其進行定義和選取。通常在數據結構變換過程中,對字符型數據和數值型數據需要分別列出兩個數組,而本文介紹的程序通過創建宏變量進行預處理識別變量的類型并將其歸入數值型和字符型兩個列表(List)中,為之后提出變量組成數組做預處理。最后得到的輸出數據集縱標目的順序即為調用宏語句“TargetList =% Bquote(Parameter1,Parameter2…)”中宏參數的排列順序,在應用時可以隨意調換參數位置并且不考慮這些變量是屬于數值還是字符型,為批量處理提供方便。

表4 某乙肝疫苗合并用藥變換后的數據結構

臨床試驗中數據采集、數據管理的規范化對保證臨床試驗質量十分重要,而目前國內在這些方面和國外相比尚有較大差距。CDSIC標準給臨床試驗數據標準化提供了基礎。本文以數據管理自動化為目標,編寫可以廣泛應用于CDISC標準化命名變量的宏程序,實現數據結構轉換的規范化。需要注意的是,在實際工作中若臨床試驗電子CRF數據設計的變量名不規范,則可采用本課題組先前提出的《流行病學調查報告數據標準化入口的SAS實現》[5]進行變量命名的標準化,再配合本文方法,即可實現能廣泛應用于臨床試驗和/或流行病學現場調查的數據結構轉換。

參考文獻

[1]Team,C.S.D.S.Study Data Tabulation Model(SDTM).2008.http:/ / www.cdisc.org/ sdtm.

[2]SAS Institute Inc.Sas9.1.3 Help and Documentation.Cary Nc:Sas Institute Inc,2003.

[3]SAS Institute Inc.Sas Institute Inc .Sas9.1.3 Sql Procedure Users Guide.Cary,Nc,2006.

[4]SAS Institute Inc.Sas Institute Inc .Base Sas9.1.3 Sql Procedure Guide:Statistical Procedures.Cary,Nc,2006.

[5]王詩遠,劉沛.流行病學調查報告數據標準化入口的SAS實現.中國衛生統計,2013,30(1):114-118.

(責任編輯:劉 壯)

*基金項目:國家科技重大專項“艾滋病和病毒性肝炎等重大傳染病防治”(2011ZX10004-902)

通信作者:△劉沛,E-mail:liupeiseu@126.com

猜你喜歡
程序
給Windows添加程序快速切換欄
電腦愛好者(2020年6期)2020-05-26 09:27:33
試論我國未決羈押程序的立法完善
人大建設(2019年12期)2019-05-21 02:55:44
失能的信仰——走向衰亡的民事訴訟程序
“程序猿”的生活什么樣
英國與歐盟正式啟動“離婚”程序程序
環球時報(2017-03-30)2017-03-30 06:44:45
基于VMM的程序行為異常檢測
偵查實驗批準程序初探
我國刑事速裁程序的構建
創衛暗訪程序有待改進
中國衛生(2015年3期)2015-11-19 02:53:32
恐怖犯罪刑事訴訟程序的完善
主站蜘蛛池模板: 久久毛片免费基地| 中文字幕有乳无码| 色综合日本| 国产大全韩国亚洲一区二区三区| 亚洲欧美日韩中文字幕在线| 国产精品成人一区二区| 中文字幕在线免费看| 欧美精品亚洲二区| 精品国产自在现线看久久| 一级毛片免费观看久| 亚洲第一页在线观看| 国产玖玖玖精品视频| 免费人成黄页在线观看国产| 亚洲精品福利网站| 日韩精品无码免费一区二区三区| 国产人成乱码视频免费观看| 免费a级毛片18以上观看精品| 国产精品久久久久久久久久久久| 欧美性天天| 91精品啪在线观看国产| 一级黄色网站在线免费看| 92精品国产自产在线观看| 亚洲成a人在线观看| 国内精品久久久久久久久久影视| 久久人妻xunleige无码| 午夜无码一区二区三区在线app| 亚洲人成在线免费观看| 中文天堂在线视频| 久久久久夜色精品波多野结衣| 亚洲天堂网2014| 999国内精品久久免费视频| 色综合天天综合| 欧美日韩精品一区二区视频| 日韩A级毛片一区二区三区| 国产麻豆aⅴ精品无码| 一本一道波多野结衣av黑人在线| 国产午夜福利片在线观看| 欧洲成人免费视频| 亚洲第一成年人网站| 免费一级毛片在线播放傲雪网| 国产激情第一页| 毛片基地美国正在播放亚洲 | 国产成人AV男人的天堂| 久久人人妻人人爽人人卡片av| 亚洲天堂久久| 五月婷婷亚洲综合| 亚洲人成高清| 波多野结衣一区二区三视频 | 四虎永久在线精品国产免费| 亚洲高清在线播放| 国产成人精品在线1区| 1024国产在线| 在线播放91| 免费在线看黄网址| 美美女高清毛片视频免费观看| 国产一线在线| 天天操天天噜| 综合网天天| 亚洲精品图区| 国产精品永久不卡免费视频| 亚洲午夜福利精品无码不卡| 国产精品冒白浆免费视频| 99偷拍视频精品一区二区| 国产精品无码一二三视频| 午夜国产在线观看| 亚洲精选无码久久久| 四虎亚洲精品| 国产亚洲欧美日韩在线观看一区二区| 国产亚洲一区二区三区在线| 国产呦视频免费视频在线观看| 日韩午夜伦| 91在线中文| 色屁屁一区二区三区视频国产| 国产麻豆另类AV| 欧美不卡在线视频| P尤物久久99国产综合精品| 亚洲国产av无码综合原创国产| 亚洲AV免费一区二区三区| 高清不卡一区二区三区香蕉| 天堂av综合网| 99久久免费精品特色大片| 国产精品永久久久久|