王瑞平 李斌
(上海市皮膚病醫院臨床研究與創新轉化中心 上海 200443)
EpiData 軟件是丹麥歐登塞的一個非盈利組織開發并推廣,是一款免費的數據管理軟件[1]。在應用EpiData軟件完成數據庫建立后,研究者就可以使用這個數據庫進行數據錄入。考慮到有些調查研究的樣本量比較大,因此在數據錄入時須要邀請多名數據錄入員完成紙質版數據的錄入;另外,有些研究的數據來源多樣,有時則須要把不同來源的數據合并在一起。遇到這些情況時,就須要應用到數據的“縱向合并”和“橫向合并”功能。此外,為了提高數據錄入的質量并能夠檢測出錄入錯誤,許多情況下須要將紙質問卷數據信息進行雙人雙遍錄入,將雙錄入的結果進行一致性核對,便可以發現錄入不一致的地方,這時便會用到EpiData 軟件的“一致性檢驗”功能。本文基于前期數據庫已完成建立的基礎上,介紹EpiData 軟件在數據庫合并和一致性檢驗中的應用方法和須注意的細節。
數據的縱向合并是指用于連接數據結構相同或相似的2 個數據文件,操作過程中2 個文件不發生任何變化,只是把2 個數據文件的“合集”內容中的數據合并在一起,增加數據的份數[2]。例如,仍以《上海醫藥》2023 年第44 卷第13 期“臨床研究規范”欄目發表的《應用EpiData 軟件創建臨床研究電子數據庫》一文中建立的“流動人口特應性皮炎患者現況調查”數據庫(圖1)為例[3],在后續的研究中邀請A、B、C 等3 名數據錄入員進行數據庫錄入。其中,A 錄入員完成800 份問卷,B 錄入員完成1 000 份問卷,C 錄入員完成700 份問卷,通過數據庫的縱向合并,最后得到包含共計2 500(即800 +1 000 +700)份記錄的數據庫。……