徐永林,蔣紅軍
(東南大學附屬第二醫 1.病案統計室, 2.胸心外科,江蘇 南京 210003)
?
SPSS軟件在宮頸癌手術后生存時間與復發影響因素分析中的應用
徐永林1,蔣紅軍2
(東南大學附屬第二醫1.病案統計室, 2.胸心外科,江蘇 南京210003)
[摘要]目的:總結SPSS軟件用于分析宮頸癌手術后生存與復發的經驗與特點。方法:將江蘇省腫瘤醫院病案室宮頸癌手術后隨訪病例共149例錄入電子表格,用SPSS軟件進行導入,定義年齡、臨床分期、病理類型、組織分化、淋巴結是否轉移、有無深肌層浸潤、脈管癌栓、復發、生存時間、生存結果等變量,用交叉表格及生存分析COX模塊進行數據分析。結果與結論:采用SPSS軟件能夠方便準確地進行χ2檢驗和多因素生存分析,找出影響生存時間的相關因素。SPSS用于分析影響宮頸癌手術后生存時間與復發的因素方法簡單,結果準確可靠。
[關鍵詞]SPSS軟件; 因素分析; 宮頸癌術后; 生存時間; 復發
SPSS軟件廣泛用于社會科學、科研及醫學統計中,是著名的三大統計軟件之一。其界面友好、操作相對簡單、結果可靠,絕大多數的統計分析與圖表制作可以通過對話框完成。作者應用SPSS軟件分析宮頸癌的臨床數據,總結SPSS應用的經驗和特點。
1資料與方法
1.1數據來源及初步整理
病歷資料來自江蘇省腫瘤醫院病案室,為2000年以來隨訪資料完整的宮頸癌術后病例,共149份。收集患者年齡、臨床分期、病理類型、組織分化、淋巴結是否轉移、有無深肌層浸潤、脈管癌栓、復發與否、生存時間、生存結果等原始資料,錄入電子表格[1]。使用的軟件及版本為SPSS 22,Excel 2010。
1.2SPSS軟件中變量的設置與定義
用SPSS直接讀入原始Excel格式數據,首行默認為變量名稱。對變量名稱進行重新定義和設定。對原始數據進行核實、排序,剔除或更正異常值,并定義數據字典。宮頸癌患者年齡為連續性數值型變量。按患者年齡的大小進行分組:1為年齡≤40歲組,2為年齡>40歲組;患者臨床分期共有ⅠA、ⅠB1、ⅠB2、Ⅱ4類,為有序分類變量。根據分析要求并臨床實際,合并為Ⅰ期和Ⅱ期共兩組。定義為數值型變量1和2,分別表示Ⅰ期和Ⅱ期,為有序二分類變量。患者病理類型有鱗癌、腺癌、腺鱗癌及小細胞癌4類,為無序分類變量。根據實際需要合并為鱗癌及非鱗癌兩類,定義為數值型變量1和2,分別表示鱗癌和非鱗癌。患者病理學組織分化程度分為低分化和中高分化兩類,為有序二分類變量,用數值1和2分別表示;淋巴結是否轉移、脈管內癌栓均為二分類變量,0代表未轉移,1代表有轉移。生存時間為連續性數值型變量。生存狀態分為死亡、復發與失訪,分別以數字0、1和2代表,失效事件為死亡,復發與失訪為刪失數據。
1.3用SPSS軟件分析宮頸癌患者臨床資料的方法
用交叉表格[2]分析各種臨床因素,如臨床分期、病理的類型、組織分化程度、有無淋巴結轉移等是否影響腫瘤復發,實行單因素χ2檢驗。用SPSS軟件中COX風險比例模型進行生存分析[3],分析因素包括病理類型、組織學類型、臨床分期、淋巴結是否轉移、有無深肌層浸潤、脈管內癌栓、復發與否。其基本步驟包括建立包含多種因素變量的數據集。并在SPSS軟件變量視圖中輸入變量名稱,將變量賦值,在“測量”一欄中定義“度量(S)”、“有序(O)”、“名義(N)”。在數據視圖界面中讀入原始數據,選擇SPSS軟件菜單中的生存函數分析。
2結果
2.1宮頸癌患者年齡、淋巴結轉移與復發關系的χ2檢驗
不同年齡組宮頸癌患者復發與否的χ2檢驗的結果見表1,淋巴結是否轉移與復發的χ2檢驗見表2。
表1宮頸癌患者年齡與復發關系的χ2檢驗

例
表2宮頸癌患者淋巴結轉移與復發關系的χ2檢驗

例
通過表1可以看出,不同年齡宮頸癌患者之間腫瘤復發差異無統計學意義(P>0.05),提示宮頸癌的復發與年齡無明顯關系。表2結果顯示,宮頸癌淋巴結轉移與無轉移患者的腫瘤復發差異有統計學意義(P<0.01)。
2.2用SPSS軟件中COX比例風險模型分析影響生存的因素
采用SPSS 22軟件的COX風險比例模型,分析影響生存時間的多種因素,結果顯示,病理類型、淋巴結是否轉移、有無深肌層浸潤是影響宮頸癌生存時間的相關因素(P<0.05)。圖1是宮頸癌患者的生存曲線圖,通過圖1可以看出,無深肌層侵潤的患者累計生存率要好于有深肌層侵潤的患者。
3討論
用SPSS軟件進行數據分析優點很多,結合本次應用,我們認為其優點主要有以下幾方面:(1) 與其他數據格式交換方便[2]。早期SPSS軟件導入其他格式的數據如dBase、Access、SAS以及Excel等需要交換數據接口,過程相對復雜。現在SPSS軟件能夠直接讀入相應的數據,輕松地選擇需要導入的工作表。(2) 界面美觀、大方,交換式幫助幾乎無處不在,自引入中文界面后其應用更為方便。通過SPSS軟件界面可以實現所有統計分析中90%以上的功能,能夠完成常用的醫學統計方面的工作。我們用SPSS軟件分析宮頸癌患者臨床資料,使用到的SPSS軟件中的數據導入、錄入,新變量的建立,標簽值的定義,數據匯總,異常值的查找與確認等,并用SPSS軟件進行統計分析和推斷。SPSS軟件中生存分析模塊共有4類。本研究所用的K- M分析法和COX比例風險模型是較常見的兩類,在生存分析中使用得最多,其操作相對簡單,結果準確,用于各種醫學生存數據的分析[4- 5]。(3) 數據字典功能增強。可以輕松地對新建的變量進行賦值、分組、合并及匯總,增強了異常值的查找與確認的功能模塊,方便了數據的查找與準備,減輕了數據整理的工作量。

圖1宮頸癌患者的生存曲線圖
總之,SPSS軟件用于分析影響宮頸癌手術后生存時間與復發因素,方法簡單、結果準確可靠。
致謝感謝江蘇省腫瘤醫院鄧裴主任在原始資料收集過程中的幫助與支持!
[參考文獻]
[1] 九州書源.Excel 2010電子表格處理[M].北京:清華大學出版社,2011.
[2] 張文彤,董偉.SPSS統計分析基礎教程[M].2版.北京:高等教育出版社,2011.
[3] 張文彤,董偉.SPSS統計分析高級教程[M].2版.北京:高等教育出版社,2013.
[4] 鐘華戈,趙波,徐艷松.直腸肛管惡性黑色素瘤222例生存分析[J].腫瘤研究與臨床,2015,27(4):268- 270.
[5] 劉恩令,周玉秀,糜若然.應用Cox比例風險回歸模型分析卵巢上皮癌的預后因素[J].中國醫藥,2014(9):1347- 1349.
doi:10.3969/j.issn.1671- 6264.2016.02.028
[中圖分類號]R713.4
[文獻標識碼]B
[文章編號]1671- 6264(2016)02- 0255- 02
[通信作者]蔣紅軍E- mail:drhj_jiang@163.com
[作者簡介]徐永林(1957-),男,江蘇南京人,高級統計師。E- mail:njxuyonglin@163.com
[收稿日期]2015- 08- 27[修回日期] 2015- 12- 17
[引文格式] 徐永林,蔣紅軍.SPSS軟件在宮頸癌手術后生存時間與復發影響因素分析中的應用 [J].東南大學學報:醫學版,2016,35(2):255- 256.
·論著·