余 鑫,晏沙沙,張 曦,朱 銳,何 亮
(云南省腫瘤醫院檢驗科,云南昆明 650000)
宮頸癌是發生于宮頸上皮的與人乳頭狀瘤病毒(HPV)感染相關的一種惡性腫瘤[1]。國際癌癥研究所(IARC)數據顯示,全球每年宮頸癌新發病例約為53.0萬,占所有女性腫瘤的12.0%,死亡病例達27.5萬[2]。而我國每年約有13.0萬宮頸癌新發病例,5.3萬女性死于該病,宮頸癌已經成為嚴重威脅女性身體健康的惡性腫瘤之一[3]。宮頸癌及其癌前病變是可預防的,但由于發展中國家缺乏經濟、技術基礎,宮頸癌篩查措施不完善,患者常失去早期治療的機會[4-5]。
目前,宮頸癌早期篩查主要依靠液基薄層細胞學技術和HPV檢測等[6],但上述方法在發展中國家尚未普及,且因為價格較高等原因導致主動篩查的人數較少,迫切需要尋找更為經濟、便利、高效的篩查方法。血常規、尿常規、生化常規檢測屬于常規體檢項目,具有價格便宜、標本留取方便、檢測方法簡單等優點,適用于多種疾病的篩查。支持向量機模型屬于神經網絡分析模型,是一種模擬人類大腦信息處理方式的簡化模型。支持向量機算法基于經驗風險最小化原則,同時強調置信范圍最小,采用結構風險最小化原理,整合泛化能力與算法復雜度之間的矛盾。因此,支持向量機算法在小樣本研究領域的表現優于傳統模式的識別方法[7]。目前,已有較多研究將神經網絡分析模型用于生物醫學[8-9]。本研究通過分析宮頸癌患者和健康人群之間血常規、尿常規及生化常規檢測水平間的差異,應用支持向量機算法建立宮頸癌篩查模型,用于宮頸癌和健康人群的鑒別,以期為精確識別宮頸癌高危人群提供可靠途徑。
1.1一般資料 選取本院婦科2016年1月1日至2018年12月31日收治的宮頸癌患者50例作為宮頸癌組。納入標準:(1)病理學或細胞學檢查初次確診為宮頸癌;(2)20~70歲女性;(3)入院后接受相關影像學檢查,如腹部彩超、胸部CT、頭部MRI、全身骨掃描或PET-CT,明確腫瘤TNM分期;(4)臨床資料完整。排除標準:(1)合并其他類型腫瘤;(2)既往進行過放療或化療;(3)合并基礎疾病,如糖尿病、高血壓、冠心病等。另選取同期年齡為20~70歲的健康體檢女性50例作為對照組。宮頸癌組和對照組中分別隨機選取10例研究對象用于小樣本初篩,兩組分別剩余的40例研究對象用于模型構建。
1.2儀器與試劑 生化常規檢測試劑和儀器由羅氏診斷產品(上海)有限公司提供;血常規檢測試劑和儀器由日本希森美康株式會社提供。
1.3方法
1.3.1文獻篩查 從文獻中篩選出與腫瘤相關的血常規指標[10-13]。
1.3.2小樣本初篩 收集10例健康體檢者(對照組A)和10例宮頸癌患者(宮頸癌組A)的生化常規及尿常規指標,進行比較,篩選出差異有統計學意義的指標,即為宮頸癌相關生化常規及尿常規指標。指標納入標準:完整的生化常規指標包括肝功能、腎功能、蛋白、電解質、血糖、血脂、心肌酶等相關指標。指標排除標準:非常規體檢中心開展項目,如胱抑素C等;人工操作項目,如尿鏡檢細菌等。根據指標納入及排除標準,最終納入的生化常規初篩指標:鉀、鈉、氯、鈣(Ca)、鎂(Mg)、鐵(Fe)、總蛋白(TP)、清蛋白、總膽紅素、直接膽紅素、丙氨酸氨基轉移酶(ALT)、天門冬氨酸氨基轉移酶(AST)、AST/ALT、尿素、尿酸(UA)、肌酐、血葡萄糖(GLU)、三酰甘油、膽固醇、低密度脂蛋白、高密度脂蛋白、肌酸激酶、肌酸激酶同工酶。納入的尿常規初篩指標:pH、尿比重(SG)、尿膽原、隱血、尿蛋白、尿GLU、尿膽紅素、尿酮體、尿紅細胞。
1.3.3篩選模型構建指標 比較剩余40例宮頸癌患者(宮頸癌組B)和40例健康體檢者(對照組B)小樣本初篩篩選出的生化常規與尿常規指標,以及文獻篩查所篩選出的腫瘤相關血常規指標,將差異有統計學意義的指標用于模型構建。

2.1宮頸癌相關指標小樣本初篩 從相關文獻中篩選出可能與腫瘤相關的血常規指標,包括白細胞計數(WBC)、血小板計數(PLT)、中性粒細胞/淋巴細胞比值(NLR)、血小板/淋巴細胞比值(PLR)、淋巴細胞計數(LY)、中性粒細胞計數(NEUT)。通過小樣本初篩,篩選出宮頸癌組A與對照組A間差異有統計學意義的指標,即為宮頸癌相關的生化常規及尿常規指標,包括SG、pH、TP、UA、Ca、Fe、Mg。見表1。
2.2篩選模型構建指標 將文獻篩查篩選出的可能與腫瘤相關的血常規指標及表1中宮頸癌相關生化常規及尿常規指標在宮頸癌組B和對照組B間進行比較,結果顯示,WBC、NEUT、NLR、PLR、TP、Ca水平在兩組間比較,差異均有統計學意義(P<0.05),可納入模型構建。見表2。

表1 兩組間差異有統計學意義的生化常規及尿常規指標比較結果

表2 兩組模型構建指標比較結果

組別nNLR[M(P25,P75)]PLR[M(P25,P75)]Fe[M(P25,P75),mmol/L]Mg(x±s,mmol/L)Ca[M(P25,P75),mmol/L]對照組B402.80(2.13,4.21)164.65(126.00,219.69)12.05(5.45,19.60)0.87±0.072.29(2.12,2.40)宮頸癌組B401.44(1.26,2.02)116.62(87.90,155.76)18.30(13.15,22.25)0.89±0.072.35(2.31,2.46)t/Z-2.565-1.6061.9011.3420.224P0.0530.1120.0010.0551.000

組別nSG[M(P25,P75)]pH[M(P25,P75)]TP[M(P25,P75),g/L]UA[M(P25,P75),μmol/L]對照組B401.02(1.01,1.03)6.00(5.50,6.50)74.50(64.50,79.00)256.50(214.00,312.75)宮頸癌組B401.01(1.01,1.02)6.00(5.50,6.50)76.00(74.00,80.00)277.50(248.25,350.00)t/Z1.5651.3422.6831.453P0.0150.055<0.0010.029
2.3支持向量機模型的構建及驗證
2.3.1樣本處理 從宮頸癌組B與對照組B的80例樣本中隨機選出62例用于構建篩查模型,剩余18例用于構建驗證模型。
2.3.2支持向量機模型的構建 模型輸入層以6個特征變量(WBC、NEUT、NLR、PLR、TP、Ca)作為協變量,單元數為6;隱藏層為隨機擬合的9個變量,目的是將非線性不可分的輸入信號設法變換成線性可分信號;輸出層節點則是利用線性函數對輸入信號進行簡單的線性加權和變換,用于鑒別宮頸癌患者和健康人群。
2.3.3支持向量機模型評價結果 篩查模型診斷宮頸癌的靈敏度為86.11%,特異度為88.46%,診斷符合率為87.10%;驗證模型診斷宮頸癌的靈敏度為66.67%,特異度為100.00%,診斷符合率為83.33%,見表3。ROC曲線分析結果顯示,構建的支持向量機模型診斷宮頸癌的曲線下面積(AUC)為0.933,見圖1。

表3 支持向量機模型評價結果

圖1 支持向量機模型診斷宮頸癌的ROC曲線
宮頸癌是嚴重危害女性健康的惡性腫瘤之一,發病率占全球女性惡性腫瘤的第2位,僅次于乳腺癌[14]。目前,宮頸癌篩查最佳方案包括,(1)優選方案:液基薄層細胞學技術和HPV聯合篩查,此篩查方法靈敏度、特異度高,但價格昂貴、技術要求高,僅適用于經濟發達地區;(2)一般方案:巴氏涂片與HPV聯合篩查,此方法快速、便捷,但價格也較高,適用于中等發達地區;(3)基本方案:肉眼觀察法,此方法假陽性率高,但價格低廉、易于操作,適用于醫療資源落后地區[15]。研究表明,85%的宮頸癌新發病例和90%的死亡病例發生在醫療資源落后地區[16]。宮頸癌前病變缺乏有效治療時易發展成為宮頸癌,早期發現與治療是宮頸癌防治的關鍵。
雖然常規體檢項目與液基薄層細胞學技術、HPV、宮頸癌相關腫瘤標志物檢測相比缺乏特異性,但如果能在患者未表現出明顯癥狀時通過分析其在常規體檢項目中的相關指標變化來預測宮頸癌的發生,對于提高早期篩查率具有重要意義。故本研究篩選出血常規、尿常規、生化常規中對宮頸癌具有一定診斷意義的指標,并通過支持向量機算法,建立了宮頸癌篩查模型,以期為宮頸癌的篩查提供一定參考。本研究結果顯示,根據文獻篩查、小樣本初篩、模型構建指標篩選所選出的血常規、尿常規、生化常規指標所構建的支持向量機模型診斷宮頸癌的AUC為0.933,診斷效能高,能夠較為準確地診斷宮頸癌,值得在臨床推廣應用。
此外,神經網絡分析模型還可用于其他腫瘤的模型預測。通過建立各類腫瘤的神經網絡分析模型,整合大數據庫,能幫助臨床醫師更有針對性地開展檢查項目,提高診斷效率;同時,也可為患者減少不必要的檢查,做到醫療資源的合理使用。
運用常規體檢項目構建的支持向量機模型具有較高的宮頸癌診斷價值,能有效提高宮頸癌早期診斷的準確性。