陸 宇,江 會
同濟大學附屬婦產科醫院,上海200040
近年來,宮頸癌的發病率逐漸上升,發病對象呈年 輕化趨勢[1]。宮頸癌根治性切除術是治療宮頸癌的主要方式[2]。然而,由于術中操作時易損傷周圍神經與膀胱組織,影響膀胱功能從而導致尿潴留的發生。據研究報道,尿潴留在婦科惡性腫瘤術后的發生率較高[3]。確定尿潴留的危險因素對于病人的長期預后至關重要[4]。機器學習技術在疾病風險預測方面已有廣泛的應用。利用機器學習算法,可以從大量的臨床數據中提取與疾病相關的特征,進而構建預測模型,預測個體的疾病發生風險[5]。常用的機器學習方法包括決策樹、支持向量機、邏輯回歸等[6]。
當前對于宮頸癌根治性切除術后尿潴留的研究多集中在護理措施上,鮮少有建立宮頸癌根治性切除術后尿潴留風險預測模型研究。本研究通過收集宮頸癌根治性切除術后病人臨床病例資料,基于機器學習算法,分別采用支持向量機、決策樹和邏輯回歸3 種機器學習方法構建宮頸癌術后尿潴留風險預測模型,并比較3 種風險預測模型的性能,以期為后續建立更加完善的宮頸癌術后尿潴留風險預測模型提供借鑒。
回顧性收集2018 年1 月—2021 年12 月行宮頸癌根治性切除術的485 例病人的資料。納入標準:符合宮頸癌診斷標準[7],且資料完整;年齡≥18 歲;意識清楚,宮頸癌根治術完成順利。排除標準:既往診斷為排尿功能障礙者;患其他嚴重基礎疾病者。本研究已通過我院倫理委員會批準(批準號:KS22352)。尿潴留診斷標準:膀胱內充滿著尿液不能自行排出或雖可以排出尿液,但是膀胱內的尿液殘余量≥100 mL 需要且重新留置導尿管。本研究通過殘余尿B 超判斷病人膀胱內殘余尿量,病人拔除導尿管后膀胱的殘余尿<100 mL就表示其功能恢復良好,若>100 mL 時診斷為尿潴留[8-9]。
通過醫院病案系統導入病人的基礎信息和手術期間信息。包括:年齡(世界衛生組織對于年齡的界定標準:≤44 歲為青年人群,>44~<60歲為中年人群,≥60歲為老年人群)、身高、體重、體質指數(BMI,分類:<18.5 kg/m2為體重過低、18.5~<24.0 kg/m2為體重正常、24.0~<28.0 kg/m2為超重、≥28.0 kg/m2為肥胖[10])、術后第1 次尿常規中白細胞數、術后是否出現尿路感染(尿路感染判斷依據我國原國家衛生和計劃生育委員會頒布的現行尿路感染的病原學診斷標準[11])、臨床分期、手術方式(腹腔鏡、開腹)、術后留置導尿留置時間、是否進行化療、術后護理方案(膀胱沖洗方案[12])等。
使用SPSS 25.0 軟件對資料進行統計分析,定性資料采用頻數、百分比(%)描述,使用Python 3.11 分別構建基于機器學習方法的決策樹、支持向量機和邏輯回歸的3 種宮頸癌術后尿潴留風險預測模型。
在構建模型前,先對所收集的數據進行預處理,包括數據清洗、特征選擇和特征編碼。
2.1.1 數據采集
數據采集階段,回顧性收集2018—2021 年在我院行宮頸癌根治性切除術的485 例病人的病例報告,其中1 例發生尿潴留和1 例未發生尿潴留病人的詳細資料見表1。每個病例有14 個特性,特征的數據類型有字符型、整型和浮點型,所以將原始數據直接輸入到分類算法模型中不可行,因為機器不能直接理解字符型特征的含義,從而難以對病例進行準確的疾病判斷?;诖藛栴},原始數據需要預處理,以便將其輸入機器學習模型中進行訓練。

表1 1 例發生尿潴留和1 例未發生尿潴留病人的資料
2.1.2 數據清洗
統計每個特征的缺失值情況,并設定閾值,若超過閾值,則剔除該特征,否則保留并填充缺失值。數據清洗后保留了459 份資料作為構建模型的數據集。
2.1.3 特征選擇
本研究最終納入BMI、手術方式、術后尿管留置時間、術后是否發生尿路感染、疾病分期、有無術后護理方案、是否進行化療以及年齡這8 個特征作為決策樹、邏輯回歸和支持向量機的輸入特征,以更好地構建分類模型。8 個特征之間的相關性見圖1。
Pearson 相關系數是用來衡量兩個變量之間的線性相關程度[13]。圖1 中,8 個特征之間的相關性減弱。比如,術后護理方案與年齡的相關系數是0.001,為正相關,但相關性很小。術后護理方案與術后尿管留置時間的相關系數是0.370,為正相關,但沒有呈現較大的相關性。這與臨床護理的特點和實踐經驗是相符的,有研究顯示,無論是否進行膀胱沖洗,病人泌尿系感染發生率都隨著尿管留置時間的延長而增加,然而,給予膀胱沖洗者泌尿系感染發生率明顯偏低,而且尿潴留改善時間明顯縮短[14]。
2.1.4 特征編碼
在經過特征選擇后,對其進行邏輯回歸、支持向量機和決策樹算法分析的離散型變量賦值,如BMI、年齡,連續變量以原始值輸入,不同指標的劃分方式與數值化方式見表2。

表2 經過特征編碼后的病人數據
本研究通過隨機數字表法抽取其中80%的宮頸癌術后病人(367 例)作為訓練集,用于構建尿潴留風險預測模型;余20%宮頸癌術后病人(92 例)作為驗證集測試模型的表現。訓練集和驗證集病人的臨床資料見表3 和表4。

表3 訓練集病人的臨床資料

表4 驗證集病人的臨床資料
3 種預測模型的混淆矩陣見圖2 和圖3。3 種預測模型的混淆矩陣展示了不同預測模型在本研究數據集中訓練集和驗證集下的混淆矩陣,從混淆矩陣上看,不管是在訓練集還是驗證集,真陽性(TP)和真陰性(TN)都是占了數據集的大多數,表明本研究所用機器學習的預測模型對于預測宮頸癌術后尿潴留是比較高效的。

圖2 訓練集模型的混淆矩陣

圖3 驗證集模型的混淆矩陣
3 種機器學習預測模型在訓練集和驗證集的受試者工作特征(ROC)曲線見圖4。決策樹的ROC 曲線不管在訓練集還是驗證集,效果都是最優的。尤其是在訓練集中,決策樹的ROC 曲線下面積(AUC)為1,但是在驗證集中,決策樹的AUC 為0.91,說明決策樹的訓練存在一定的過擬合現象。盡管如此,決策樹在訓練集和驗證集中的效果依然是最優的。支持向量機和邏輯回歸的ROC 曲線不管在訓練集中還是在驗證集中,AUC 都相差不大,性能都不如決策樹。

圖4 ROC 曲線(A 為訓練集;B 為驗證集)
通過混淆矩陣可得到3 種預測模型的準確率、召回率、精確率、F1 值和AUC,具體見表5。訓練集用于訓練模型,驗證集用于測試模型的泛化能力。在訓練集和驗證集中,決策樹模型的評估值都是最高的。決策樹不管在訓練集中還是在驗證集中,準確率、召回率、精確率、F1 值和AUC 都比支持向量機和邏輯回歸更優,這說明決策樹在構建宮頸癌術后尿潴留風險預測模型中具有較高的準確率及較好的泛化性能。支持向量機在訓練集中準確率、召回率、精確率、F1 值和AUC 都比邏輯回歸更優。同時,在驗證集中,支持向量機的召回率和F1 值比邏輯回歸更優,但是支持向量機精確率和AUC 卻比邏輯回歸差。說明支持向量機在宮頸癌術后尿潴留數據集中的泛化能力比邏輯回歸差。

表5 3 種機器學習模型的對比結果
隨著大數據的出現以及人們對大數據分析能力的提升,科技發展的各領域都在不斷革新,其中以人工智能發展最為突出,這也意味著人類社會將走向智能時代[15]。大數據時代的到來,直接產生了機器學習這一新的科學領域,機器學習主要是為人工智能技術在大數據時代提供一種實用性技術[16]。對醫院信息系統所積累的醫療大數據進行匯集、建模分析,運用機器學習技術可以合理預測和判定未知數據的已知類型[5]。
在醫學上,疾病風險預測模型用于輔助醫療決策,疾病風險預測模型可以結合兩項或多項病人的相關數據來預測臨床結果。機器學習是用計算機來模擬或實現人類學習活動的學科。機器學習以其準確性高、可操作性強的特點很大程度提高臨床工作效率,也能為復雜多變的疾病研究提供一個新的視角。除此之外,海量的醫學數據也為挖掘潛在的危險因素提供了數據支持。杜晨等[17]通過收集經內鏡或手術病理證實的炎癥性腸病病人的信息后利用6 種模型對數據進行處理,結果表明,靈鄰近算法(KNN)模型的穩定性較高,在驗證集中準確率最高,準確率為87.9%。
本研究回顧性收集了在我院行宮頸癌根治性切除術病人的病史信息,篩選出8 個危險因素,主要為年齡、術后導尿管留置時間、BMI、術后是否發生尿路感染、有無術后護理方案、疾病分期、手術方式和是否化療。根治性子宮切除術是治療宮頸癌的首選治療方式[18]。受到手術范圍的影響,病人術后往往會出現膀胱功能、結直腸蠕動功能和性功能異常等并發癥[19]。有研究顯示,老年女性病人出現急性尿潴留的原因為逼尿肌收縮功能低下,老年病人術后并發癥多,基礎疾病多, 術后恢復能力降低,膀胱功能逐漸下降,排尿功能也顯著降低[20-21]。有研究顯示,腹腔鏡手術治療宮頸癌效果確切,但術后病人手術部位感染發生率高[22]。
在模型構建方面,經過數據的采集、預處理后使用決策樹、支持向量機和邏輯回歸3 種機器學習方法構建宮頸癌術后尿潴留風險預測模型。通過混淆矩陣計算3 種機器學習算法的準確率、召回率、精準率、F1 指數和AUC 值后,綜合預測效能最佳的模型是決策樹模型。支持向量機在訓練集中準確率、召回率、精確率、F1 值和AUC 都比邏輯回歸更優。同時,在驗證集中,支持向量機的召回率和F1 值比邏輯回歸更優,但是支持向量機的精確率和AUC 卻比邏輯回歸差。本研究所建立的決策樹模型性能最佳,后續可以利用所構建的模型識別宮頸癌術后發生尿潴留的風險;同時,還可以作為醫療決策的支持工具,區分高危人群,并從多種治療方案中進行針對性指導。