袁清連,古聰慧,毛 靜,喻意美
人工流產是意外妊娠后主要補救措施之一,近年來報道顯示全球范圍內超過7 000萬例女性需要接受人工流產[1]。女性人工流產方式受到包括環境、社會因素在內的復雜因素影響[2-3],既往采用Logistic回歸模型分析影響因素存在諸多局限,如處理非線性、高度交互及存在諸多缺失值等,且難以直接顯示相關指標對于結果的影響程度。而決策樹模型作為一種新型數據挖掘方法,可有效消除傳統回歸模型在分析影響因素方面的不足[4]。基于以上證據,本次研究回顧性納入2021年9月—2022年10月深圳市羅湖醫院集團(羅湖區人民醫院、羅湖區婦幼保健院和羅湖區中醫院等)所屬醫療機構收治的9 245例人工流產女性的流行病學資料,基于決策樹模型分析羅湖區人工流產方式的影響因素,并與Logistic回歸模型比較,現報道如下。
回顧 性 納 入2021 年9 月—2022 年10 月 深 圳 市羅湖醫院集團(羅湖區人民醫院、羅湖區婦幼保健院和羅湖區中醫院等)所屬醫療機構收治的9 245例人工流產女性作為研究對象,根據人工流產方式將其分為藥物組(2 004例)和手術組(7 241例)。納入標準:1)臨床確診早孕;2)要求終止妊娠;3)孕周在16周以內。排除標準:1)因其他疾病住院治療;2)有人工流產禁忌證;3)不愿配合檢查治療;4)臨床資料欠完整。本研究方案經醫院倫理委員會批準。
登錄醫院電子病歷系統記錄病人年齡、孕周、受教育程度、人工流產方式偏好情況、職業、人均月收入水平、婚姻狀況、生育情況及最終流產情況。選擇有醫學背景的專業人員為調查員,并對調查員進行統一培訓。經過規范化培訓后雙人錄入數據,確保準確。
采用SPSS 23.0軟件對數據進行統計分析。定性資料采用例數、百分比(%)表示,比較采用χ2檢驗;影響因素分析采用Logistic回歸模型和決策樹模型;以P<0.05為差異有統計學意義。
單因素分析結果顯示,不同孕周、年齡、人工流產方式偏好情況、受教育程度、婚姻狀況、生育情況的女性人工流產方式選擇差異有統計學意義(P<0.05)。具體見表1。

表1 人工流產方式影響因素的單因素分析 單位:例
利用Logistic回歸模型,本研究以人工流產方式(藥物組=0,手術組=1)為因變量,以單因素分析中有統計學意義的項目為自變量(賦值方式見表2)進一步進行多因素分析。結果顯示,孕周、年齡、人工流產方式偏好情況、受教育水平及生育情況均是影響人工流產方式選擇的獨立因素(P<0.05),見表3。

表2 自變量賦值方式

表3 人工流產方式影響因素的多因素分析
基于給定的變量,本研究采用決策樹模型對人工流產方式進行分析。反應變量為人工流產方式,孕周、年齡、人工流產方式偏好情況、月收入情況、受教育程度、職業、婚姻狀態及生育情況為解釋變量。模型參數設置:最大樹深度為4,父節點和子節點的最小個案數分別為100和50。結果顯示,孕周、人工流產方式偏好情況、婚姻狀況及生育情況對人工流產方式選擇有顯著影響。其中,人工流產方式偏好情況是最主要的影響因素。決策樹模型的簡化圖見圖1。錯分矩陣及風險統計分析結果顯示,決策樹模型的預測分類與真實分類的一致性較高,風險估計值為0.10,即預測錯誤率為10.00%,具有良好模型擬合度。見表4。

圖1 人工流產方式決策樹模型簡化圖

表4 決策樹模型錯分矩陣及風險統計分析結果
人工流產是避孕失敗而致意外妊娠的情況下,在孕早期采取的人為終止妊娠的一種補救措施[5]。研究結果顯示,羅湖區的人工流產率高達6.2%,并且呈低齡化趨勢,表明人工流產在該地區是一個普遍存在的問題。低齡化趨勢表明年輕女性中的意外妊娠和不愿意懷孕的情況占比較高,這可能與性教育和避孕知識不足、避孕方法使用不當等因素有關,不僅對婦女的身心健康帶來負面影響[6],而且對整個社會的發展和人口結構產生一定的不良影響。因此,加強對性教育和避孕知識的宣傳普及、提高女性避孕意識和方法使用率是降低人工流產率、改善人口結構的重要措施。本研究基于決策樹模型分析影響人工流產方式選擇的因素,發現人工流產方式偏好情況對于人工流產方式選擇影響最大,意味著妊娠婦女更傾向于根據自己的認知和意愿選擇流產方式,同時表明,個體意識和選擇權在選擇流產方式時發揮著決定性作用。研究結果表明,病人個體意識和態度是影響人工流產方式選擇的主要因素[7-8]。因此,在進行人工流產的決策過程中,應充分尊重病人的意見和選擇,提供詳細的醫學信息和指導,幫助病人做出符合自己情況和意愿的決策。尤其在當今緩解人口老齡化和放開“三孩”背景下,研究羅湖區婦女的人工流產方式流行病學特點及其影響因素,進而采取相應措施解決問題,具有深遠的現實意義。婦女選擇人工流產方式受環境和社會因素影響,各因素之間復雜,存在交互影響作用;傳統的使用描述性流行病學研究方法探討其特征及其影響因素,無法處理不同因素之間的非線性、相互作用[9-10]。
本研究采用決策樹模型分析結果顯示,人工流產方式偏好情況對于流產方式選擇影響最大,即在考慮人工流產方式時,個體意識和選擇權發揮決定性作用。多數婦女傾向于根據自己的認知和意愿來選擇人工流產方式。此外,孕周是另一個重要的考慮因素。早孕期(孕周≤7周)的婦女更有可能選擇藥物流產,而隨著孕周的增加,手術流產可能是一個更好的選擇。因此,對于孕周較晚的妊娠,醫生應向病人推薦手術流產,并提供全面的術前和術后指導。孕周≤7周人群中未婚和未育人群選擇藥物流產比例較高,則主要與手術流產創傷大并可能影響后續生育有關。以往研究結果表明,婚姻狀況和生育情況對人工流產方式選擇的影響相對較弱,已婚已育女性和未婚未育女性在人工流產方式選擇上沒有顯著差異[11-12]。然而,部分研究指出,未婚和未育女性更傾向于選擇藥物流產,可能與這些女性對手術有恐懼心理有關,而已婚已育女性可能更傾向于選擇手術流產,因為已有生育經歷可能影響其對藥物流產的意見[13-14]。因此,醫生在提供流產方式選擇建議時仍應根據病人的婚姻狀況和生育情況,綜合考慮個體差異,為病人提供最適合的選擇,與以往報道結果[15-16]相符。本研究納入的女性中部分人工流產史資料缺失,導致未對人工流產史情況進行分析。既往報道提示,未流產過人群選擇藥物流產比例更高,這可能因此類女性對于手術懼怕,導致首次人工流產更加傾向于藥物流產;而對于既往有人工流產史的女性選擇手術流產主要受上次藥物流產滿意度較差影響,反之亦然[17-20]。
在本研究中使用了決策樹模型和Logistic回歸模型來分析數據,這兩種方法都有其優勢,但也存在一定的局限性。例如決策樹模型可以清晰地展示不同因素的影響,但可能受到樣本大小的限制。而Logistic回歸模型可以從整體上反映影響因素,但可能忽略一些細節。
決策樹模型主要用于評估不同變量對模型預測的價值及影響方式,并根據人群特征進行細分;但Logistic回歸模型則往往從整體上反映人工流產方式選擇潛在影響因素[21]。本研究Logistic回歸模型分析結果中,孕周、年齡、人工流產方式偏好情況、受教育程度及生育情況均是人工流產方式選擇的獨立影響因素,與決策樹模型結果存在一定差異。Logistic回歸模型并未證實婚姻狀況對人工流產方式選擇有影響,本研究認為可能的原因是傾向于選擇手術流產和孕周≤7周的女性對于藥物流產的優勢(如藥物流產醫源性創傷小、不適感覺輕微等內容)認知水平偏低,上述人群的不同特征導致婚姻狀況這一影響因素被遮蔽;而Logistic回歸模型中因共線性問題導致這一因素獨立影響被遺漏。同時本研究Logistic回歸模型還提示年齡、受教育程度與人工流產方式選擇間存在獨立關系,但這一觀點未被決策樹模型證實。本研究認為上述因素在決策樹模型第1步分析中具有統計學意義,但在這部分分析中人工流產方式偏好影響最顯著,故以人工流產方式偏好作為首層分類變量,而在后續劃分中并無統計學意義,故未納入決策樹模型。決策樹模型相較于傳統Logistic 回歸模型具有如下優勢[22]:1)能夠評估相關因素對于人工流產方式選擇的影響程度,同時還可反映不同特征群體對何種結果影響程度更高,較單純分析影響因素更具有指導價值;2)避免因自變量間共線性導致具有統計學意義的變量被遺漏;3)能夠同時顯示各變量間相互作用關系,并清楚直觀地顯示分析過程及結果。但需要注意決策樹模型也存在一定不足,即在樣本量較小情況下結果可能存在不穩定性[18];而本研究納入病例數較為充足,故可避免或減輕這一問題。有研究提示決策樹模型納入變量并非在同一層面比較[23],可能存在順序偏差,本研究認為在臨床實踐中可通過聯合Logistic回歸模型,分析人工流產方式選擇的共同影響因素,并進一步對不同特征人工流產女性進行分類指導及提出更具針對性的建議。
本研究通過基于決策樹模型的分析揭示了羅湖區人工流產方式選擇受孕周、人工流產方式偏好情況、婚姻狀況及生育情況等因素的獨立影響。其中,人工流產方式偏好情況對人工流產方式選擇的影響最為顯著。這些發現對于優化人工流產的個體化治療策略,提高人工流產個體的醫療體驗和治療效果具有重要意義。然而,本研究仍存在一定的局限性,建議在未來的研究中納入更全面的變量,并綜合使用不同的分析方法以進一步完善對人工流產方式選擇影響因素的認知。