肖軍 李小薇 高瞻 孟方園 盧江敏 候杜娟 李翠瑩
高原是人類最具挑戰的環境之一,近年來,隨著國防建設的需求日益增大,每年進入高原地區駐訓演練的人數也不斷增加。然而,生活在平原的人群進入高原后,部分人會出現包括頭疼、嘔吐、心慌、食欲減退等一些列臨床癥候群,稱為急性高原反應(acute mountain sickness, AMS)[1]。從我軍資料來看,急進高原時中國官兵發生AMS的概率較高,造成大量非戰斗減員,影響部隊的戰斗力,嚴重者還會發展為高原腦水腫和高原肺水腫,威脅進入高原人群的生命安全[2]。AMS的發生存在明顯的個體差異,若能在進入高原前,將這些AMS易感人群篩選出來,則可以減少AMS易感人群進入高原,從源頭上降低AMS發病率,有效降低非戰斗減員[3]。然而,目前國內外對于AMS的研究仍集中于發病機制、預防治療等方面,尚缺少準確實用的AMS預測模型的研究。針對該問題,本研究擬通過生理、生化和遺傳學指標等模型構建所需的指標體系,利用徑向基函數神經網絡的AMS預測模型識別高原耐受人群,以期減少進駐高原部隊官兵AMS的發生,提高高原作戰衛勤保障能力。
1 實驗對象 選擇四川地區入藏人員98人作為受試對象。平均年齡(22.8±1.2)歲,無進入高原低氧環境暴露史。在平原(海拔500 m)完成實驗室指標檢測后,進入西藏高原地區(海拔3 658 m),入藏后1~3天進行急性高原反應評估,AMS疾病診斷標準參照國家軍用標準GJB1098-91。本研究經中國人民解放軍空軍特色醫學中心(原空軍總醫院)倫理委員會批準(第2017-16-YJ01)。
2 方法
2.1 指標體系的建立:根據國外關于急性高原病發病機制研究進展,依簡單、易測、低傷害等原則,選擇測定指標,構建模型指標體系,并以此作為徑向基函數(radial basis function,RBF)神經網絡模型的因素集。進入高原前,由醫務人員對98名受試對象按既定檢測指標進行檢測[4]。進入高原后,根據急性高原病診斷標準進行判斷,如發生急性高原病,則賦值為1,反之則賦值為0。輸入的篩選指標包括:生理指標:身體質量指數(BMI);生化指標:血紅蛋白,氧飽和度,P50;遺傳學指標:EPAS1基因單核苷酸多態性(single nucleotide polymorphism,SNP)位點(rs13419896,rs1868092,rs4953354),EGLN1基因SNP位點(rs12097901,rs2790859)。
2.2 RBF神經網絡模型構建:RBF神經網絡是以函數逼近理論為基礎而構造的一類前向網絡,由輸入層、隱藏層、輸出層構成。采用SPSS 26.0進行構建神經網絡預測模型[5],將收集到的數據集按7∶3比例分為訓練集和測試集,隱藏層中的最小單元數設置為1,最大單元數為50。
2.3 ROC曲線繪制:以模型的1-特異度為橫坐標,靈敏度為縱坐標,繪制ROC曲線,計算機處理得到曲線下面積(area under the curve,AUC),AUC<0.5說明無診斷價值,AUC=1為最理想檢測指標。
1 構建RBF樣本集,擬合RBF神經網絡 以受試對象急進高原前各項指標作為網絡輸入變量,急性高原病發生與否作為因變量構建預測模型,樣本分區按照樣本的相對數目以7∶3隨機分配為訓練集和檢驗集。若檢驗集有一個或多個樣本的輸入變量或目標變量未在訓練集中出現,則會在分析時排除某些檢驗集和訓練集中的樣本。因此,構建成功的模型實際訓練集中樣本數為50例,檢驗樣本數為9例,排除樣本39例。模型輸入層的因子共9個包括:BMI,血紅蛋白,氧飽和度,P50,EPAS1基因SNP位點(rs13419896,rs1868092,rs4953354),EGLN1基因SNP位點(rs12097901,rs2790859);隱藏層單元數為10,激活函數為Softmax;輸出層單元數為2,激活函數恒等式函數,誤差函數平方和函數。利用訓練集進行模型擬合后其對應的平方和誤差為5.133,正訓練時間為0.11秒,預測正確百分比為88.0%;以此模型對檢驗集進行預測,其平方和誤差僅為0.894,預測正確百分比為88.9%(表1)。

表1 模型預測分類情況
2 ROC曲線評價RBF神經網絡模型對AMS的預測能力以預測模型為檢驗變量,對AMS及非AMS進行ROC曲線分析(圖1),結果顯示,構建的神經網絡預測模型的AUC為0.917。

圖1 ROC曲線評價RBF神經網絡模型對AMS的預測能力
3 模型自變量重要性分析 利用軟件自帶的自變量重要性分析模塊,對納入模型的自變量重要性進行分析,結果顯示,EPAS1的SNP位點rs13419896和氧飽和度最為重要,而BMI的重要性最小(圖2)。

圖2 輸入層各指標在模型中重要性分析
隨著對AMS發病機理的認識不斷深入,AMS的預防和治療措施也在不斷完善,其發病率呈下降趨勢。國內外的研究發現,急進高原后出現AMS是存在個體差異的,有人對于高原低氧更敏感,更易發生AMS。因此,AMS易感性的特異性指標及其檢測成為國內外學者研究的重點之一,特別是易感性指標研究較多,從基礎研究出發,研究生理生化指標與急性高原病之間的關系,如:體重指數[6]、肺功能[7]、血氧飽和度[8]、血液酸堿度[9]、心率變異[10]、血漿皮質醇含量[11]、屏氣時間、呼吸頻率[12]等指標。同時,研究者還從心理學開展了大量工作,結果發現焦慮、抑郁等反應心理情緒因素的測評分值也與AMS的發生有關。
同時,隨著生物技術和遺傳學的發展,國內外學者不僅將目光聚焦在個體生理生化的指標變化上,還從生物學和遺傳學方面通過對一些基因進行研究,以期從生物遺傳學的角度篩選識別耐受高原低氧人群。單核苷酸多態性(SNP)是新一代遺傳標記,其遺傳性穩定,并可用于構建單體型。SNP在基因組中數量巨大,檢測相對容易,可形成快速化檢測,分析個體之間特定基因SNP的差異,就有可能找到用于識別耐受低氧人群的特異性遺傳標記[13]。課題組的前期研究結果顯示,在排除其他AMS的發病因素后,每個人仍表現出不同程度的高原低氧反應,隨后的測序研究發現EPAS1、EGLN1基因的某些SNP位點具有顯著性差異,這些差異可能會影響下游低氧相關基因的轉錄表達,而編碼區的SNP甚至會造成編碼蛋白的氨基酸序列發生改變,進而影響不同個體對急性缺氧應激的適應能力以及患AMS的嚴重程度和預后。基于此,本研究在模型構建時所選擇的測定因素包含了生理、生化以及遺傳學等多個指標,以此形成構建預測模型所需的指標體系。
國內外高原醫學的研究者一直在尋找并建立一個預測急性高原病或篩選高原耐低氧人群的模型方法。然而, 目前只有個別的文獻利用回歸分析的方法研究生理生化指標與急性高原病發病的關系,如采用Logistic回歸分析發現在高原低氧暴露后血氧飽和度值、暴露時間、海拔高度可作為判斷AMS易感性的依據[14,15]。國內學者同樣通過多元回歸分析研究顯示,進入高原季節、年齡、進入高原目的和抵達高原前后48小時內是否失眠與AMS發生顯著相關[16]。然而,這些回歸分析無法很好地處理各變量之間的共線性問題,它要求測量的變量之間是相互獨立的。然而事實上,人體作為一個多系統的整體,各變量指標之間不可能完全獨立,而且,在影響進入高原低氧耐受能力的因素中還有如組織管理、心理活動、衛生措施等定性因素,各指標之間也不完全是線性相關的,這種方法的研究結果只能說明這類生理、生化指標與AMS發病有關,不能作為急性高原病易感的判斷預測方法。
近年來,隨著人工智能技術的發展,神經網絡理論得到廣泛應用,其中RBF神經網絡是應用最廣泛的一種神經網絡,它是以函數逼近理論為基礎而構造的一類前向網絡,它與BP神經網絡相比通常規模較大,但學習速度更快,且網絡的函數逼近能力、模式識別與分類能力均優于后者。由于其可以規避回歸方法在模型構建中的局限,因而,利用徑向基函數神經網絡建立的模型更具有良好穩定的預測效果。
本研究中,利用RBF神經網絡構建的模型,其訓練集的正確百分比達到88.0%,而測試集的正確預測百分比達到88.9%。進一步利用ROC曲線對模型的診斷能力進行評估,結果顯示,曲線下面積為0.917,表明具有良好的診斷能力。因為某些原因,本研究的預測模型只是利用某一海拔高度的診斷結果建立起來的,而且僅跟蹤了小部分人員,其他海拔高度以及大量人員是否適合該模型,其判斷能力是否可行,準確度如何,以及是否還要增加其他檢測指標,還需要進
一步探討。另外,該模型只能判斷是否會發生AMS,而無法進一步判斷其發病嚴重程度的高低。盡管有上述不足,但不可否認,本研究結果在一定程度上利用RBF神經網絡從多角度指標體系為定量判斷急進高原人群是否患AMS提供了一種可靠的預測方法。
利益沖突所有作者均聲明不存在利益沖突