






摘要:目的 探索基于多約束表征學習分類模型在面對缺失實驗室指標的情況下鑒別卵巢癌的鑒別能力和應用價值。方法 收集了2344例患者(393例卵巢癌和1951例對照)的缺失實驗室指標表格型數據,使用本研究提出的基于判別學習和互信息以及特征投影重要性得分一致性及缺失位置估算的表征學習分類模型對缺失的卵巢癌實驗室指標特征進行投影到潛在空間得到分類模型。對提出的約束項進行消融實驗,通過準確率、ROC曲線下面積(AUC)、敏感度、特異性說明約束項的可行性和有效項。采用交叉驗證方法和準確率、AUC、敏感度、特異性評價該分類模型的鑒別性能。將本研究與其他用于缺失數據的插補方法進行對缺失數據處理后鑒別分類能力的對比。結果 消融實驗結果顯示約束項之間有很好的相容性,每項約束項都有較好的魯棒性。交叉驗證結果顯示,本研究提出的基于多約束表征學習分類模型在面對缺失實驗室指標的情況下對卵巢癌的鑒別中的AUC、準確率、敏感度、特異性分別為0.915、0.888、0.774、0.910,其中AUC和敏感度優于其它缺失數據插補方法。結論 基于多約束表征學習模型在缺失實驗室指標鑒別卵巢癌的應用中具有優秀的鑒別能力和較高的應用價值。與其他缺失插補方法相比,本研究提出的多約束表征學習模型在針對卵巢癌缺失實驗室指標的鑒別分類任務中具有較大的優勢。
關鍵詞:缺失數據;多約束表征學習模型;判別分析;特征投影重要性得分一致性;……