付洺宇,朱一陽,吳春勇,侯鳳貞*,關 媛**
(1中國藥科大學理學院,南京211198;2中國藥科大學藥物分析系,南京211198)
藥物發現是一個漫長的過程,主要包括4個階段:目標選擇和驗證、化合物篩選和優化、臨床前研究、臨床試驗[1]。在大多數情況下,關于藥物發現的研究最終都無法達到臨床試驗階段,其中藥代動力學的不良性質是導致研究中斷的主要原因[2]。由此可見,充分研究先導化合物早期的藥代動力學性質對減少臨床失敗造成的經濟損失具有重要意義。 藥物的血漿蛋白結合率(plasma protein binding,PPB)反映了藥物與血漿蛋白的結合程度,它影響藥物在體內的分布、代謝與排泄,與藥物的相互作用及作用機制等密切相關。藥物在血漿中未結合的部分通常用fu(the fraction unbound in plasma)表示。通過預測藥物的fu,有助于了解藥物的藥代動力學特性,從而在藥物發現的早期階段選擇合適的候選藥物[3]。
近年來,人工智能算法被越來越多的應用在計算人體藥代動力學特性的研究中,為研究者在新藥發現和優化階段選擇合適的化合物提供了幫助[4-10]。目前已有幾種商業軟件可通過軟件自身的算法直接預測fu,如ADMET Predictor 和BIOVIA Discovery Studio。然而,與真實值相比,這些軟件預測的結果普遍不高。一些研究使用機器學習方法通過構建藥物血漿蛋白結合率的定量結構-藥物動力學關系(quantitative structure-pharmacokinetic relationship,QSPR)模型預測fu。Votano 等[11]在由808 個藥物構成的訓練集上使用Molconn-Z 軟件計算分子描述符,用人工神經網絡、多元線性回歸(multiple linear regression,MLR)、支持向量機(support vector machines,SVM)、K- 近 鄰(k nearest neighbors,KNN)4 種方法來預測fu,預測模型的R2普遍在0.61 左右。……