中圖分類號 R969.3;TP8 文獻(xiàn)標(biāo)志碼 A 文章編號 00-0408(2025)-399-06
DOI 0.6039/j.issn.00-0408.2025..20
ABSTRACT OBJECTIVE To construct three-class (insufficient, normal, excessive) and two-class (insufficient, normal) models for predicting plasma concentration of valproic acid(VPA),and compare the performance of these two models,with the aim of providing a reference for formulating clinical medication strategies. METHODS The clinical data of 480 patients who received VPA treatment and underwent blood concentration test at the Xi’an International Medical Center Hospital were collected from November 2022 to September 2024(a total of 695 sets of data). In this study,predictive models were constructed for target variables of three-class and two-class models. Feature ranking and selection were carried out using XGBoost scores. Twelve different machine learning algorithms were used for training and validation,and the performance of the models was evaluated using three indexes: accuracy,F(xiàn)1 score,and the area under the working characteristic curve of the subject (AUC). RESULTS XGBoost feature importance scores revealed that in the three-class model,the importance ranking of kidney disease and electrolyte disorders was higher. However,in the two-class model,the importance ranking of these features significantly decreased,suggesting a close association with the excessive blood concentration of VPA. In the three-class model,Random Forest method performed best,with F1 score of 0.704 0 and AUC of 0.519 3 on the test set;while in the two-class model,CatBoost method performed optimally,with F1 score of 0.785 7 and AUC of 0.819 5 on the test set. CONCLUSIONS The constructed three-class model has the ability to predict excessive VPA blood concentration,but its prediction and model generalization abilities are poor;the constructed two-class model can only perform classification prediction for insufficient and normal blood concentration cases, but its model performance is stronger.
KEYWORDS valproic acid; machine learning; plasmaconcentration prediction; small-sample dataset; modelcomparison
丙戊酸(valproic acid,VPA)是一種廣譜抗癲癇藥,通過增加腦內(nèi) γ -氨基丁酸( γ -aminobutyric acid,GABA)水平等機(jī)制發(fā)揮抗癲癇和穩(wěn)定情緒作用,可用于全面性癲癇、部分性癲癇及肌陣攣癲癇等多種類型的癲癇發(fā)作及雙相情感障礙等精神疾病的治療[1―3]。但VPA體內(nèi)代謝的個(gè)體差異較大,血藥濃度與劑量呈非線性相關(guān)[4]。此外,VPA 的有效血藥濃度范圍較窄,當(dāng)VPA 血藥濃度低于 50μg/mL 時(shí)可能導(dǎo)致臨床治療失敗,而超過100μg/mL 時(shí)患者出現(xiàn)不良反應(yīng)的風(fēng)險(xiǎn)又會(huì)顯著升高[5]。因此,監(jiān)測VPA的血藥濃度對于提升臨床用藥的安全性和有效性至關(guān)重要。
VPA血藥濃度通常通過血液生化檢測,這需要對患者進(jìn)行采血,并且其檢測過程不僅耗時(shí)還需投入較高經(jīng)濟(jì)成本。因此,開發(fā)VPA血藥濃度預(yù)測模型成為了近年來的研究焦點(diǎn)[6]。傳統(tǒng)的VPA藥代動(dòng)力學(xué)預(yù)測模型主要包括一室模型[6]、二室模型[7]、群體藥代動(dòng)力學(xué)模型[8]以及基于生理的藥代動(dòng)力學(xué)模型[9]4種。然而,由于藥代動(dòng)力學(xué)的高度非線性和多因素影響,使得藥代動(dòng)力學(xué)預(yù)測模型的構(gòu)建頗具挑戰(zhàn)性。隨著機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,VPA血藥濃度預(yù)測建模成為可能,且國內(nèi)外相關(guān)研究已經(jīng)取得了一定成果,如有研究者通過構(gòu)建模型來預(yù)測癲癇患者轉(zhuǎn)氨酶異常升高情況[10]、老年癲癇患者血藥濃度[11]、兒科抗癲癇血藥濃度[12]以及精神類疾病患者血藥濃度[13]等。鑒于此,本研究回顧性采集了西安國際醫(yī)學(xué)中心醫(yī)院的真實(shí)世界數(shù)據(jù),構(gòu)建了用于VPA血藥濃度預(yù)測的三分類和二分類模型并比較了其性能,旨在輔助臨床制定更精確的用藥方案。
1 資料與方法
1.1 研究對象與樣本收集
收集2022 年11 月-2024 年9 月在西安國際醫(yī)學(xué)中心醫(yī)院服用VPA 并接受血藥濃度檢測的患者的臨床資料。患者納入標(biāo)準(zhǔn)如下:連續(xù)接受VPA 治療 4~5 個(gè)半衰期達(dá)到穩(wěn)態(tài)血藥濃度后,于下次給藥前采血的患者。本研究共納入554 例門診及住院患者(包括重癥監(jiān)護(hù)室患者),共計(jì)841 份VPA 血藥濃度數(shù)據(jù)樣本。排除VPA血藥濃度異常(低于VPA 血藥濃度檢測下限)的數(shù)據(jù)樣本28份和VPA給藥途徑不詳?shù)臄?shù)據(jù)樣本118份,最終獲得有效數(shù)據(jù)樣本695 份,涉及480 例患者。根據(jù)文獻(xiàn)報(bào)道及臨床經(jīng)驗(yàn),本研究統(tǒng)計(jì)了患者臨床資料的32 個(gè)特征,共分為5 大類,具體包括:基礎(chǔ)信息(性別、年齡、身高、體重),給藥相關(guān)信息(給藥途徑、日劑量),實(shí)驗(yàn)室生化指標(biāo)[白細(xì)胞計(jì)數(shù)、血小板計(jì)數(shù)、總膽紅素、間接膽紅素 、胱 抑 素 C、丙 氨 酸 轉(zhuǎn) 氨 酶(alanine transaminase,ALT)、天冬氨酸轉(zhuǎn)氨酶(aspartate transaminase,AST)、白蛋白(albumin,ALB)、肌酐(creatinine,Cr)、肌酐清除率(creatinine clearance rate,CCR)],合并癥(高同型半胱氨酸血癥、糖尿病、高血壓、電解質(zhì)紊亂、肝病、腎病、感染、低蛋白血癥)以及合并用藥(使用碳青霉烯類抗生素、具有酶誘導(dǎo)作用的抗癲癇藥、其他抗癲癇藥、質(zhì)子泵抑制劑、組胺 H2 受體拮抗劑、蛋白酶抑制劑、護(hù)肝藥、抗精神病藥)。本研究經(jīng)西安國際醫(yī)學(xué)中心醫(yī)院倫理委員會(huì)批準(zhǔn)(批準(zhǔn)號:GJYX-KY-2024-032),在研究過程中采用的數(shù)據(jù)已完全刪除患者隱私信息。
1.2 數(shù)據(jù)預(yù)處理與規(guī)范化
(1)分類特征的數(shù)值化:將合并癥和合并用藥情況轉(zhuǎn)換為二進(jìn)制數(shù)值(“1”代表存在/使用,“0”代表不存在不使用);同樣地,將性別和給藥途徑也轉(zhuǎn)換為二進(jìn)制數(shù)值(“1”代表男性/靜脈給藥,“ s0 ”代表女性/口服給藥)。
(2)臨床資料特征的缺失值填充:695 份數(shù)據(jù)樣本中,僅有285份樣本的數(shù)據(jù)完整,臨床資料特征的缺失比例 具 體 為 :身 高 29.74% ),體 重( 28.59% ),CCR( 26.58% ), Cr(15.8%) ),間接膽紅素( 19.54% ),胱抑素C( 16.09% ) ,ALB ( 13.22% ) ,ALT ( 11.21% ) ,AST( 11.93% ),白細(xì)胞計(jì)數(shù) (11.64% ),血小板計(jì)數(shù)( .11.64% ),總膽紅素( 10.78%) ),日劑量 3.59% ),年齡 (0.14%) )。本研究按照缺失值的常規(guī)填充步驟,采用中位數(shù)填充法對缺失的臨床資料特征進(jìn)行填充。
(3)數(shù)值特征的歸一化:對所有數(shù)值特征執(zhí)行歸一化處理。
1.3 目標(biāo)數(shù)據(jù)集的構(gòu)建
(1)三分類模型數(shù)據(jù)集:VPA 的有效血藥濃度為50~100μg/mL 。因此,本研究將VPA 血藥濃度作為目標(biāo)變量結(jié)果,分為不足組( lt;50μg/mL,n=278? )、正常組( '50~100μg/mL , n=377 )和超限組 ?gt;100μg/mL , n= 40),構(gòu)成三分類模型數(shù)據(jù)集。分別將不足組、正常組和超限組內(nèi)的樣本取 80% ,重新組合為訓(xùn)練集( n=556 ),將各組剩余的 20% 樣本重新組合為測試集( ζn=139ζ )。為避免因超限組樣本數(shù)量較少引起的樣本不均衡問題,本研究采用 SMOTE 算法(參數(shù)為 sampling_strategy Ψ=Ψ 'auto')對訓(xùn)練集數(shù)據(jù)進(jìn)行了增強(qiáng)。經(jīng)數(shù)據(jù)增強(qiáng)處理后,訓(xùn)練集內(nèi)超限組和不足組的樣本數(shù)量均擴(kuò)增到訓(xùn)練集內(nèi)正常組樣本數(shù)量,即302例。
(2)二分類模型數(shù)據(jù)集:從695 份VPA 血藥濃度樣本中移除超限組的40份樣本數(shù)據(jù),將目標(biāo)變量簡化為不足組( lt;50μg/mL , n=278. )和正常組 '50~100μg/mL ,n=377 ),構(gòu)成二分類模型的數(shù)據(jù)集。與三分類模型數(shù)據(jù)集的劃分相似,正常組和不足組內(nèi)的所有樣本數(shù)據(jù)也按照8∶2 的比例進(jìn)行劃分,并組合成訓(xùn)練集(
)和測試集(
)。需要指出的是,二分類模型與三分類模型的數(shù)據(jù)集構(gòu)建過程是相互獨(dú)立的,相關(guān)樣本數(shù)據(jù)是隨機(jī)選取的(隨機(jī)種子不同)。
1.4 模型特征的選取
考慮到三分類模型和二分類模型所采用的數(shù)據(jù)集大小并不相同,本研究采用XGBoost 算法(XGBoost 特征篩選具有較高的穩(wěn)健性)對特征重要性進(jìn)行評分,以對這2種分類方法的模型特征變量進(jìn)行排序和選取。在得到各模型的特征排序后,從排名前10位的特征開始訓(xùn)練模型,觀測模型準(zhǔn)確率,并依次遞增特征數(shù)量,直至分類模型的準(zhǔn)確率基本收斂到穩(wěn)定值,將收斂時(shí)的特征選取為模型特征。
1.5 模型構(gòu)建與性能評價(jià)
結(jié)合上述XGBoost方法選取出的特征,分別構(gòu)建針對VPA 血藥濃度預(yù)測的三分類以及二分類模型。本研究采用隨機(jī)森林(Random Forest)、梯度提升決策樹(Gradient Boosting Decision Tree,GBDT)、自適應(yīng)提升算法(Adaptive Boosting,AdaBoost)等 12 種常見的機(jī)器學(xué)習(xí)算法構(gòu)建預(yù)測模型。為了更加公平地比較各種算法的性能,各算法均使用XGBoost算法選擇的相同特征子集進(jìn)行訓(xùn)練。訓(xùn)練過程的調(diào)優(yōu)過程為:在過采樣后的訓(xùn)練數(shù)據(jù)集合內(nèi),對各模型的參數(shù)進(jìn)行超參數(shù)組合,并進(jìn)行超參數(shù)空間的有限窮舉網(wǎng)格搜索,最后利用5折交叉驗(yàn)證法篩選最優(yōu)超參數(shù)組合。
本研究通過準(zhǔn)確率、F1分?jǐn)?shù)以及受試者工作特征曲線 下 面 積(area under the working characteristic curve,AUC)3個(gè)指標(biāo)對模型的性能進(jìn)行比較,并挑選出表現(xiàn)最佳的模型進(jìn)行深入分析。其中,準(zhǔn)確率反映了模型正確分類的樣本占總樣本的比例,但當(dāng)樣本分布不均時(shí),其可能會(huì)產(chǎn)生誤導(dǎo)性結(jié)果;F1分?jǐn)?shù)是精確率和召回率的調(diào)和平均值,能夠更加全面地評價(jià)模型的性能[13];AUC 能夠綜合反映模型的整體分類能力,并具有區(qū)分正、負(fù)樣本的能力以及模型的泛化能力。為了進(jìn)一步提升模型的穩(wěn)健性,本研究還采用機(jī)器學(xué)習(xí)領(lǐng)域常用的5倍交叉驗(yàn)證法來驗(yàn)證這12種機(jī)器學(xué)習(xí)方法的性能。此外,本研究對三分類和二分類模型的最優(yōu)方法分別進(jìn)行了敏感性分析,即分析模型對輸入數(shù)據(jù)微小變動(dòng)的穩(wěn)健性。模型敏感性分析的過程為:通過在測試集上疊加高斯噪聲(強(qiáng)度為特征標(biāo)準(zhǔn)差的0.005倍)生成擾動(dòng)數(shù)據(jù);重復(fù)100次迭代后分別用擾動(dòng)數(shù)據(jù)預(yù)測模型,統(tǒng)計(jì)每次迭代的預(yù)測準(zhǔn)確率;最后計(jì)算所有準(zhǔn)確率的平均值和標(biāo)準(zhǔn)差以量化模型預(yù)測的穩(wěn)定性。
1.6 統(tǒng)計(jì)學(xué)方法
采用Python 進(jìn)行數(shù)據(jù)分析。采用K-S 檢驗(yàn)對數(shù)據(jù)特征的連續(xù)變量進(jìn)行正態(tài)性檢驗(yàn),發(fā)現(xiàn)數(shù)據(jù)均不符合正態(tài)分布,故采用 M(P25,P75) 表示,不同分類模型中2個(gè)數(shù)據(jù)集之間的差異采用秩和檢驗(yàn)進(jìn)行比較;計(jì)數(shù)資料用例數(shù)或百分比 (%) 表示,不同分類模型中2 個(gè)數(shù)據(jù)集之間的差異采用卡方檢驗(yàn)進(jìn)行比較。
2 結(jié)果
2.1 2類模型的數(shù)據(jù)基線特征比較
2 類模型采用的數(shù)據(jù)集的基線特征見表1。結(jié)果顯示,在三分類模型中,僅給藥途徑(口服)在訓(xùn)練集和測試集中差異具有統(tǒng)計(jì)學(xué)意義
),其余指標(biāo)差異均無統(tǒng)計(jì)學(xué)意義( Pgt;0.05) );在二分類模型中,性別(男)、合并使用其他抗癲癇藥、合并使用蛋白酶抑制劑在訓(xùn)練集和測試集中差異具有統(tǒng)計(jì)學(xué)意義 (Plt;0.05) ),其余指標(biāo)差異均無統(tǒng)計(jì)學(xué)意義 ?Pgt;0.05 )。
2.2 2類模型的特征評分及特征選取結(jié)果
采用XGBoost排序的特征進(jìn)行模型訓(xùn)練,當(dāng)特征數(shù)量遞增到16個(gè)時(shí),各分類模型的準(zhǔn)確率基本收斂到穩(wěn)定值,此時(shí)各分類模型前16個(gè)特征的重要性評分之和已經(jīng)超過了 97% 。因此,本研究采用前16個(gè)特征進(jìn)行模型訓(xùn)練,其詳細(xì)信息見表2。根據(jù)表2 可知:(1)在三分類和二分類模型的前16 個(gè)特征中,相同特征有15 個(gè)。(2)合并腎病和合并電解質(zhì)紊亂對2個(gè)模型的影響差異較大。其中,合并腎病在三分類模型中的XGBoost 評分排第1位,但在二分類模型中的評分僅排第15位;合并電解質(zhì)紊亂在三分類模型中的XGBoost 評分排第3 位,但未出現(xiàn)在二分類模型中。(3)結(jié)合2類模型的數(shù)據(jù)基線特征比較結(jié)果和表2可以看出,盡管性別(男)這一特征在訓(xùn)練集與測試集間存在分布差異( (Plt;0.05) ),但其在XGBoost模型特征重要性排名中位列第4位(二分類模型中),表明該特征與VPA血藥濃度關(guān)聯(lián)性較強(qiáng),仍具有潛在預(yù)測價(jià)值,故保留用于模型訓(xùn)練。
2.3 2類模型的性能分析結(jié)果
12 種機(jī)器學(xué)習(xí)方法在不同分類模型中的性能分析結(jié)果見表3。
2.3.1 三分類模型中的結(jié)果
由表3 可知,在三分類模型中,以Random Forest 方法的表現(xiàn)最佳,其訓(xùn)練集中5倍交叉驗(yàn)證的性能指標(biāo)為:準(zhǔn)確率 0.716 3、F1 分?jǐn)?shù) 0.714 1;測試集中的性能指標(biāo)為:準(zhǔn)確率0.705 0、F1 分?jǐn)?shù)為0.704 0。值得注意的是,在三分類模型中,各機(jī)器學(xué)習(xí)方法的測試集性能普遍低于訓(xùn)練集,這暗示了數(shù)據(jù)分布的不一致性以及存在過擬合的可能性。圖1 進(jìn)一步展示了Random Forest 方法在三分類模型中的學(xué)習(xí)曲線。從圖1可以看出,訓(xùn)練集的準(zhǔn)確率始終接近于1,即訓(xùn)練集的擬合程度較高;然而,當(dāng)訓(xùn)練集樣本數(shù) lt;500 時(shí),其準(zhǔn)確率基本不超過0.5;隨著訓(xùn)練集樣本數(shù)的增加,其交叉驗(yàn)證準(zhǔn)確率最終穩(wěn)定在0.72左右,與訓(xùn)練準(zhǔn)確率差異較大。
此外,Random Forest 方法在三分類模型中的AUC計(jì)算結(jié)果顯示:(1)不足組 vs. (正常組 + 超限組),AUC =0.24 ,表明模型對“不足”類別與正常組 + 超限組的區(qū)分效果差;(2)正常組 vs. (不足組 + 超限組),AUC :=0.21 ,表明模型對“正常”類別與不足組 + 超限組的區(qū)分效果差;(3)超限組 vs. (不足組 + 正常組),AUC =0.89 ,表明模型對“超限”類別與不足組 + 正常組的區(qū)分效果較好。
表1 2類模型采用的數(shù)據(jù)集基線特征

表2 不同分類模型前16個(gè)特征的XGBoost重要性評分

將上述3個(gè)AUC結(jié)果融合得到Random Forest方法在三分類模型中的平均AUC為0.519 3,綜合學(xué)習(xí)曲線,提示三分類模型存在過擬合問題,表明超限組與其他組(不足組 + 正常組)的樣本分布存在顯著差異,三分類模型的可靠性較低,泛化能力較差。
2.3.2 二分類模型中的結(jié)果
在二分類模型中CatBoost 方法為最優(yōu),其訓(xùn)練集5倍交叉驗(yàn)證的性能指標(biāo)為:準(zhǔn)確率0.668 8、F1 分?jǐn)?shù)為0.668 5;測試集的性能指標(biāo)為:準(zhǔn)確率0.786 3、F1 分?jǐn)?shù)0.785 7、AUC 0.819 5,對不足組和正常組的區(qū)分效果較好。由于二分類模型數(shù)據(jù)樣本分布較為均衡,其測試集準(zhǔn)確率和F1 分?jǐn)?shù)均能有效反映模型性能。此外,各機(jī)器學(xué)習(xí)方法在二分類模型測試集的性能指標(biāo)超過了訓(xùn)練集的性能,這表明模型在訓(xùn)練過程中已經(jīng)充分掌握了數(shù)據(jù)的特征和規(guī)律,達(dá)到了較好的性能。
表3 不同分類模型中各機(jī)器學(xué)習(xí)方法的性能指標(biāo)

圖1 三分類模型中的Random Forest方法的學(xué)習(xí)曲線

2.4 模型敏感性分析結(jié)果
圖2 和圖3 分別展示了2 類模型中最優(yōu)機(jī)器學(xué)習(xí)方法的敏感性分析的準(zhǔn)確率分布直方圖,具體結(jié)果為:三分類模型中Random Forest方法敏感性分析的準(zhǔn)確率平均值為 0.680 4、標(biāo)準(zhǔn)差為 0.016 5,二分類模型中 Cat‐Boost 方法敏感性分析的準(zhǔn)確率平均值為0.761 8、標(biāo)準(zhǔn)差為0.010 1。
圖2 三分類模型Random Forest方法敏感性分析的準(zhǔn)確率分布

3 討論
本研究采用綜合性醫(yī)院的真實(shí)世界數(shù)據(jù),運(yùn)用12種機(jī)器學(xué)習(xí)方法構(gòu)建了用于預(yù)測VPA 血藥濃度的三分類和二分類模型。在三分類模型中,Random Forest方法表現(xiàn)最佳,其測試集F1 分?jǐn)?shù)為0.704 0;而在二分類模型中,CatBoost 方法最優(yōu),其測試集F1 分?jǐn)?shù)為0.785 7。通過XGBoost重要性評分發(fā)現(xiàn),三分類和二分類模型的16個(gè)特征中有15 個(gè)相同,僅合并電解質(zhì)紊亂和給藥途徑(口服)2個(gè)特征在2個(gè)模型中有所不同。這些特征組成及導(dǎo)致其在不同模型中排名高低的潛在原因包括:(1)患者的年齡、性別、體重及日劑量是影響VPA 清除率的關(guān)鍵協(xié)變量,進(jìn)而影響了VPA 的血藥濃度[7]。(2)合并使用碳青霉烯類抗生素(如美羅培南、亞胺培南)后VPA血藥濃度顯著降低,會(huì)增加癲癇發(fā)作風(fēng)險(xiǎn)[5,14];再者,合并使用具有酶誘導(dǎo)作用的抗癲癇藥(如卡馬西平、苯巴比妥、苯妥英鈉)會(huì)降低VPA血藥濃度,可能誘發(fā)驚厥或癲癇發(fā)作[15]。(3)肝、腎功能指標(biāo)如AST、ALT、胱抑素C 等異常會(huì)影響VPA 的代謝與排泄,導(dǎo)致VPA 血藥濃度升高[16―18]。(4)VPA血藥濃度與血液毒性相關(guān),VPA血藥濃度升高可能會(huì)導(dǎo)致血小板和白細(xì)胞計(jì)數(shù)異常[19―20]。(5)VPA的超限可能會(huì)引起代謝性酸中毒,繼而造成電解質(zhì)紊亂[21]。
圖3 二分類模型CatBoost 方法敏感性分析的準(zhǔn)確率分布

相較于其他研究,本研究展現(xiàn)了3 個(gè)顯著特點(diǎn):(1)樣本源自綜合性醫(yī)院,覆蓋多科室、多病種、多患者來源,還包括VPA血藥濃度超限的樣本,數(shù)據(jù)集多樣性強(qiáng),在三分類模型中測試集的F1分?jǐn)?shù)達(dá) 0.7040(2) 本研究是在剔除超限組樣本數(shù)據(jù)后完成的二分類建模,即便樣本量相對較小,但二分類模型中測試集的F1 分?jǐn)?shù)仍達(dá)到0.785 7,接近大樣本模型性能[13]。(3)本研究通過比較三分類和二分類模型的XGBoost特征排名,發(fā)現(xiàn)合并腎病和合并電解質(zhì)紊亂與VPA血藥濃度超限關(guān)聯(lián)性強(qiáng);此外,本研究通過對比三分類和二分類模型的AUC值,發(fā)現(xiàn)2類模型性能存在較大差異的主要原因?yàn)槌藿M樣本量少(僅占樣本總數(shù)的 5.76% ),超限組與其他2 組數(shù)據(jù)分布差異較大。
盡管本研究中的模型展現(xiàn)出了較好的分類效果,但仍存在若干局限性:(1)本研究采用的數(shù)據(jù)樣本量較小,原因在于所選醫(yī)院運(yùn)行時(shí)間不足5年,且納入的數(shù)據(jù)不足2年,導(dǎo)致實(shí)際有效數(shù)據(jù)積累時(shí)間較短,這對模型性能的提升產(chǎn)生了不利影響。(2)由于數(shù)據(jù)集源自綜合性醫(yī)院的實(shí)際診療流程,VPA血藥濃度超限的樣本在總體數(shù)據(jù)集中占比較低,盡管本研究采取了技術(shù)手段對樣本不均衡問題進(jìn)行了緩解,但這種樣本的不均衡性仍對三分類模型的訓(xùn)練造成了負(fù)面影響。(3)本研究所采用的訓(xùn)練和測試數(shù)據(jù)均僅來源于單一中心,這可能導(dǎo)致模型在外部的通用性不高。
4 結(jié)語
本研究利用西安國際醫(yī)學(xué)中心醫(yī)院的真實(shí)世界數(shù)據(jù)構(gòu)建了VPA 血藥濃度的三分類和二分類模型。通過對比2 種分類模型的XGBoost 特征排名,發(fā)現(xiàn)合并腎病和合并電解質(zhì)紊亂這2 個(gè)特征與VPA 血藥濃度的超限具有較強(qiáng)的關(guān)聯(lián)性。三分類模型具有VPA 血藥濃度超限的預(yù)測能力,但因其復(fù)雜的模型構(gòu)建和樣本數(shù)據(jù)分布情況,表現(xiàn)最優(yōu)的Random Forest 方法的F1 分?jǐn)?shù)僅達(dá)到0.704 0,AUC僅為0.519 3,預(yù)測能力和模型泛化能力較差;二分類模型剔除了VPA 血藥濃度超限部分的數(shù)據(jù),側(cè)重于VPA血藥濃度是否達(dá)到治療要求,雖僅能對血藥濃度不足和正常情況進(jìn)行分類預(yù)測,但具有更高的準(zhǔn)確性,其 F1 分?jǐn)?shù)達(dá)到了 0.785 7,AUC 達(dá)到了 0.819 5,預(yù)測及模型泛化能力較強(qiáng)。
參考文獻(xiàn)
[ 1 ] MARSON A,BURNSIDE G,APPLETON R,et al. TheSANAD Ⅱ study of the effectiveness and cost-effectiveness of valproate versus levetiracetam for newlydiagnosed generalised and unclassifiable epilepsy:anopen-label,non-inferiority,multicentre,phase 4,ran‐domised controlled trial[J]. Lancet,2021,397(10282):1375-1386.
[ 2 ] MARSON A G,BURNSIDE G,APPLETON R,et al. La‐motrigine versus levetiracetam or zonisamide for focal epi‐lepsy and valproate versus levetiracetam for generalisedand unclassified epilepsy:two SANAD Ⅱ non-inferiorityRCTs[J]. Health Technol Assess,2021,25(75):1-134.
[ 3 ] 陳策,鄭麗丹,謝作良,等. 雙相情感障礙住院患者的臨床特征及用藥情況的調(diào)查研究[J]. 中國全科醫(yī)學(xué),2020,23(2):245-250.
[ 4 ] HIEMKE C,BERGEMANN N,CLEMENT H W,等 . 神經(jīng)精神藥理學(xué)治療藥物監(jiān)測共識指南:2017版[J]. 實(shí)用藥物與臨床,2022,25(2):97-118.
[ 5 ] LI Z,GAO W,LIU G,et al. Interaction between valproicacid and carbapenems:decreased plasma concentration ofvalproic acid and liver injury[J]. Ann Palliat Med,2021,10(5):5417-5424.
[ 6 ] 錢金,陳順,謝新芳,等. 建立丙戊酸鈉在中國癲癇患者中的群體藥代動(dòng)力學(xué)模型[J].第二軍醫(yī)大學(xué)學(xué)報(bào),2017,38(11):1449-1453.
[ 7 ] METHANEETHORN J. A systematic review of popula‐tion pharmacokinetics of valproic acid[J]. Br J Clin Phar‐macol,2018,84(5):816-834.
[ 8 ] 張仲斌,吳曄,季雙敏,等. 不同年齡組中國癲癇患兒丙戊酸群體藥代動(dòng)力學(xué)模型的建立[J]. 中華實(shí)用兒科臨床雜志,2014,29(9):698-703.
[ 9 ] OGUNGBENRO K,AARONS L,CRESim amp; Epi-CRESimProject Groups. A physiologically based pharmacokineticmodel for valproic acid in adults and children[J]. Eur JPharm Sci,2014,63:45-52.
[10] MA H Y,HUANG S H,LI F X,et al. Development andvalidation of an automatic machine learning model to pre‐dict abnormal increase of transaminase in valproic acid-treated epilepsy[J]. Arch Toxicol,2024,98(9):3049-3061.
[11] MA P,SHANG S L,HUANG Y F,et al. Joint use of popu‐lation pharmacokinetics and machine learning for predic‐tion of valproic acid plasma concentration in elderly epi‐leptic patients[J]. Eur J Pharm Sci,2024,201:106876.
[12] DAMNJANOVI? I,TSYPLAKOVA N,STEFANOVI?N,et al. Joint use of population pharmacokinetics and ma‐chine learning for optimizing antiepileptic treatment in pe‐diatric population[J]. Ther Adv Drug Saf,2023,14:20420986231181337.
[13] HSU C W,LAI E C,CHEN Y B,et al. Valproic acid moni‐toring:serum prediction using a machine learning frame‐work from multicenter real-world data[J]. J Affect Disord,2024,347:85-91.
[14] 杜欣,李欣燚,謝曉慧,等. 碳青霉烯類藥物對丙戊酸血藥濃度影響及兩藥聯(lián)用后癲癇發(fā)作影響因素:文獻(xiàn)Meta分析[J].中國醫(yī)院藥學(xué)雜志,2021,41(4):395-399.
[15] 林小燕,林燕玲,莊俊鵬. 癲癇患者丙戊酸鈉血藥濃度的影響因素[J]. 臨床合理用藥,2024,17(36):59-62.
[16] 張文濱,林燕,蔡優(yōu)生,等. 丙戊酸鈉血藥濃度影響因素及不良反應(yīng)分析[J]. 臨床合理用藥,2024,17(10):33-36.
[17] 董露露,鄒素蘭,凌靜.肝功能異常患者丙戊酸鈉血藥濃度的影響因素分析[J]. 淮海醫(yī)藥,2022,40(4):346-349.
[18] 王利媛,段自皞,李晶,等. 基于游離丙戊酸血藥濃度開展丙戊酸鈉劑量調(diào)整的藥學(xué)實(shí)踐1例[J].中國醫(yī)院藥學(xué)雜志,2023,43(1):117-120.
[19] ACHARYA S,BUSSEL J B. Hematologic toxicity of so‐dium valproate[J]. J Pediatr Hematol Oncol,2000,22(1):62-65.
[20] NASREDDINE W,ATWEH S F,BEYDOUN A A,et al.Predicting the occurrence of thrombocytopenia from freevalproate levels:a prospective study[J]. Seizure,2022,94:33-38.
[21] 王之舟,程紅勤,白向榮,等. 丙戊酸鈉致高乳酸血癥伴代謝性酸中毒[J]. 藥物不良反應(yīng)雜志,2020,22(6):379-380.(收稿日期:2025-01-22 修回日期:2025-05-06)