武建卓,彭潔,王婷婷,李雪
(廣東省藥品檢驗所,國家藥品監督管理局藥品快速檢驗技術重點實驗室,廣東 廣州 510663)
紅霉素為大環內酯類多組分抗生素,目前評價其質量的關鍵項目含量測定的基本方法是微生物檢定法。該法存在操作步驟多,試驗過程長,影響結果的人為因素多等缺點。多組分抗生素不同組分生物活性存在差異,且各組分之間的活性存在協同或拮抗等情況,組效之間是非線性關系,不能簡單用組分含量等理化測定結果來準確表征藥品質量[1]。為此,引入GA-BP神經網絡,對多組分抗生素的高度非線性化學成分表征信息和效價進行處理,綜合運用模式識別技術中的各種計算方法和手段才可能有效地解決多組分抗生素質量評價難題,實現基于儀器分析數據之上的多組分抗生素質量智能辨識與評價,以期替代傳統的微生物檢定法。
遺傳算法(GA)是模擬自然演化過程搜索全局最優解的方法,它的群體性搜索策略使其不易陷入局部最優,而且其定義域可以任意設定,使得遺傳算法的應用范圍大大擴展,方便與其他算法相結合。BP神經網絡算法本質上為梯度下降法,所以容易陷入局部最優。鑒于遺傳算法的優點和BP 網絡存在的缺陷,本文將兩者結合使用,利用遺傳算法不易陷入局部最優的特性,補償BP神經網絡梯度下降易于陷入局部最優的缺陷[2]。
本試驗收集了紅霉素腸溶片的組分測定和效價測定數據,采用GA-BP人工神經網絡技術建立模型,對網絡模型進行學習后對紅霉素腸溶片效價進行預測,并對預測準確度進行了研究,本試驗利用Python 編程軟件實現。
1.1 儀器 Shimadzulc-20AT液相色譜儀;Agilent 1260高效液相色譜儀;ZY300-IV抑菌圈測量儀;C2933隔水式培養箱。
1.2 試藥 紅霉素標準品(批號:130307-201417)與紅霉素系統適用性對照品(批號:130670-201501)由中國食品藥品檢定研究院提供;紅霉素雜質A、紅霉素雜質B、紅霉素雜質C、紅霉素雜質D、紅霉素雜質E與紅霉素雜質F對照品由Toronto Research Chemicals Inc提供;紅霉素B與紅霉素C為《歐洲藥典》(EP)對照品;甲醇與乙腈為色譜純,由Honeywell International Inc提供;水為超純水,其余試劑均為分析純。
本試驗總共測定了552批次的紅霉素腸溶片樣品,其中235批次紅霉素腸溶片來自2012年國家評價性抽驗,涉及的生產企業37個,涉及批準文號數38個,原料藥來自紅霉素5個主流原料生產廠的原料;317批次紅霉素腸溶片來自2017年國家評價性抽驗,涉及的生產企業28個,涉及批準文號數28個,原料藥來自紅霉素3個主流原料生產廠的原料。
2.1 紅霉素腸溶片組分測定[3]按照《中國藥典》2020年版(二部)紅霉素項下“紅霉素組分”條件測定,按扣除輔料峰外峰面積歸一化法計算供試品中紅霉素組分A、紅霉素組分B、紅霉素組分C、雜質A、雜質B、雜質C、雜質D、雜質E、雜質F和總雜質的百分含量。圖譜見圖1~2。

圖1 系統適用性圖譜

圖2 供試品圖譜
2.2 紅霉素腸溶片效價測定 參照《中國藥典》2020年版(二部)附錄抗生素微生物檢定法進行測定。
2.3 GA-BP人工神經網絡的構模、訓練和預測
2.3.1 BP網絡的結構設計 根據紅霉素腸溶片組分含量來推斷其效價,類似于天然藥物定量組效關系的研究,適合采用GA-BP人工神經網絡實現較準確的定量預測[4]。網絡結構的設計包括確定輸入與輸出層的節點數目、隱層的數目、每個隱層節點的數目。根據紅霉素腸溶片組分測定數據集,選擇紅霉素組分A、紅霉素組分B、紅霉素組分C、雜質A、雜質B、雜質C、雜質D、雜質E、雜質F和總雜質共10個變量因素作為網絡的輸入數據,以抗生素微生物檢定法測得的效價作為網絡的輸出數據。根據Kolmogorov定理,三層BP網絡充分學習后能逼近任何函數,因此構建三層結構的BP神經網絡。隱含節點數的確定有很多經驗法則,本文取2n+1個的隱含層結點數,其中n為輸入層的結點個數。因此這里隱含層結點數為21個。輸出層包含1個節點,輸出紅霉素腸溶片效價[5-8]。
2.3.2 GA-BP人工神經網絡的參數設置[9-10]GA初訓練參數設置:設置種群規模N=50、交叉概率為0.85、變異概率為0.05、最大進化代數1 000,當最優個體的適應度函數比值E<1.05時訓練結束。
BP神經網絡參數設置:初訓練結束后,改用BP算法進行局部搜索。訓練過程中,訓練要求精度為0.001、最大失敗次數20、學習速率為0.1,最大訓練次數1 000,其他參數為默認值,經多次訓練直至達到誤差限。
2.4 紅霉素腸溶片組分測定數據統計情況 本試驗共獲得552批次紅霉素腸溶片測定數據,設置訓練組和測試組,其中訓練組隨機抽取502個批次測定樣品數據用于構建模型,測試組則取剩余50個批次測定樣品數據用于評價模型的預測能力。對兩組數據采用T檢驗比對各組分含量,結果兩組差異無統計學意義,有可比性,結果見表1。

表1 紅霉素腸溶片的樣本數據統計情況
2.5 紅霉素腸溶片效價預測 對測試組的50個批次紅霉素腸溶片樣品的效價進行預測,并與實際測定效價數據進行比較,檢驗預測效果。結果預測效價誤差百分率最高值為-4.61%,均未超過5%,誤差百分率平均值為2.22%,優于一般儀器分析相對標準偏差2.50%,說明模型具有較高的效價預測精度,而且穩定性也較好,因而具有較強的預報能力。結果見表2。

表2 紅霉素腸溶片測定效價與預測效價的比較
目前,《中國藥典》2020年版應用微生物檢定法進行含量測定的抗生素品種仍有84個。由于微生物檢定法操作步驟復雜,試驗周期長,對操作人員技術熟練度和操作細致度要求高等諸多缺點,采用微生物檢定方法進行含量測定的比重正在不斷縮小,尤其在《歐洲藥典》《英國藥典》中HPLC法具有明顯的替代趨勢。但是由于國內絕大多數多組分抗生素的量效統一工作尚未完成,各化學成分的含量還無法完整的反應藥品的內在質量情況,HPLC 法的替代應用還是要審慎進行。
本文針對紅霉素類抗生素為多組分抗生素的特點,引入GA-BP神經網絡,對多組分抗生素的高度非線性化學成分表征信息和效價進行處理,在多種化學組分與藥物效價間建立起定量關系模型,通過預測效價值來評價藥品質量,替代傳統的微生物檢定法,改善多組分抗生素微生物檢定法測定中諸多缺陷,提高多組分抗生素的質量控制水平,從實際結果來看,取得了不錯的效果。