何建春,夏茂寧,趙 倩
(1.重慶市大足區人民醫院,重慶 402360;2.四川輕化工大學,四川 自貢 643000)
HBV血清是檢測患者是否感染HBV的鑒定標準,目前已有學者表明采用醋酸纖維素膜與料銀納米顆粒SERS相結合的簡單方法進行血清蛋白分離和生化分析,其中銀納米顆粒是通過使用硝酸鹽和鹽酸羥胺制作而成的,加入銀納米顆粒可以增強蛋白質拉曼信號,另外,醋酸纖維素膜除了能除去蛋白質以外,還能除去其他各種化學成分,為血清檢測提供了一種獨特的蛋白檢測手段。進一步提高HBV血清的識別度。同時醋酸纖維素膜與銀納米顆粒可以與血清中的氨基酸、維生素、無機鹽、葡萄糖和蛋白質等無機、有機混合物發生一定反應,進一步促進血清檢測效率。
目前對血清檢測通常采用拉曼光譜,而拉曼光譜分析法具有非接觸、速度快以及無損的優點[1-3],近年來拉曼光譜分析成為有機化學、材料科學、生物醫學等研究領域的研究熱點問題[4-5]。拉曼光譜進行生物樣品檢測時,樣品無需進行前置處理并且樣品用量少。由于拉曼光譜資料具有特征峰多、數據維數大等缺陷,因此能夠獲得較好的生物樣本資料;拉曼光譜對生物探測的準確性有直接的影響。為了提高HBV血清檢測的精度,降低拉曼光譜的冗余信息和特征峰值數量,提出一種基于連續投影法的拉曼光譜特征波長篩選和灰狼優化算法優化極限學習機[6]的HBV血清檢測模型。在醋酸纖維素膜與銀納米顆粒對血清進行分離的基礎上,針對HBV血清拉曼光譜數據具有維度高、非線性強的特點,將拉曼光譜、連續投影法、主組分法等多種光譜的特征篩查進行了比較,并初步建立了一種用于 HBV的熒光光譜的光譜特性波長選擇。考慮到 ELM模式的參數設定會對 ELM模式進行性能的影響,采用 GWO方法進行 ELM模型的參數優選,并采用GWO-ELM方法進行了基于GWO-ELM的 HBV病毒抗體的識別。與PSO-ELM、GA-ELM和ELM相比,GWO-ELM的HBV血清檢測模型的識別精度最高,為HBV血清檢測提供了新的方法。
銀納米顆粒是通過使用硝酸鹽和鹽酸羥胺生產的。首先將10 mL鹽酸羥胺溶液(6×10-2mol/L)與9 mL氫氧化鈉溶液(10-2mol/L),并將混合物加入到180 mL硝酸銀(1.11×10-3mol/L)中,然后將混合溶液在室溫下連續攪拌15 min。銀納米顆粒的尺寸遵循平均直徑為45 nm,標準偏差為8 nm。
為驗證本文方法進行拉曼光譜生物醫學檢測的效果,選取2例 HBV病人的血樣和2例正常人群的血樣進行檢測。10 μL的血清用吸管在醋酸纖維薄膜上進行標記;1 min后,該標本已被膜完全吸附。之后,將包含血清的醋酸酯薄膜的部位切開,并在包含10 mL冰乙酸、90 mL體積分數95%酒精和100 mL超級純水的緩沖劑中清洗,以除去包含在血漿中的其他成分(諸如電解質和某些外來物質),并且將血漿蛋白質僅保留在醋酸纖維薄膜中。隨后,將僅含有血清蛋白的醋酸纖維素膜切割并收集在管中,并向管中加入60 μL乙酸,目的是將醋酸纖維素膜的片段溶解到透明溶液中。之后,將 140 μL 膠體銀納米顆粒加入試管中。將管置于37 ℃溫水中,將混合物攪拌30 min。在此過程中,絮狀沉淀物(溶解的膜碎片)出現在管中。離心后(1 000 r/min,10 min),收集 10 μL 上清液(蛋白質-銀納米顆粒混合物)并轉移到鋁板上進行拉曼光譜測量,選取每個樣品的中心位置,分別測試得到50組拉曼光譜數據。首先使用離心機提取全血的血清,然后在測試晶片上用棉花蘸取血液樣本,待血清風干之后進行檢測。用拉曼光譜測定血清,用最高峰值的拉曼光譜進行規范化處理,得到拉曼光譜圖。在圖1、圖2及圖3、圖4分別為2個正常人的血清和2個B型感染人的血清。

圖1 測試區域和光譜圖Fig.1 Test area and spectrogram

圖2 測試區域和光譜圖 Fig.2 Test area and spectrogram

圖3 測試區域和光譜圖Fig.3 Test area and spectrogram

圖4 測試區域和光譜圖Fig.4 Test area and spectrogram
標準的GWO算法包括3種行為:包圍行為、捕獵行為以及攻擊行為[7]。
1.2.1包圍行為
這一階段,按照式(1)和(2)式對灰狼進行圍捕:
(1)
(2)
1.2.2捕獵行為
α、β、δ分別為最優解、第2解和第3解,則α、β、δ根據式(3)~式(5)可以重新定位[8]:
(3)
(4)
(5)

(6)
(7)
(8)
(9)
1.2.3攻擊行為
該階段,狼群攻擊捕獲獵物。當|A|≤1時,狼接近目標(X*,Y*)并將目標鎖定在目標身上;當|A|>1時,狼從他們的捕食范圍內移開,去找新的目標。
ELM模型的輸入層權重值與隱含層偏置值初始值是隨機產生,通過反復訓練,不斷調整逼近期望輸出。為改進ELM模型初始權值和隱含層偏置對檢測結果的影響,提高ELM模型的性能,本文采用GWO算法優化ELM模型參數,將平均誤差作為適方函數的選取[9]:
(10)
式中:Ti和Oi是第一采樣的真實值和期望值;k用于培訓的樣本數目;wmin、wmax分別為輸入權值w的取值上限和下限[10-12];bmin、bmax分別為隱含層偏置b的取值上限和下限。
基于GWO改進ELM模型的血清檢測的算法流程如下。
Step1:讀取乙肝血清近紅外拉曼光譜數據,并過程進行標準化,同時對測試數據進行分割:
(11)
式中:拉曼光譜的最大值和最小值是xmax和xmin;LB和UB為標準化后的Raman譜的最大值和最小值,取LB=-1,UB=1;x和xnew為原始拉曼光譜數據與歸一化處理之后的拉曼光譜數據;
Step2:固定 GWO的方法主要包括:最大迭代數Tmax;搜索維D;群體規模N;w和b的搜尋區間是[wmin,wmax]和[bmin,bmax]。將灰狼群的初始群體進行隨機初始化,各群體的位置與ELM模式的輸入權重及隱含層偏差的參數結合(w,b);
Step3:每個灰狼種的適應程度由式(10)來計算[13];
Step4:根據適應程度的不同,灰狼的數量被分為2類α、β、δ和ω;
Step5:按照式(3)~式(5)更新灰狼種群個體的位置;
Step6:計算灰狼群中的更新點的適應程度f(w,b)new,并與上一代最優適應度f(w,b)best相比較,如果f(w,b)new>f(w,b)best,則該灰狼種群個體適應度f(w,b)new替換掉f(w,b)best,并且保存這一群體的個體的地理分布;否則,保留f(w,b)best;
Step7:判定方法結束條件,如果目前的迭代數為t>Tmax,則該方法結束,并給出最優化的最優化位置,也就是ELM的最佳參數(w*,b*)。相反,則回到Step3到Step6的迭代式;
Step8:運用ELM模型的最優參數組合(w*,b*)對測試數據進行血清檢測[14]。
基于GWO改進ELM模型的HBV血清檢測的建模流程可以描述:
(1)選擇血清樣本;
(2)采集HBV者和正常人的拉曼光譜;
(3)拉曼光譜數據預處理;
(4)建立HBV血清GWO-ELM檢測模型;
(5)HBV血清檢測模型的驗證。
拉曼光譜的預處理技術主要有:一階導數、二階導數、多元散射以及標準化的正態變化法[15]。原始數據在表1中顯示了各種預加工模式下的模型探測。

表1 不同預處理方式的建模檢測結果對比Tab.1 Comparison of modeling test results with different pretreatment methods
由表1可知,使用多重散射修正(MSC)進行模型檢驗是最佳的[16]。故本文使用 MSC的拉曼光譜化學分析進行了預處理,建模方法采用ELM模型。
HBV拉曼光譜資料的特征:信號峰多,數據多,HBV血清檢測模型建立之前需要先對拉曼光譜數據進行特征波長選擇。文中分別運用全波段(FS)、連續投影法[17-18](SPA)和主成分分析(PCA)進行乙肝血清近紅外拉曼光譜有效特征波長選擇。在選擇了有效特性波長之后,模型探測的結果比較如下。由表2可知,采用持續投射方法進行的 HBV血清模型試驗效果最佳。

表2 波長選擇結果對比Tab.2 Comparison of wavelength selection results
由表3可知,第1個主成分(PC1)的貢獻率為64.84%;第2個主成分(PC2)的貢獻率為26.24%,前2個主成分累計貢獻率達到了91.07%。

表3 PCA前7個主成分的貢獻率和累計貢獻率Tab.3 Contribution rate and cumulative contribution rate of the first seven principal components of PCA
從圖5可以看出,主成分數為8時,HBV血清檢測的正確率最高,均方根誤差最小。

圖5 SPA有效特征波長選擇結果Fig.5 SPA effective characteristic wavelength selection results
為了驗證GWO-ELM模型的有效性和可靠性,將GWO-ELM與PSO-ELM、GA-ELM和ELM模型進行對比[19]。ELM模型的激活函數為sig函數,為確定隱層節點數,初始隱層節點數為1時,其不斷增加,直到隱層節點數為50;不同隱層節點數的HBV血清檢測準確率如圖6所示。

圖6 隱層節點數與準確率關系圖Fig.6 Relationship between number of hidden layer nodes and accuracy
從圖6可以看出,SPA-ELM模型的隱層節點數為30時,HBV血清檢測的準確率最高,故文中ELM模型的隱層節點數設定為30。在表4中給出了各種模式的校正集合和預報集合的評估準確率。
由表4可知,在校正集和預測集上,GWO-ELM的準確率分別為92.02%和81.69%,優于PSO-ELM的90.80%和78.87%;GA-ELM的89.57%和76.06%以及ELM的88.96%和74.65%。與ELM模型相比,GWO-ELM的HBV血清檢測的準確率分別提高了3.06%和7.04%,說明GWO-ELM有效提高了HBV血清檢測的精度。

表4 不同模型評價結果Tab.4 Evaluation results of different models
為了進一步說明GWO-ELM對HBV血清檢測的有效性,將GWO-ELM與隨機森林回歸(RFR)、網格搜索優化隨機森林回歸(Grid-RFR)和粒子群優化隨機森林回歸(PSO-RFR)進行對比,對比結果如表5所示。

表5 不同算法HBV血清檢測結果Tab.5 HBV serum detection results of different algorithms
由表5可知,在校正集和測試集上,GWO-ELM模型HBV血清檢測的準確率最高。在評價指標準確率、精準率、召回率和Fscore4個評價指標上,GWO-ELM均優于PSO-RFR模型、Grid-RFR模型和RFR模型,從而驗證了GWO-ELM進行HBV血清檢測的有效性和可靠性,為HBV血清檢測提供了新的方法。
拉曼光譜技術是一種無創、無損的光學工具,可用于通過激光激發生物標本的振動和旋轉光譜信息來研究生物分子的光譜分布。血清拉曼光譜分析已被用于檢測核酸,蛋白質和脂質的存在。拉曼光譜的形狀和趨勢可能有助于識別這些分子成分的變化。一些光譜指紋可能與對疾病診斷和分類有用的特定生物標志物相關聯。早期研究還表明,使用血清拉曼光譜分析診斷HBV可能是可行的。本研究分析了2例 HBV病人的血樣和2例正常人群的血樣進行拉曼光譜檢測。分別運用全波段(FS)、連續投影法(SPA)和主成分分析(PCA)進行HBV血清近紅外拉曼光譜有效特征波長選擇。從模型探測的結果可知,采用連續投射方法進行的 HBV血清模型試驗效果最佳。機器學習技術已被用于分析高維拉曼光譜數據。且先前的研究表明,在識別性能方面,SPA算法優于其他傳統分類算法,例如FS,PCA等。
通過將ELM-GWO與優化方法集成,可以實現最佳的輸入權重和隱藏層偏差,從而保證最佳的ELM/GWO性能,從而有效識別HBV血清。極限學習機(ELM)是近年來提出的一種新算法,它基于單隱層前饋神經網絡(SLFN),解決了神經網絡中隱含層數難以確定的問題,且ELM具有學習速度更快,泛化能力好,產生獨特的最優解等特點。因此,ELM最受歡迎的改進之一是灰狼優化-極限學習機(GWO-ELM),其中GWO集成到ELM中,以獲得最佳的輸入權重和偏差。GWO是通過研究灰狼的狩獵行為而建立的,其概念簡單,易于實現,只需要很少的編碼行,允許許多人利用它。與其他進化算法相比,GWO在調節參數方面具有更高的計算效率。這種整合 (GWO-ELM) 的有效性已在本文中所證實,該方法可以有效地改善 HBV的血清學診斷的正確性。
為了提高HBV血清檢測的精度,基于連續投射技術的特點波長篩選和灰狼優化算法對極限學習機的血清檢測模式的改進。為提高ELM模型的性能,運用GWO算法優化選擇ELM模型的輸入權值和隱含層偏置,本文介紹了一種基于GWO-ELM技術的連續投射技術進行特征波長篩選的HBV血清學研究。與PSO-ELM、GA-ELM和ELM相比,利用GWO-ELM技術建立的 HBV血清檢測方法能有效地改善 HBV的血清學診斷的正確性,為HBV血清檢測提供了新的方法。