張子緩 劉鳳嬌,2 鄭鳳英 駱嘉燚 黃昭景 梁潔玲鄭靜茵 黃倩燕 李順興*,2
1(閩南師范大學化學化工與環境學院, 漳州 363000)2(現代分離分析科學與技術福建省重點實驗室, 污染監測與控制福建省高校重點實驗室, 漳州 363000)
生物硫醇包括半胱氨酸(Cys)、同型半胱氨酸(Hcy)和谷胱甘肽(GSH)等,在人體生理和病理過程中起著重要作用,其含量水平反映了人體內循環穩態。尿液中Cys 含量與癌癥以及結石性胱氨酸尿有關[1],Cys 濃度過高有罹患肝胱氨酸尿病風險[2];尿液中Hcy 含量超出一定范圍則可能與腎臟和血管疾病相關[3];GSH 穩態的變化與神經退行性疾病、衰老、HIV 感染、囊性纖維化和癌癥相關聯,Hcy 參與很多生理過程[4-5]。因此,檢測這些生物硫醇對于日常居家健康監測和疾病預診具有重要意義。
目前,尿液中生物硫醇的測定方法包括高效液相色譜法[6]、熒光分光光度法[3,7-14]、電化學方法[1,15]、免疫法[16-17]和紙基微流控比色法[18]等。高效液相色譜法和熒光分光光度法需昂貴大型儀器,操作和攜帶不便,檢測時間長;電化學方法檢出限低,但不穩定;免疫法價格昂貴、操作檢測復雜,不適合非專業人使用;紙基微流控比色法不穩定,測試誤差大。傳統比色法通常使用人眼識別和歐式距離(Euclidean distance,ED)法檢測,易受人為因素影響和環境噪聲干擾,待測樣品的顏色特征易產生波動,即使同一樣品的圖像,不同位置色差也會很大,特別是邊緣和中心色塊均勻性不一致,這歸因于不同人操作及樣品滲透速度的差異性,材料不均勻性不可避免地導致光散射差異,引起測量結果變異。因此,亟需一種適合居家使用的成本低、檢測快、易操作、精度好和準確率高的與生物硫醇相關的疾病預檢方法。
采用靜電紡絲技術制作的納米纖維膜已被用于制作如智能墊子、催化支架、過濾膜、能量存儲/傳統組件、電氣器件和生物醫學支架等,在基于比色法的分析檢測中取得了良好的效果[19]。機器學習的模型得益于全樣本圖像表征和強大的特征提取能力,可基于此優化比色傳感器的檢測精度和靈敏度,已經成功應用于溶解鐵形態分析及生物利用性評價[20]和食品中的亞硝酸鹽濃度的測定[21]等,用戶使用時結合開發的智能手機APP,采用手機拍照,按照APP 頁面提示操作即可獲取測試結果[22]。Ortenzi 等[23]通過人工智能(卷積神經網絡(Convolutional neural networks,CNN))算法,使用RGB 圖像分析對奶牛糞便的主要特征如pH 值、顏色和一致性進行了分類和評估。
新型硫醇顯色劑Zincon-Zn2+絡合物對巰基有特異性響應,其絡合平衡常數(K=1.01×107)遠小于巰基-Zn2+絡合物(K=4.10×1011)。當存在硫醇時,Zincon-Zn2+會發生Zn2+的解離與絡合反應,因此可根據試紙顏色變化來定量分析尿液中的生物硫醇含量[24-25]。本研究以聚丙烯腈(Polyacrylonitrile,PAN)、薄層層析硅膠(Silica gel,SG)和聚乙烯吡咯烷酮(Polyvinyl pyrrolidone,PVP)為載體,采用靜電紡絲技術將顯色劑均勻嵌進納米纖維膜中,采用比色法檢測生物硫醇,并與CNN 結合,構建了生物硫醇全分析系統,具有準確率高、檢出限低、使用期限長和簡易便攜等特點,可用于疾病的無創預診。
LN-01C 靜電紡絲儀(綠納科技有限責任公司);Zeiss Sigma 300 掃描電子顯微鏡(德國卡爾蔡司公司);IJ-6B 磁力攪拌器(金壇市新航儀器廠);UV-5800PC 紫外-可見分光光度計(上海元析儀器有限公司);BS 124S 電子天平(北京賽多利斯儀器系統有限公司);帶平面標準光源(定制)。
PAN(分子量150000,美國Sigma-Aldrich 公司);Zincon 試劑(麥克林生化科技股份有限公司);N,N-二甲基甲酰胺(D M F, 9 9.5%)、P V P(分子量1 3 0 0 0 0)、S G(9 9%)、二水合醋酸鋅(C4H6O4Zn·2H2O,99%)、蛋氨酸(Met,99%)、丙氨酸(Ala,99%)、色氨酸(Trp,99%)、高半胱氨酸(Hcy,99%)、精氨酸(Arg,98%)、酪氨酸(Tyr,99%)、異亮氨酸(Ile,99%)、尿素(Ure,99%)、纈氨酸(Val,99%)、苯丙氨酸(Phe,99%)、絲氨酸(Ser,99%)、甘氨酸(Gly,99%)、L-半胱氨酸(Cys,95%)、蘇氨酸(Thr,99%)、組氨酸(His,99%)、亮氨酸(Leu,99%)、賴氨酸(Lys,99%)、脯氨酸(Pro,99%)和谷胱甘肽(GSH,98%)(阿拉丁生化科技有限公司)。所用試劑均為分析純;實驗用水為超純水(18.2 MΩ·cm)。
1.2.1 靜電紡絲法制備生物硫醇比色試紙
生物硫醇比色試紙的制備過程如圖1A 所示。稱取20 mg Zincon 試劑和8.0 mg 二水合醋酸鋅溶解于6.0 mL DMF 中,加入0.40 g PAN、0.10 g PVP 和0.15 g SG,常溫(25 ℃)下攪拌8.0 h, 移入10 mL 注射器中。設置靜電紡絲儀注射泵速度、滾筒轉速、正負極電壓和注射器流速分別為1.5 mL/h、60 r/min、17 kV和1.7 mL/h, 在環境濕度低于60%和25 ℃的條件下進行靜電紡絲。4 h 后得到均勻的高分子納米纖維膜,經真空烘箱烘干3 h,即得到生物硫醇比色可視化試紙(PAN-Zincon-Zn2+),將其裁剪成1.0 cm×1.0 cm的正方形。

圖1 (A)靜電紡絲法制備PAN-Zincon-Zn2+比色試紙示意圖;(B)PAN-Zincon-Zn2+比色試紙檢測機理圖Fig.1 (A) Schematic illustration of preparation of PAN-Zincon-Zn2+ colorimetric paper by electrospinning method; (B) Schematic of detection mechanism of PAN-Zincon-Zn2+ colorimetric test paper
如圖1B 所示,Zincon 指示劑和生物硫醇的巰基存在對Zn2+的競爭性結合。當生物硫醇不存在時,Zn2+可形成Zincon-Zn2+配合物,試紙呈藍色;當生物硫醇存在時,其巰基與Zincon-Zn2+解離出來的Zn2+絡合,試紙顏色由藍色逐漸變為紫紅色。
1.2.2 人工尿液的配制
分別稱取17.3 g Ure、14.1 g NaCl、2.80 g KCl、0.600 g CaCl2·2H2O、0.430 g MgSO4·4H2O 和0.500 g NH4OH,溶于1.0 L 超純水中,加入0.62 mL HCl,制得人工尿液(pH = 7.0±0.1)。
1.2.3 數據集的制備
以Cys 為代表,分別以超純水、人工尿液和健康人尿液為溶劑,Cys 為溶質,配制濃度分別為0、0.5、1.0、2.0、5.0、10、20 和30 mmol/L 的溶液。
分別取上述制備的不同濃度溶液10 μL 滴在試紙(見1.2.1 節)中心,10 s 后,采用平面標準光源(R=10,G=10,B=10),試紙距攝像頭10 cm 處,利用機器視覺連續捕捉每個濃度的圖像,其中,超純水溶液樣品圖片2100 張,人工尿液樣本圖片700 張,健康人尿液樣本圖片1400 張。將這4200 張圖片混在一起,相同濃度的打上標簽(例如1.0 mmol/L 的圖片標簽為1.0),按濃度進行樣本分類,形成全濃度數據集。
1.2.4 生物硫醇智能比色檢測系統的構建
如圖2 中①所示,本研究應用的機器學習模型是基于CNN 算法,通過卷積和池化運算,提取PANZincon-Zn2+的特征。

圖2 基于卷積神經網絡(CNN)模型比色分析系統的生物硫醇快速定量檢測示意圖Fig.2 Schematic diagram of rapid and quantitative detection of biomercaptan by convolutional neural networks(CNN) model-based colorimetric analysis system
如圖2 中②所示,將數據集(見1.2.3 節)按8∶2 分成訓練集與驗證集(訓練集3360 張,驗證集840 張),通過調節后臺代碼參數訓練出合適的機器學習模型,用PyQt5 完成界面,后臺點擊上傳圖片按鈕,即對圖像濃度進行預測,后臺返回生物硫醇濃度。
如圖2 中③所示,采用github 開源Tensorflow 2.3 框架搭建CNN 和輕量化卷積神經網絡(Mobilenet)兩種模型,對數據集進行分類,據圖片樣本分類正確率對代碼模型和參數進行適當調整,訓練出精確度符合實際要求的模型,通過上傳真實樣本檢測模型的正確率和損失函數。這兩種模型由卷積層、最大池化層和全連接層組成,分別用于圖像特征提取、降維(減少計算數據量)和分類。以劃分好的測試集輸入模型進行訓練,訓練后的模型可從比色試紙中提取顯色特征,根據圖像特征將其歸為某一濃度,從而進行定量分析。采用安卓技術開發APP,用智能手機捕捉圖像上傳,封裝好的機器學習模型處理并給出測量濃度。
1.2.5 試紙的親水性測試
采用接觸角計測量水接觸角(Water contact angle,WCA)。測量前,將納米纖維墊切成20 mm×40 mm大小,粘貼在載玻片上。將載玻片水平放置,將5 μL 超純水滴在膜表面,在10 s 內測量薄膜表面與水滴之間的接觸角并拍照。對每個納米纖維薄膜樣品進行3 次重復實驗。WCA 可以準確地反映納米纖維薄膜的表面疏水性,WCA >90°的表面視為疏水表面。
PAN 作為比色試紙基底,不溶于水,以纖維絲方式層層堆積包裹、保護內部的顯色劑Zincon-Zn2+,可以延長PAN-Zincon-Zn2+比色試紙保質期。PVP 穩定無毒,含強極性基團內酰胺,具有吸水性,還有增溶、分散和吸附效應。將水溶性高分子聚合物PVP 加入到靜電紡絲液中,可使比色試紙具有親水性,受試樣品更易滲進試紙,顯色反應更容易、更快[23];但由于反應迅速,顯色不均勻,都發生在試紙邊緣。加入不溶于有機溶劑的SG,通過劇烈攪拌(>1400 r/min)使之均勻分散在紡絲液中,SG 表面有大量羥基,具有親水性,這樣制作出來的比色試紙顯色均勻。如圖3A 所示,顯色劑均勻包裹在比色試紙中每一條納米纖維絲中,而且比色試紙具有“鳥巢狀”的結構,增加了比表面積。如圖3B 所示,隨機選取50 根納米纖維絲測量直徑,70%納米纖維絲的直徑在300~350 nm 之間。對比色試紙的親水性能進行探究發現,只加入PAN,動態接觸角大于120°,試紙疏水性好,從液滴開始接觸并完全潤濕試紙時間約為16 s(見電子版文后支持信息)。當加入SG 和PVP 后,液滴接觸試紙時間0、3 和4 s,動態接觸角分別為α=121°(圖3C)、β= 61.2°(圖3D)和θ= 29.9°(圖3E),完全潤濕需要8 s, 測試時間比只加PAN 減少1/2,可見加入PVP 和SG 提高了試紙的親水性。

圖3 (A、B)PAN-Zincon-Zn2+比色試紙不同放大倍數的掃描電鏡(SEM)圖像,圖B 中插圖為粒徑分布圖;PAN-Zincon-Zn2+比色試紙在滴加超純水(C)0、(D)3 和(E)4 s 時的水接觸角(WCA)Fig.3 (A,B)Scanning electron microscopy(SEM)images of PAN-Zincon-Zn2+colorimetric paper with different magnifications,inset in Fig.3B is diagram of size distribution;Water contact angles(WLA)of PAN-Zincon-Zn2+colorimetric test paper after dropping ultrapure water for (C) 0, (D) 3 and (E) 4 s, respectively
取1.2.3 節配制的不同濃度的Cys 溶液各10 μL, 由低濃度到高濃度順序滴加在PAN-Zincon-Zn2+試紙中心,10 s 后得到一個標準比色卡,隨Cys 濃度由低到高,試紙呈現由藍色、紫紅色到醬紅色變化順序。將比色卡圖像導入Photoshop 進行分析,讀取試紙的B 值(B-valve),發現隨著Cys 濃度升高,B 值呈現下降趨勢(0~10 mmol/L), 隨后趨于穩定(10~30 mmol/L)(圖4A),Cys 濃度在0~10 mmol/L 范圍內與B 值呈線性負相關(圖4B)。這是傳統的ED 法,線性范圍為0.5~10 mmol/L。在Cys 濃度超過10 mmol/L時,肉眼已不能辨別出PAN-Zincon-Zn2+試紙顏色的細微變化。

圖4 (A)歐氏距離(ED)法中不同濃度Cys 對應的B-value;(B)ED 法中Cys 濃度與B-value 的線性擬合結果;(C)Zincon、Cys 與Zn2+絡合反應吸收光譜圖,插圖為對應的光學照片; (D)基于CNN 模型的智能比色檢測標準曲線圖; (E)常見氨基酸(Cys、Hcy 和GSH: 1.00 mmol/L; 其它氨基酸2.00 mmol/L)干擾性實驗圖Fig.4 (A) B-values of different concentrations of Cys in Euclidean distance (ED) method; (B) Linear fitting of Cys concentration and B-value in ED method; (C) Absorption spectra of Zincon and Cys complexing with Zn2+,inset is corresponding optical images;(D) Standard calibration curve of intelligent colorimetric detection based on CNN model; (E) Interferences of common amino acids (Cys, Hcy, GSH: 1.00 mmol/L; other amino acids:2.00 mmol/L)
本研究探究了在水溶液中主要存在的3 種物質Zincon、Zn2+、Cys 及其絡合物的整個體系的紫外-可見吸收光譜變化,如圖4C 曲線a 所示(由15.0 mmol/L Zincon 與7.5 mmol/L Zn2+絡合為Zincon-Zn2+,取0.5 mL 加入到3.0 mL 超純水中),Zincon-Zn2+呈藍色,最大吸收波長為638 nm;如圖4C 曲線b 所示(將曲線a 中的超純水換為等體積的3.0 mmol/L Cys),Cys-Zn2+與Zincon-Zn2+共同存在,是紅色和藍色的混合色;如圖4C 曲線c 所示(0.5 mL 15.0 mmol/L Zincon 加入3.0 mL 超純水),只有Zincon 存在時,溶液呈現橙紅色,最大吸收峰波長為462 nm;如圖4C 曲線d 所示(0.5 mL 7.5 mmol/L Zn2+與2.5 mL 3.0 mmol/L Cys絡合),Cys-Zn2+無色透明。鑒于Zincon-Zn2+對400~750 nm 光均有吸收,與比色測定Cys 后置換出的Zincon 存在明顯的光譜干擾,常用的紫外-可見分光光度法無法準確定量分析Cys。
綜上可知,ED 法無法辨別相似圖像細微的區別,紫外-可見分光光度法受整個體系復雜反應的影響,兩種方法都不能精確定量分析Cys。本研究開發了基于CNN 算法的模型,如圖4D 所示,通過卷積計算提取圖像特征,池化去掉噪聲,采用有監督的方法把樣本和標簽輸入模型,得到一個真實樣本和預測樣本標簽的標準曲線,即CNN 模型預測的Cys 濃度與其真實的濃度呈正相關。基于CNN 模型測定Cys 濃度的檢出限為0.01 mmol/L, 線性范圍由ED 法的0.5~10 mmol/L 擴展到了0.01~30 mmol/L。
為了評估方案的可行性,本研究選取了尿液中可能存在的氨基酸進行抗干擾實驗,如圖4E 所示,不含巰基的氨基酸對測定結果無顯著影響,即PAN-Zincon-Zn2+比色試紙對含巰基氨基酸的測定具有選擇性。
將訓練集和驗證集分別采用CNN 和Mobilenet 兩種模型,經加載數據集、加載模型、保存模型和測試模型提取圖片特征,訓練200 次以測試效果。如圖5A 和5B 所示,CNN 模型訓練65 次時,訓練集和驗證集的準確率已達到1,損失函數隨訓練次數增加和模型正確率同步收斂,當正確率達到1 時,損失函數值收斂到0.1,說明模型學習能力好。Mobilenet 模型在訓練55 次時,正確率達到1,此時損失函數值收斂到0.1,顯示訓練集效果好(圖5C)。采用驗證集驗證Mobilenet 模型的準確率,根據結果去調節模型參數,增強模型泛化能力和魯棒性,由圖5D 可得,當訓練次數少于55 次,損失函數在0.5 處收斂,驗證集正確率在55%~65%之間波動,說明損失函數出現梯度爆炸現象。即使將訓練集模型中的學習率降低,增大訓練輪數,驗證集正確率可上升到75%,損失函數也只能降到0.2,因此Mobilenet 模型訓練存在過擬合問題,對圖像樣本學習效果較差,優化不到理想效果。因此,CNN 模型可以根據圖像更準確預測樣本濃度。

圖5 (A)CNN 訓練精度、損失值與訓練次數擬合曲線;(B)CNN 驗證精度、損失值與訓練次數的擬合曲線;(C)輕量化卷積神經網絡(Mobilenet)訓練精度、損失值與訓練次數的擬合曲線;(D)Mobilenet驗證精度、損失值與訓練次數的擬合曲線Fig.5 (A) Fitting curve of training accuracy, loss value and training times by CNN; (B) Fitting curve of verification accuracy,loss value and training times by CNN;(C)Fitting curve of training accuracy and loss value with training times by Mobilenet;(D)Fitting curves of accuracy and loss value with training times by Mobilenet
制備2.0 mL Cys 濃度分別為0、0.5、1.0、2.0、5.0、10、20 和30 mmol/L 的人工尿液,每個濃度測定10 次,各制作10 張圖片,對模型準確率進行測試。抽取每個濃度圖片各1 張進行測試,模型對輸入樣本的評價與真實標簽對比后進行打分,將最接近真實標簽的概率判定為最可能的值,判斷結果概率最大的作為預測標簽返回給用戶。CNN 模型預測上述濃度真實概率分別為0.81、0.80、0.70、0.82、0.90、0.65、1.00 和0.91,判斷為其它非真實標簽的概率均小于0.35,模型返回用戶數據是概率最大的對應濃度,所以這些待測樣本的準確率為1(圖6A)。將剩下72 張樣本圖片輸入模型進行驗證,70 張預測正確,2 張預測錯誤,即樣本預測正確概率為97.5%。采用相同測試集和方法對Mobilenet 模型的準確率進行評估,隨機抽取每個濃度圖片各1 張進行測試,Mobilenet 模型輸出預測的真實概率分別為0.50、0.60、0.70、1.00、0.60、0.20、0.90 和0.75,真實樣本為0 mmol/L 的標簽判斷為0 mmol/L 或0.5 mmol/L 的概率都為0.50,模型會給用戶返回2 個預測值。真實樣本為10 mmol/L 的判斷正確概率為0.20,判斷錯誤概率為0.80,此時返回用戶的濃度是30 mmol/L,模型將標簽為10 mmol/L 的樣本判斷錯誤(圖6B)。剩下72 張樣本圖片輸入模型進行驗證,58 張正確,14 張錯誤,Mobilenet 模型預測正確概率為80%。經過1000 張樣本驗證,CNN 模型正確率穩定在98%,Mobilenet 模型正確率平均約75%,且不穩定,而傳統ED法準確率為85%(圖6C)。綜上,建立的CNN 模型穩定性和準確率更好。

圖6 (A)CNN 模型真實值和預測值的熱圖;(B)Mobilenet 模型真實值和預測值的熱圖;(C)ED 法、CNN 模型法和Mobilenet 模型法正確率對比圖Fig.6 (A)Heat map of true and predicted values with CNN model;(B)Heat maps of real and predicted values with Mobilenet model; (C) Accuracy comparison among ED method, CNN model and Mobilenet model
為驗證基于CNN 的智能可視化檢測平臺對尿液中生物硫醇檢測的準確性,取健康人的尿液(取自課題組志愿者)10.0 mL,用0.22 μm 濾膜過濾,以Cys 為生物硫醇代表物質,進行加標回收實驗,結果見表1。?回收率在98.4%~114.0%之間,相對標準偏差(RSD)為1.6%~3.0%,表明基于CNN 的方法用于實際尿液中生物硫醇的檢測具有良好的實用性。

表1 基于CNN模型的人尿液中生物硫醇檢測結果Table 1 Detection results of biomercaptan in human urine based on CNN model
本研究基于競爭性、選擇性和快速絡合反應前后吸光性能的顯著差異,設計了新型生物硫醇顯色劑Zincon-Zn2+,以PNA、SG 和PVP 為保護載體,采用靜電紡絲技術,構建了穩定性、重現性、選擇性和抗干擾性能優良的比色傳感器。將CNN 模型與比色試紙結合,借助機器學習突出的全樣本圖像表征和強大的特征提取能力,以B 值為測量參數,有效解決了Zincon-Zn2+與Zincon 嚴重的光譜干擾問題,可以快速測量尿液中生物硫醇的濃度。結果表明,采用CNN 模型準確率可達98%以上,檢出限為0.1 mmol/L;將訓練好的卷積云網絡模型封裝,通過與手機APP 結合,提高了使用便捷性。