劉勤穎,唐玉國,歐陽楠,李桂琴,李 敏*
(1.上海大學 上海市智能制造及機器人重點實驗室,上海200444;2.中國科學院 蘇州生物醫學工程技術研究所,江蘇 蘇州215000)
光學相干層析成像(Optical Coherence To?mography,OCT)結合內窺探頭技術可實現體腔器官在體的斷層成像[1-2]。與傳統超聲內窺成像技術相比,內窺OCT技術具有成像速度快、分辨率高、無需耦合介質[3]等優點,能夠幫助醫生快速識別微小病灶,適用于診斷早期食道癌、宮頸癌、結直腸癌等體腔內疾病[4]。
光纖旋轉掃描內窺OCT作為一種較為成熟的內窺成像方式已經開始向商業化產品發展,如Ninepoint公司的NvisionVLE系統,采用50 kHz掃頻光源,成像速度為12.5 frame/s;Abbott公司的Ilumien3系統,采用90 kHz掃頻光源,成像速度為100 frame/s。2014年,Cho等人[5]指出提高內窺OCT的成像速度能夠有效避免在體成像時生物抖動造成的圖像模糊,因此研究人員在提高內窺OCT成像速度方面進行了大量研究。
內窺OCT的成像速度主要取決于系統的掃描速度和數據的實時處理。在系統掃描速度方面,Wang等人[6]利用微型電機研制遠端掃描OCT探頭,最高每秒可產生4 000 frame/s的數據量,但是在進行成像時必須重新調整圖像以補償微型電機的旋轉誤差,且微型電機價格昂貴,對外部磁場高度敏感,在實際臨床應用方面,還需要克服一定的技術困難。在數據處理方面,圖形處理單元(Graphics Processing Unit,GPU)或現場可編程門陣列(Field Programmable Gate Ar?ray,FPGA)已被用于OCT數據處理加速。Zhang等人[7]利用GPU實現了125 MS/s的OCT數據處理速度,Tang[8]利用FPGA實現了200 MS/s的數據處理速度。Chen等人[9]利用壓縮感知重構圖像減輕數據采集與處理系統的壓力。但是對于技術成熟的掃描頻率為200 kHz的掃頻光源,每秒可采樣數據流量為409 MS/s,由于內窺圖像重構算法的復雜性,單純依靠GPU或FP?GA處理方案難以滿足數據實時處理的要求。另外,對于光纖旋轉掃描的內窺成像方式,掃描速度的大幅提高會引起嚴重的圖像漂移,也是一個亟待解決的問題。
本文針對200 kHz高速內窺式掃頻OCT(Swept Source OCT,SSOCT)系統中存在的大量數據無法實時處理和高速轉動下圖像漂移的問題,提出了一種具有141 frame/s成像速度的內窺SSOCT系統設計方法,將FPGA與GPU相結合提高數據處理速度,并利用碼盤反饋漂移校正技術提高成像穩定性。經過對系統性能的實驗驗證和數據分析,本文使用的數據處理方法能夠滿足高速內窺SSOCT數據的實時處理要求并有效提高成像穩定性。最后,按照動物實驗倫理要求,利用研制的系統對小鼠結直腸進行在體成像實驗,結果表明內窺SSOCT系統可清晰識別結直腸的多層組織結構。
高速內窺SSOCT系統如圖1所示,主要由光學系統模塊、數據處理模塊和運動控制模塊等組成。光學系統模塊包括掃頻光源、光纖耦合器、光纖旋轉器與準直器等部分。其中,掃頻光源(AXP50124-8,AXSUN,美國)的掃描頻率為200 kHz,中心波長為1 310 nm,帶寬為110 nm。光源發出的光經過10/90光纖耦合器后,10%的光束入射到參考平面鏡,90%的光束經過光纖旋轉器和探頭入射到樣品上。兩路光束經樣品和參考平面鏡反射后形成干涉光信號,干涉光信號通過平衡探測器轉換為電信號,并通過差分處理扣除直流信號,最后由數據采集卡進行采集。

圖1 內窺式SSOCT系統結構Fig.1 Structure diagram of endoscopic SSOCT system
為了實現高速數據的實時處理和顯示,系統選用數據采集卡(ATS9373,AlazarTech,加拿大)進行數據采集。該采集卡具有12位分辨率,單通道模擬輸入的采樣率高達4 GS/s。采集到的數據經過內嵌在采集卡上的FPGA模塊進行部分數據處理后,上傳至部署了GPU加速模塊的PC主機完成進一步的圖像重構、顯示和存儲等功能。
為了實現探頭高速旋轉且系統圖像的穩定顯示,系統采用理論最高轉速12 000 r/min的無刷電機(CHB-BLDC4260,馳海,中國)驅動光纖旋轉器旋轉,并在光纖旋轉器上安裝反饋碼盤。采用控制器(MSFOCD-5AL,美固思,中國)進行電機控制,其速度閉環控制可設定為-32 768~32 768 r/min。邏輯控制卡驅動電機旋轉,并對碼盤反饋信號與光源的觸發信號(A-trigger)進行邏輯判斷,輸出數據采集觸發信號(DAQ-trigger)。
高速內窺SSOCT系統中使用的內窺探頭結構示意圖如圖2(a)所示,探頭由光纖、折射梯度透鏡(Grin Lens,GL)和棱鏡等構成。樣品臂的光束通過光纖旋轉器、單模光纖、光纖插針和GL,最后形成的聚焦光束直徑約為20μm,探頭聚焦光束直徑即SSOCT系統的橫向分辨率。探頭實物如圖2(b)所示,探頭直徑約為1.2 mm,外套透明塑料套管保護探頭。

圖2 內窺探頭設計Fig.2 Design of endoscopic probe
內窺SSOCT系統通常涉及的數據處理包括漢明窗整形、傅里葉變換(Fourier Transform,FFT)、取對數和極坐標變換(Polar Coordinate Transformation,PCT)等操作。針對本文采用的200 kHz掃頻光源,當每個A-scan上采集數據點為2 048時,系統每秒需處理的數據流量將達到409.6 MS/s。FFT數據變換后,僅選擇頻譜數據中的一半數據量進行圖像重構,則每秒進行PCT極坐標圖像變換的數據量約為204.8 MS/s。為了滿足系統數據的實時處理要求,本文設計的數據處理流程如圖3所示。整個數據處理流程通過FPGA和GPU來完成,具體過程如下:首先,系統數據采集卡ATS9373對干涉信號進行采集;然后,利用ATS9373內嵌的FPGA模塊(5SGXMA 3K3F40C3N,Altera,美國)進行漢明窗整形、傅里葉變換、取對數等數據處理來減輕后續處理壓力。隨后,經過處理之后的數據上傳至PC端進行一維數據顯示。最后,將數據經過PCIe×16(理論傳輸速率為16 GB/s)總線傳送至圖形處理器GPU(RTX2080s,NVIDIA,美國)進行PCT圖像重建,處理后的圖像數據再通過PCIe×16總線傳回PC端進行圖像顯示。

圖3 數據處理與圖像顯示流程Fig.3 Flow chart of data processing and image display
ATS9373采集卡中FPGA模塊的邏輯元件數量為340 000,FFT的處理速度可達1 GS/s。RTX2080s的核心頻率為1 650~1 815 MHz,流處理器單元為3 072個,每秒可計算峰值為11TFLOPS,可滿足實時處理的要求。
由于內窺探頭高速旋轉下旋轉速度的不均一性,圖像會因每幀采樣起始位置的隨機變化而發生不可控制的漂移。為解決圖像漂移問題,系統采用隨動碼盤反饋信號來標記圖像的起始位置并將信號反饋給邏輯控制卡。光纖旋轉運動控制結構如圖4所示,碼盤(TEP-K60,特恩普,中國)通過連接器裝配在光纖旋轉器上,保證與探頭旋轉同步。無刷電機作為系統探頭旋轉的驅動器,通過皮帶帶動光纖旋轉器旋轉。

圖4 探頭旋轉運動控制結構Fig.4 Probe rotation control structure
為了控制探頭轉動并保證圖像穩定性,選用 邏 輯 控 制 卡(SB-RIO9637,National Instru?ments,美國)進行高速邏輯時序控制。該邏輯控制卡可在40 MHz基本時鐘下,每25 ns響應一次,高于掃頻光源觸發信號(A-trigger)頻率,滿足系統的高速邏輯控制需求。當邏輯控制卡通過I/O輸出高電平時,無刷電機開始帶動光纖旋轉器轉動,同時碼盤開始計數。邏輯控制卡對旋轉掃描信號與掃頻光源觸發信號進行邏輯與運算,控制數據采集卡進行采集。同時,邏輯控制卡根據碼盤計數確定每圈起始位置,并且通過控制每圈掃頻光源觸發信號個數保證每幀圖像的尺寸相同。
邏輯控制卡的邏輯時序設計如圖5所示。旋轉掃描信號變成高電平時,探頭開始旋轉,并且碼盤開始計數。碼盤反饋信號計數達到360,表示探頭旋轉一圈。每圈掃頻光源產生的觸發信號A-trigger數量,理論上為:

圖5 采集邏輯時序原理Fig.5 Schematic diagram of logic timing acquisition

其中:S為探頭的轉速,v為掃頻光源觸發信號頻率。當探頭轉速為100 r/s時,圖像幀數為100 frame/s,每圈掃頻光源觸發信號A-trigger數量為2 000。經過多次測試,探頭旋轉一圈實際上的觸發信號數量會略高于理論數量N(1~30)。為了保證每幀圖像大小不變,每轉一圈強制設置M個DAQ-trigger采集觸發信號給到采集卡,進而避免圖像漂移現象。
相較于其他提高內窺OCT穩定性的方法,如Ahsen等人[10]利用內窺探頭結構標記對圖像數據進行重采樣,Abouei等人[11]提出基于方位角的圖像校準算法,本文提出的硬件邏輯控制方法無需后續算法處理,可實現實時內窺OCT的穩定成像。
影響內窺SSOCT數據處理速度的瓶頸主要為FFT數據處理和PCT圖像重建。為了驗證系統數據處理設計的合理性,本文對上述處理算法在不同的硬件處理平臺下進行了對比分析。首先,針對系統每秒產生的409.6 MS原始數據量,通過程序循環運行測試3種硬件的FFT處理能力。3種硬件分別是中央處理器CPU(W2223)、圖形處理器GPU(RTX2080s)、以及采集卡ATS9373內嵌的FPGA模塊。測試結果如圖6顯示,CPU的處理速度約為21.5 MS/s,GPU的處理速度約為240.2 MS/s,FPGA的處理速度約為1.1 GS/s。由此可見,單獨使用CPU或單獨使用GPU都不能滿足實時FFT處理的實時性要求,僅有ATS9373數據采集卡內嵌的FPGA模塊可以滿足。

圖6 實際數據量與各平臺FFT處理速度Fig.6 Actual data volume and FFT processing speed of each platform
其次,針對重構PCT圖像所需的204.8 MS/s數據處理流量,通過程序循環運行,采用66幀圖像尺寸為1 024×3 000像素的數據量,對CPU和GPU兩種硬件的PCT處理能力進行了測試。結果如圖7所示,CPU的處理速度約為15.2 MS/s,GPU的處理速度約為284.3 MS/s,顯然,GPU的處理速度可以實現圖像極坐標的實時顯示。在圖像重構數據處理中沒有使用FPGA的原因是圖像重構算法對于FPGA編譯而言過于復雜,且板載內存容量不夠。因此,本文設計的如圖3所示數據處理結構,充分發揮了FPGA和GPU各自的獨特優勢,實現了內窺SSOCT成像系統數據流處理的高速實時進行。

圖7 實際數據量與各平臺的PCT處理速度Fig.7 Actual data volume and PCT processing speed of each platform
為了進一步驗證圖3的數據處理結構是否實現了圖像的實時顯示,本文通過對無刷電機在不同轉速下的成像幀數進行了測試。測試過程中,無刷電機實際帶負載狀態下的最高轉速為9 000 r/min。測試結果如表1所示,系統的實際成像速度與理論計算結果接近。但是,由于光纖旋轉器的實際轉速與無刷電機理論設置值之間存在一定的偏差,因此表1中實際測試成像速度略低于理論計算數值。實驗結果表明,整個數據處理流程完全滿足高速內窺SSOCT系統的實時成像,特別是在9 000 r/min轉速下,成像速度可達到141 frame/s。

表1 在不同轉速下的圖像幀數Tab.1 Number of image frames at different speeds
為驗證圖5設計的系統圖像穩定方法的有效性,設計了如圖8(a)所示的系統成像測試。將探頭放置在桌面上,探頭旋轉時系統對桌面進行掃描成像。其中,轉速設置為3 000 r/min。圖8(b)為系統掃描桌面的OCT圖像,圖中圓環表示探頭上的塑料套管,亮線表示桌面信號。以圖像中心為原點建立坐標系,桌面與塑料套管的切點A和原點的連線與坐標軸形成的夾角θ表示桌面所在位置。

圖8 圖像穩定性測試方法Fig.8 Image stability test method
利用tracker(實驗影像分析)軟件對旋轉過程中切點A進行了位置追蹤,連續追蹤100張圖像中A的軌跡。如圖9所示,“方塊”和“圓形”分別是有無碼盤反饋時A的軌跡變化。結果表明,有碼盤反饋的情況下,A點位置始終保持相對穩定;而無碼盤反饋的情況下,A點位置則無規律漂移。無碼盤反饋狀態下,統計A點位置每幀抖動的平均角度為±23.46°,利用1-23.46/180計算得到圖像穩定性在87.0%;碼盤反饋狀態下,統計A點位置每幀抖動角度平均為±2.47°,利用1-2.47/180計算得到圖像穩定性在98.6%以上。圖像中剩余的微小抖動可能是探頭本身細微抖動引起的。

圖9 100幀圖像A點偏移角度Fig.9 Point A offset angle of 100 frames of images
OCT是一種測量組織散射特性的成像技術。不同生物組織因成分差異導致其散射特性不同,從而在OCT圖像中顯示出不同的圖像特征。由文獻[12]和[13]可知,結直腸不同層次結構之間的散射特性不同,因此OCT能夠區分結直腸的層次結構。為驗證本文系統對結直腸的成像能力,選用活體小鼠結直腸進行OCT成像實驗。實驗小鼠為C57小鼠,體重為20~25 g。首先,對小鼠腹腔注射4%水合氯醛2 mL進行麻醉后,放置于實驗臺上,如圖10所示。其次,將帶有塑料套管的探頭從肛門插入小鼠腸道約2~3 cm處。實驗過程中,系統探頭輸出的光功率約為7 mW(屬于國家激光安全標準3b級別),旋轉速度設置為3 000 r/min。最后,OCT成像采集完成后,對小鼠結直腸掃描部位進行蘇木精—伊紅(HE)切片處理,用于OCT成像和HE切片結果的對比分析。

圖10 小鼠實驗圖Fig.10 Mouse experiment diagram
小鼠結直腸成像結果如圖11(a)所示,局部放大圖如圖11(b)所示,HE切片對照圖如圖11(c)所示。對比HE切片和局部放大OCT圖像,OCT圖像中結直腸黏膜層表現為弱反射層,黏膜下層的上下邊界表現為強反射層,固有肌層表現為弱反射層,最外側漿膜層表現為強反射層。在許多小鼠結直腸樣本成像中,黏膜下層較窄,上下兩條邊界較難區分,只能觀察到一條亮線。

圖11 結直腸成像與HE對比Fig.11 Comparison of colorectal image with HE
生物實驗過程中采取了麻醉等一系列手段減少對小鼠的傷害,所有操作均通過了中國科學院蘇州生物醫學工程技術研究所實驗動物倫理委員會的批準,并且符合《江蘇省實驗動物管理方法》的要求。
圖12(a)為Welge等[14]利用OCT對小鼠結直腸成像的效果圖,其掃頻光源的中心波長為1 040 nm,掃 頻 速 率 為16 kHz。圖12(b)為Li等[15]利用OCT對小鼠結直腸成像的效果圖,其掃頻光源的中心波長為1 310 nm,掃頻速率為100 kHz。由圖可以看出,小鼠結直腸的層次分布與本文測試結果一致,進一步驗證本文利用高速數據處理、圖像穩定方法和200 kHz掃頻光源研制的高速內窺SSOCT成像系統可以清晰穩定地分辨結直腸組織結構,具有一定的應用潛力。

圖12 結直腸成像對比Fig.12 Comparison of colorectal images
本文采用FPGA和GPU相結合的數據處理技術解決了高速內窺SSOCT系統數據量過大而無法實時處理的問題,利用碼盤反饋技術有效地解決了探頭在高速旋轉下產生的圖像漂移問題,并設計搭建了基于200 kHz掃頻光源的高速內窺SSOCT系統。實驗結果表明,系統圖像尺寸為1 024×1 333時,可實現141 frame/s的成像速度,并且圖像穩定性從87.0%提高到98.6%以上。利用研制的直徑1.2 mm內窺成像探頭,對小鼠結直腸進行了SSOCT實時成像實驗,結果表明該系統能夠有效地分辨生物組織層次。相較于現有的商業化產品,本文研制的系統采用技術成熟度較高的光纖旋轉掃描方案,實現了141 frame/s高速內窺SSOCT穩定成像,有望在很大程度上減少在體實時成像時生物抖動引起的圖像模糊。在下一步工作中將通過大量的實驗探索內窺SSOCT系統的臨床應用價值,為早期消化道癌癥診斷,特別是對發生于黏膜層到黏膜下層的早期癌癥浸潤深度的診斷,提供一種新型的高分辨診斷方法。in vivo[J].Biomedical Optics Express,2014,5(1):223-232.