葉福強 李鵬 韓一芳 張琪 林彥鋒 王凱英 王太武 宋宏彬 王長軍 汪春暉 張錦海★
近年暴發的西非埃博拉出血熱(2014年)、巴西寨卡病毒病(2015年)和尼日利亞拉薩熱疫情(2018年)等新發傳染病對疫區民眾的生命健康造成巨大威脅[1-6]。為了有效遏制傳染病蔓延,亟需快速有效的病原體檢測確認技術。常用的聚合酶鏈式反應(polymerase chain reaction,PCR)擴增技術對未知病原或高突變率病原檢測能力有限。現有的二代高通量測序平臺雖然具備鑒別病原微生物的能力[1,7-11],但對實驗室環境要求苛刻,文庫制備流程復雜,也限制其大規模的現場快速檢測應用。
由Oxford Nanopore Technologies(ONT)開發的三代測序平臺MinION,通過捕捉DNA/RNA 經過納米孔時引起的電流變化來鑒別核苷酸[12-13]。其在病原體現場快速檢測方面具有諸多優勢:①便攜。總質量僅為87 g,可應用于現場檢測[14-17]。②供電方式簡單。USB 3.0 接口即可保證測序儀穩定運行。③測序數據實時產出即時分析。④讀長長。現有報道的最長測序讀長~2.3 Mb[12]。當前該平臺已用于人類血液、尿液和呼吸道樣本里的病毒和細菌病原體檢測[7,18-19],也為西非埃博拉病毒病以及巴西寨卡病毒暴發疫情的病原確認和流行病學調查提供了關鍵線索[5,20-22]。為了驗證納米孔測序技術在呼吸道病毒病原體應急檢測中的可行性,筆者使用MinION 對上呼吸道感染患者的咽拭子標本進行快速測序及病原學分析,并采用PCR 實驗驗證測序結果。
咽拭子標本由東部戰區疾病預防控制中心于2019年3月在流感網絡實驗室運行期間采集于某部1 名士兵,該患者因出現發熱、咳嗽、流涕等癥狀就醫,初步診斷為上呼吸道感染,病原不明。
病毒核酸抽提試劑盒Qiagen QIAamp Min-Elute Virus Spin Kit 購自德國Qiagen 公司,Qubit 3及配套定量試劑耗材、磁力架購自美國Invitrogen公司,cDNA 合成試劑盒NEBNext Ultra II RNA First Strand Synthesis Module 和NEBNext Ultra II Non-Directional RNA Second Strand Synthesis Module 購自美國NEB 公司,AMPure XP 磁珠購自于美國Beckman 公司,快速建庫測序試劑盒(SQKRADSP4)、測序芯片制備試劑盒(EXP-FLP001)、測序芯片(FLO-MIN106,R9.4)、測序儀MinION Mk1B 購自英國ONT 公司,核酸抽提試劑盒TaKa-Ra MiniBEST Viral RNA/DNA Extraction Kit 及實時熒光定量PCR 檢測試劑盒One Step Prime-ScriptTMRT-PCR Kit(Perfect Real Time)購自日本Takara 公司。
1.2.1 病毒總核酸抽提及定量
對用于MinION 測序的樣本病毒總核酸(DNA/RNA),除不進行離心過濾、不加入核酸酶和溶菌酶外,其余實驗步驟均按說明書操作進行。收集核酸后,取2 μL 樣本核酸按儀器說明書測定dsDNA 和RNA 濃度。
1.2.2 逆轉錄合成cDNA 及定量
首先使用NEBNext Ultra II RNA First Strand Synthesis Module 合成cDNA 的第一鏈,然后使用NEBNext Ultra II Non-Directional RNA Second Strand Synthesis Module 合成cDNA 的第二鏈。使用Beckman AMPure XP 磁珠按說明書的方法對cDNA 產物進行純化收集。取1 μL 產物,使用Qubit 3 對dsDNA 濃度進行測量,測量過程按儀器說明書進行。
1.2.3 MinION 文庫構建及測序
測序在MinION Mk1B 測序儀上進行。首先按說明書要求進行測序芯片質檢,質檢通過后依照快速建庫測序試劑盒及測序芯片引發試劑盒操作流程構建測序文庫并加樣至測序芯片中,在加樣過程中避免將氣泡引入加樣孔中。在測序儀控制軟 件MinKNOW(v 3.1.19,ONT 官 網https://nanoporetech.com/下載)上對測序參數進行設置,測序運行時間設為”48 h”。
1.2.4 MinION 測序數據生物信息學分析
使用MinKNOW 實時讀取測序儀產生的fast5文件,使用Albacore 軟件(v 2.3.4,ONT 官網下載)將fast5 文件轉換成fastq 文件,堿基質量分數低于7的序列將被剔除。使用Nanoplot 軟件(v 1.22.0)[23]查看測序數據質量及讀長分布。使用Centrifuge(v 1.0.4)[24]對測序數據進行初步比對分析:將所有通過質控的序列與人(Grch38.p12)和病毒參考基因組(NCBI Refseq 數據庫ftp://ftp.ncbi.nlm.nih.gov/genomes/refseq/,2019年3月21日下載,共計8 588 個病毒全基因組序列)進行快速比對,參數設置為“--min-hitlen 15-k 5”,3 min 內即完成比對過程。
為進一步了解物種構成,采取“先比對后剔除”的策略,先使用Minimap2 軟件(v 2.16)[25]將所有質控后序列與人參考基因組比對,參數設置為“-ax map-ont-k 15”,使用samtools(v 1.9)[26]對比對產生的sam 文件進行處理,得到的未匹配序列用于下一步操作。然后將上步獲得的序列與NCBI病毒參考數據庫進行比對,參數為“-ax map-ont -k 7”,獲得的未匹配序列用于下步比對。最后,將上步未匹配序列使用BLASTN(v 2.8.1)與NCBI 細菌和古細菌參考基因組比對(包括12 668 個細菌和283 個古細菌全基因組序列,2019年3月21日下載),參數為“-perc_identity 90-word_size 16-evalue 0.000 001”,未匹配的序列定義為“未分類序列”。
為進一步了解比對詳情,將匹配到NCBI 病毒Refseq 參考數據庫的序列提取出來,進行在線BLAST 比對,參數設置同上,并挑選出比對一致性較好的基因組,用于下游分析并統計比對情況,包括比對一致性、查詢序列覆蓋度等信息。使用samtools 及Qualimap(v 2.2.2)[27]計算參考基因組覆蓋度。使用自有Perl(v 5.22.1)腳本查看序列的產出時間并進行統計排序。
1.2.5 實時熒光定量PCR
使用實時熒光定量PCR 來驗證MinION 測序獲取的病原陽性結果。Adv7 引物序列:HAdV7-F:5′-GAGGAGCCAGATATTGATATGGAATT-3′,HAdV7-R:5′-AATTGACATTTTCCGTGTAAAGCA-3′ ,探針序列為FAM-AAGCTGCTGACGCTTTTTCGCCTGA-BHQ1。H3N2 引物:H3F:ACCCTCAGTGTGATGGCTTCCAAA,H3R:TAAGGGAGGCATAATCCGGCACAT,探針序列為FAM-ACGCAGCAAAGCCTA CAGCAACTGT -BHQ1。使用無核酸酶的水作為陰性對照。使用的總核酸從咽拭子病毒保存液中抽提,使用試劑盒配制PCR 反應體系。反應條件為42℃5 min,95℃10 s,95℃5 s(40 個循環),60℃34 s。Ct 值<35 時,認為PCR 檢測陽性。
樣本抽提后RNA 濃度為20.8 ng/μL,dsDNA濃度為52.0 ng/μL。逆轉錄合成cDNA 后的定量結果為77.2 ng/μL,以cDNA 作為模板建立MinION文庫并測序。MinION 運行15 h,共產生236 764 條序列(圖1),其中188 063 條序列(占比79.43%)通過數據質控(高質量序列,堿基質量分數均不低于7),其余序列未通過質控(低質量序列)。

圖1 MinION 測序通量Figure 1 The sequencing throughput of MinION
通過質控的測序數據用于下游生物信息學分析。其中最長讀長為102 326 bp,最短讀長為23 bp,總堿基數為246.7 M。平均讀長為1 311.8 bp,平均質量分數為9.1,讀長中位數為3 281 bp。
快速比對分析結果表明樣本中同時存在兩種呼吸道病原體:人呼吸道腺病毒7 型(DNA 病毒)和甲型流感病毒H3N2 亞型(RNA 病毒)。僅2 min 50 s 即完成比對過程,獲得初步鑒定結果。
質控后的數據中共有145 861 條序列(占比77.56%)來自于人,病毒序列數為6 876(占比3.66%),細菌/古細菌比對數為6 057(占比3.22%,主要包括來自口動菌屬、奈瑟氏菌屬、鏈球菌屬、普氏菌屬、克雷伯菌屬、梭菌屬、嗜血桿菌屬、韋榮球菌屬等口咽部細菌),未分類序列數為29 269(占比15.56%),分類結果見圖2。

圖2 測序數據構成Figure 2 The composition of sequencing data
進一步的生物信息學分析同樣在樣本中同時鑒別出兩種呼吸道病原體:人呼吸道腺病毒7 型和甲型流感病毒H3N2 亞型,分別有19 條和4 條序列比對到參考基因組。進行在線BLAST 比對后,選取比對一致性較好的人呼吸道腺病毒7 型(Adv7,Genbank 序列號:MG696128.1,基因組大小為35 233 bp)和甲型流感病毒H3N2 亞型(H3N2,Genbank 序列號:MK633737.1-MK633744.1,共8 個基因區段,基因組大小分別為1 701 bp、982 bp、1 410 bp、1 497 bp、838 bp、2 151 bp、2 274 bp 和2 280 bp)基因組進行下一步分析。
19 條Adv7 序列與參考基因組的比對一致性介于84.83%和96.55%之間,查詢序列覆蓋度介于70.63%和99.58%之間(表1)。19 條序列中,讀長排名前三的分別為14 910 bp,14 720 bp 和12 097 bp。對Adv7 參考基因組覆蓋度為87.65%,覆蓋深度介于1X 和5X 之間(圖3)。4 條H3N2 序列比對到參考基因組的3 個區段上,分別是區段2(PB1和PB1-F2基因,MK633743.1),區段3(PA和PA-X基因,MK633742.1)和區段6(NA 基因,MK633739.1),比對一致性介于91.43%和94.74%之間,對3 個區段的覆蓋度分別為32.81%,6.79%和7.02%。
至此,鑒定出該患者為呼吸道腺病毒7 型和甲型流感病毒H3N2 亞型混合感染。
MinION 的文庫制備具有簡易快速的優點,從獲得樣本到建立文庫并上機測序,僅用時約3.5 h(215 min)(圖4)。納米孔測序技術還具有實時產出數據的優勢,測序開始僅9 s 后即有可用于下游分析的原始數據產生。測序1 h 內,共計產生18 151 條序列,占總產出數據的比重為7.67%,其中通過質控的序列數為15 559,占所有可用數據的比重為8.27%。測序開始僅8 min 后,MinION 即產出第1 條Adv7 序列,讀長為12 097 bp,與MG696128.1 參考序列一致性為90.80%,比對覆蓋度高達99.58%(表1)。測序開始后的9 h 內,78.95%的Adv7 序列均已產出,讀長最長為14 910 bp。14 h 以后,所有Adv7 序列均已產出。對于H3N2 數據而言,測序開始69 min 后即產生第1 條序列,9 h 內產出所有H3N2 序列。測序進行15 h后終止,進行快速宏基因組比對分析,僅需3 min即獲得微生物初步分類結果。綜上,從拿到樣本到獲得初步鑒定結果,共耗時約18.6 h,低于當前二代臺式測序平臺所需時長。值得注意的是,測序開始9 h 內,匹配到Adv7 和H3N2 參考基因組的絕大部分序列已經產生。此時終止測序亦可獲得類似鑒定結果,因此實際流轉時間可控制在13 h以內。

圖4 MinION 測序流轉時間Figure 4 The sequencing turnaround time of MinION
擴增曲線表明,Adv7 和H3N2 均為PCR 陽性(圖5)。PCR 結果與測序結果吻合。同時,對該份送檢標本,未檢出流感網絡實驗室監測的其它呼吸道病原(包括其它亞型甲型流感病毒、乙型流感病毒、支原體、衣原體、冠狀病毒等,數據未顯示)。

圖5 實時熒光定量PCR 結果Figure 5 The results of real-time fluorescence quantitative PCR
作為經典、常見的微生物快速檢測方法,PCR技術靈敏度和準確度高,在目標微生物參考序列已知的情況下,能在4 個小時左右獲得對單一病原的鑒定結果。但對于新發、未知病原體,由于缺乏病原序列先驗知識,通常需要針對多種潛在病原設計多對引物,進行多輪PCR 進行篩查,工作量大且仍有可能無法獲得病原檢測結果。當前主流二代測序平臺文庫制備流程一般較為繁瑣,測序周期長,同時數據分析必須在測序完成后進行,限制其在病原體快速檢測方面的應用。基于納米孔測序技術的MinION 能有效解決以上不足,已應用于埃博拉病毒病、寨卡病毒病的病原體現場快速檢測中。
呼吸道病毒病原體包括DNA 病毒和RNA 病毒,為了全面捕獲咽拭子保存液里的病毒序列,在病毒種類不明確時,必須采取病毒DNA 和RNA 同時測序的策略,所以,對于應急檢測的樣本而言,逆轉錄合成cDNA 這一步必不可少,其耗時一般在2~3 h。對于病原體快速測序而言,逆轉錄合成cDNA 會是限速步驟之一,在今后的檢測過程中,還需探索快速合成cDNA 的實驗方法。
從獲得樣本到建立文庫并上機測序,僅用時約3.5 h,遠低于當前主流二代臺式測序平臺所需的至少6 h 的建庫時間[28]。從取樣到獲得初步鑒定結果,MinION 測序流轉時間約為18.6 h,其中測序時長15 h。對于培養樣本或者具有病原先驗知識的樣本而言,可以針對性選擇核酸富集(核酸含量符合建庫要求無需富集、PCR 擴增富集DNA 樣本、逆轉錄合成cDNA)或文庫制備流程(快速建庫、連接建庫、RNA 直接測序、cDNA 直接測序等),測序儀運行時長也可針對性進行調整。當前單個R9測序芯片總數據產量可達到10~15 Gb,單個細菌或病毒的培養樣本一般測序數據產量達到1Gb(細菌基因組的覆蓋度此時一般可達100X-200X)時,即可考慮終止測序,測序耗時一般不超過5 h,遠低于本研究中的15 h。而對于非培養樣本而言,則需要動態監測產出數據,測序時長也會相應增加。本研究中,測序開始9 h 內,匹配到Adv7 和H3N2 參考基因組的絕大部分序列已經產生。測序開始5 h內,至少有50%的Adv7 和H3N2 序列已產生。因此,應急檢測的流轉時間還有望進一步減少。
本文使用一步法RT-PCR 對測序結果進行驗證。可以發現Ct 值與匹配序列數目和數據產出時間具有一定相關性。Ct 值越小,核酸含量相對越高,匹配到參考基因組的序列就越多,其數據產生的時間越早;反之,匹配到參考基因組的序列則越少,數據產出時間越晚。
本文的研究結果表明,MinION 用于呼吸道病原體的快速檢測具有可行性,且具備同時檢測多種病原體并對病原分型的能力,但仍有一些技術問題需要解決,如在快速檢測背景下,人的臨床樣本,尤其是咽拭子、血液、尿液等樣本,其宿主核酸含量占比一般較高,病原體核酸含量極低,這就導致測序數據中宿主相關序列占絕大部分。如何有效地富集病原體核酸將會是該技術應用于現場快速檢測需要解決的重難點問題。筆者相信,隨著納米孔測序技術及相關試劑的升級完善,MinION 有潛力成為病原體快速檢測和臨床診斷的常規工具。