孫鳳環, 陳 健 綜述, 張 鵬 審校
(1. 同濟大學醫學院,上海 200092; 2. 同濟大學附屬上海市肺科醫院胸外科,上海 200433)
隨著現代醫學技術的發展,腫瘤已經進入了個體化治療階段。腫瘤的基因組轉錄組和表觀遺傳特征在探究腫瘤的發生、轉歸和個體化治療中起到了重要作用。諸多研究[1-7]表明腫瘤微環境在此過程中也發揮了重要作用,各種檢查點抑制劑的使用顯著提高了部分患者的生存[8]。利用單細胞測序可以解析各種腫瘤細胞及腫瘤微環境中其他細胞的特點,更精準地從分子層面闡釋腫瘤發生、發展、轉移和耐藥的機制,提高腫瘤的診斷效率、預測腫瘤轉歸并提高個體化治療水平。本文將對單細胞測序技術及近年來利用該技術探究腫瘤異質性、腫瘤微環境特征和耐藥性等各方面的應用進行綜述。
單細胞測序(single-cell sequencing, SCS)是從單細胞水平揭示細胞基因組、轉錄組或表觀遺傳變化的技術,從不同角度揭示細胞在不同階段的功能和特性,可以通過一次建庫,測得數百上千個單細胞的信息。傳統的測序方法是對大量的混合細胞進行測序,把大量混合細胞的遺傳信息進行平均化,忽略了各種類型的細胞之間的區別。如MAP等通過全部外顯子測序檢測了原發性肺癌的4個不同區域的病灶,發現在不同肺葉的肺癌組織、同一肺葉的不同病灶的肺癌組織、同一肺葉同一病灶不同區域的肺癌組織的基因表達差異[9]。但該研究未能明確這些差異表達基因的細胞來源,很有可能忽略一些數量稀少細胞的表達特征。而SCS技術可以更明確細胞水平的異質性,有利于分析組織中數量較少細胞的遺傳信息和異質性較大腫瘤的特征。
實現SCS有2種方法: (1) 分離單個細胞并獨立構建測序文庫進行測序;(2) 給每個細胞加上獨一無二的DNA序列,測序時,把攜帶相同標記序列(barcode)的片段視為來自同一個細胞,通過一次建庫測得數百上千個單細胞的信息,見圖1。DNA主要是通過一種經過改造的高效轉座酶(transposase)Tn5來添加標記序列;mRNA只需要在poly T引物的5’端加入標記序列即可。為了一次能夠捕獲更多單細胞,目前最常用的解決方案是組合索引,即通過Tn5轉座和PCR加2次標簽[10-11]。

圖1 單細胞測序的發生過程Fig.1 The process of single cell sequencingA: 箭頭代表移動方向,整個反應體系包含: 細胞、磁珠、細胞裂解液、反應需要的酶、buffer及進行油包水的油滴。B: 黑色部分代表細胞標記序列,每個磁珠只有一種細胞標記序列,黃色部分代表獨立分子標簽(unique molecular indexing, UMI),每個鏈上的UMI均不同,橘黃色部分代表來自細胞中的遺傳物質
SCS主要包括單細胞基因組測序、單細胞轉錄組測序和單細胞表觀遺傳測序,從不同角度揭示了腫瘤微環境中不同細胞的特性。
1.2.1 單細胞基因組測序 單細胞基因組測序主要包括單細胞全基因組測序和單細胞全部外顯子測序。主要用于鑒定單核苷酸變異、拷貝數變異(copy number variations, CNV)和染色體結構變異。
1.2.2 單細胞轉錄組測序 最常用的方法為單細胞全轉錄組測序,對單細胞中mRNA進行基因表達定量、功能富集、代謝通路分析。
1.2.3 單細胞表觀遺傳測序 單細胞表觀遺傳測序主要是研究DNA的表觀遺傳修飾,如甲基化、羥基化以及組蛋白修飾等。目前最為常用的是單細胞甲基化測序(single cell methylation sequencing, scM-seq)。scM-seq主要有3種方法: 單細胞限制性代表區域甲基化測序(methylation sequencing of single cell restricted representation regions, scRRBS-seq)、單細胞亞硫酸氫鹽測序(single-cell bisulfite sequencing, scBS-seq)、單細胞全基因組甲基化測序技術(single-cell whole genome bisulfite sequencing, scWGBS-seq)。其中scBS-seq覆蓋的GpG位點最多,約370萬個。
1.2.4 多組學測序 同時進行單細胞基因組和轉錄組測序的方法主要有3種: (1) scGT-seq(single-cell genome and transcriptome codetection and sequencing): 采用微流體的方式將兩者分離進行測序;(2) G&T-seq(genome and transcriptome sequencing): 采用物理方法將兩者分離測序;(3) DR-seq(gDNA-mRNA seque-ncing): 采用擬線性擴增法[12]。
同時進行三重組學的測序: 單細胞三重組學測序(single-cell triple omics sequencing, scTrio-seq)可同時檢測同一個單細胞內的基因組、轉錄組和DNA甲基化組的信息。這種方法是采用一種溫和的裂解方案,僅裂解單個細胞的細胞質從而將mRNA釋放到溶液中,同時保持細胞核完整。再將裂解產物離心分離含有mRNA的上清液與含有核的沉淀,并將各自轉移到不同的管中。對上清液進行scRNA-seq,然后再用scRRBS-seq方法對沉淀物進行DNA甲基化測序。從而可以同時得到來自同一細胞的基因組、轉錄組和DNA甲基化的信息[13]。
單細胞測序主要涉及四大步驟,包括單細胞分離、核苷酸序列(DNA或RNA)擴增、基因測序和數據分析。
1.3.1 單細胞的分離 實體腫瘤組織單細胞分離主要通過酶解法或機械法獲取單細胞懸液,再從其中分選出合適的細胞群進行后續操作;循環腫瘤細胞可以直接進行分選,分選方法包括通過表面標記/表型分離的方法(流式細胞術、微流控、顯微操作、光鑷和激光捕獲顯微切割)[14-15]和稀有細胞群的獲取方法(nanofilters,MagSweeper,激光捕獲,Cell Search,DEP陣列和CellCelector)[16]。
1.3.2 核苷酸序列擴增 人類二倍體單細胞中DNA重量僅為6pg,遠低于NGS所需的ng~μg DNA量,因此進行單細胞測序時需要高效準確的DNA擴增。DNA擴增的方法主要有: (1) PCR技術[引物延伸預擴增PCR(PEP-PCR)、簡并寡核苷酸引物PCR(DOP-PCR)、變體置換DOP-PCR(D-DOPPCR)];(2) 多重置換擴增技術;(3) 微孔置換擴增系統;(4) 多重退火和基于循環的擴增循環[14,17-19]。同時,單細胞中含10pg的總RNA和0.1pg的mRNA,需要將mRNA高保真性高效地反轉錄為cDNA雙鏈,再進行擴增。轉錄組擴增的方法包括: (1) smart-seq(Switching mechanism at 5’ end of the RNA transcript)或smart-seq2;(2) Phi29轉錄組擴增;(3) 基于PCR的半隨機轉錄組擴增;(4) UMI[12]。
1.3.3 建庫測序 基因測序是通過構建文庫,利用各種測序方法,分析基因或轉錄組堿基序列、基因的表觀遺傳修飾。
1.3.4 數據分析 數據分析是指通過各種算法對測序結果進行搜索(收集和篩選),處理(編輯、整理、管理和顯示)及利用(計算、模擬),從測序結果中獲取有用信息的一種方法。
Kim等[20]從2個肺腺癌患者來源的腫瘤細胞異種植入的小鼠(PDX)中提取了83個細胞進行單細胞轉錄組測序,對其中43個小鼠的重復樣本進行全外顯子測序,觀察到包括KRASG12D在內的50種腫瘤特異性單核苷酸變異,發現了所有的PDX細胞之間均具有異質性[20]。
Ni等[21]通過對一種肺癌亞型(不包括其它亞型)的循環腫瘤細胞進行單細胞外顯子測序,發現個體(甚至不同)患者的CTC中一些高度重現的CNV與耐藥相關,一些基因位點(如c-Myc,TERT,HLA)的特定組合的CNV與轉移相關,可能的機制是: 原發性腫瘤中的癌細胞與某些CNV可以侵入周圍組織并有效浸潤,這也可能使CTC發生免疫逃逸。這些為腫瘤的無創診斷和個體化治療提供了新思路。
腫瘤的異質性是腫瘤細胞增殖過程中細胞遺傳物質在復制、轉錄和翻譯的不同層面發生變化,導致子代細胞在基因型和表型中均存在差異。腫瘤的異質性主要體現在4個層面: 不同腫瘤之間、同一腫瘤的不同病灶之間、同一個腫瘤的同一個病灶的不同區域、同一腫瘤的同一病灶的同一區域的不同細胞之間。Kim等[22]用腎切除術后1年內出現獨立肺轉移灶的透明細胞性腎細胞癌患者的肺轉移的腫瘤組織,以及原發的及肺轉移的腫瘤細胞異種植入的小鼠的116個細胞進行單細胞RNA測序,在單細胞水平上發現了腫瘤內部的異質性,發現頑固性患者體內有不同的靶向藥物通路活化,制定了靶向轉移的癌細胞中的兩個相互獨立的通路的治療戰略。Hou等[23]從1例患者的骨髓樣本中隨機選取了82個骨髓細胞以及8個正??谇火つど掀ぜ毎?,進行了單細胞全部外顯子測序,發現骨髓增殖性腫瘤患者的腫瘤細胞與正常細胞的基因表達譜完全不同,不同腫瘤細胞之間的基因表達也存在差異,呈現遺傳多樣性。發現不同的細胞同時存在多種基因突變的短暫時期,其中有明顯的生長優勢的細胞群發展成為腫瘤。
Venteicher等[24]對10例IDH-A腫瘤患者的9879 個單細胞和6個IDH-O腫瘤的4347個單細胞進行了單細胞轉錄組測序,并將測序結果與165個TCGA的數據對比,發現在IDH-A和IDH-O中觀察到有相同的膠質譜系和發育層次結構,表明所有IDH突變膠質瘤起源于同一個祖細胞。與神經膠質譜系的相似性相反,IDH-A和IDH-O在其腫瘤微環境中差異顯著,特別是小膠質細胞/巨噬細胞的富集程度。小膠質細胞和巨噬細胞在不同臨床分期的IDH-A腫瘤之間也不同。這一研究成果對于此類疾病的管理和治療具有重要意義。Casasent等[25]從10例乳腺導管原位癌和浸潤性導管癌患者的腫瘤組織中分離了1293個細胞,并對這些細胞進行了外顯子測序,發現了浸潤性導管癌與導管原位癌原位癌之間有直接的基因相關性(有相同的突變和CNAs),來自同一個譜系,在發生浸潤性改變之前就已經發生浸潤性導管癌中的基因突變和復制子變化,一個或多個克隆遷移到周圍組織形成了浸潤性腫瘤。
Zheng等[26]從6例肝細胞癌患者的外周血、腫瘤組織、腫瘤鄰近部位正常組織中分離了5063個T細胞,進行了單細胞轉錄組測序,對T細胞進行了細胞亞群分類、發展軌跡分析,比較了不同亞群中T細胞克隆的分布,探討了不同亞群之間的關系,發現了每個亞群的特異性基因表達,發現相較于外周血和癌旁組織的T細胞,腫瘤組織中大量存在CD8+T細胞的功能紊亂及抑制性T細胞。并證明Layilin基因對于CD8+T細胞的殺傷功能有抑制作用,可能會成為免疫療法的新靶點。同時,基于TCR數據分析發現,肝癌內存在大量處于耗竭狀態的T細胞,揭示了腫瘤細胞免疫逃逸的原因。此外,該研究還描繪了初始T細胞向耗竭狀態的發展軌跡,并在耗竭性CD8+T細胞亞群中發現了一類FOXP3+抑制性T細胞的存在,提出了耗竭的CD8+T細胞可能會進一步發展成抑制性T細胞。
Tanga等[13]運用最新的scTrio-seq技術對1例肝癌患者癌組織中的25個癌細胞同時進行了3種組學的分析。發現這25個肝癌細胞來自2個不同的細胞亞群。在基因組水平上,亞群I中的細胞含有較多拷貝數增加的染色體及染色體片段,而亞群II中含有較多拷貝數減少的染色體和染色體片段;在DNA甲基化水平上,亞群I比亞群II有更高的DNA甲基化水平,且產生的差異大多發生在CpG島(CGI)區域;在轉錄組水平上,多個與炎癥免疫應答相關的基因,以及與補體激活相關的基因表達在亞群I中都明顯降低,而與癌癥發生和轉移相關的重要基因ANO1和S100A11等的表達在2個亞群中也有明顯差別。對于多種組學數據的分析顯示,在被檢測肝癌細胞中,數量上占比較小的亞群I的細胞的DNA拷貝數變異更多,且DNA甲基化水平更高,可能更易逃脫患者免疫系統的識別,更易出現腫瘤轉移。
Miyamoto等[27]從13例雄激素抵抗(AR)的患者體內收集77份CTC進行單細胞轉錄組測序。通過將AR患者CTC與未進行治療患者的CTC進行對比,發現AR組Wnt信號通路激活。從而闡釋了前列腺癌細胞對雄激素剝奪療法抵抗的原因。Kim等[20]從2例肺腺癌患者來源的腫瘤細胞異種植入的小鼠(PDX)中提取了83個細胞進行單細胞轉錄組測序,對其中43個小鼠的重復樣本進行全外顯子測序,觀察到包括KRASG12D在內的50種腫瘤特異性單核苷酸變異,發現了所有的PDX細胞之間均具有異質性。作者根據KRASG12D突變和69個肺腺癌預后基因表達的風險評分將PDX細胞分為4組,發現表達KRASG12D和低風險評分的組的PDX細胞在體外抗癌藥物治療后依舊存活,說明表達KRASG12D和高RS的PDX細胞可能與耐藥相關。此外,高表達KRASG12D和高RS的PDX細胞會掩蓋無KRASG12D(KRASWT)和/或低RS細胞類型。具有不同作用機制(細胞毒性和靶向特異性信號轉導途徑)的殺腫瘤抗癌藥物能將高表達KRASG12D和高RS的細胞轉變為低表達KRASG12D和低RS的PDX細胞。從而說明: (1)具有激活的KRAS標簽的腫瘤細胞是藥物靶標,但KRAS突變本身不是靶標;(2)與耐藥性相關的腫瘤群體可能被群體內的顯性基因組特征的群體掩蓋。(3)參與離子通道轉運的基因和P型ATP酶的上調可能在耐藥性中起關鍵作用。
盡管運用單細胞測序技術研究腫瘤的發生發展和轉移已經有了一定的成果,但無論是單細胞測序技術本身還是在腫瘤研究中的應用都有一些問題尚待解決。(1) 覆蓋率低。(2) 缺乏一定的空間信息。單細胞測序在單細胞分離過程中將單個細胞從組織中分離出來,整個測序過程不能還原其本身的結構,尚且需要結合免疫組化等其他方法進行空間定位。(3) 缺乏從循環腫瘤細胞中獲取更高純度的腫瘤干細胞的方法[28]。(4) 對于實現DNA高效率高保真度擴增的方法以及實現mRNA反轉錄轉化為高效率高保真度的DNA雙鏈的方法的研究仍需繼續深入。(5) 仍需探索捕獲更多GPG位點的方法。
目前大多數針對腫瘤的研究尚且聚焦于單細胞基因組水平,轉錄組、蛋白質組和表觀遺傳的研究尚且不多。不能完整的揭示整個腫瘤的發生發展和轉移的過程。
單細胞測序技術能鑒別腫瘤發展過程中的基因變異及其變異率、腫瘤的異質性、追溯關鍵基因的克隆起源、腫瘤各亞型之間的基因序列差異,區分腫瘤中的免疫細胞亞群、探索腫瘤微環境,探索腫瘤的發生過程,闡釋腫瘤的耐藥機制,提高腫瘤的治療效果。雖然單細胞測序技術尚存在一些局限性,但它為研究腫瘤發生發展和轉移的分子機制提供了新技術,有望在腫瘤的早期診斷、病程進展和治療的方面提供新的預防和治療手段??梢詫渭毎麥y序技術應用于肺癌領域,從基因組、轉錄組和表觀遺傳3個方面鑒別肺癌發生、復發、轉移的原因,不同類型肺癌的預后不同的原因,不同患者對放化療和藥物治療反應性不同的原因,并尋找這些事件發生的標志物,以該標志物為指導進行疾病的預防、診斷、手術方式以及是否進行新輔助化療,術后放化療和藥物輔助治療方式的選擇,并可以以此為靶點研究新的治療藥物和方法。