陳世鈺,崔 帥,蔣亞君,鑫 婷,王 洋,郝玉欣,黃建新,郭曉宇,朱鴻飛,吳佳俊,賈 紅
(1.中國農業科學院北京畜牧獸醫研究所,北京 100193;2.中國動物疫病預防控制中心,北京 102618;3.大理農林職業技術學院,大理 671003)
非洲豬瘟(African swine fever,ASF)是由非洲豬瘟病毒(African swine fever virus,ASFV)感染引起的豬的急性、熱性、高度接觸性傳染病。ASFV是一種核質大DNA病毒,長度介于170~190 kb[1],共含有150多個開放閱讀框(open reading frame,ORF),其中34個編碼結構蛋白,但目前仍有很多蛋白功能未知[2-3]。1921年ASF首次在肯尼亞暴發[4],隨后在撒哈拉以南非洲大部分地區和撒丁島流行[5]。ASFV在20世紀50年代首次進入歐洲,到1995年從西班牙和葡萄牙徹底根除[6]。2007年歐洲再次暴發疫情,并傳播至烏克蘭、歐盟東部國家、波蘭、俄羅斯等國家[1,7]。2018年中國遼寧首次報道ASF疫情[8],隨后傳播至全國,造成巨大的經濟損失。ASFV傳播方式多樣,主要通過易感動物直接接觸傳播,或污染的豬肉、車輛、人及蜱間接傳播[9]。發病動物表現高熱、出血和多器官病變,短時間內死亡。試驗性感染后7~10 d出現臨床癥狀,可被視為感染晚期[10]。
長鏈非編碼RNA(long non-coding RNA,lncRNA)是一種非編碼、長度>200 nt的RNA分子,位于細胞核或細胞質中,具有一定功能,可在轉錄、轉錄后及表觀修飾等多個水平上調節靶基因的表達[11-12],在細胞增殖、自噬、凋亡及疾病發生發展等多個過程中發揮重要作用。本研究利用高通量測序技術成功構建了豬外周血淋巴細胞的lncRNA文庫,通過GO功能和KEGG信號通路富集分析,初步鑒定出影響Toll樣受體信號通路的調控網絡,為進一步闡述病毒炎癥反應和病毒復制等提供了一定理論依據,為ASF的防控提供技術支撐。
1.1.1 試驗動物及毒株 10頭英系大白豬購自北京市SPF豬育種管理中心,所有豬檢測ASFV、豬繁殖與呼吸綜合征病毒(PRRSV)、豬圓環病毒(PCV)、豬偽狂犬病病毒(PRV)及其抗體,結果均為陰性。本試驗所用毒株ASFV CADC-HN09株由中國動物疫病預防控制中心提供。試驗動物飼養于中國動物疫病預防控制中心P3實驗室
1.1.2 主要試劑及儀器 TRIzol?Reagent、Plant RNA Purification Reagent、UNG酶、Qubit 4.0(Invitrogen公司);TruseqTMSmall RNA sample pre Kit、cBot Truseq PE Cluster Kit v3-cBot-HS、Novaseq 6000 SBS Kit v3-HS(200 cycles)(Illumina公司)。NanoDrop2000分光光度計(Thermo公司);瓊脂糖(北京全式金生物技術有限公司);RNA提取試劑盒、lnRcute lncRNA First-Strand cDNA Kit、lnRcute lncRNA qPCR Kit(SYBR Green)、DL2000 DNA Marker(天根生化科技(北京)有限公司)。實時熒光定量PCR儀(型號:ABI 7900HT)。
1.2.1 試驗動物分組及處理 將豬分為試驗組(5頭)和對照組(5頭),分別接種1 mL 102HAD50的ASFV強毒和等劑量的PBS。于第7天采集前腔靜脈血,用淋巴細胞分離試劑盒分離淋巴細胞,細胞樣品于-80 ℃保存備用。
1.2.2 RNA提取與質量檢測 試驗組和對照組各隨機選取3個樣品進行高通量測序。采用TRIzol法提取樣品總RNA,1.0%瓊脂糖凝膠電泳檢測樣品完整性,NanoDrop2000分光光度計檢測樣品濃度與純度。其中,28S/18S為1.8~2.2,RIN值>7代表提取RNA完整性較好;濃度≥50 ng/μL、總量不低于1 μg即滿足建庫要求。
1.2.3 測序數據及質量控制 基于邊合成邊測序(sequencing by synthesis,SBS)技術,采用Illumina 高通量測序平臺對cDNA文庫進行測序,產出大量的高質量的原始數據(Raw data),其大部分堿基質量分值能達到或超過Q30。對原始測序數據進行質量過濾,去除測序接頭序列、低質量讀段、含N比例超過10%的序列及長度過短序列,得到高質量的質控數據(Clean data)。
1.2.4 參考基因組比對分析 質控后的原始數據,即Clean data(reads),因測序片段是mRNA隨機打斷的,為確定這些片段由哪些基因轉錄而來,使用HISAT2數據庫將質控后的測序數據比對到豬參考基因組(https://www.ncbi.nlm.nih.gov/genome/?term=txid9822[Organism:exp]),進而獲得用于后續轉錄本組裝、表達量計算等的Mapped data,同時對該次轉錄組進行測序比對。
1.2.5 lncRNA差異表達分析 獲得所有lncRNA表達量后,對表達數據進行統計學分析,進而篩選不同樣本之間顯著差異的基因。篩選過程以log2|FoldChange|≥1且P<0.05為標準,滿足條件的為顯著差異lncRNA,并對篩選到的差異lncRNA進行可視化展示。
1.2.6 差異表達lncRNA靶基因預測及富集分析 對差異表達lncRNA采用反式調控(trans法)進行靶基因預測,即當lncRNA與一些距離較遠的基因在表達量上存在正相關或負相關的情況時,就可通過樣本間lncRNA與蛋白編碼基因的表達量相關性分析來預測其靶基因,并對篩選到的差異表達lncRNA進行靶基因GO功能和KEGG信號通路富集分析。
1.2.7 Toll樣受體信號通路調控網絡 根據GO功能和KEGG信號通路富集分析結果,篩選Toll樣受體信號通路,挖掘出調控該通路的內源性lncRNA及相關靶基因。根據差異表達的內源性lncRNA預測其反式調控的靶基因mRNA,初步挖掘調控該通路的lncRNA-mRNA調控網絡。
1.2.8 實時熒光定量RT-PCR驗證篩選的lncRNA 為確保測序結果的準確性,通過實時熒光定量RT-PCR方法進一步驗證所篩選lncRNA。以U6作為內參基因,引物信息見表1。引物由生工生物工程(上海)股份有限公司合成。反轉錄及實時熒光定量PCR體系和程序參照試劑盒要求進行。

表1 引物信息
2組樣品經過高通量測序后,得到Raw reads,結果見表2。原始文庫經過去除低質量和受污染的序列后,獲得Raw reads 519 473 712條,Clean reads 504 387 798條,而純凈序列/原始序列集中在92%~98%,說明低質量數據較少,測序效果良好。對照組GC含量在50%左右,而試驗組GC含量卻維持在56%以上,說明病毒感染導致宿主基因組中GC含量升高。

表2 測序數據統計結果
使用HISAT2數據庫對測序數據進行注釋并將其定位到豬參考基因組,分析序列在基因組上的分布情況,結果見表3。由表3可知,純凈序列的總體比對率在79%~93%,將其去重后的唯一比對率稍有下降,維持在63%~90%,以上結果表明,僅有少量reads可比對到參考基因組多個位置,多數reads為唯一匹配。

表3 比對率統計
利用高通量測序技術對差異表達的lncRNA進行分析,以log2FoldChange為橫坐標、log10FDR為縱坐標對6個樣本中的差異lncRNAs繪制火山圖(圖1),直觀反映了樣本間差異表達的分布情況,將上調和下調的顯著性差異表達進行統計,結果顯示,上調表達lncRNAs 38個,下調表達lncRNAs 35個。

右側點表示顯著上調的基因;左側點表示顯著下調的基因
以樣本為橫坐標、差異表達基因為縱坐標對差異顯著lncRNA進行聚類分析,結果見圖2。由圖2可知,2組樣本間lncRNAs表達差異顯著(P<0.05),試驗組與對照組屬于不同的分支,說明這2組樣本所有基因的表達模式不同。

圖2 差異表達lncRNAs聚類熱圖
2.4.1 GO功能富集 將篩選出來的差異表達的lncRNA進行反式調控靶基因預測,利用GO數據庫進行分類,涉及生物過程(biological process,BF)510個條目、細胞組分(cellular component,CC)87個條目、分子功能(molecular function,MF)67個條目。生物過程包括調節免疫系統過程、防御反應、生物刺激、病毒反應和先天性免疫等;細胞組分大多富集在胞內的細胞器和染色體等;分子功能主要富集在蛋白結合、ATP酶調節活性、陰離子結合和腺苷酸結合等。挑選顯著富集的前30個繪制氣泡圖,結果見圖3。

每個節點代表一個GO條目術語,代表富集到每個GO 條目中的差異基因;節點的大小與富集到該通路中的差異基因個數成正比
同時對GO富集結果前10個GO條目繪制網絡圖,其中,調節免疫系統過程、多器官反應、壓力應答等過程富集基因最多,且靶基因存在一定的交叉,同時調控多種反應過程,如STAT2參與病毒防御、病毒反應和壓力應答等過程,調控病毒感染后的信號轉導;IL23R、TRAF3、TNFRSF4、IFNGR1等多種細胞因子相關受體被顯著富集到這些條目(圖4)。

圖4 GO功能富集網絡圖
2.4.2 KEGG通路富集 選取顯著差異的前29條通路繪制柱狀圖(圖5)。結果顯示,841條靶基因共富集到332個信號通路上,大部分靶基因與細胞循環、疾病及免疫應答有關,其中細胞循環差異最顯著,含127條靶基因,占15.1%,差異顯著性依次為p53信號通路、減數分裂等。

圖5 KEGG通路功能分析
進一步分析發現,Toll樣受體信號通路(Toll-like receptor signaling pathway)、TNF信號通路(TNF signaling pathway)、產生IgA的腸道免疫網絡(intestinal immune network for IgA production)、甲型H1N1流感(influenza A)等與免疫應答反應、細胞凋亡等過程有關,其中,Toll樣受體信號通路在這些通路中被顯著富集。
通過差異表達的lncRNA的KEGG信號通路分析發現Toll樣受體通路顯著富集,該通路共富集到靶基因22個,包括RIPK1、NFKBIA、TRAF3、PIK3CD、LY96、CXCL11、SPP1、MAPK8、IRAK1、IRF7、TLR3、MAP2K6、PIK3CB、TICAM1、TLR1、TLR6、PIK3CA、CCL4、CXCL10、CXCL9、TOLLIP、IFNAR1。lncRNA-ENSSSCG00000041959、lncRNA-ENSSSCG000000 37324、lncRNA-ENSSSCG00000049925、lncRNA-ENSSSCG00000048079共4個lncRNA(后續簡寫為lncRNA959、lncRNA324、lncRNA925、lncRNA079)是與Toll樣受體信號通路相關的差異表達lncRNAs,具體信息見表4。經分析后發現多數靶基因與lncRNA959作用,lncRNA959位于6號染色體(P=0.00879),預測出lncRNA959通過反式調控靶基因RIPK1、IRAK1的表達,兩者與lncRNA靶向調控的正確率分析高達0.97和0.99,初步鑒定出lncRNA959-RIPK1和lncRNA959-IRAK1可能是影響Toll樣受體信號通路的lncRNA-mRNA調控網絡。

表4 Toll樣受體信號通路靶基因
為驗證測序結果中獲得的差異表達lncRNA結果的可靠性,對Toll樣受體信號通路富集到的4個主要基因進行實時熒光定量RT-PCR分析,結果發現RNA-seq與實時熒光定量RT-PCR(qRT-PCR)基本一致(圖6),說明測序結果較可靠。

圖6 4個差異表達lncRNAs的驗證
ASFV屬于非洲豬瘟病毒科非洲豬瘟病毒屬,為該科唯一成員。該病毒是唯一的DNA蟲媒病毒,只感染豬,家豬和野豬尤為易感,感染后出現嚴重的臨床癥狀,包括持續高燒、厭食、水樣腹瀉、皮膚潮紅和運動失調等[13-15]。病理學上可見全身器官出血性病變,并伴有白細胞減少癥和細胞因子風暴[16]。細胞因子在免疫反應、抗病毒作用等方面有著關鍵作用,調節先天和獲得性免疫反應[17-18]。盡管目前對發病機理的認識不斷加深,但ASFV誘發這些變化的具體機制仍有待進一步研究。
新一代高通量測序技術近幾年得到快速發展并不斷優化,在挖掘和鑒定lncRNA方面表現出巨大的優勢。研究發現,非編碼RNA在生物活動和病理過程(如病毒感染和腫瘤發生)中發揮重要作用[19],不僅對豬的各種性狀具有調控作用,而且可影響某些疾病的發生發展[12],尤其是病毒宿主相互作用以及病毒增殖等過程[20]。Hao等[21]檢測乙型肝炎病毒(HBV)感染相關lncRNAs的血漿水平發現,AP000253能促進肝癌細胞系中HBV的轉錄和復制,并可作為HBV感染的潛在生物標志物。Liu等[22]發現了參與調節抗病毒先天免疫反應的lncRNA-Malat1,通過RNA-RBP互作網絡靶向TDP43激活來抑制抗病毒先天反應,增加了對先天反應和自身免疫發病機制的分子調控的認識。目前,有關ASFV感染后引起宿主mRNA和miRNA等差異表達譜已有報道,但ASFV感染后引起宿主lncRNA差異表達譜鮮有報道。根據先前的報道,急性ASF試驗性感染在接種后7~10 d出現臨床癥狀,可被視為感染晚期[10]。組織病理學評估顯示疾病發生典型改變,如巨噬細胞浸潤和細胞凋亡,以及ASF感染終末期的細胞因子風暴[23]。同時,本研究在試驗過程中也發現在3~5 d開始表現食欲下降等臨床癥狀,7 d左右出現運動障礙、食欲衰退和高熱等癥狀。因此,本試驗以ASFV感染7 d后的外周血淋巴細胞為研究對象,利用高通量測序技術成功構建了豬外周血淋巴細胞的lncRNA文庫,去除低質量、受污染序列及<25 bp的小片段后,共獲得Clean reads 504 387 798條,這些高質量數據不僅豐富了豬的RNA文庫,同時為后續研究奠定了一定基礎。經進一步統計學分析后得到73個差異表達lncRNAs,聚類熱圖顯示,2組樣本的基因表達量差別較大,存在明顯的上調、下調。
利用GO數據庫,將差異基因按照參與的生物過程、細胞組分、分子功能等分類富集分析,生物過程富集到調節免疫反應過程及先天性免疫,推測這些差異lncRNA可能通過模式識別受體識別特定病原體相關分子模式,啟動先天免疫應答反應,從而誘導干擾素的表達。ASFV編碼多種免疫逃逸蛋白以逃避宿主天然免疫系統,如MGF360、MGF505能抑制Ⅰ型干擾素(IFN-I)表達,同時抑制產生的抗病毒效應[24]。Jiang等[25]發現lnc-Lsm3b與病毒RNA競爭結合RIG-Ⅰ單體,限制RIG-Ⅰ蛋白的構象變化,阻止下游信號傳導,從而終止IFN-Ⅰ的產生。IFN-Ⅰ誘導的lncRNA-ISIR反饋通過去除免疫反應中的抑制性Fli-1來增強IRF3的激活,揭示了lncRNA介導的轉錄因子激活的調節方法[26]。對于本研究中篩選到的差異lncRNAs調節先天性免疫需進一步驗證。
差異表達lncRNAs靶基因的KEGG信號通路富集結果顯示,Toll樣受體信號通路、TNF信號通路、產生IgA的腸道免疫網絡、甲型H1N1流感等通路顯著富集。TLRs對病原體的識別通過誘導促炎細胞因子的產生和共刺激分子的上調,引起先天免疫的快速激活。通過MyD88依賴性途徑進行TLR信號傳導途徑,導致促炎細胞因子的產生,并快速激活NF-κB和MAPK。Toll樣受體在ASF感染過程中也發揮著重要作用[27]。Henriques等[28]發現一種新的ASFV蛋白pI329L可抑制Toll樣受體3(TLR3)信號通路。ASFV編碼蛋白A528R通過靶向p65激活和核轉位抑制TLR8-NF-κB信號傳導。I329L抑制dsRNA刺激的NFκB和IRF3的激活,I329L蛋白的表達也抑制了IFN-β和CCL5的激活。TRIF的過度表達逆轉了I329L介導的NFκB和IRF3激活的抑制[29]。Yang等[30]在ASFV感染后的轉錄水平分析后發現,TLR4和TLR6是RLR途徑的負調節因子,在ASFV感染期間呈顯著下降趨勢,本研究在參與Toll樣受體信號通路的lncRNA靶基因中也發現了TLR1、TLR3、TLR6等因子,這表明ASFV感染可能激活了TLR和RLR信號通路。本研究發現,ASFV感染會導致外周血淋巴細胞Toll樣受體信號通路顯著富集,結合前期報道及研究,ASFV可能通過調控Toll樣受體信號通路進而影響宿主免疫炎癥反應。
本試驗成功運用新一代高通量測序技術篩選出差異表達lncRNAs,并進行GO功能、KEGG通路富集分析,初步鑒定出lncRNA-ENSSSCG00000041959-RIPK1和lncRNA-ENSSSCG00000041959-IRAK1可能是影響Toll樣受體信號通路的調控網絡。預測lncRNA-ENSSSCG00000041959通過反式調控靶基因RIPK1、IRAK1的表達進而影響Toll樣受體信號通路。