童江楊,陳建楠,2,3,薛 婷,2,3,王勖榮*
(1.福建師范大學生命科學學院, 福建 福州 350117; 2.福建省特色海洋生物資源可持續利用重點實驗室, 福建 福州 350117; 3.海洋生物醫藥與制品產業化開發技術公共服務平臺, 福建 福州 350117)
草魚呼腸孤病毒(Grass Corp Reovirus,GCRV)是呼腸孤病毒科Reoviridae水生呼腸孤病毒屬Aquareovirus的原型成員,是中國大陸分離的第1株魚類病毒[1],在已知的水生呼腸孤病毒屬中致病性最強[2-3],能導致草魚在育種以及培育階段出現嚴重的出血熱病。該疾病具有流行地區廣、流行季節長、發病率高、致死率高、危害性大的特點。GCRV是典型的雙鏈RNA病毒,這類病毒通常都是一種無包膜的顆粒,通過單層或多層外衣殼來包裹住一個分段的雙鏈RNA(double-strand RNA,dsRNA)基因組[4-10]。這類病毒一般有一個由內衣殼蛋白(Inner Capsid Proteins,ICPs)組成的封閉二十面體內核(core)。核內包裹有10~12個RNA依賴的RNA聚合酶復合物(RNA dependent RNA polymerase complexes)以及分段式的RNA。這些聚合酶復合物被內衣殼蛋白固定在內核5次對稱軸下方的內表面附近,周圍盤繞著按層狀分布的基因組。經生化試驗鑒定,這些聚合酶復合物的數量應該與分段RNA的數量相對應。包括草魚呼腸孤病毒在內的雙鏈RNA病毒,他們的轉錄與復制過程都在內核中完成,特殊的結構保護了病毒RNA在內源轉錄與復制的過程中免受外部環境的影響,為冷凍電鏡三維重構研究處于生命周期中不同狀態下的病毒三維結構創造了條件。據研究報道,不同狀態下的病毒聚合酶復合物結構會發生變化。這導致病毒聚合酶復合物與病毒衣殼之間存在對稱失配的問題,病毒的三維結構在解析過程中被平均。本研究提出了一種利用二十面體點群的特殊子群搜索的對稱失配三維重構算法,能夠高效地搜索出病毒顆粒圖像對應的真實取向,從而消除對稱失配問題對病毒三維結構信息的影響。
Liu等[11]率先提出了利用對稱失配的方法解析病毒內部的高分辨三維結構,并在2015年最先應用于具有單層外衣殼的質型多角體病毒(CPV)上,成功還原了質型多角體病毒內部呈液晶態層狀分布的基因組結構以及呈D3對稱的病毒RNA聚合酶(RdRp)結構,終結了雙鏈RNA病毒RdRp與基因組呈線軸狀分布的猜想。Li等[12]基于此前研究,系統總結了利用對稱失配三維重構病毒衣殼內部蛋白復合物與基因組結構的一般流程。王勖榮等[13]使用對稱失配三維重構的方法成功解析了具有雙層外衣殼結構的草魚呼腸孤病毒3.6?的全病毒結構。然而由于草魚呼腸孤病毒二十面體衣殼頂點與內部轉錄酶的對稱失配,這些結構仍不是病毒的真實結構。草魚呼腸孤病毒的內部結構仍然具有D3對稱性,對稱失配的問題使得在三維重構中部分真實的結構信息被平均。研究還通過分類對比發現,信號平均的情況只發生在赤道組的RdRp上。
本研究提出了一種利用二十面體點群的特殊子群搜索的對稱失配三維重構算法流程,使用了成熟態的GCRV病毒顆粒作為本研究對象,利用濾波后的自然退化型GCRV病毒顆粒對稱失配三維重構的病毒結構作為初始模型,隨后通過特殊子群定位草魚呼腸孤病毒內部聚合酶復合物缺失的特異性頂點位置,破除了D3對稱性對病毒三維結構的影響,并最終得到了病毒顆粒電鏡圖像對應的取向中心。新算法省略了三維重構過程中利用病毒高分辨結構信息投影擬合減除衣殼電鏡圖像信號的過程,加入基于低通濾波后的低分辨模板的局部取向搜索,提升了搜索的精度及效率,并成功結合三維分類的方法從6個赤道組頂點中分離出特異性頂點位置,為雙鏈RNA病毒生命周期的分子機制研究提供新方法。
1.1.1細胞與毒株 草魚呼腸孤病毒的毒種購自中國典型培養物保藏中心、草魚腎(Ctenop haryngodonIdellus Kidney,CIK)細胞購自武漢華爾納生物科技有限公司。
1.1.2試驗試劑 胎牛血清(Gibco原裝進口,賽默飛世爾科技公司)、PBS緩沖液(阿拉丁試劑公司)、固體氯化銫(西格瑪奧德里奇公司)、透析卡(賽默飛世爾科技公司)、Quantifoil R2/1銅網(北京中鏡科儀公司)。
1.1.3主要培養基 DMEM培養基:Gibco牌,購自賽默飛世爾科技公司。
1.1.4主要儀器設備 A2型二級生物安全柜(上海貝茵生物科技有限公司)、落地式大型冷凍離心機(艾本德股份公司)、水平離心機(賽默飛世爾科技公司)、恒溫細胞培養箱(賽默飛世爾科技公司)、潔凈工作臺(蘇州市安泰空氣技術有限公司)、數顯三用恒溫水浴箱(上海比朗儀器有限公司)、超速離心機(賽默飛世爾科技公司)、FEI Vitrobot Mark IV快速冷凍儀(賽默飛世爾科技公司)、120kV F20 透射電子顯微(賽默飛世爾科技公司)、300kV Titan Krios透射電子顯微鏡(賽默飛世爾科技公司)、K3直接電子檢測器(美國Gatan公司)。
1.2.1草魚呼腸孤病毒的純化和樣品制備 取凍存至液氮中的CIK細胞,于28℃培養箱和含10%胎牛血清的DMEM培養基中復蘇傳代。待細胞生長至豐度為80%時,用Aquareovirus (reovirus)毒種感染CIK細胞,并在細胞完全病變(100% CPE)的情況下收獲細胞及上清液。通過對病變細胞反復凍融3次獲取其細胞裂解液,在4℃下以8000 r·min-1離心30 min,以去除細胞碎片。對所有裂解液上清在4℃下以20000 r·min-1離心1 h,將病毒顆粒離心沉淀成團。離心后去除上清,用PBS緩沖液重懸病毒沉淀,然后于4℃下在1.45、1.38、1.36 g·mL-1的氯化銫溶液中以36000 r·min-1超速離心4 h,再通過密度梯度離心法純化重懸的病毒顆粒。隨后收集超離后含有病毒的條帶,并置于PBS緩沖液中進行透析脫鹽。負染鑒定最終純化的病毒顆粒形態,將最終病毒樣品置于冰上等待冷凍樣品制備。
1.2.2冷凍樣品制備和冷凍電鏡數據收集 樣品玻璃化過程采用FEI Vitrobot Mark IV快速冷凍設備來進行,設置樣品室內條件:4℃環境及100%濕度,然后在FEI Vitrobot Mark IV設備中加入乙烷(用液氮冷卻)。取梯度離心純化的3.5 μL病毒樣品涂在輝光放電后的Quantifoil R2/1網格上,使用濾紙吸附4 s后將載網快速投入至液態乙烷中。對于快速冷凍后載網,使用山西高等創新研究院的配備有K3直接電子檢測器(Gatan)的300 kV FEI Titan Krios透射電子顯微鏡收集樣品的多幀圖像。數據收集參數如下:放大倍數為110000倍,產生的物理像素大小為1.36 ?,對應的超分辨率像素大小為0.68 ?;所收集的多幀圖像,每次曝光7.6秒共計得到32幀圖像,總電子劑量數約為28 e/?2。
1.2.3冷凍電鏡數據處理 本試驗共收集到電鏡多幀圖像約4200張,其中有顆粒共4142張,本研究沿用傳統的MotionCorr2對每組多幀圖像文件進行光束引起樣品漂移的對齊校正,再對襯度傳遞函數(CTF)參數使用Gctf進行估計。完成圖像預處理后,使用自己編寫的Icosprocess軟件對收集到的數據,應用二十面體對稱性(I2)進行三維重構,得到病毒顆粒的高分辨三維結構。在二十面體三維重構的基礎上,利用自主編寫的一系列軟件包:proc_icos、local_box、local_refine以及local_reconstruct對病毒的十二個特異性頂點進行了局部重構與精修,最終得到病毒十二個頂點的高分辨三維結構。基于濾波后的先驗模型,使用自行編寫的軟件包symmetry_mismatch_search對十二個頂點進行非對稱搜索,得到了RdRp的二十面體對稱失配取向,并重構出三維結構。隨后利用得到的對稱失配取向重構出了一個帶有偽D3對稱性的病毒對稱失配三維結構,以此確定了病毒的D3對稱軸,隨后RdRp被分成赤道組與兩極組。赤道組的顆粒對應的sub_box文件被用于提取出該組對應頂點的圖像及對應信息。最后再利用relion 4.0的三維聚類功能分離出特異性頂點的信號。
對GCRV病毒懸浮液進行氯化銫密度梯度離心,最終獲得兩層乳白色蛋白條帶。分別取超離后上下兩層蛋白條帶的樣品進行負染觀察,可以初步判斷,見圖1。上層條帶主要為細胞碎片、雜蛋白及少量病毒顆粒,下層條帶為成熟態GCRV病毒顆粒。取下層條帶進行透析脫鹽后并再次負染觀察,結果(圖2)發現透析后成熟態GCRV病毒顆粒的濃度適中、形態均一,并且負染圖中病毒顆粒雙層衣殼清晰可見。將成熟態GCRV樣品置于冰上等待冷凍電鏡樣品制備。

注:A圖為超離后的上層條帶負染圖,B圖為下層條帶負染圖圖1 CsCl溶液超速離心后的GCRV病毒樣品負染結果Fig.1 Negative staining results of GCRV virus samples after the ultracentrifugation of CsCl solution

圖2 透析脫鹽后的GCRV病毒樣品負染結果Fig.2 Negative staining results of GCRV virus samples after the dialysis desalting
由于使用超分辨的方法收集電鏡圖像肉眼無法識別病毒顆粒,對圖像施加以Gaussian濾波,使得冷凍電鏡圖像中的病毒顆粒肉眼可見,見圖3A。使用Gctf計算所收集數據的平均最高分辨率可達4.2?,見圖3B。成熟態的GCRV是一種生物大分子,由1500多個分子組成,直徑約為820?,見圖3C。先前的研究表明,使用300 kV的低溫電鏡可以在近原子分辨率下進行數據收集,并得到高分辨三維結構。

注:A圖為GCRV病毒顆粒濾波到6?后的冷凍電鏡圖像;B圖為電鏡圖像的功率譜,紅圈為GCTF預測的效信號分辨率;C圖為電鏡圖像中提取的GCRV顆粒,直徑約為82 nm圖3 試驗收集的GCRV病毒顆粒的冷凍電鏡圖像及顆粒信息Fig.3 Cryo-EM images and particle information of GCRV virus particles collected in the experiment
試驗總共收集了4215張冷凍電子顯微圖像。三維重構和精修是使用本課題組獨立的研究和開發軟件包進行的。數據預處理階段,通過自動顆??蛉『腿斯秃说姆绞娇偣蔡崛×?5307個病毒顆粒,并根據相殘標準來獲取的近原子分辨二十面體三維結構,見圖4。

注:左圖為GCRV病毒顆粒二十面體三維重構結構;右圖為左圖結構的局部二級結構圖4 GCRV病毒三維結構圖及局部二維結構Fig.4 Three-dimensional structure diagram and local two-dimensional structure of GCRV virus
通過觀察GCRV病毒顆粒的二十面體三維結構,可以看到明顯的二級結構以及較為顯著的氨基酸側鏈信息,說明該結構分辨率已達到近原子分辨,其病毒顆粒的取向中心參數已完全收斂。對比GCRV病毒顆粒與MRV病毒顆??梢园l現,二者在結構蛋白種類數量與組裝結構上并無太大差異,見表1。

表1 GCRV與MRV結構蛋白種類、位置與功能
二十面體病毒衣殼的三維重構一般都利用該結構的高度對稱性。該方法通過對衣殼上一個非對稱單元對應的取向施加以60個等價對稱操作,得到其他59個等價取向并加以利用,可以使數據得到更有效的利用。這60個對稱操作對應了二十面體的60個點群。二十面體上的12個頂點對應了二十面體60個對稱操作中的12個。利用這一特性本研究開發了一套針對雙鏈RNA病毒十二個頂點的局部重構算法,流程圖見圖5。首先使用proc_icos程序將二十面體病毒顆粒的一個頂點轉到特殊位置,并得到它在實空間中的坐標。接著通過計算得出了這12個對稱操作對應的點群,并利用這些點群得到了12個等價變換操作矩陣。利用這些變換操作,可以得到實空間中病毒顆粒12個頂點的位置坐標。選擇合適的sub_box大小并使用local_box程序將這些頂點的信號從病毒顆粒圖像中提取出來,隨后使用local_reconstruct程序對病毒顆粒進行頂點的局部重構,得到病毒12個頂點的三維平均。由于二十面體的頂點具有C5對稱性。利用local_refine應用C5對稱性對該結構進行精修后,即可得到一個局部的高分辨結構。

圖5 GCRV病毒顆粒頂點局部三維重構流程Fig.5 Flow path of local 3D reconstruction of GCRV virus particle vertex
在此前的研究中,通過病毒衣殼減除、基于高分辨衣殼信號的衣殼圖像信號減除以及對稱失配信號搜索等方法,已掌握了草魚呼腸孤病毒自然退化型顆粒(Native Degrad Particle,NDP)的RdRp結構信息。本研究基于先驗的結構信息,開發出了一套病毒局部對稱失配取向搜索的算法。本研究以濾波到20?的NDP頂點對稱失配結構為模板,利用程序symmetry_mismatch_search作局部取向的搜索,對稱性選擇C5。等到取向收斂后即可得到GCRV病毒顆粒頂點的對稱失配取向,通過迭代精修即可得到高分辨的病毒RdRp。
草魚呼腸孤病毒擁有11條分段式的雙鏈RNA,對應有11個RdRp。然而正二十面體共有12個頂點,RdRp與頂點對稱失配。先前的研究證明,RdRp呈偽D3對稱分布。沿D3對稱軸將GCRV的RdRp分成兩極組與赤道組,那么通過平均密度判斷可知,缺失的RdRp分布在赤道組中。針對這個問題本研究對局部搜索的范圍進行了優化,將12個頂點對應的對稱操作再次細分為兩極組與赤道組兩組,分別得到兩個分組的對稱操作矩陣。隨后利用赤道組的對稱操作矩陣提取了該分組對應的頂點圖像,并編寫了取向中心文件轉換腳本Icos2RLN.Py將結果接入到relion 4.0中進行不帶精修的三維聚類。
由于赤道組共有6個不同的位置,因此對這些圖像聚類的時候分成了6組,結果見圖6。通過觀察這些聚類結構的二維投影發現,6個位置中有一個位置沒有RdRp的信號,且該位置的被類似核酸的物質占據。該聚類結果證明了算法的有效性,對基于GCRV對稱失配結構的病毒內源轉錄分子機制研究以及GCRV生命周期的分子機制研究都具有重要意義。

圖6 GCRV病毒內部赤道組RdRp的三維聚類結果Fig.6 Three-dimensional clustering results of the equatorial group RdRp within the GCRV virus
此前,研究人員總結過該類病毒的分段RNA數量應與RdRp數量一致的規律。本研究結果指出,GCRV病毒的RdRp數量確實為11個,與其具有的11段分段RNA數量一致。這與先前擁有10個分段RNA的MRV與CPV,具有10個RdRp的研究結果也相吻合。同時,分類結果也證實了本研究提出的算法切實可行。至于病毒的缺失的RdRp為何必須位于D3對稱中靠近赤道的一組,本試驗無法給出合理推斷,且目前也沒有相關研究證據可以說明。此類病毒的RdRp的分布規律和組裝機制仍有待進一步探明。
GCRV作為典型的雙鏈RNA病毒,其生命周期擁有獨特的內源轉錄機制。在雙鏈RNA病毒中,有致死率極高的輪狀病毒(Rotavirus)、作為基因治療載體的哺乳動物呼腸孤病毒(Mammalian Reovirus)以及能造成對我國水產行業極大沖擊的草魚出血熱的草魚呼腸孤病毒(Grass Carp Reovirus)。這些病毒由于在組裝過程中自帶有內源轉錄蛋白,其在侵染細胞后可以在病毒封閉的衣殼內完成RNA的轉錄與復制,穩定性很高。針對這類病毒的抗病毒藥物與疫苗研發需要對其生命周期的分子機制有充分的了解,而獲得組成病毒的結構蛋白的高分辨結構信息又是前者的充要條件。本研究成果為GCRV乃至其他雙鏈RNA病毒生命周期的分子機制的探索提供了方法學基礎。在此基礎上,本研究期望獲取其對稱失配結構的高分辨信息,并闡明其生命周期的分子機制,為抗病毒藥物與疫苗研發提供堅實的理論基礎。