申 欣, 吳志剛,3
(1. 淮海工學院 海洋學院, 江蘇 連云港 222005; 2. 中國科學院 海洋研究所, 山東 青島 266071; 3. 加州大學河濱分校, 美國 加利福尼亞州 92521)
單環刺螠線粒體基因組全序列的獲得
——長PCR結合鳥槍法測序
申 欣1,2, 吳志剛2,3
(1. 淮海工學院 海洋學院, 江蘇 連云港 222005; 2. 中國科學院 海洋研究所, 山東 青島 266071; 3. 加州大學河濱分校, 美國 加利福尼亞州 92521)
由于具有單基因所不可比擬的優勢, 線粒體基因組現已成為后生動物種群遺傳和分子系統發育研究中一個重要的信息來源。本研究選取螠蟲動物的代表物種——單環刺螠(Urechis unicinctus), 詳細闡述了利用長PCR方法擴增其線粒體DNA, 獲得約15 kb的擴增產物, 進而構建shotgun文庫, 最終成功獲得單環刺螠線粒體基因組全序列的流程。本實驗流程樣品需求量少、設備要求低、簡便快捷。
線粒體基因組; 長PCR; 鳥槍法; 單環刺螠(Urechis unicinctus)
由于分子生物學和基因組學的快速發展, 科學家們逐漸認識到生命形式起源和進化的密碼蘊涵在DNA鏈中, 核苷酸的組合變化和基因的排列順序提供了有價值的系統發育信息。與單個基因相比, 線粒體基因組是一個完整的體系, 具有信息量豐富(包括RNA二級結構和基因排列順序等)和系統發育樹結構穩定等優點[1~3]。由于線粒體基因組具有諸多優勢,使其成為研究后生動物關鍵類群的起源、進化、系統發育關系及群體遺傳分化的理想材料[4~6]。
目前可以通過 3種方法獲得后生動物線粒體基因組: 常規PCR方法、物理分離方法和長PCR方法。常規 PCR方法操作簡單、對樣品需求量少, 但容易受到線粒體假基因和串聯重復區的干擾; 而物理方法分離線粒體基因組 DNA, 則存在對儀器要求高、樣品需求量大等缺點[2], 這在一定程度上制約著線粒體基因組研究的快速發展。本研究選取 蟲動物代表物種——單環刺螠(Urechis unicintus), 利用長PCR方法擴增其線粒體DNA進而對長PCR產物構建shotgun文庫, 最終成功獲得單環刺螠線粒體基因組全序列。本實驗流程的建立為測定其他海洋無脊椎動物的線粒體基因組提供較高的參考價值。
1.1 材料
鮮活的單環刺螠樣品購于水產品市場, 體長約15 cm, 呈長囊形, 身體呈淡紅色, 由吻及軀干兩部分組成。
1.2 方法
1.2.1 單環刺螠線粒體分離及線粒體DNA提取
取1g單環刺螠肌肉組織, 在潔凈培養皿里將其剪碎。將剪碎的肌肉組織轉入勻漿管里進一步勻漿。勻漿時, 按照比例[勻漿緩沖液體積(mL) : 組織質量(g) =2 : 1]加入勻漿緩沖液(100 mmol/L Tris-HCl, 250 mmol/L蔗糖, 10 mmol/L EDTA, pH 7.4); 勻漿10次左右至無塊狀組織, 把勻漿液轉移至 1.5 mL 無菌Eppendorf管中; 4 ℃、2 300 g離心10 min, 棄沉淀,轉上清于新的無菌Eppendorf管中; 重復上述步驟1次; 取上清液于4 ℃、20 000 g離心20 min沉淀線粒體, 棄上清。然后, 加750 μL裂解液(100 mmol/L Tris-HCl, 100 mmol/L EDTA, 1.5 mol/L NaCl, 1%CTAB, pH 8.0)裂解提取DNA, 所得DNA作為常規PCR和長PCR的模板。
1.2.2 單環刺螠線粒體DNA的PCR擴增
利用后生動物cox1基因的通用引物(LCO: GGT CAA CAA ATC ATA AAG ATA TTG G, HCO: TAA ACT TCA GGG TGA CCA AAA AAT CA)[7]采取常規PCR的擴增方案獲得cox1基因的部分片段, 測序后得到單環刺螠cox1基因的部分序列, 然后根據此序列設計長PCR引物(cox1F: TCA CCC TGT TCC TAC TCC TCC ACC AA,cox1R: CCT ACG ACC AGA ACG AAT GCC TTT AT), 擴增余下的線粒體基因組區域, 從而獲得單環刺螠線粒體DNA(圖1)。長PCR擴增的反應體系為: 18 μL ddH2O、2.5 μL LA-Buffer(Mg2+plus, Takara)、0.5 μL dNTP(分別為 10 mmol/L)、1 μLcox1F(5 μmol/L)、1 μLcox1R(5 μmol/L)、1 μL LA Taq聚合酶(1 unit, Takara)和1μL模板。長PCR擴增的反應條件為: 94 ℃變性2 min, 然后34個循環(94 ℃20 s, 54 ℃退火45 s, 65 ℃延伸13 min), 最后72 ℃延伸10 min, 最終獲得了大小約15 kb的線粒體DNA片段(圖2)。

圖1 單環刺螠線粒體基因組的擴增方法Fig. 1 The amplification strategy ofU. unicinctusmitochondrial genome

圖2 單環刺螠線粒體DNA長PCR擴增產物Fig. 2 Long-PCR amplification product ofU. unicinctusmitochondrial DNA
1.2.3 單環刺螠線粒體DNA隨機破碎及shotgun文庫的構建
把長度約為15 kb的PCR產物置于冰上用超聲破碎儀破碎(200 V, 持續時間0.2 s, 破碎3~5次), 在1%瓊脂糖凝膠上檢測線粒體 DNA的破碎情況。在進行末端修復后, 利用膠回收試劑盒(QIAGEN Gel Purification Kit)回收破碎后的 PCR產物, 純化后的產物隨后與pUC18(Takara)平端載體連接16 h。連接產物于透析膜上透析1 h。取1 μL透析后連接產物用BIO-RAD電轉儀電擊(電壓: 2.1 kV)轉入49 μL大腸桿菌(Escherichia coli)DH10B, 電擊產物迅速轉入1 mL SOC培養基中, 180 r/min復蘇1 h, 取100 μL菌液在LB平板(含氨芐青霉素100b mg/L、X-gal 40 mg/L和IPTG 24 mg/L)上過夜培養。
1.2.4 重組質粒測序
根據pUC18載體自身序列設計的M13+和M13?引物在ABI 3730 x1自動測序儀上對陽性克隆進行測序。單環刺螠線粒體基因組大部分序列是通過克隆測序獲得; 在克隆沒有覆蓋到的區域以及低質量值的位置, 通過設計引物進行常規 PCR擴增, 然后對常規PCR產物進行測序獲得峰圖。
1.2.5 序列拼接及基因注釋
將測序峰圖文件通過Phred-phrap軟件進行序列組裝[8,9], 然后通過Consed軟件對序列拼接的精確性和測序質量進行檢查[10], 從而獲得單環刺螠線粒體基因組全序列。蛋白質編碼基因和核糖體RNA基因通過DOGMA軟件進行注釋[11], 而轉運RNA基因通過tRNAscan-SE 1.21軟件進行預測[12]。
2.1 單環刺螠線粒體基因組結構及組成
單環刺螠線粒體基因組全長為15 761 bp, 與其他大多數后生動物線粒體基因組的基因組成相同,共編碼37個基因, 其中包括13個蛋白質編碼基因、22個轉運RNA基因和兩個核糖體RNA基因。基因排列順序與美洲刺螠(Urechis caupo)線粒體基因組完全相同[13]。單環刺螠、美洲刺螠與已知的環節動物線粒體基因組在基因分布上具有一個共同的特征:所有基因都在同一條鏈上編碼[14~17]。
2.2 單環刺螠線粒體基因組的非編碼區
單環刺螠線粒體基因組與已測定的其他后生動物線粒體基因組一樣, 包含了幾個非編碼區。非編碼區總長 997 bp, 其中最長的非編碼區長度為923 bp, 余下的74bp分布在線粒體環上其他的 15個區域, 除了在tRNASer(AGN)和cox3之間的非編碼區域長達42 bp之外, 其余非編碼區的長度均在1~5 bp。單環刺螠、美洲刺螠與環節動物代表物種的最大非編碼區的長度和 AT含量見表1。

表1 單環刺螠、美洲刺螠與環節動物代表物種線粒體基因組的最大非編碼區Tab. 1 The largest non-coding region of available echiurans and annelids mitochondrial genomes
2.3 基因排列順序Boore等[18]認為基因排列的比較可為系統發育研究提供一些有價值的信息, 特別是在探討一些古老的進化關系時。比較螠蟲動物和環節動物的線粒體基因組的基因排列, 呈現出較高的保守性。環節動物門內的基因順序相對保守[14], 單環刺螠線粒體基因組有 3個基因區塊與環節動物具有相同的基因排列順序, 分別是trnT-nad4L-nad4、nad1-trnI和trnQ-
nad6-cob-trnW-atp6-trnR-trnH-nad5-trnF(圖 3)。這些保守的基因排列順序在線粒體基因組層次上支持蟲動物和環節動物具有親緣關系。
2.4 3種線粒體基因組獲取方法的比較
目前可通過 3種方法獲得后生動物線粒體基因組: 常規PCR方法、物理分離方法和長PCR方法。常規PCR的方法根據后生動物線粒體基因組的通用引物, 或通過近源物種的線粒體基因組全序列, 設計出覆蓋全基因組的引物, 采用常規 PCR技術對線粒體基因組進行擴增。常規PCR的方法具有操作簡單、對樣品需求量少等優點, 但在操作中容易受到線粒體假基因和串聯重復區的干擾[2,19]。而基于物理方法分離線粒體基因組 DNA(主要包括密度梯度離心法和差速離心法等), 則存在對儀器要求高、樣品需求量大等缺點。基于長PCR的方法對模板質量、引物特異性和聚合酶都有相對較為嚴格的要求[2]。本研究以1g單環刺螠肌肉組織為實驗材料, 利用長PCR方法擴增其線粒體 DNA, 獲得約 15kb的擴增產物,進而超聲隨機破碎、構建shotgun文庫, 最終成功獲得單環刺螠線粒體基因組全序列的流程。

圖3 螠蟲動物和環節動物線粒體基因組基因排列的比較Fig. 3 Gene order of mitochondrial genomes from Echiura and Annelida
本研究通過長 PCR方法, 高效、快捷地獲得高純度的單環刺螠線粒體 DNA, 通過構建 shotgun文庫順利獲得了單環刺螠線粒體基因組全序列, 通過生物信息學軟件進行了序列組裝和基因預測。結果顯示, 單環刺螠線粒體基因組 DNA為雙鏈環狀DNA, 全長15 761 bp; 與后生動物線粒體基因組典型的基因組成相同, 包含37個基因, 其中13個蛋白質編碼基因、22個tRNA基因和2個核糖體RNA基因。本實驗方法與物理分離方法相比具有樣品需求量少、設備要求低和簡便快捷等優點, 而且同時避免了常規PCR容易受到假基因和串聯重復區干擾等問題, 為測定其他海洋無脊椎動物的線粒體基因組提供參考。
[1] Boore J L, Collins T M, Stanton D,et al.Deducing the pattern of arthropod phylogeny from mitochondrial DNA rearrangements[J].Nature, 1995, 376: 163-165.
[2] 尚娜, 周志軍.動物線粒體基因組全序列測定的研究策略[J].河池學院學報, 2008, 28(2): 62-65.
[3] Lavrov D V, Lang B F.Poriferan mtDNA and animal phylogeny based on mitochondrial gene arrangements[J].Syst Biol, 2005, 54: 651-659.
[4] Helfenbein K G, Fourcade H M, Vanjani R G,et al.The mitochondrial genome ofParaspadella gotoiis highly reduced and reveals that chaetognaths are a sister group to protostomes[J].Proc Natl Acad Sci USA, 2004, 101:10 639-10 643.
[5] Dellaporta S L, Xu A, Sagasser S,et al.Mitochondrial genome ofTrichoplax adhaerenssupports placozoa as the basal lower metazoan phylum[J].Proc Natl Acad Sci USA, 2006, 103: 8 751-8 756.
[6] Shen X, Ma X Y, Ren J F,et al.A close phylogenetic relationship between Sipuncula and Annelida evidenced from the complete mitochondrial genome sequence ofPhascolosoma esculenta[J].BMC Genomics, 2009, 10:136-146.
[7] Folmer O, Black M, Hoeh W,et al.DNA primers for amplification of mitochondrial cytochrome coxidase subunit I from diverse metazoan invertebrates[J].Mol/L Mar Biol Biotechnol, 1994, 3(5): 294-299.
[8] Ewing B, Hillier L, Wendl M C,et al.Base-calling of
automated sequencer traces using phred. I. Accuracy assessment[J].Genome Res, 1998, 8(3): 175-185.
[9] Ewing B, Green P.Base-calling of automated sequencer traces using Phred. II. Error probabilities[J].Genome Res, 1998, 8(3): 186-194.
[10] Gordon D, Abajian C, Green P.Consed: A graphical tool for sequence finishing[J].Genome Res, 1998, 8(3):195-202.
[11] Wyman S K, Jansen R K, Boore J L.Automatic annotation of organellar genomes with DOGMA[J]. Bioinformatics, 2004, 20(17): 3 252-3 255.
[12] Lowe T M, Eddy S R.tRNAscan-SE: a program for improved detection of transfer RNA genes in genomic sequence[J].Nucleic Acids Res, 1997, 25: 955-964.
[13] Boore J L.Complete mitochondrial genome sequence ofUrechis caupo, a representative of the phylum Echiura[J].BMC Genomics, 2004, 5(1): 67-74.
[14] Jennings R M, Halanych K M.Mitochondrial genomes ofClymenella torquata(Maldanidae) andRiftia pachyptila(Siboglinidae): evidence for conserved gene order in annelida[J].Mol/L Biol Evol, 2005, 22(2):210-222.
[15] Bleidorn C, Podsiadlowski L, Bartolomaeus T.The complete mitochondrial genome of the orbiniid polychaeteOrbinia latreillii(Annelida, Orbiniidae)—A novel gene order for Annelida and implications for annelid phylogeny[J].Gene, 2006, 370: 96-103.
[16] Boore J L, Brown W M.Mitochondrial genomes ofGalathealinum,Helobdella, andPlatynereis: sequence and gene arrangement comparisons indicate that Pogonophora is not a phylum and Annelida and Arthropoda are not sister taxa[J].Mol/L Biol Evol, 2000,17(1): 87-106.
[17] Boore J L, Brown W M.Complete sequence of the mitochondrial DNA of the annelid wormLumbricus terrestris[J].Genetics, 1995, 141(1): 305-319.
[18] Boore J L, Brown W M.Big trees from little genomes:mitochondrial gene order as a phylogenetic tool[J].Curr Opin Genet Dev, 1998, 8: 668-674.
[19] Ren J F, Liu X, Zhang G F,et al.“Tandem duplication-random loss” is not a real feature of oyster mitochondrial genomes[J].BMC Genomics, 2009, 19(10):84-89.
Received: Mar., 5, 2010
Key words:mitochondrial genome; long PCR; shotgun;Urechis unicintus
Abstract:Due to their many advantages over single genes, mitochondrial genomes have become an important source of information in metazoan population genetics and molecular phylogenetic studies. In this study,Urechis unicintus, a represent species of Echiura, was chosen to be as an example to clearly elaborate the process of long PCR amplification of its mitochondrial DNA. The long PCR amplified product was about 15kb. Then the shotgun library was constructed and the entire mitochondrial genome sequence was successfully obtained. The results show that the long PCR-based method is less demand of devices and amounts of tissue compared with physical separation method.
(本文編輯:譚雪靜)
Complete mitochondrial genome sequence of Urechis unicinctus accomplished by long PCR combined with shotgun sequencing
SHEN Xin1,2, WU Zhi-gang2,3
(1. College of Marine Science, Huaihai Institute of Technology, Lianyungang 222005, China; 2. Institute of Oceanology, Chinese Academy of Sciences, Qingdao 266071, China; 3. University of California, Riverside, CA 92521, USA)
Q959.195
A
1000-3096(2010)12-0026-04
2010-03-05;
2010-08-04
江蘇省自然科學基金項目(BK2007066); 江蘇省海洋生物技術重點建設實驗室課題(2009HS13)
申欣(1981-), 男, 山東成武人, 講師, 博士, 主要從事線粒體基因組學的研究, E-mail: shenthin@163.com