張金勇 何暮春 項子龍 柳淑芳① 莊志猛
(1. 中國水產(chǎn)科學研究院黃海水產(chǎn)研究所 農(nóng)業(yè)農(nóng)村部海洋漁業(yè)可持續(xù)發(fā)展重點實驗室 青島 266071;2. 青島海洋科學與技術(shù)試點國家實驗室海洋漁業(yè)科學與食物產(chǎn)出過程功能實驗室 青島 266071;3. 南京農(nóng)業(yè)大學無錫漁業(yè)學院 無錫 214081;4. 中國海洋大學海洋生命學院 青島 266003;5. 上海海洋大學水產(chǎn)與生命學院 上海 201306)
金烏賊(Sepia esculenta Hoyle, 1885)俗稱墨魚或烏魚,主要分布于中國沿海海域、日本北海道以南、朝鮮西南海域及菲律賓群島海域(Okutani, 1995)。金烏賊是一種具有較高經(jīng)濟價值的優(yōu)良品種,曾是我國渤、黃海重要捕撈對象。然而,20 世紀80 年代以來,由于過度捕撈、棲息地破壞等原因,金烏賊資源急劇衰退(郝振林等, 2007)。金烏賊具有營養(yǎng)豐富、生長迅速、個體大(均重700 g)、生命周期短(約1 年)、世代更新快和洄游規(guī)律性強等特點,為保護和恢復金烏賊資源,我國學者在金烏賊基礎(chǔ)生物學、增養(yǎng)殖技術(shù)及種群遺傳學等方面開展了系列研究(鄭小東等,2002、2003; 趙厚鈞等, 2004; 郝振林等, 2008; 韓松等,2010; Zheng et al, 2007、2009),并于2010 年突破了金烏賊人工繁育和增殖放流技術(shù)(佚名, 2010)。為更好地開展金烏賊繁育及增殖養(yǎng)護工作,有必要從分子層面精準評估現(xiàn)有種群的種質(zhì)狀況和遺傳多樣性。
簡單重復序列(Simple sequence repeat, SSR)分子標記技術(shù),也稱為微衛(wèi)星DNA 序列標記,其串聯(lián)重復的核心序列為1~6 個核苷酸(Powell et al, 1996;Toth et al, 2000)。作為一種遺傳標記,SSR 廣泛存在于原核和真核生物基因中,具有重復性好、共顯性高、穩(wěn)定性強、多態(tài)性豐富等特點(Tuler et al, 2015)。按照SSR 的來源,可分為表達序列標簽SSR (EST-SSR)和基因組SSR(g-SSR)。近年來,相對于傳統(tǒng)的ESTSSR 開發(fā),通過轉(zhuǎn)錄組測序平臺開發(fā)SSR 標記已在多種水產(chǎn)動物中得到應用。本研究在金烏賊Pacific Biosciences 單分子實時(Single-molecule real-time,SMRT)測序技術(shù)和Illumina RNA-Seq 技術(shù)轉(zhuǎn)錄組測序獲得生物學數(shù)據(jù)信息的基礎(chǔ)上,利用Micro Satellite(MISA)軟件篩選SSR 位點并分析其分布及組成特征,以期為后續(xù)的金烏賊群體遺傳結(jié)構(gòu)分析、遺傳圖譜構(gòu)建、重要性狀QTL 定位和良種選育等研究提供基礎(chǔ)數(shù)據(jù)。
實驗用金烏賊于2017 年1 月~7 月取自青島金沙灘水產(chǎn)開發(fā)有限公司,挑選體形完整,無傷害的個體。分別從生長(約6 月齡)、產(chǎn)卵(10~11 月齡)和產(chǎn)后瀕死(11~12 月齡)三個關(guān)鍵時期隨機選擇3 個雌性金烏賊親體。從選擇的雌性個體解剖腦亞腳葉/嗅葉、視腺、卵巢和纏卵腺組織樣品,浸沒在RNAlater(天根, 中國)中,并于–80℃儲存。
提取金烏賊不同時期的腦亞腳葉/嗅葉、視腺、卵巢和纏卵腺組織樣本的總RNA,送天津諾禾致源生物信息科技有限公司,采用PacBio SMRT 測序技術(shù)和Illumina RNA-Seq 技術(shù)進行轉(zhuǎn)錄組測序,通過整合PacBio SMRT 和Illumina 測序數(shù)據(jù),生成高質(zhì)量的金烏賊轉(zhuǎn)錄組,包含177,951 條全長轉(zhuǎn)錄本(Zhang et al, 2019),以此作為分析數(shù)據(jù)。
為檢測金烏賊的SSR 位點,利用MISA(v1.0) (http://pgrc.ipk-gatersleben.de/misa)對其Unigene 序列進行分析。SSR 位點包含了單核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸以及六核苷酸重復。判斷的標準為單核苷酸重復至少12 次;二核苷酸重復至少6 次;三核苷酸重復至少5 次、四核苷酸重復至少5 次、五核苷酸重復至少4 次、六核苷酸重復至少4 次。
金烏賊轉(zhuǎn)錄組測序共獲得177,951 條全長轉(zhuǎn)錄本,序列總長度為198,175,926 bp。檢索Unigene 序列,共發(fā)現(xiàn)161,327 個SSR 位點,分布在64,933 條Unigene 中,發(fā)生頻率(含SSR 的Unigene 數(shù)與Unigene總數(shù)之比)為36.49%,出現(xiàn)頻率(SSR 數(shù)目與Unigene總數(shù)之比)為90.66%,平均每1,228 bp 含有1 個SSR位點。此外,有33,136 條Unigene 含超過1 個SSR位點,33,260 條Unigene 含有復合型SSR(表1)。
金烏賊EST-SSR 類型豐富,從表2 可以發(fā)現(xiàn),單核苷酸到四核苷酸重復最多,占總SSR 位點數(shù)量的99.55%,其中,單核苷酸和二核苷酸所占的比例較大,分別占總數(shù)的46.00%和39.93%;其次為三核苷酸和四核苷酸,分別為9.48%和4.14%。五、六核苷酸重復率總計0.448%,數(shù)量很少。
金烏賊SSR 中,單核苷酸重復以A/T 重復基序最多,占總SSR 的44.79%;二核苷酸重復以AT/AT和AC/GT 重復基序為主要類型,共占SSR 總數(shù)的34.73%;三核苷酸重復則以AAT/ATT 和ATC/ATG出現(xiàn)頻率最高,共占 4.71%;四核苷酸重復則以AAAG/CTTT 居多,AGAT/ATCT 次之。其他五核苷酸和六核苷酸重復基元類型較多,數(shù)量非常少,出現(xiàn)頻率很低,見表3。

表2 金烏賊EST-SSR 不同重復基元分布情況Tab.2 Distribution of different repeat motifs in S. esculenta

表3 金烏賊EST-SSR 重復基元的類型Tab.3 Type of EST-SSR repeat motifs in S. esculenta
重復片段的長度會影響SSR多態(tài)性,而SSR重復次數(shù)可以決定重復片段的長度。金烏賊SSR的堿基重復次數(shù)很廣泛,整體波動在5~100次范圍內(nèi),多集中于5~29次。單核苷酸重復12~102次;二核苷酸重復6~50次;三核苷酸重復5~24次;四核苷酸重復6~19次;五核苷酸重復6~19次;六核苷酸重復6~12次。重復12次的頻率最高,共有18,289條,占總SSR數(shù)的11.34%,其次是重復6次(10.98%)、13次(7.73%)、7次(6.82%)、14次(6.28%),30次以上(含30)占3.40%。總體上,金烏賊轉(zhuǎn)錄組SSR的重復次數(shù)以11~20次最多,占總SSR比例為47.92%,4~10次次之,為35.03%;重復次數(shù)21~30次為14.24%;重復次數(shù)大于30次為2.80% (圖1)。

圖1 金烏賊轉(zhuǎn)錄組EST-SSR 不同重復基元的重復次數(shù)Fig.1 Repeat numbers of EST-SSR with different motifs in transcriptome of S. esculenta
SSR位點中重復基元的長度是影響其多態(tài)性高低的重要因素,當SSR≥20 bp時,其多態(tài)性高;重復基元長度12≤SSR<20 bp時,多態(tài)性中等;而低于12 bp時,多態(tài)性極低。本研究中去除了12 bp以下的SSR,長度≥12 bp的SSR共有161,327個。從金烏賊轉(zhuǎn)錄組中SSR基元長度分布情況可以看出,其中,重復基元長度在12~19 bp的SSR位點最多,共有95,323個,占SSR總數(shù)的59.09%;其次為20~30 bp,共有43,977個,占SSR總數(shù)的27.26%;長度在31~40 bp的,共10,931個,占SSR總數(shù)的6.78%;長度在41~ 50 bp的,共5,588個,占SSR總數(shù)的3.46%;基元長度大于50 bp的數(shù)量最少,共5,508(3.41%)。根據(jù)該結(jié)果,可推測該研究中Ⅱ型SSR(長度為12~20 bp)的SSR的比例為59.09%,具有中等多態(tài)性,有較高的潛在可用性。而具有高度多態(tài)性的I型SSR(長度≥20 bp)中,含有低級基元(二、三核苷酸重復)SSR位點數(shù)量占優(yōu),這部分SSR位點具有豐富的多態(tài)性(圖2)。

圖2 金烏賊轉(zhuǎn)錄組SSR 位點重復基元序列長度分布頻率Fig.2 Frequency of SSR repeat sequence length distribution in transcriptome of S. esculenta
本研究以金烏賊轉(zhuǎn)錄組信息對其EST-SSR 進行開發(fā)。結(jié)果顯示,金烏賊轉(zhuǎn)錄組中含有豐富的SSR位點。從金烏賊轉(zhuǎn)錄組的177,951 條Unigene 中,共搜索出161,327 個SSR,分布在64,933 條Unigene 中,SSR 的出現(xiàn)頻率為90.66%。與其他水生動物SSR 的出現(xiàn)頻率相比,明顯高于扁玉螺(Neverita didyma)(86.53%) (盧瑋筱等, 2018)、黃姑魚(Nibea albiflora)(39.30%) (龔詩琦等, 2016)、翹嘴鱖(Siniperca chuatsi)(27.51%) (袁文成等, 2015)、羅氏沼蝦(Macrobrachium rosenbergii) (45.91%) (王傳聰?shù)? 2018)、無針烏賊(Sepiella japonica) (48.70%) (呂振明等, 2017; 管奧等,2018)、馬氏珠母貝(Pinctada martensii) (13.34%)(王忠良等, 2015)、櫛江珧(Atrina pectinata) (8.2%)(李東明等, 2017)、縊蟶(Sinonovacula constricta)(8.89%) (劉博等, 2012)、泥蚶(Tegillarca granosa)(14.83%) (周小龍等, 2013) (表5)。
SSR 檢索標準、數(shù)據(jù)庫豐富程度以及物種差異,都會影響SSR 的出現(xiàn)頻率(Varshney et al, 2005)。如張秀英等(2012)采用不同檢索條件從櫛孔扇貝BES文庫篩選SSR,表明SSR 出現(xiàn)頻率隨檢索標準的提高而降低。數(shù)據(jù)庫豐富程度也會影響EST-SSR 位點出現(xiàn)頻率,石耀華等(2008)和王忠良等(2015)先后從馬氏珠母貝6,979 和74,007 條EST 序列中篩選得到243 和9,872 個EST-SSR 位點,位點出現(xiàn)頻率分別為3.48%和13.34%。Franklin 等(2005)和王艷紅等(2011)對凡納濱對蝦(Litopenaeus vannamei)不同數(shù)量的EST序列進行EST-SSR 篩選,其出現(xiàn)頻率分別為4.9%和7.8%。

表5 目前已獲得EST-SSRs 出現(xiàn)頻率的部分水生動物Tab.5 Some aquatic animals that have obtained the frequency of EST-SSRs
大量研究表明,在已開發(fā)的EST-SSR 標記中,二核苷酸和三核苷酸重復基元類型最為豐富。蝦夷扇貝和櫛江珧的EST-SSR 均以二核苷酸重復基元所占比例最高,分別占40.54%和77.08% (李云峰等, 2010;李東明等, 2017);縊蟶SSR 以三核苷酸重復SSR 比例最高,為37.13% (劉博等, 2012)。本研究發(fā)現(xiàn),金烏賊EST-SSR 重復類型中,以單核苷酸重復基元最多,比例達到46.00%,其次為二核苷酸,為39.93%。這和無針烏賊(呂振明等, 2017)、馬氏珠母貝(王忠良等, 2015)、羅氏沼蝦(王傳聰?shù)? 2018)和扁玉螺(盧瑋筱等, 2018)中單核苷酸重復基元是主導類型的研究結(jié)果相似。同時,本研究發(fā)現(xiàn),金烏賊轉(zhuǎn)錄組中,SSR位點最多的是單核苷酸的重復基元A/T,占總SSR 的44.79%;其次為二核苷酸的AT/AT 和AC/GT,共占SSR 總數(shù)的34.73%。此外,金烏賊轉(zhuǎn)錄組SSR 位點重復基元序列長度在20 bp 以上的SSR 位點共有66,004 個,占SSR 總數(shù)的40.91%,并且其中含有低級基元(二、三核苷酸重復) SSR 位點數(shù)量占優(yōu),這部分SSR 可能具有較高的利用價值。
整體而言,金烏賊轉(zhuǎn)錄組SSR 出現(xiàn)頻率較高且類型豐富,共檢測出161,327 個SSR 位點,分布在64,933 條Unigene 中,SSR 位點發(fā)生頻率為36.49%,出現(xiàn)頻率高達90.66%。這些SSR 在提高物種遺傳多樣性潛能方面發(fā)揮著重要的作用。研究結(jié)果為下一階段開發(fā)金烏賊多態(tài)性SSR 分子標記提供了基礎(chǔ)數(shù)據(jù),也為開展金烏賊種質(zhì)資源保護利用、遺傳多樣性評價和未來分子標記輔助育種等研究奠定基礎(chǔ)。