袁莉霞,王芙蓉,劉 姝,孫 妍,樓天靈
(浙江醫藥高等專科學校,浙江 寧波 315100)
烏藥[Lindera aggregate(Sims)Kosterm]為新“浙八味”之一,因產于浙江天臺,故名臺烏藥,其塊根有行氣止痛、降脂、護肝等功效[1,2]。由于道地烏藥的使用量日趨增多,且缺乏集中化保護,使得道地烏藥蘊藏量日趨減少,因此集約化管理迫在眉睫。據《本草綱目》記載,“其直根者不堪用”[3],且其生長年份較長,因此在種質選取中存在較大難度。
DNA條形碼技術已廣泛用于各物種分類鑒定、親緣性及多樣性分析等。該技術不受形態和發育狀態的影響,準確度高,分類依據可靠,在植物鑒定中已取得顯著成效[4-6]。matK為植物DNA條形碼的標準序列之一,能夠有效對植物屬間及屬以上級別進行鑒定[7],對近緣性物種也有較好的分辨能力[8]。滕艷芬等[9]通過分析同屬間5種石斛的葉綠體matK基因序列,成功將正品與混淆品區分開。劉靜等[10]通過不同的石斛及密花石豆蘭的matK序列分析發現,matK基因可用于種及變種之間的鑒別。鄭輝等[11]以ITS2+matK序列對峨眉山區唇形科藥用植物進行鑒定,發現ITS2+matK序列能夠快速、準確鑒定并闡明物種之間的親緣關系。Alaklabi等[12]利用葉綠體matK和質體rbcL基因進行研究發現,該基因序列可用于蘆薈及其近緣物種的鑒定。王瑞嫻等[13]利用matK序列對7份桑葉進行聚類分析,結果表明桑樹品種間的遺傳多樣性低于其他植物。
目前,matK基因在烏藥鑒定中的應用尚未見報道。本研究從生物信息學角度對烏藥matK基因編碼蛋白進行分析,并通過序列聚類方法,完成遺傳進化及多樣性分析,為烏藥種質資源鑒別、分類及多樣性研究提供參考。
從NCBI獲取的11種山胡椒屬matK基因序列為研究對象,這11個物種分別為烏藥(Lindera aggregata),登 錄 號:AB442057.1;桂 皮 釣 樟(Lindera benzoin),登錄號:MG220997.1;香葉樹(Lindera communis),登錄號:AF244405.1;綠葉甘植(Lindera fruticosa),登錄 號:AF244405.1;黑殼 楠(Lindera megaphylla),登錄號:AF244404.1;滇粵山胡椒(Lindera metcalfiana),登錄號:AF244403.1;三椏烏藥(Lindera obtusiloba),登錄號:AF244402.1;山橿(Lindera reflexa),登錄號:AF244401.1;天全釣樟(Lindera tienchuanensis),登錄號:AF244399.1;山胡椒(Lindera glauca),登錄號:AB442056.1;三股筋香(Lindera thomsonii),登錄號:AF244400.1。
利用NCBI ORFfinder在線工具對烏藥matK基因進行分析,通過DNAman軟件和ProtParam(https://web.expasy.org/protparam/)預測編碼氨基酸;利用Protscale(https://web.expasy.org/cgi-bin/protscale/protscale.pl?1)、SignalP4.1(http://www.cbs.dtu.dk/services/SignalP-4.1/)及TMHMM Server v.2.0(http://www.cbs.dtu.dk/services/TMHMM/)分析烏藥matK蛋白的親/疏水性、信號肽及跨膜結構域;利用GOR IV(https://npsa-prabi.ibcp.fr/cgi-bin/secpred_gor4.pl)和SWISS-MODEL(http://www.swissmodel.expasy.org/)預測烏藥matK蛋白的二、三級結構;運用MEGA7軟件對烏藥等11種matK基因序列構建進化樹。
利用NCBI ORFfinder對烏藥matK基因的開放閱讀框進行分析,結果如圖1所示。烏藥matK基因序列長度為1 628 bp,包含14個開放閱讀框,其中ORF1的長度為1 545 bp,起始密碼子位于1 bp的位置,終止密碼子位于1 524 bp的位置。利用DNAman對matK基因編碼的氨基酸序列進行預測,結果顯示其所編碼的氨基酸個數為507個(圖2)。

圖1 烏藥matK基因的開放閱讀框分析

圖2 烏藥matK基因及編碼氨基酸序列
通過ProtParam分析發現,烏藥matK的分子式為C2757H4209N743O735S12,相對分子質量為59 839,其中Leu占比最高,為12.23%(62/507);其次為Ser、Ile和Phe,分 別 為11.64%(59/507)、8.28%(42/507)和8.09%(41/507);Met和Cys占比最低,均為1.18%(6/507)(圖3)。

圖3 烏藥matK的氨基酸組成
烏藥matK的一級結構分析發現存在極性氨基酸,這些氨基酸對高級結構一定有影響。利用Protscale對編碼的氨基酸序列進行親/疏水性分析,結果表明該蛋白的親水指數為-0.200,為親水蛋白(圖4)。利用SignalP4.1對matK序列的信號肽預測分析發現,該蛋白第8號位上的氨基酸S值最大,為0.486;第21號位上Y值和C值均最大,分別為0.307和0.242;S值平均為0.385,小于0.5,這表明該蛋白不存在信號肽(圖5)。通過對matK跨膜預測發現,該蛋白膜內外的比例為100∶1(圖6),表明該蛋白不具備細胞間信號傳遞的能力。

圖4 烏藥matK的親/疏水性

圖5 烏藥matK的信號肽預測

圖6 烏藥matK的跨膜結構預測
通過GOR IV分析發現,在烏藥matK的二級結構中,α-螺旋(H)為182個,占35.90%;延長線(E)為75個,占14.79%,隨機線圈(C)為250,占49.31%(圖7)。通過SWISS-MODEL對烏藥matK三級結構預測發現,在三級結構中,隨機線圈分布最多,其次為Alpha螺旋,這與二級結構的預測結果相一致(圖8)。

圖7 烏藥matK的二級結構

圖8 烏藥matK的三維結構
以NCBI中獲取的11種matK基因序列為對象,通過MEGA7軟件構建進化樹(圖9),結果表明,該進化樹主要分為3個類群,烏藥(Lindera aggregata)與椏烏藥(Lindera obtusiloba)、三股筋香(Linderathomsonii)在第2個類群,表明烏藥與這2個物種間親緣性較高;山胡椒(Lindera glauca)與烏藥親緣關系最遠。

圖9 烏藥matK基因的系統進化樹
matK基因進化速度與rbcL基因相比較慢,而略快于ITS,是目前最常用的DNA條形碼序列,已被廣泛應用于中藥鑒定[14-16]。林曉霞等[17]通過matK和rbcL序列對采集到的22份鐵皮石斛進行了系統進化分析和種質的鑒定,結果發現matK分析得到的系統進化關系具有更高的遺傳多樣性;Asahina等[18]通過matK和rbcL序列對石斛進行鑒定,同樣發現rbcL序列的鑒定能力不如matK序列。熊哲銘等[19]通過matK序列對5種陰地蕨屬(Botrychium)藥用植物進行了種間親緣關系分析。目前,尚未見matK基因在烏藥上的研究。
本研究發現,烏藥matK基因所編碼的蛋白開放閱讀框大小為1 545 bp,編碼的氨基酸有20種,共507個,其中占比最高的氨基酸為Leu,最低的為Met和Cys。該蛋白不穩定指數為52.66,親水指數為-0.200,為親水蛋白。該蛋白不存在信號肽,且不具備細胞間信號傳遞的能力。此外,通過11種山胡椒屬matK基因的進化樹結果發現,烏藥與三股筋香的親緣性最高,與山胡椒的親緣性最遠。該研究可為烏藥的種質資源鑒別及系統進化分析提供參考依據。