富玉竹 李欣 李曄 王斯德 金麗華 于然
摘要:蛋白酶(protease)是以降解蛋白質為主的糖苷酶,具有豐富的多樣性,在生物有機體中發揮著重要而又廣泛的作用,具有廣泛的研究和應用價值。本研究采用ProtParam、ProtScale、SignalP 4.1 server和NPSA serve等生物信息學軟件,對天藍色鏈霉菌、普通擬桿菌、金黃色葡萄球菌、枯草桿菌等16種微生物蛋白酶的理化性質、蛋白結構、系統發生樹和功能域等進行了分析。結果表明:通過分析16種微生物蛋白酶的穩定性發現,金黃色葡萄球菌、唾液鏈球菌、短小芽孢桿菌、綠膿桿菌為不穩定蛋白;二級結構由α螺旋、β轉角、無規則卷曲和延伸鏈等結構元件組成;除了節桿菌屬、無乳鏈霉菌、普通擬桿菌、腸桿菌屬具有信號肽,其余蛋白酶氨基酸序列不具有信號肽的特點。可以推測出蛋白酶為非分泌性蛋白;只有綠膿桿菌和豬鏈球菌有跨膜結構,剩下其余幾種微生物均沒有跨膜結構。具有2個蛋白功能域,分別為Peptidase S8 familyi、Fn3_5like domain。
關鍵詞:微生物;蛋白酶;序列分析;生物信息學;理化性質;蛋白結構;信號肽
中圖分類號: S188+.3文獻標志碼: A
文章編號:1002-1302(2020)04-0065-08
收稿日期:2018-12-14![]()
基金項目:北京市自然科學基金(編號:2182019);北京市教育委員會項目(編號:1-PXM2018-014306-000057/7);國家自然科學基金青年科學基金(編號:51708005);北京電子科技職業學院重點課題(編號:2019-KXZ);北京市優秀人才資助(拔尖自然科學)(編號:2020Z002-002-KWT)。
作者簡介:富玉竹(2000—),女,北京人,研究方向為酶與基因重組,E-mail:1002967685@qq.com;共同第一作者:李欣(1998—),女,北京人,研究方向為生物技術,E-mail:1217436404@qq.com。
通信作者:李?曄,博士,副教授,研究方向為蛋白重組表達和分子診斷。E-mail:liyeyashi@163.com。
蛋白酶是催化水解蛋白質肽鍵的一類酶的總稱[1],在生物有機體中發揮著重要而又廣泛的作用,具有廣泛的研究和應用價值。按其水解多肽的方式,可以將其分為內肽酶和外肽酶2類。內肽酶將蛋白質分子內部切斷,形成分子質量較小的肽。外肽酶從蛋白質分子的游離氨基或羧基的末端逐個將肽鍵水解而游離出氨基酸,前者為氨肽酶,后者為羧肽酶[2-4]。蛋白酶在食品產業中運用十分廣泛,如在白酒發酵中可添加適量蛋白酶對白酒香氣進行改良[5-7],或在對肉類進行加工中添加,改進肉的嫩度,提升口感[8-10],或使用蛋白酶對小麥提取有益物質[11-13],或對對蝦進行改良[14-15],等等。市面上食品用蛋白酶大部分來源于植物中蛋白酶的分離提取,如木瓜蛋白酶,但是提取率較低[16-18],若采用基因工程手段,對其進行分析優化,使其在細菌中重組表達,則有望大幅度提高產量,進一步推廣工業化應用[19]。
本研究采用生物信息學的分析方法,結合ProtParam、ProtScale、TargetP 1.1 Server等生物信息學軟件,對天藍色鏈霉菌、節桿菌屬、普通擬桿菌、金黃色葡萄球菌、腸桿菌屬、霍氏腸桿菌、大腸桿菌、粗球孢子菌、無乳鏈霉菌、枯草桿菌、嗜堿芽孢桿菌、地衣芽孢桿菌、短小芽胞桿菌、來源于海洋細菌、唾液鏈球菌、綠膿桿菌等共計16種微生物蛋白酶氨基酸序列的理化性質、序列分子進化、親/疏水性、磷酸化位點、二級結構、功能域、亞細胞定位、信號肽等進行分析和預測,為下一步進行基因工程菌構建、表達、重組蛋白酶奠定基礎。
1?材料與方法
1.1?數據來源
試驗中氨基酸序列均來自于美國國家生物信息中心(NCBI)中已登錄的序列,分別為天藍色鏈球菌、節桿菌屬、普通擬桿菌、金黃色葡萄球菌、腸桿菌屬、霍氏腸桿菌、大腸桿菌、粗球孢子菌、無乳鏈霉菌、枯草桿菌、嗜堿芽孢桿菌、地衣芽孢桿菌、短小芽孢桿菌、來源于海洋細菌、唾液鏈球菌、綠膿桿菌,共16種微生物(表1)。
1.2?研究方法
運用ProtParam分析微生物蛋白酶序列理化性質;運用MEGA 5軟件中的鄰接(neighbor-joining,簡稱NJ)法建分子進化樹;運用ProtScale進行親/疏水性的分析和預測;運用TargetP 1.1 Server進行亞細胞定位分析和預測;運用在線工具SignalP 4.1 server進行信號肽分析和預測;運用NPSA server進行微生物蛋白酶氨基酸序列二級結構分析和預測;運用NetPhosK 2.0 Server進行磷酸化位點分析和預測;運用TMHMM 2.0 Server進行跨膜結構域的分析和預測;運用NCBI上的保守域數據庫(CDD)進行功能結構域分析和預測(表2)。
2?結果與分析
2.1?微生物蛋白酶氨基酸理化性質特性
經過ProtParam工具分析16種微生物蛋白酶氨基酸序列,結果見表3。先討論各蛋白酶的氨基酸數目,除天藍色鏈霉菌、節桿菌屬、普通擬桿菌、腸桿菌屬、無乳鏈霉菌、來源于海洋細菌外,其他的微生物蛋白酶氨基酸殘基數量在325~654個之間。以分子量來說,無乳鏈霉菌最大,粗球孢子菌最小。所選細菌蛋白酶理論等電點(pI)均在4.78~6.61之間,霍氏腸桿菌最大,金黃色普通球菌菌最小。所選細菌蛋白酶脂肪指數基本集中在80左右。通
過分析16種微生物蛋白酶的穩定性,發現除金黃色葡萄球菌、唾液鏈球菌、短小芽孢桿菌、綠膿桿菌為不穩定蛋白外,其他均為穩定蛋白。在天藍色鏈霉菌中,最豐富的氨基酸是Ala、Gly和Arg,可能與維持蛋白酶空間結構的穩定性有關[20]。
2.2?微生物蛋白酶氨基酸分子進化樹分析
對16種微生物蛋白酶氨基酸序列,運用MEGA5軟件中的NJ法進行分子系統進化分析,得到微生物蛋白酶氨基酸序列的分子進化樹(圖1),可以較為精確地確定其微生物的進化地位[21-22]。綠膿桿菌、唾液鏈球菌、霍氏腸桿菌、嗜堿芽孢桿菌、無乳鏈霉菌、金黃色葡萄球菌、來源于海洋細菌、短小芽胞桿菌、地衣芽孢桿菌、枯草桿菌聚在同一支,而粗球孢子菌,天藍色鏈霉菌、大腸桿菌、節桿菌屬。腸桿菌屬、普通擬桿菌聚在另一分支上,表明微生物蛋白酶有較高的保守性,可以作為微生物遺傳分子進化的重要理論依據。
2.3?微生物蛋白酶氨基酸序列的疏水性/親水性
疏水性指的是1個分子(疏水物)與水互相排斥的物理性質。蛋白質由20種氨基酸組成,它們的親/疏水性的相互作用是維持蛋白質三級結構最重要的作用力之一。經ProtScale對16條微生物蛋白酶氨基酸序列疏水性/親水性進行預測,正值表示疏水,值越大表示疏水性越強;負值表示親水,值越大表示親水性越強;而數值在-0.5~0.5之間的主要表現為兩性氨基酸[23-25]。以枯草桿菌為例的結果如圖2所示,多肽鏈中第336位甘氨酸有最低分值-2.10,親水性最強;第115位天冬氨酸有最高分值2.522,疏水性最強。其他位的氨基酸疏/親水性均勻分布,且親水性氨基酸數量較多。因此在整個蛋白酶肽鏈上表現為一定的親水性,但親水性較弱。
2.4?微生物蛋白酶亞細胞定位分析
亞細胞定位是指某種蛋白或表達產物在細胞內的具體存在部位[26]。對16條微生物蛋白酶氨基酸序列采用TargetP 1.1 Server在線生物學工具進行了亞細胞定位。結果表明,除來源于海洋細菌可信度為5沒有明確定位以外,其余的可信度均為3或3之下。由此推斷,在天藍色鏈霉菌、節桿菌屬、普通擬桿菌等微生物中,微生物蛋白酶的定位有所不同。
2.5?微生物蛋白酶氨基酸序列磷酸化位點分析
磷酸化是蛋白質重要的翻譯后修飾之一,磷酸化反應泛指把磷酸基團在酶催化作用下轉移到其他化合物的過程,是生物體內一種普通的調節方式,在細胞信號轉導的過程中起重要作用[27-29]。本研究以16條微生物蛋白酶氨基酸序列為對象,通過NetPhosK 2.0 Server對其蛋白酶氨基酸序列進行預測,預測其絲氨酸(Ser)、蘇氨酸(Thr)、酪氨酸(Tyr)磷酸化位點位置及數量。以枯草桿菌為例,研究結果(圖3)顯示,磷酸化位點有34個,蘇氨酸的位點最多。其中,酪氨酸磷酸化位點有Y81、Y99、Y221、Y325、Y339、Y413,共計6個;絲氨酸磷酸化位點有 S9、S56、S138、S140、S163、S180、S191、S205、S242、S271、S280、S415,共計12個;蘇氨酸磷酸化位點有T19、T62、T84、T121、T135、T162、T201、T223、T277、T314、T316、T322、T337、T352、T380、T385,共計16個。對16種微生物蛋白酶氨基酸序列進行分析,除腸桿菌屬、節桿菌屬、普通擬桿菌、無乳鏈霉菌、來源于海洋細菌外,其他磷酸化位點數量都在100個以下。其中,絲氨酸磷酸化位點較多的是無乳鏈霉菌、來源于海洋細菌、節桿菌屬,蘇氨酸磷酸化位點較多的是無乳鏈霉菌、來源于海洋細菌、節桿菌屬,酪氨酸磷酸化位點較多的是來源于海洋細菌、無乳鏈霉菌、普通擬桿菌(表4)。
2.6?微生物蛋白酶的二級結構分析
蛋白質的二級結構是指蛋白質多肽鏈本身的折疊和盤繞的方式,其基本單位主要有α-螺旋、β-折疊、β-轉角和無規則卷曲4種類型。二級結構是通過骨架上的羰基和酰胺基團之間形成的氫鍵維持的,氫鍵是穩定二級結構的主要作用力[30-31]。微生物蛋白酶均由α螺旋、β轉角、無規則卷曲和延伸鏈等結構元件組成,以16條微生物蛋白酶氨基酸序列為研究對象進行蛋白質二級結構分析預測。以枯草桿菌為例,通過NPSA server程序對其蛋白酶氨基酸序列進行二級結構分析,結果表明,其中α螺旋(35.55%)所占比例最高,其次為無規則卷曲(27.73%)或延伸鏈(24.40%) β轉角(12.32%)所占比例最小(表5)。
2.7?微生物蛋白酶信號肽分析
信號肽位于分泌蛋白的 N 端,一般由 15~30 個氨基酸組成,并大致分為3個區段:一個帶正電的 N 末端; 一個中間疏水序列,它是信號肽的主要功能區; 一個較長的帶負電荷的 C 末端,是信號序列切割位點。對信號肽分析,是進行體外重組表達的一項重要工作。外源蛋白在宿主菌,如大腸桿菌中的表達形式多為細胞內不溶性表達(包涵體),少數為細胞外分泌表達。利用信號肽來引導外源蛋白定位分泌到細胞特定區間,提高可溶性,可避免因包涵體復性帶來的困難[32]。利用工具Signal 4.1 server對16條微生物蛋白酶氨基酸序列進行信號肽分析,其中無乳鏈霉菌蛋白酶的信號肽分析結果見圖4。
由圖4可見,原始剪切位點C最大值在第31個氨基酸,分值為0.768;綜合剪切位點Y最大值在第31個氨基酸,分值是0.698;信號肽S最大值在第14個氨基酸,分值為0.838;平均信號肽S值在第1~30個氨基酸之間,平均值是0.652。因此,推斷蛋白酶有信號肽存在的可能性,可能是分泌性蛋白。對16種微生物蛋白酶進行信號肽的相應分析,除了節桿菌屬具有信號肽,位點在20與21之間;無乳鏈霉菌具有信號肽,位點在30與31之間;普通擬桿菌具有信號肽,位點在20與21之間;腸桿菌屬具有信號肽,位點在20與21之間,其他蛋白酶氨基酸序列不具有信號肽的特點。
2.8?微生物蛋白酶跨膜結構域的分析
跨膜結構域是膜內蛋白質與膜脂相結合的主要部位,一般由 20個左右的疏水氨基酸殘基組成,形成α螺旋,固著于細胞膜上起錨定作用,對正確認識和理解蛋白質的功能、結構、分類 、方位及蛋白質在細胞中的部位和作用均有著重要的指示意義。以無乳鏈霉菌為研究對象,用在線生物學工具TMHMM 2.0 Server進行預測分析,結果見圖5:無乳鏈霉菌有1個跨膜區,為1次跨膜的膜蛋白。
2.9?微生物蛋白酶功能域分析
蛋白質的結構域是指在超二級結構的基礎上組裝而成的,多肽鏈折疊成近乎球狀的組裝體,這種相對獨立的三維實體叫結構域。由一個或幾個完整獨立的結構域組成。利用生物學工具CDD分析無乳鏈霉菌蛋白酶氨基酸序列功能結構域,結果(圖6)表明,無乳鏈霉菌蛋白酶具有3個功能域:N端164~650的肽段與Peptidase S8 family有較高的同源性,N端402~545的肽段與PA_C5a有較高的同源性,N端664~774的肽段與Fn3_5 -like domain有較高的同源性。
3?討論與結論
采用生物信息學的分析方法?以枯草桿菌為重點,對天藍色鏈霉菌、節桿菌屬、普通擬桿菌等16種微生物蛋白酶氨酸序列的理化特性、親/疏水性、信號肽、二級結構、系統發育進化、功能結構域、磷酸化位點等進行了預測和推斷。
蛋白酶氨基酸序列理化性質分析顯示,天藍色鏈霉菌、節桿菌屬、普通擬桿菌等微生物理論等電點pI大小不等,脂肪指數基本上在80左右,除金黃色葡萄球菌、唾液鏈球菌、短小芽孢桿菌、綠膿桿菌為不穩定蛋白外,其余的均為穩定蛋白。在天藍色鏈霉菌中,最豐富的氨基酸是Ala、Gly和Arg。
系統進化分為2支,綠膿桿菌、唾液鏈球菌、霍氏腸桿菌、嗜堿芽孢桿菌、無乳鏈霉菌、金黃色葡萄球菌、來源于海洋細菌、短小芽胞桿菌、地衣芽孢桿菌、枯草桿菌聚在同一分支,而粗球孢子菌、天藍色鏈霉菌、大腸桿菌、節桿菌屬、腸桿菌屬、普通擬桿菌聚在另一分支上。
在整個微生物蛋白酶多肽中,疏/親水性氨基酸均勻分布在其中,且親水性氨基酸數量略多,因此在整個蛋白酶肽鏈上表現為一定的親水性,但親水性較弱。除源于海洋細菌可信度為5沒有明確定位外,其余的可信度均為3或3之下,由此推斷,在天藍色鏈霉菌、節桿菌屬、普通擬桿菌等微生物中,蛋白酶的定位有所不同。枯草桿菌的磷酸化位點有34個,蘇氨酸的位點最多。
在微生物蛋白酶氨基酸序列中,α-螺旋、β-轉角、延伸鏈、無規則卷曲等二級結構元件的數量、比例差異不大,在整個肽鏈中無規則卷曲占據主導地位。在微生物蛋白酶功能域分析中,通過對16種微生物蛋白酶氨基酸序列分析,最多只有3個功能域。蛋白酶在不同生物種類中的大小數量是不同的,在大多數微生物中是由325~654個氨基酸組成的。
目前,蛋白酶在許多方面都有相關研究,如干酪生產、肉類嫩化和植物蛋白改性等。現今市面上銷售的蛋白酶大部分來源于對動物及植物組織的提取,雖然可基本滿足市面上對其需求,但依然存在產率低、成本高等問題。近年來,隨著基因工程手段的發展,在分析清楚蛋白酶的結構和性質的前提下可以通過分子生物學手段對其進行異源重組表達,為探究其性質及在生物學過程中的應用奠定基礎。
參考文獻:
[1]銀?鳳,周愛梅,張祥剛,等. 南美白對蝦蝦頭主要自溶酶的分離純化及鑒定[J]. 食品與發酵工業,2011,37(3):23-26.
[2]付?靜. 食品外肽酶的研究進展[J]. 食品科學,2013,34(7):349-354.
[3]胡二坤,郭興鳳,吳欣欣,等. 中性蛋白酶水解條件對玉米蛋白酶水解產物抗氧化活性影響研究[J]. 糧食與油脂,2015(5):51-54.
[4]劉麗莉,楊協力. 產骨膠原蛋白酶菌種的篩選與鑒定[J]. 食品與生物技術學報,2011,30(6):917-923.
[5]馬?特,宋連寶,趙?輝. 白酒窖泥中蛋白酶產生菌的篩選及復配[J]. 食品科學,2016,37(7):146-151.
[6]李樹森. 酸性蛋白酶在酒精生產中的應用[J]. 釀酒,2014(3):84-86.
[7]王春才,郭福陽,宮殿良,等. 酸性蛋白酶和發酵促進劑在玉米濃醪發酵生產食用酒精中的聯合應用[J]. 糧食與食品工業,2015,22(1):47-50.
[8]郭正富,楊小琴,李?軍. 高粱替代玉米日糧添加蛋白酶對肉雞生長性能、養分利用率和肉質的影響[J]. 中國飼料,2018(4):23-28.
[9]李麗杰,楊志華. 木瓜蛋白酶嫩化鹿肉方法的研究[J]. 食品工業科技,2015,36(6):216-219,234.
[10]趙?立,陳?軍,李苗云,等. 木瓜蛋白酶嫩化鴨肉效果的研究[J]. 食品與發酵科技,2015,51(6):41-46.
[11]李君蘭. 牛羊胰酶提取,胰蛋白酶純化及其酶學特性研究[D]. 蘭州:甘肅農業大學,2011.
[12]鄭志強. 不同蛋白酶對小麥蛋白酶解物抗氧化活性的影響[J]. 食品科學,2017,38(7):161-166.
[13]孟丹陽,趙?偉,楊瑞金,等. 小麥面筋蛋白酶解過程中功能性質的變化規律研究[J]. 食品工業科技,2016,37(5):115-119.
[14]莊志凱,吉宏武. 南美白對蝦蝦頭內源酸性蛋白酶的分離純化及其酶學特性研究[J]. 食品工業科技,2012,33(18):116-120.
[15]鄭鴦鴦,吉?薇,吉宏武,等. 大豆胰蛋白酶抑制劑的提取純化及其對凡納濱對蝦類胰蛋白酶的抑制作用[J]. 食品與發酵工業,2016,42(11):231-236.
[16]劉?平,胡志和,吳子健,等. 超高壓對木瓜蛋白酶構象及酶活力的影響[J]. 食品科學,2015,36(23):23-27.
[17]程云龍,管軍軍,李世豪. 酶法改性大豆分離蛋白最新研究進展[J]. 糧食與飼料工業,2015,12(3):20-23,27.
[18]張金蘭,王文平,王夫杰,等. 醬油釀造中蛋白酶系的研究進展[J]. 中國釀造,2014,33(11):1-5.
[19]馮?炘,裴宇航,周曉飛. 纖維素降解菌的篩選與高效混合菌群的構建[J]. 西北農林科技大學學報(社會科學版),2012,40(4):155-160.
[20]陳巧容,李?娟,王亞軍. 豬Smad7和Smad9基因克隆、序列分析與組織表達圖譜探究[J]. 四川大學學報(自然科學版),2015,52(1):157-162.
[21]胡彥婷,安麗康,尹淑麗,等. 推定第四類羊毛硫素合成酶生物信息學分析[J]. 微生物學通報,2016,43(11):2464-2472.
[22]李?寧,王柏柯,楊生保,等. 21種植物八氫番茄紅素合成酶的生物信息學分析[J]. 新疆農業科學,2015,52(12):2157-2165.
[23]Cai L T,Jiang G H,Lei B,et al. Cloning and sequence analysis ofT-psy1 gene from flue-cured tobacco[J]. Tobacco Science and Technology,2010(2):58-63.
[24]王凌云,郭?明,趙?艷,等. 谷子蔗糖合成酶基因家族鑒定及生物信息學分析[J]. 江蘇農業科學,2017,45(15):30-34.
[25]Qin X,Coku A,Inoue K,et al. Expression,subcellular localization,and cis-regulatory structure of duplicated phytoene synthase genes in melon (Cucumis melo L.)[J]. Planta,2011,234(4):737.
[26]Dibari B,Murat F,Chosson A,et al. Deciphering the genomic structure,function and evolution of carotenogenesis related phytoene synthases in grasses[J]. BMC Genomics,2012,13(1):221.
[27]孫?倩. 三種不同來源(植物、細菌和真菌)蛋白酶的純化、性質及應用研究[D]. 北京:中國農業大學,2016.
[28]馮立娟,焦其慶,尹燕雷,等. 石榴果皮DHQ/SDH基因的克隆及序列分析[J]. 江蘇農業科學,2017,45(1):26-29.
[29]要笑云,張?強,撖靜宜,等. 毛果楊半胱氨酸蛋白酶基因PtCP3的基因克隆和原核表達分析[J]. 中國農學通報,2016,32(14):50-55.
[30]駱東偉,陳?杰,劉?娟. 蛋白質二級結構預測方法初探[J]. 生物技術世界,2014(11):225.
[31]吳玉明. 蛋白質二級結構預測的一種新的編碼方式[J]. 工業控制計算機,2015(4):109-110,113.
[32]Wang Z,Wei P,Wu M,et al. Analysis of the sucrose synthase gene family in tobacco:structure,phylogeny,and expression patterns[J]. Planta,2015,242(1):153-166.