黃萌,王緯,楊輝,車程川
(1.山東水利職業學院,山東 日照 276826;2.曲阜師范大學 生命科學學院,山東 曲阜 273165)
醬油是一種集美味與香氣于一體的特色調味品,醬油的芳香風味物質主要來自于小分子量的氨基酸類物質。醬油的生產過程是微生物在多種酶的作用下,進行原材料大分子有機物的分解和重組,同時在環境條件下,發生生物化學反應,形成醬油物質[1,2]。在醬油的形成過程中,原材料中的蛋白質發生水解,形成多種氨基酸,并衍生為多種蛋白類物質,醬油中的蛋白質物質以衍生蛋白的形式存在。對醬油的生產過程進行有效控制,需對該類蛋白衍生物結構進行預測。
所謂三角化模型是指通過識別蛋白質衍生物的化學鏈,折疊形成復雜蛋白質構型的過程,不同的化學鏈長,標識為不同的蛋白質衍生物。通過分析不同的蛋白質衍生物化學鏈,確定該類物質存在鏈長范圍,形成鏈長閾值區間,進而進行閾值區間識別,預測不同蛋白質衍生物的種類及結構[3]。
每100 mL醬油中蛋白質含量約為10 g,該類蛋白質一部分來自于原材料中未發生水解的蛋白質,另一部分來自于蛋白質降解以后的蛋白類衍生物。
在整個醬油生產過程中,醬油中的總蛋白含量不斷發生變化,其中清蛋白、球蛋白、醇溶蛋白以及谷蛋白為醬油中的4種主要蛋白類物質,相互不斷地發生物質轉化。在生產初期,清蛋白和球蛋白發生降解,降解物之間發生轉化,生成難以溶解的谷蛋白。隨著生產過程的不斷進行,谷蛋白發生降解,在一系列蛋白酶的條件作用下,微生物不斷代謝,谷蛋白生成球蛋白和部分清蛋白,進而沉淀到醬油生產罐底部,形成醬油當中的蛋白類物質[4,5]。在醬油生產原料中,球蛋白與醇溶蛋白的物質含量最低,清蛋白和谷蛋白的降解產物形成醬油中的多種氨基酸。谷蛋白的結構成分復雜,在生產過程中,谷蛋白不能發生徹底的降解,未降解的蛋白質溶解于醬油中。
蛋白質折疊模型是根據蛋白質水解以后所得到的簡化鏈狀結構進行分析的氨基酸結構,簡化的鏈狀結構可理解為一系列直徑大小的球狀物質。用白色和黑色兩種球體表示蛋白質鏈狀結構中的氨基酸小球,小球之間通過化學鍵連接,形成蛋白質物質。
蛋白質折疊模型是一種簡單的自然構型模型,蛋白質中的多種氨基酸被簡化為黑、白兩種氨基酸小球,小球之間相互連接,表示蛋白質能量[6]。與蛋白質實際結構相比,這種簡化的折疊模型求解計算量巨大,隨著蛋白質結構的不斷增加,氨基酸連接鍵之間的求解指數不斷增加。醬油蛋白質折疊結構模型示意圖見圖1。

圖1 醬油蛋白質折疊結構模型示意圖Fig.1 Schematic diagram of protein folding structure model of soy sauce
折疊模型中,若干個簡化球體或若干個化學鍵之間可近似形成三角形,該類模型成為蛋白質折疊三角化模型。
蛋白質鏈能量模型也稱為AB型模型,是通過利用兩種簡化后的氨基酸球體來描述蛋白質結構[7],其中A表示疏水性氨基酸,B表示親水性氨基酸。AB氨基酸球體之間的距離固定,表示每個氨基酸小球的能量相等,若干個AB型模型連接組成氨基酸能量鏈:

利用能量函數模型計算得出的蛋白質結構模型與蛋白質的折疊模型更接近,與蛋白質折疊模型相比,求解計算量相當。
閾值算法是一種能夠進行最優化求解的算法,同時在計算過程中篩選最差的解。閾值算法通過既定的閾值不斷縮小搜索范圍,當函數目標值進入閾值范圍時,即被接收;當目標函數值或變形以后的目標函數值超過閾值時,計算結果即被拒絕[8]。
在閾值迭代計算過程中,閾值不斷變化,形成一系列閾值序列,隨著閾值迭代計算的不斷進行,閾值收斂準則越來越嚴。
在進行醬油蛋白質結構預測時,用到的閾值偽代碼為:
● 1.Generate an initial solution S=S0;
● 2.Select the threshold change counter k=0;
● 3.Select a threshold descend schedule tk;
● 4.Select an initial threshold T=T0;
● 5.Select a repetition threshold Mk;
● 6.Repeat;
● 7.Set repe tition counter m=0;
● 8.Repeat;
● 9.Generate a candidate solution St;
● 10.Calculate the difference of cost d=f(St)-f(S);
● 11.If d<=tk;
● 12.then S=St;
● 13.Until m=Mk;
● 14.Until stopping criterion is met.
為降低三角化模型的計算數據量,對蛋白質三角化模型進行優化,同時采用閾值迭代的算法對模型進行求解。
在三角化模型中,對氨基酸序列中的疏水性氨基酸用H表示,親水性氨基酸用P表示,將氨基酸小球放置在三角形網格頂點,則可構成蛋白質三角化模型。蛋白質優化后的三角化模型見圖2。

圖2 醬油蛋白質三角化優化模型Fig.2 Optimization model of soy sauce protein triangulation
從優化后的蛋白質序列模型可以看出,氨基酸折疊成緊密連接狀態,兩種不同顏色的小球之間代表固定鍵長的化學鍵,整個蛋白質結構序列和能量可直觀顯示出來。
利用建立的閾值算法,對優化后的蛋白質三角化模型進行求解。求解過程中,每種蛋白質按照兩種優化后的三角化模型進行求解,得出醬油中的4種蛋白質結構序列。4種蛋白質預測結構見圖3。

圖3 醬油蛋白質預測結構Fig.3 Protein prediction structure of soy sauce
采用Osborne法對醬油中的蛋白質進行提取,主要提取對象為清蛋白、球蛋白、醇溶蛋白以及谷蛋白,提取完成后,采用凱氏定氮法進行蛋白質氨基酸序列檢測,在進行氨基酸序列檢測時,每種蛋白質物質進行3次氨基酸物質檢測。醬油中蛋白類物質含量見表1。蛋白質氨基酸序列檢測結果見表2。

表1 醬油中主要蛋白類物質含量Table 1 Content of main protein substances in soy sauce g/dL

表2 醬油蛋白質氨基酸序列檢測結果Table 2 Detection results of amino acid sequence of soy sauce protein
經對比,利用閾值算法和三角化模型結合所進行的蛋白質結構預測結果,和利用凱氏定氮法檢測所得的蛋白質氨基酸序列檢測結果相符。
利用三角化模型進行蛋白質氨基酸序列結構預測,同時結合閾值算法進行預測結構篩選,所得到的蛋白質結構預測結果和實際檢測所得的蛋白質結構相符。因試驗檢測周期較長且資源耗費較大,因此對醬油蛋白質物質種類篩選及醬油成分預測時,可采用閾值算法與三角化模型相結合的方式進行篩選和預測。