李葉青 景張牧 江皓 徐泉 周紅軍 馮璐
(1. 中國石油大學(北京)新能源與材料學院 生物燃氣高值利用北京市重點實驗室,北京 102249;2. 丹麥奧胡斯大學工程系,切勒 8830)
目前,全國每年產生數以億計的有機廢棄物。現階段常用的有機廢棄物處理方法包括:熱處理(如氣化、熱解等)以及生物處理(如厭氧消化、堆肥等)[1]。我國城市有機廢棄物的含水率高、熱值低(熱值為3 MJ/kg,含水率約80%[2]),導致熱處理的效率不高。而堆肥由于產生大量溫室氣體(CO2、CH4和N2O)、占地面積大以及周期較長等缺點,限制了其直接應用[3]。不過,好氧堆肥可以作為厭氧消化的后續處理使沼渣深度腐熟,轉化為腐殖質改良土壤[4]。將厭氧消化和好氧堆肥聯合使用,既解決了厭氧消化后產生的沼渣不宜直接還田的問題,還可縮短好氧堆肥周期、提高有機肥肥力。此外,從能源結構、碳減排、城鎮化發展等多個角度考慮,沼氣工程在中國的發展已經成為了必然趨勢[5]。到2020年,中國沼氣年利用量已達到440×1010m2[5]。盡管厭氧消化技術在我國發展迅速,但其系統中種群結構等信息尚未被完全了解[6],這在一定程度上阻礙了它們在生物能源生產方面的廣泛應用[7]。如果僅依賴于微生物培養的技術,微生物活性和功能的生物因素(如種間關系和生物多樣性)等對消化過程產生的影響會被忽視。到目前為止,我們仍在努力將厭氧消化系統中的群落結構和功能與環境等因素聯系起來,并期望通過改變微生物群落來優化過程效率和提高穩定性[8]。微生物組學分析能夠極大的提高我們對這些復雜系統的理解,被認為是了解厭氧消化系統中的群落結構和構建其與外部環境變化關聯性的有力工具。本文系統回顧了厭氧消化過程的微生物學研究,并強調各種生物因素對厭氧消化表現的重要影響。
目前,對于厭氧消化過程的認識普遍基于“三階段、四種群”的基本原理[10]。“三階段”依次為水解階段、產酸階段和產甲烷階段。“四種群”分別是水解酸化菌、產氫產乙酸菌、同型產乙酸菌和產甲烷菌。水解階段一般認為是復雜的有機化合物轉化為簡單的有機化合物的過程,簡單的有機化合物分為兩類:產甲烷物質和其他消化產物。產甲烷物質是可以直接被產甲烷菌利用并產生甲烷的底物,主要為乙酸(70%)[11]。其他消化產物則能夠被產氫產乙酸菌代謝,轉化為乙酸、氫氣和二氧化碳。與此同時,同型產乙酸菌將氫氣和二氧化碳轉化為乙酸(此階段可逆)。最后,在產甲烷階段,不同營養型的產甲烷菌將產甲烷物質和H2轉化為氣態甲烷,這是整個厭氧消化的限速階段[12]。多種微生物發揮不同的功能,共同組成了厭氧消化系統[13]。厭氧消化的基本原理如圖1所示。

圖1 厭氧消化的基本原理(三階段四種群)
微生物組學包括基因組學、蛋白組學以及代謝組學,研究微生物從遺傳基因到表達代謝的全過程(表1)。基因組學包括16S rRNA基因組學[14]、宏基因組學[15]、宏轉錄組學[16]。其檢測手段為高通量測序技術,又稱為下一代測序(Next-Generation Sequencing,NGS)。高通量測序技術至今為止已經經歷了三代的發展,第1代高通量測序技術以Sanger測序為代表,第2代以Illumina測序平臺為代表,目前正在開發第3代——單分子測序技術[17]。近年來隨著測序平臺吞吐量的提升、參考數據庫的完善以及成本不斷下降[18],高通量測序技術已經被廣泛用于調查和研究各種厭氧消化系統的生物多樣性[19],成為研究各種環境中微生物群落的有力工具。目前最廣泛使用的高通量測序系統主要基于二代 Illumina 平臺所開發的MiSeq、HiSeq和NovaSeq等[17]。基因組學的研究為微生物群落提供了詳盡的物種信息[20]。
總體而言,各種基因測序方法都有其特定的局限性,而利用多種測序方法共同分析可以彌補其不足。以16S rRNA基因測序為例,由于通用引物無法匹配所有16S rRNA靶點,研究的高變區數量有限(大多為V4)以及擴增過程中產生嵌合體等原因,其精度會受到制約,還會使得特定物種的豐度發生改變,例如Euryarchaeota和Spirochaetes[21]。而宏基因組測序則不受系統發育標記基因的限制,能夠檢測出多種物種(細菌、真菌、古菌、病毒等),并可能獲得新基因乃至新物種信息。因此被認為是評估分類學組成最準確的方法[22]。而宏基因組的局限性在于其不能區分表達和非表達的基因,因此不能反映實際的代謝活動[23]。而宏轉錄組可被用于識別復雜生態系統中mRNA表達的生物學特征[16]。但宏轉錄組的研究也存在包括從環境樣本中難以回收高質量mRNA,物種的mRNA半衰期短,以及需要從其他RNA物種中分離mRNA等問題[22]。因此,從宏基因組分析推斷出的基因豐度高并不一定表明具有高的轉錄或代謝活性。Maus等[24]通過對嗜熱沼氣工程的微生物組進行研究,發現其中包含大量迄今為止未知或未充分了解的物種,只有18%-25%的16S rRNA基因轉錄序列能被分類到屬級,這表明宏轉錄組的測序廣度還有待提高。截止到目前,被測序和研究的16S rRNA序列,5S和23S rRNA序列較為豐富,mRNA序列則相對較少。盡管宏轉錄分析的應用中存在需要進一步細化的技術問題,但其已經提供了一些新的生物學發現。Wang等[25]通過宏轉錄分析和關鍵酶的測定發現磁鐵礦誘導的直接種間電子傳遞(Direct interspecific electron transfer,DIET)可以部分取代種間氫轉移(Interspecies Hydrogen Transfer,IHT),清除電子轉移阻斷,改善乙酸營養型甲烷生成效率。
宏蛋白質組學被定義為在特定位點的環境微生物群落的所有蛋白質組成進行大規模表征[26],為蛋白質結構、定位和蛋白質-蛋白質相互作用的研究提供最直接的證據。由于不同微生物群落的復雜性、自然環境的異質性和干擾化合物的存在,很難提取出合適的蛋白質部分進行分析[27]。盡管存在這些困難,蛋白質組學在將微生物群落的遺傳多樣性和活動與其對生態系統功能的影響相關聯方面發揮著巨大的潛力[22]。例如,Jing等[28]首次用于混合培養的iTRAQ定量蛋白質組學分析表明,在丙酸鹽甲烷化過程中,磁鐵礦誘導了涉及各種途徑的蛋白表達水平的變化,并發現丙酸代謝相關蛋白上調。現階段宏蛋白質組學仍是一個新興領域,其在未來對復雜微生物群落的研究可能得到進一步發展和廣泛應用。
近些年代謝組學雖然發展迅速,但是仍然遠遠落后于基因組學和蛋白質組學,尚未應用于厭氧消化,本文不做討論。

表1 應用于厭氧消化的微生物組學類型
常用的厭氧微生物群落生物信息學分析如圖2所示。從圖中看出,生物信息學分析測序結果包括幾個方面,物種組成分析,α多樣性分析,OTU聚類分析,多元統計學分析(PCA/ PCoA/ NMD,RDA/CCA),共現關系研究和代謝功能與通路研究。

圖2 厭氧微生物群落生物組學分析(部分圖片經參考文獻[31-32]許可轉載,版權歸愛斯維爾、美國化學學會所有)
物種組成分析是厭氧微生物群落最常用的生物信息學分析方法之一。可以使用Phylophlan[37]、MetaPhlAn[39]、PyNAST[7]或者 RDP Classifier[46]等軟件對核心OTU序列和參考序列進行比對,并將比對后的序列進行系統發育組成推斷。常用的基因組 參 考 序 列 數 據 庫GenBank[46]、EBI、DDBJ[39]、IMG/M[47]。常用的物種注釋數據庫包括Greengene數據庫[31]、Silvia數據庫[41,47]。以圖2-a為例,微生物群落的系統發育分析可以從界、門、綱、目、科、屬、種等不同層次進行,運用Krona軟件[40]能夠展現出整個微生物群落的多級物種分類圖。
目前,學者們對不同操作條件下厭氧消化池微生物組成進行了大規模的分析。其中最常見的研究內容是細菌和古菌的相對豐度。不同底物、接種物以及反應參數下,反應器的微生物組成各不相同[31-32]。但可以確定的是,隨著時間的推移,相同反應器微生物豐度在一定時間內的總體概況是相似的,群落演替遵循確定的趨勢[31]。
通常使用Mothur[20,34]、R語言中的Vegan包[31]或RDP[48]來研究產甲烷系統的微生物群落多樣性。常用的多樣性分析的指數(圖2-b)包括:Chao1豐富估計量,基于覆蓋度的物種豐富度(ACE),香農多樣性指數(Shannon- Wiener index)和辛普森多樣性指數(Simpson diversity index)。其中Chao1、ACE和Shannon- Wiener index與微生物群落生物多樣性呈正相關,Simpson diversity index 與微生物群落生物多樣性呈負相關。Chao1和ACE指數可直接用于計算微生物群落中物種總數,Shannon-Wiener和Simpson diversity index還與群落均勻度有關,可用于估算生物多樣性。群落的均勻度越高,其產甲烷活性就越高。Wittebolle等[49]觀察到群落的均勻度與功能穩定性相對應。微生物多樣性結構的均勻性確保了群落的多樣化代謝的能力。此外,物種的覆蓋率(Good’s coverage)越高,測序結果越真實。α多樣性分析各指標的計算公式如表2所示。α多樣性的下降可作為反應器運行狀況惡化的早期預警[47]。

表2 α多樣性分析參數的公式和符號意義[50]
維恩圖(VennDiagram)可以用來表示OTU的共同和獨特的組成部分[32]。在通常情況下進行分析時,常選用相似水平為97%的OTU 樣品。可以使用R 語言VennDiagram包[32]、Venny工具[47]或在線工具(http://www.biovenn.nl/)繪制出圖。如圖2-c可以直觀地反映出厭氧反應器中OTU的相似部分,3個反應器的相同OTU比例為60.9%。結合其他討論,維恩圖的公共部分可能是該系統中發揮特定功能的物種[32]。
最常見的多元分析方法包括主成分分析(Principal Component Analysis,PCA)[43,47],主坐標分 析(Principal Coordinate Analysis,PCoA)[34,51],非度量多維尺度分析(Non-metric Multidimensional Scaling,NMDs)[35,42],冗 余 分 析(Redundancy Analysis,RDA)[7,21,37,48]和典范對應分析(Canonical Correspondence Analysis,CCA)[51]。這些多元技術的共同之處在于,每一種技術本質上都被看作是一種排序分析,其目的是描述相鄰對象的相似性。常用的計算工具包括R語言的Vegan包[7]、PC-ORD軟件[20]和Matlab[45]等。
PCA與PCoA以及NMDs是3種典型的非約束排序分析。其中PCA與PCoA的一個顯著區別在于,PCA基于相似系數矩陣(如歐式距離)確定主成分,而PCoA基于距離矩陣(如Bray-Curtis,UniFrac 和Jaccard)確定主坐標(圖2-d)。另一個非約束分類分析NMDS算法能夠對對象的距離進行排序,并使用這些排序將對象非線性地映射到一個簡化的二維排序空間上,從而保持它們排序的差異而非原始距離[52]。與PCA和PCoA相比,NMDS算法相似度高的數據集更密集,相似度低的數據集更疏遠,這使得被測細菌和古菌群落剖面之間關系視圖更加清晰[52]。無約束排序分析在分析復雜宏基因組數據,或者微生物群落結構差異方面的應用越來越多[7,31,34]。Feng等[31]運用三維- PCoA分析發現不同污泥停留時間(SRT)的反應器內的微生物群落迅速從接種菌群中發生分化,且微生物群落動態在不同反應器之間同步。Ning等[35]將NMDS結合參數聯合解釋分析發現,酸和的協同脅迫是抑制機制的主要驅動因素,并進一步發現細菌群落對相關負載蛋白更為敏感,有可能引起產甲烷群落從乙酸營養型產甲烷向氫營養型產甲烷的轉變。
在約束排序分析中,RDA和CCA是兩種常用的微生物與環境因子關聯性分析方法。這兩種方法非常相似,都可以使用箭頭代表環境因素,解釋環境梯度影響了系統發育結構的變化情況。不同的是,RDA基于線性模型,而CCA基于單峰模型。以用Anoca軟件進行去趨勢對應分析(Detrend Correspondence Analysis,DCA)分析結果作為選擇RDA和CCA的標準[20,47]。若DCA第一軸大于4.0,CCA擬合效果更好;而在3.0-4.0之間,RDA和CCA均可;小于3.0,RDA的結果可信度更高。Feng等[31]運用CCA分析表明,隨著OLR的增加,碳水化合物、脂類、蛋白質等有機大分子向可溶性有機分子的水解和轉化增加。反之丙酸和乙酸等可溶性中間產物濃度的升高可能表示產甲烷過程被部分抑制。
厭氧消化菌群并非以單個OTU來執行功能,而是通過厭氧食物鏈形成一個復雜的群落。為了描述種間關系,共現關系網絡常用于揭示物種-物種的關聯,描述核心物種之間的相互作用[38,47]。在這些研究中,共現網絡的拓撲結構主要在Gephi[31]、Cytoscape[47]軟件中使用皮爾遜或斯皮爾曼相關性分析[53]和存在缺失數據的超幾何分布[54]得到了可視化。密集連接的節點被劃分為簇,這些簇被解釋為具有重疊生態位[53-54]的類群。
以圖2-e為例,當兩個節點(OTUs或任何分類相關的單位)在多個樣本中同時出現或顯示相似的豐度模式時,則為正相關;反之則為負相關。節點的大小代表與其相關物種的多少,節點之間各邊的寬度與相關強度成正比[34]。然而這些關系的生態相關性并不容易解釋。例如,由于交叉取食、生物膜內的共聚集、共定殖、生態位重疊等原因,都可能形成正相關關系;而由于偏害共棲、捕食-被捕食關系、競爭等原因,則可能形成負相關關系[55]。此外,更復雜的生態相互作用形式容易被忽視,例如滯后關系和多物種的共生(競爭)關系。
為了深入了解分類組成之外的信息,可以使用生物信息學平臺或工具對宏基因組數據進行功能注釋。常用讀取基因組的工具為MG-RAST服務器[39]。常 用 功 能 注 釋 數 據 庫 包 括GO、KEGG[36,40,42]、COG[36,41]、Pfam[41]、SWISS-PROT[45]、UniProt-KB[45]。趙一全[42]利用宏轉錄組學在研究預處理秸稈對微生物的影響時,通過基于KEGG數據庫比較甲烷代謝相關途徑豐度時發現未處理樣本微生物群落能夠進行多種途徑的營養代謝活動,而經過預處理的樣本中的甲烷代謝途徑較為單一。之后將注釋到的數據映射到代謝通路圖(類似于圖2-f)中,發現預處理并未改變代謝途徑,而是能夠將某些通路中的中間代謝產物的合成途徑變得更為直接。Heyer等[45]首次對40份沼氣廠樣本進行了大規模宏蛋白組分析。該方法比起基因組學研究,可以過濾出更具體的核心物種和核心函數。在這些系統研究的基礎上,可以確定某種蛋白作為生物標志物。如果這些生物標記物的豐度迅速變化或表現出與選擇的工藝參數相矛盾,這可能是之后過程失敗的標志。
微生物組學分析將微生物群落組合模式與運行參數相聯系,可以指導厭氧消化參數的調節。但目前用來解釋微生物群落組合模式的理論仍存在一定的分歧。其中占主導地位的理論主要分兩種:生態位理論和中性理論。經典的生態位理論強調了微生物的種間關系(如共生和競爭)生態位分化和底物營養等確定性過程的重要性[29]。中性理論則只考慮出生、死亡、漂移、移民等隨機過程對生態環境的影響[56]。大部分研究認為生態位理論和中性理論對構建土壤和生物反應器的微生物群落非常重要[57]。微生物群落的組成并不完全是由環境條件決定,而是在一定程度上依賴中性過程[56]。了解微生物群落組成對生態位理論和中性過程及對環境條件的依賴度,對設計和維護厭氧消化工程有著極大的意義。
由于群落組合模式的復雜性以及影響微生物群落結構的參數的多樣性,理解環境參數與微生物的相互作用變得困難[58]。一般來說在所有厭氧消化系統中均存在一個核心菌群[37]。Tao等[59]從20個運行了長達兩年的實驗室規模的厭氧消化反應器中采集了138個樣本,并得出了核心菌群的組成(Bacillus、Clostridium、Bacteroides、Eubacterium、Cytophaga、Anaerophaga和Syntrophomonas等),而產甲烷菌的組成因接種源、反應器溫度或鹽度不同而不同。核心菌群與沼氣產量有顯著的相關性。產甲烷量高的反應器,其細菌群落非常相似。相對應的是,古菌群落由于功能的變異性較大而具有較強的多樣性[37]。此外,有些物種雖然稀有,但也是厭氧消化過程的重要驅動力,如Hyphommicium、Gordonia、Methanospirillum等[48,60]。
最近的研究表明,厭氧消化所涉及的細菌群落具有高度的恢復力(Resilience)。水解、產酸的每一個主要步驟都有多個相關的系統發育群落,功能冗余在所難免[29]。較高水平的發酵菌群(如互營細菌)的動態變化與初級發酵菌群(如Clostridia和Bacteroidetes)豐度變化明顯不同,它們更依賴冗余來維持群落的整體功能[37]。均勻度較高的群落利用冗余功能通路的潛力更高,即具有更多并行通路的群落對底物代謝的反應更有效[7]。這使得以特定代謝方式調控細菌菌群變得困難[61]。
作為厭氧消化過程中甲烷生產的最終步驟,產甲烷古菌代謝途徑較為單一。目前所有已知的產甲烷菌都表達甲基輔酶M還原酶(mcr)[62]。最常見的乙酸營養型產甲烷菌參與的乙酸代謝過程如圖3-A所示:首先,以乙酸受到乙酸激酶(ack)、磷酸乙酰轉移酶(pta)或乙酰輔酶A合成酶(acs)等酶催化形成乙酰輔酶A。然后乙酰CoA 再在乙酰輔酶A脫羰酶/合酶復合體(cdh)的作用下形成甲基四氫甲烷喋呤。此外,氫營養型產甲烷菌參與了完整的CO2還原途徑的所有通路(圖3-B)。涉及這些通路的重要酶包括:四氫甲烷蝶呤甲酰轉移酶(hfr)、次甲基甲酰四氫甲烷蝶呤環化水解酶(mch)、亞甲基四氫甲烷蝶呤脫氫酶(mtd)以及5,10-亞甲基四氫甲烷蝶呤還原酶(mer)等[63]。此后氫營養型產甲烷途徑與乙酸營養型產甲烷途徑相同,經四氫甲烷蝶呤S-甲基轉移酶(mtr)和甲基輔酶M還原酶(mcr)的催化下形成甲烷[40]。另外,一些新的生化途徑被發現,包括DIET[25],膜結合的反向電子轉移,以及以氫和/或甲酸鹽的形式處理電子的胞質凝聚型酶[64]。厭氧消化的代謝過程的“面紗”正逐漸地被揭開。

圖3 產甲烷途徑
隨著宏基因組測序技術的廣泛使用,越來越多的厭氧消化相關的功能生物標記物被鑒定出來,從而簡化了基因組研究。mcrA基因的a亞基是研究最多的產甲烷菌的功能基因,其拷貝數[65]和轉錄本[66]與甲烷產量存在顯著正相關,被認為是厭氧消化中最重要的生物標志物。輔酶F430作為mcrA基因的輔酶同樣可以量化產甲烷潛力[66]。Fe-Fe-氫化酶大亞基的基因(hydA)被用作產氫發酵細菌生物標記物[67]。同型產乙酸細菌以甲酰四氫葉酸合成酶編碼基因(FTHFS)(Wood-Ljungdahl通路的關鍵酶)作為生物標志物[68]。此外,基因組研究還可鑒定編碼關鍵微生物基因組的特定代謝途徑的酶,包括碳水化合物利用、脂肪酸降解、氨基酸發酵等[69]。通過16S rRNA基因測序與已培養的相似物種做比對,也可以推測出厭氧消化過程的功能[7]。但由于密切相關的生物可能在功能上有所差異,因此應謹慎做出結論[70]。如果基于相關性分析來建立假設,并且使用補充技術進一步論證,得出的結果將更加可靠。
研究沼渣中抗生素耐藥基因(Antibiotic Resistance Genes,ARGs),可以界定其給土壤等其他環境因素可能帶來的風險[71]。沼渣中的ARGs可能會傳播給致病菌,從而降低致病菌在醫療過程中對抗生素的敏感性,對公眾健康構成威脅。ARGs可通過水平基因轉移在不同微生物種群間傳播,形成具有抗生素耐受性的細菌。使用宏基因組測序不僅揭示了微生物水平基因轉移的證據,也證明了其耐藥性傳播機制。Lee等[72]對具有代表性的有機廢棄物(糞便、污泥和食品垃圾回收廢水)中ARGs的多樣性和數量進行研究,發現糞便中ARGs的總量最高,其次是污泥和食品垃圾回收廢水。不同基質間ARGs的多樣性和作用機制存在較大差異。研究發現,厭氧消化能有效地降低ARGs拷貝數,但不同抗性機制下的相對豐度則存在明顯差異[72]。某些細菌(如Clostridium和Nitrosomonas)可能是多個ARGs的潛在宿主。Luo等[39]發現,在以糞肥和工業廢料為原料的反應器中,ARGs的總豐度在7×10-3-1.1×10-1拷貝數/ 16S rRNA基因拷貝數之間變化,并且嗜熱型厭氧消化器在去除ARGs上有一定優勢。除此之外,延長固體停留時間以及添加生物炭都可以降低ARGs的環境風險[73]。
厭氧消化是一種生態友好的有機廢棄物處理及資源回收過程。在過去的十年中,隨著微生物組學的快速發展,我們對厭氧消化中微生物菌群的結構和功能的認識也有了質的提升。這不僅能夠更好地建立微生物群落模型,而且也將使人們更清楚地了解相關的環境條件、代謝途徑和演替規律,從而解釋這種格局。微生物組學研究為曾經被認為是“黑盒”的復雜微生物群落提供了光明。本文綜述了目前微生物組學的類型和常用的生物信息學分析手段,以及最近的研究進展,有助于確定最佳的沼氣生產因素的組成,改進厭氧消化器的操作參數;也有助于充分利用厭氧微生物群落潛力,為設計最佳厭氧消化工藝提供理論依據。
目前為止,通過厭氧消化微生物組來改善厭氧消化產甲烷效率仍面臨許多挑戰。首先,微生物組的厭氧微生物群落研究仍處于起步階段,需要儲存已有數據作為參考。并且新的研究需要讀入大量的微生物組數據,為之前的研究結果提供統計支持,這導致需要為測序數據提供龐大的存儲空間;其次,大多數序列分析需要與參考數據庫中相似序列進行比對,但仍有部分基因在現有數據庫中無法匹配到相似序列。未來有必要擴大參考數據庫,建立能夠對基因組學數據進行全面和綜合分析的平臺;最后,未來的研究不僅需要考慮微生物的代謝,還需要考慮微生物代謝物如何改變自身或其他微生物的基因潛力與表達,整合多組學分析也是必不可少的。總而言之,要想通過厭氧微生物群落的微生物組學信息來精確調節厭氧消化反應器的性能,仍有很長的路要走。而研究微生物群落如何響應性能參數,已經是向目標邁出了第一步。