宋國慶 ,李輝 ,馬克 ,趙雪瑩 ,沈憶文 ,謝建輝 ,周懷谷
(1.復旦大學基礎醫學院法醫學系,上海 200032;2.上海市公安局物證鑒定中心 法醫物證學現場應用技術公安部重點實驗室 上海市現場物證重點實驗室 上海市刑事科學技術研究院,上海 200083)
土壤樣本在刑事案件中并不少見,黏附于鞋、衣物或兇器的土壤有助于提示案件現場及自然環境,指明偵查方向并縮小偵查范圍,為案件偵破提供科學依據[1]。傳統的法醫土壤分析主要是通過理化方法對土壤表征和組分進行分析,早期的土壤微生物基因組學研究依賴微生物分離和純培養,鑒定方式主要為形態觀察、生化反應和免疫學等方法,然而環境微生物群落中超過99%的微生物無法在培養條件下生長[2]。隨著分子生物學技術,特別是高通量測序(highthroughput sequencing,HTS)技術在法醫土壤分析中的應用,土壤微生物學在法庭科學領域的應用逐漸成為研究熱點[3]。HTS單次反應能夠同時對幾十萬乃至幾百萬條DNA進行測序,該方法使得對土壤中非培養微生物的發現和研究成為可能,促進了微生物基因組學的發展[4]。細菌是土壤微生物的主要類群之一,細菌中的核糖體小亞基16S rRNA是研究細菌進化良好的分子時鐘,被廣泛應用于細菌物種分類學和菌群結構或功能的研究[5-6]。
本研究采集上海市7個地區的土壤樣本,利用HTS技術對16S rRNA基因高變區片段測序,采用生物信息學軟件對測序結果進行多樣性分析,比較不同土壤中細菌群落的差異性,探索其應用于法庭科學的可行性。
采樣時間為2018年2月,共7個地點,每處重復采樣3次,各采樣點間隔1~2 km,環境溫度為(7.54±0.62)℃,空氣濕度為(63±8)%,采樣方法為土壤垂直剖面分層取樣(地表以下10cm和30cm處)[7],分層采樣后將樣本混合均勻裝入樣本袋,標記好采集地點和土壤類型。土壤樣本采集地點及環境條件見表1。

表1 土壤樣本采集地點及環境條件
采樣后于6h內進行土壤細菌基因組DNA提取。稱量250 mg土壤,采用土壤基因組DNA提取試劑盒[離心柱型,天根生化科技(北京)有限公司]提取基因組DNA,操作過程參照產品說明書。提取的DNA置于-20℃保存。
提取的DNA采用Ion 16STMMetagenomics試劑盒(美國Thermo Fisher Scientific公司)對細菌16S rRNA基因高變區進行擴增。試劑盒包含兩套擴增引物(V2-4-8和V3-6,7-9),分別在兩個PCR體系進行擴增(反應體系及條件相同),同時添加大腸桿菌(Escherichia coli)作為對照。PCR 反應體系:2×Environment Master Mix 15 μL,16S rRNA 引物 3 μL,DNA模板2 μL,加去離子水補至30 μL。反應條件:95 ℃預變性10min;95℃ 30s,58℃ 30s,72℃ 20s,25個循環(大腸桿菌為18個循環);72℃延伸7min,4℃保存。PCR產物經1.5%瓊脂糖電泳進行檢測。
PCR產物采用Agencourt AMPure XP核酸純化試劑盒(美國Beckman Coulter公司)純化后,使用QubitTMdsDNA HS Assay試劑盒(美國Thermo Fisher Scientific公司)在QubitTM2.0熒光定量儀(美國Thermo Fisher Scientific公司)上測定DNA濃度,定量后采用 Ion Plus Fragment Library Kit和 Ion XpressTMBarcode Adapters Kit(美 國 Thermo Fisher Scientific公司)進行末端修復與添加接頭,操作過程參照產品說明書。
將構建好的文庫用Ion Universal Library Quantitation Kit(美國 Thermo Fisher Scientific公司)在LightCycler? 96 System(瑞士Roche公司)采用熒光定量PCR方法進行定量。根據產品說明書進行模板制備和上機測序,文庫均一化后,使用Ion Chef System和Ion AmpliSeqTMKit for Chef DL8(美國Thermo Fisher Scientific公司)進行乳化PCR和模板富集。本研究選擇Ion 530TM測序芯片(美國Thermo Fisher Scientific公司),芯片上樣完成后在Ion S5TM基因測序儀(美國Thermo Fisher Scientific公司)上進行HTS,共850個測序循環。
測序原始數據先通過儀器配套的TorrentSuiteTMv5.6軟件進行質量控制,生成fastq格式文件。接著按照QIIME v1.9.3軟件的使用要求,建立mapping文件以便樣本的多樣性分析,QIIME v1.9.3軟件對fastq文件進行處理(引物和接頭序列的去除,低質量序列的過濾,數據的均一化等)后,獲得有效數據,之后選擇高變區V4區作為分析對象進行操作分類單元(operational taxonomic unit,OTU)聚類和物種注釋,并計算各樣本的alpha多樣性指數(包括測序平臺期指數、Chao1指數、Observed species指數、Shannon指數和Simpson指數等)。對于物種注釋結果可通過R語言的“gplot”工具包,以樣本名稱為橫坐標,細菌名稱為縱坐標,選取相對豐度排行大于0.5%的各門細菌,在門分類水平進行各樣本的熱圖聚類分析。對于樣本的alpha多樣性指數,可以通過GraphPad Prism v5.01軟件進行統計分析,對樣本alpha多樣性參數計算平均值,對數據進行單因素方差分析,檢驗水準α=0.05。同時選擇相對豐度大于1%的細菌繪制柱狀百分比堆積圖,其他則歸類為Others,生成門和科分類水平物種相對豐度柱狀圖。組間差異分析則通過Galaxy平臺中的PICRUSt對原始16S rRNA測序數據的種屬數量標準化后,將16S rRNA的種屬構成信息導入STAMP v2.1.3軟件進行主成分分析(principal component analysis,PCA),并采用非加權的分析方法更準確地描述樣本細菌群落組間差異結果。本研究將從物種相對豐度聚類熱圖、alpha多樣性指數分析和beta多樣性分析(PCA)等方面比較各土壤樣本間細菌群落的差異。
本研究共收集到3類土壤樣本共21份,其中有19份擴增成功(草地土壤樣本9份、樹林土壤4份、沙灘土壤6份),陽性對照大腸桿菌擴增成功,復合擴增產物片段長度約為250bp。電泳結果見圖1。

圖1 21份土壤樣本的電泳結果
測序結果在TorrentSuiteTMv5.6軟件進行數據提取和初步分析,得到測序數據整體概況和測序深度等信息。擴增成功的20份樣本(19份土壤樣本和對照大腸桿菌)在一張Ion 530TM測序芯片上進行測序,圖2為芯片的概況圖,其中芯片中有效區域為80%,文庫連接率為100%,除去37%的多克隆、51%的低質量文庫和0%的測試片段,最終文庫的有效率為31%,共2.37×105個讀長片段,片段平均長度為219 bp,產生數據總量為51.3Mb,經QIIME v1.9.3軟件計算,每個樣本的平均測序序列為11386±4483。

圖2 20份樣本在Ion 530TM測序芯片的測序概況圖
通過QIIME v1.9.3軟件對OTU序列進行物種注釋,結果共計67門254綱463目732科,將注釋結果導入GraphPad Prism v5.01軟件,繪制門和科分類水平的物種相對豐度柱狀圖(圖3~4)。
在門分類水平,變形菌門(Proteobacteria)、酸桿菌門(Acidobacteria)和放線菌門(Actinobacteria)在土壤樣本細菌群落中構成占比較大。
在科分類水平,酸桿菌科(Acidobacteriaceae)、紅螺菌科(Rhodospirillaceae)、鞘酯菌科(Sphingomonadaceae)和華桿菌科(Sinobacteraceae)在群落構成中比重較大。總體來看并無特異性細菌。

圖3 門分類水平細菌群落分類柱狀百分比堆積圖

圖4 科分類水平細菌群落分類柱狀百分比堆積圖
2.3.1 物種相對豐度聚類熱圖
為了直觀展示各樣本中細菌群落的差異變化情況,使用QIIME v1.9.3軟件完成聚類后,利用R語言的gplot函數在門分類水平進行各樣本的熱圖聚類分析,如圖5所示,各土壤樣本細菌群落在門分類水平熱圖聚類成功。在門分類水平可以直觀地看出土壤樣本中細菌群落和大腸桿菌差異明顯,數據質量控制較好;土壤樣本中細菌群落的多樣性和豐富度遠遠大于大腸桿菌;草地、樹林和沙灘土壤樣本在各門分類水平細菌中顏色存在差異,尤其在變形菌門、酸桿菌門和放線菌門中顏色差異明顯,同組樣本間顏色差異較小。

圖5 各土壤樣本細菌群落門分類水平物種豐度聚類熱圖
2.3.2 樣本的alpha多樣性分析
為了將單樣本細菌群落的多樣性量化分析,使用QIIME v1.9.3軟件對樣本alpha多樣性進行統計分析,得到各土壤樣本細菌群落的Chao1指數、Observed species指數、Shannon指數和Simpson指數等多樣性參數,對3類土壤樣本和3類草地土壤樣本的alpha指數取平均值,結果見表2~3。
3類土壤樣本和3類草地土壤樣本的Chao1指數和Observed species指數通過GraphPad Prism v5.01軟件進行統計分析,結果顯示,3類土壤樣本的Chao1指數和Observed species指數差異具有統計學意義(P<0.05),而3類草地土壤樣本的Chao1指數和Observed species指數差異無統計學意義(P>0.05)。
2.3.3 樣本的beta多樣性分析
通過PCA(圖6)可展示樣本組間的差異情況,兩個主成分可以反映樣本全部信息的82.7%,說明數據提取較為完全,代表性高。各土壤樣本細菌群落受到環境的影響,PC1和PC2的貢獻度有所波動,但各類型土壤樣本的距離較近,聚集性較好。3種類型土壤相比,各草地土壤樣本之間距離較近,重復性較好,而各沙灘土壤樣本之間距離較遠,重復性較差。

表2 草地、樹林和沙灘土壤的alpha指數平均值

表3 人工草地、天然草地和工業區草地土壤的alpha指數平均值

圖6 土壤樣本細菌群落的PCA圖
法醫微生物學正逐步成為法庭科學領域的研究熱點,HTS技術克服了非培養細菌無法被測序的缺陷,能夠對土壤樣本中所有細菌進行深度測序,以達到區分不同土壤的目的[8]。目前,土壤微生物基因組學方法應用于法庭科學領域主要是根據細菌群落結構演替特征推斷土壤來源或死亡時間等[9-11]。本研究通過Ion S5TM基因測序儀對土壤細菌16S rRNA基因進行HTS,從物種注釋分析、門分類水平熱圖聚類分析、alpha多樣性和beta多樣性4個方面進行分析討論,初步探索土壤細菌群落特征應用于不同土壤鑒定的有效性。此外,為了減少自然環境中溫度和濕度等因素的影響,本次采樣時間選為冬季,此時晝夜溫差與濕度變化小,群落結構較穩定[12]。細菌16S rRNA基因高變區V4區為半保守高變區,在門類鑒定水平與完整16S rRNA序列的分辨率相近[13],故本研究選取16S rRNA基因的V4高變區作為分析對象。
本次測序的低質量數據占比較大,測序數據通過QIIME v1.9.3軟件行進一步優化,將質量值小于Q20的數據過濾,即保留錯誤識別概率小于1%或正確率大于99%的數據,在HTS中,堿基質量值(quality score或Q-score)是堿基識別(base calling)出錯概率的整數映射,堿基質量值越高表明堿基識別越可靠,堿基測序錯誤的可能性越小。進行物種注釋后,在門和科分類水平繪制物種豐度的柱狀百分比堆積圖。門分類水平下,各土壤樣本中的變形菌門、酸桿菌門和放線菌門占比較大,與JESMOK等[14]的研究結果基本一致,其中變形菌門在樹林土壤中比例最高,酸桿菌門在草地土壤中比例最高,放線菌門在沙灘土壤中比例最高,該結果也與XU等[15]的研究結果基本一致。3類土壤在門分類水平中具有差異的原因,可能是3種植被光合作用能力和土壤養分不同,從而使得細菌的種類和豐度不同,另外也受到植被類型、植物根系分泌物等因素的影響[16]。此外,城市環境的改善使得人工草地和工業區草地逐漸向天然草地趨化,人工草地、天然草地和工業區草地土壤的細菌群落比例相似,并無太大差異。在科分類水平,各類土壤樣本的差異不明顯,也沒有特異的生物學標記,無法進一步注釋分類。
基于細菌門分類水平聚類結果和相對豐度的熱圖能夠反映群落構成的差異性和相似性[17]。在門分類水平上,變形菌門、酸桿菌門、放線菌門、擬桿菌門(Bacteroidetes)、芽單胞菌門(Gemmatimonadetes)、浮霉菌門(Planctomycetes)和疣微桿菌門(Verrucomicrobia)在各樣本中紅色方格較多,相對豐度較高。其中,變形菌門相對豐度在樹林土壤中最高,酸桿菌門相對豐度在草地土壤中最高,放線菌門相對豐度在沙灘土壤中最高,與物種注釋的結果基本吻合。由于熱圖只能通過顏色的深淺和差異判斷樣本之間的差異,而群落的相對豐度無法有效地量化并區分不同土壤,所以需要結合多樣性統計結果對樣本細菌群落作進一步多樣性分析。
多樣性代表了群落結構組織化水平,alpha多樣性和beta多樣性是評估多樣性的重要參數[18]。alpha多樣性是群落內物種豐富度和均勻性的綜合體現,其中豐富度主要由Chao1指數和Observed species指數反映,兩者數值越高,OTU直觀統計的數量越大,表明群落的豐富度越高;均勻度主要由Shannon指數和Simpson指數反映,Shannon指數值越高,Simpson指數值越低,表明群落的均勻性越高[19]。在相同的測序豐度時,3類土壤樣本的alpha指數平均值存在差異,其中Chao1指數和Observed species指數差異最為明顯(P<0.05),說明細菌群落的平均物種多樣性水平有差異,但人工草地、天然草地和工業區草地土壤樣本的alpha指數平均值差異并不明顯(P>0.05)。alpha多樣性的結果表明:不同土壤細菌群落多樣性有差異,草地土壤的多樣性大于樹林土壤,樹林土壤的多樣性大于沙灘土壤,而人工草地、天然草地和工業區草地土壤的多樣性相似。beta多樣性通過算法將各樣本序列的進化關系及豐度信息轉換為樣本間距離,直觀反映樣本組間的群落差異[18]。beta多樣性通常基于原始的物種組成矩陣進行排序分析,在減少數據維數的同時還保持最大數據貢獻值。由于復雜的環境因素對土壤細菌群落構成差異影響尤為明顯,因此往往采用不考慮物種豐度的變化而進行分析[20-21]。本研究中,3類不同土壤樣本直觀地被分為3個亞群,其中草地土壤樣本的重復性較好,說明草地土壤樣本之間的差異度較小,而沙灘土壤各樣本分布離散,重復性較差,說明其細菌群落的多樣性和穩定性較差,可能原因為沙灘土壤樣本受環境因素影響(鹽堿程度和溫度)比其他兩種類型土壤更大[22]。總體而言,草地土壤的OTU豐度大于樹林土壤,而樹林土壤大于沙灘土壤,但人工草地、天然草地和工業區草地土壤仍然無法有效區分。不同土壤養分和含水量不同,草地植物根系復雜,其分泌物為土壤提供了豐富的養分,直接影響土壤微生物的數量,草地土壤細菌多樣性與樹林土壤有明顯差異[23]。而在草地沙漠化的過程中,隨著土壤中有機碳的逐漸減少,微生物的多樣性也減少[24]。本研究中alpha和beta多樣性結果印證了以上結論,即3類不同土壤細菌群落多樣性和相對豐度有著明顯的差異。
SENSABAUGH[25]提出法醫土壤微生物學需要解決以下問題:(1)證明不同地域土壤的微生物群落構成不同;(2)分析方法要將分辨性和穩定性結合;(3)統計方法必須客觀評估樣本間的差異性。本研究比較了不同土壤細菌群落的差異性,結果表明,草地土壤細菌群落的多樣性和豐富度最高,樹林土壤次之,沙灘土壤最低,3類土壤的多樣性差異具有統計學意義,物種注釋分析可以宏觀地比較出3類土壤的差異,基本證明通過細菌群落的豐度及多樣性鑒定不同土壤的有效性,可以為偵查破案提供線索和方向。但研究中仍然存在著不足之處,如在實際工作中地表土壤樣本更為多見,樣本量少、測序深度不夠和未考慮植物種類等影響因素。此外,法醫土壤微生物學的研究時間并不長,通過微生物鑒定土壤尚未有公認的標準,仍需不同地域大樣本研究、法醫土壤微生物學數據庫的建設和標準鑒定方法的確定,從而作出更科學的評估,拓展微生物學在法庭科學領域的應用。