宋瑞震, 高 鑫, 陳宏權, 曾賽星
(1.上海交通大學 安泰經濟與管理學院,上海 200030;2.上海交通大學 中美物流研究院,上海 200030)
鐵路工程是我國基礎設施建設的重要組成部分,處于我國綜合交通運輸體系中的骨干地位。截至2020年底,我國鐵路營業里程達14.6萬公里,其中高速鐵路3.8萬公里,極大地促進了我國經濟增長[1]。鐵路工程具有建設規模大、地區跨度大、生態環境影響顯著等特點,極易對生態環境脆弱地區產生不可逆的生態影響。因此在工程設計階段,就必須充分考慮工程建設可能帶來的生態環境影響。例如,青藏鐵路橫貫青藏高原,工程建設會對動植物的生存環境以及生物多樣性產生顯著影響。為保護青藏高原的生態環境,我國政府投入了約15.4億元用于沿線的環境保護和生態恢復[2],在青藏鐵路沿線設計建設了33座“生態走廊”,解決了鐵路工程所引發的動物生存棲息地分割問題[3];采用48臺最先進的旋挖式鉆機修建青藏鐵路清水河特大橋,避免了鉆孔產生泥沙所引發的水體污染[4];采用濕鉆法施工,降低隧道施工中粉塵帶來的大氣污染問題等[5]。
鐵路工程生態風險的復雜性早已備受關注,在鐵路建設期間可能會對沿線動植物、自然景觀和生態系統造成不同類型和程度上的影響,在不同鐵路工程特殊的施工條件和自然環境下,生態風險的復雜性將進一步提高[6]。對鐵路工程具體生態風險類型的研究,國內外學者主要從生態風險受體、生態影響范圍和影響程度等方面展開。生態風險受體主要包括鐵路工程沿途影響的動植物生活[7]、景觀格局[8]、人類活動[9]等方面,通過對風險受體的識別和分析能夠直接為鐵路建設的環境保護提供指導。對鐵路工程生態影響范圍和程度的研究,學者們主要將工程實踐與遙感圖像、GIS技術和生態學的理論方法相結合[10],確定鐵路工程生態影響的范圍和大小,及其隨時間和空間的變化情況,從宏觀的角度評估和預測生態風險[11]。整體來看,現有研究從多個角度探討了鐵路工程的主要生態風險受體和受影響程度,大多風險識別是基于某一確定視角下的主要風險類型,再結合過去相關的設計規范和主觀的經驗判定確定,能夠有重點地突出各種生態風險類型,但忽視了生態風險管理的客觀性和全面性。因此,需要使用更加客觀、系統的技術方法,全面地識別和梳理鐵路工程的生態風險類型。
機器學習(machine learning,ML)是一類算法的總稱,這類算法可以從大量的歷史數據推斷出數據隱含的規律,并利用這種規律進行判斷或預測[12]。主題模型是無監督機器學習模型中的一個重要分支,廣泛應用于自然語言處理(natural language processing,NLP)中。主題模型的發展基于早期的向量空間模型(vector space model,VSM)中存在的“一詞多義”和“一義多詞”問題,先后有學者提出了潛在語義分析(latent semantic analysis,LSA)模型和概率潛在語義分析(probabilistic latent semantic analysis,PLSA)模型。在此基礎上,Blei等[13]提出著名的隱含狄利克雷分布(latent dirichlet allocation,LDA)模型,因其廣泛的適用性和良好的拓展性,國內外學者將LDA模型應用于潛在風險挖掘、計算機視覺和輿情監控等領域[14,15]。LDA模型在訓練時不需要人工標注訓練集,所以十分適合對未知類型的主題進行識別和分類,如鐵路工程中存在的潛在生態風險類型。
然而,由于LDA是基于詞袋(bag of words)模型構建的,使模型得到的每個主題之間的關鍵詞的關系割裂[16],而Word2Vec模型可以通過構建三層神經網絡用詞嵌入(word embedding)的方式將文本詞向量化,通過結構化的詞向量分析關鍵詞間的語義關系[17]。Word2Vec模型包含兩種模型,分別是利用上下文預測中心詞的CBOW(continuous bag of words model)模型與通過中心詞預測上下文的Skip-Gram(continuous skip-gram model)模型。近年出現了將LDA與Word2Vec結合的研究[18],使主題和詞嵌入取得更準確的結果。經過Word2Vec模型處理后,將詞表示為低維空間上的語義向量,但仍然不夠直觀。所以可以進一步利用主成分分析法(principal component analysis,PCA)提取詞向量中的重要特征并對特征降維,得到更加直觀的關鍵詞語義關系[19]。
基于以上分析,本文將LDA、Word2Vec和PCA三種無監督機器學習模型整合使用,其優勢在于利用LDA模型得到更加客觀、全面的風險主題詞的基礎上,借助Word2Vec解決LDA中主題詞的語義關系不明問題,再利用PCA解決Word2Vec中詞向量維度高不直觀問題,最終更加全面、系統和直觀地得到鐵路工程的生態風險類型和風險間的相關關系。
綜上,鐵路工程帶來的生態風險管理異常復雜,而現有的研究中,并沒有客觀、系統地對生態風險類型、風險源和應對策略進行梳理和歸納。為了建設環境友好的綠色鐵路工程并降低工程建設對生態環境的影響,首先,識別鐵路工程在建設期存在的主要生態風險類型,這為項目的生態風險管理指明了方向;其次,針對各類風險,進一步挖掘對應的主要風險源,這為應對生態風險提供了具體目標;最后,根據生態風險和風險源,匹配應對策略,這為生態風險管理提供了具體的治理措施。基于此,本文基于三種機器學習模型,以鐵路工程建設階段存在的生態風險為研究對象,通過對大量歷史文本數據的分析,提出了基于機器學習的鐵路工程風險識別與應對的模型方法,形成了“風險識別—風險溯源—風險應對”的研究架構。
本文的創新點在于:在理論上,形成鐵路工程生態環境“風險識別—風險溯源—風險應對”的研究架構,豐富了鐵路工程生態風險管理和保護的理論內涵,為研究和分析工程風險提供了新思路;在實踐上,提出了一種基于機器學習的鐵路工程生態風險管理的模型方法,補充了現有研究的方法體系,也為鐵路工程實踐中的生態風險識別、管理和修復提供決策參考。
本文以鐵路工程生態風險相關的歷史文本為數據,利用三種機器學習模型的互補優勢,提出基于機器學習的鐵路工程生態風險識別與應對模型(如圖1)。該模型包括四個主要步驟:文本收集與預處理、樣本篩選、機器學習模型訓練與可視化和生態風險、風險源及應對策略提取,最終得到鐵路工程生態環境“風險識別—風險溯源—風險應對”框架。該模型的優勢在于:(1)針對大量的文本數據,只需對機器學習模型輸出的主題相關詞進行標注即可得到系統且全面的鐵路工程生態風險類型。(2)使用的LDA、Word2Vec和PCA均屬于無監督機器學習模型,有效地避免了人為梳理聚類的主觀性問題。(3)通過對生態風險關鍵詞表的調整,本文提出的模型方法還能被應用于識別其他工程的各類風險,具有一定的推廣價值。

圖1 基于機器學習的鐵路工程生態風險識別與應對模型流程圖
2.2.1 文本收集與預處理
本文選擇提取WebofScience和Scopus兩個數據庫中已經正式發表的鐵路工程生態環境風險相關文本全文數據。同時,考慮到鐵路工程施工技術和裝備水平的不斷提升,部分過去存在的生態風險問題已經在工程中得到解決,所以選擇數據庫中2010—2021年間的文本數據。根據關鍵詞使用:railwayAND(“environment*risk*”OR“ecolog*risk*”OR“environment*issues”OR“ecolog*issues”OR“environment*problem*”OR“ecolog*problem*”)在文本的標題、摘要或關鍵詞中搜索,各數據庫得到的文本結果如表1所示。

表1 數據收集與預處理結果
對文本預處理的步驟主要分為:全文PDF解碼、分詞、去停用詞和特殊符號。由于文本標題、摘要和關鍵詞中信息有限,作為數據輸入主題模型訓練可能無法得到詳盡的風險類型,所以提取全文構建樣本數據。
2.2.2 樣本篩選
樣本得分的計算和篩選步驟如下:第1步,設定鐵路工程生態風險相關的關鍵詞KEYi(i=1,…,n),并根據關鍵詞在文本數據標題中的詞頻分為高度相關、中度相關和低度相關三類。再根據相關程度對關鍵詞組賦權,經過多次取樣試驗后調整賦值范圍,確定從低到高的關鍵詞賦權為[1,4]、[4,7]、[7,10]范圍內的隨機整數WEIGHTj(j=1,…,m),如表2所示。第2步,分別統計上一步處理好的每個文本數據中相關關鍵詞表的各關鍵詞出現的頻次Ki(i=1,…,n)。第3步,運用公式(1)計算每個文本的相關性得分,選擇得分排序前50%的文本作為后續機器學習模型的訓練樣本。第4步,將各關鍵詞在權重范圍內多次取值,重復計算文本相關性得分,并取每次得分前50%文本的并集作為初始樣本。

表2 鐵路工程生態風險關鍵詞優先級及權重取值范圍
2.2.3 機器學習模型訓練與結果提取
通過結合三種機器學習模型的互補優勢,實現對鐵路工程生態風險系統性地識別,主要步驟為:(1)LDA與Word2Vec模型參數計算,包括:構建語料庫和困惑度計算;(2)基于LDA“主題—單詞”分布的風險識別,包括:LDA模型建模與訓練;(3)基于Word2Vec和PCA的鐵路工程生態風險溯源與應對,包括:Word2Vec模型訓練和PCA降維與可視化。
(1)LDA與Word2Vec模型參數計算
首先,為了將詞語中的語義處理為機器學習模型能夠識別和訓練的信息,需要基于詞袋模型構建語料庫。詞袋模型中利用詞頻表示詞向量,但詞頻多的詞并不一定是重要的風險分類詞,所以通過TF-IDF(term frequency-inverse document frequency)算法修正詞向量的特征權重。具體是通過公式(2)和(3)分別計算詞頻TF和逆向文本頻率指數IDF,再基于公式(4)得到TF-IDF權重值。
其 中xi,j表示詞 在文本dj中出 現的次 數;∑kxk,j表 示文本dj中所有詞出現的次數;|D|表示語料庫中文本總數;|{j:ti∈dj}|表示包含詞ti的文本數。為了避免不在語料庫中的詞計算IDF值時|{j:ti∈dj}|為零的情況,所以使用|1+{j:ti∈dj}|。
此外,在進行LDA模型訓練之前,需要確定語料庫的隱含主題數作為模型的輸入參數。由于事先并不確定鐵路工程的生態風險類型數,無法通過經驗確定主題數,所以本文通過計算困惑度(perplexity)確定最優的隱含主題數如(5)式。
(2)基于LDA“主題—單詞”分布的風險識別
鐵路工程生態風險識別的具體識別過程是:根據LDA輸出的“主題—單詞”分布,得到各類生態風險主題下相關系數最大的15個主題詞,再分別對不同主題下的15個主題詞進行人工識別與標注,得到鐵路工程生態風險分類結果。
在LDA模型中,每一篇文檔代表了一些主題所構成的一個多項式分布,每一個主題又代表了很多單詞所構成的一個多項式分布,而Dirichlet分布是這兩個多項式分布的共軛先驗分布,因此可以通過多項式分布中的數據更新Dirichlet分布的參數(LDA模型中的α和β),從而獲得更準確的估計。基于此,本文構建了LDA模型求解中的損失函數如(6)式所示。
其中D表示語料庫,也就是M篇文章的集合;α表示生成每篇文章主題的多項式分布的Dirichlet分布的參數;β表示生成文章中某個單詞的多項式分布的Dirichlet分布的參數;θd表示第d篇文章的主題分布,也是多項式分布的參數;zdn表示第d篇文章的第n個單詞的主題;wdn表示第d篇文章的第n個單詞。
根據TF-IDF算法得到的語料庫與困惑度計算得到的LDA模型的隱含主題數,LDA主題模型訓練求解基于變分推斷EM算法,該算法是將變分推斷和EM 算法(expectation-maximization algorithm)結合得到LDA模型中的“文檔—主題”和“主題—單詞”分布。
(3)基于Word2Vec和PCA的鐵路工程生態風險溯源與應對
在LDA模型得到的“文檔—主題”分布的基礎上,結合上一步由“主題—單詞”分布識別的生態風險分類,得到每個文檔最大概率歸屬的生態風險類型。再將每類風險主題下的相關文本先后輸入到Word2Vec和PCA模型中,訓練得到不同生態風險下的最大相關詞,并將相關詞標注和歸納,最終確定各類生態風險的溯源與應對策略。
運用Word2Vec中的Skip-Gram模型計算各類風險主題詞的詞向量,來進一步分析風險主題詞的相關關系。Skip-Gram模型每次選擇文中的一個詞作為中心詞,再通過計算該中心詞的上下文詞的準確性來調節模型中的參數,經過多次迭代使模型的損失函數最小化如(7)式,求解得到風險主題相關詞的詞向量。從相關程度高的相關詞中進行各類生態風險源頭和策略的標注,匹配得到各類生態風險的源頭和策略。
其中T表示語料庫中的所有詞;t表示中心詞的位置;m表示中心詞上下文取詞范圍;p(xt+i│xt)表示中心詞取xt時,在其上下文中的第i個詞xt+i出現的條件概率。
為了進一步完善生態風險之間的相關關系,并且更加直觀地表示出各生態風險主題詞的語義關系,本文基于SVD分解協方差矩陣實現PCA模型,通過提取高維詞向量中的主要特征,實現對高維主題詞向量的降維,并作可視化處理,以驗證LDA模型結果并進一步發現各類生態風險的相關關系。
利用公式(1)進行10次文本相關性得分計算后,篩選得到637個文本構建語料庫。在進行機器學習模型訓練之前,通過計算困惑度選擇最優隱含主題數,得到不同主題數情況下的困惑度結果(圖2)。從圖中可以看出,LDA模型的困惑度值前期隨著主題數的增加明顯下降,說明模型能夠很好地將不同主題分類。隨著主題數的增加,困惑度下降的趨勢在主題數為35之后逐漸平緩,為了避免過模型擬合的情況,選擇隱含主題數為35。

圖2 不同主題數下的模型困惑度
隱含主題數確定后,通過變分推斷EM算法求解得到“主題—單詞”分布,設置EM 算法的最大迭代次數為100,得到每個主題輸出最相關的前15個單詞。然后對35個主題的主題詞進人工標注,抽象出各主題含義。排除主題中安全事故、自然災害和工程主體建筑損壞等鐵路建設中的其他非生態風險,得到與鐵路生態風險相關的主體模型聚類結果如表3所示,將生態風險相關的主題詞做詞云可視化,可以提取歸納出鐵路工程建設的生態風險主要有如下8類:棲息地分割(主題詞中包含:物種、列車、暴露、擾動、活動、空間、分布等);景觀破壞(主題詞中包含:地表、坡度、植被、腐蝕、景觀、土壤、保護、物種、生態、鐵路、植物、損失、覆蓋等);大氣污染(主題詞中包含:排放、溫室氣體、碳、灰塵、廢氣、化石等);噪聲污染(主題詞中包含:噪聲、交通、振動、聲音、生活、住宅、公共等);土壤污染(主題詞中包含:土壤、鉛、鎘、金屬、污染、元素、銅、鋅、風險、鉻、采樣、鎳、鉛、植物等);隧道涌水(主題詞中包含:破壞、洪水、排水、規模、地表、強度、暴露、風險、結構、局部、空間、道路、地下水、損失、隧道等);廢水污染(主題詞中包含:離子、鹽分、硫酸鹽、排水、含量、濃度、沉降、液體等);水土平衡破壞(主題詞中包含:多年凍土、土壤、干燥、水分、密度、混合、化學、溫度、地層、地表、沉降、沙地、隧道、位移、巖石等)。

表3 LDA模型聚類結果
使用語料庫訓練Word2Vec模型后,得到各風險主題詞的詞向量,再進行PCA降維得到主題風險詞的分布情況,可以看出不同類型風險主題詞的空間分布差異,如土壤污染的相關主題詞基本分布在{(x,y)│x∈(-2,0),y∈(-1,1)}區域內,噪聲污染的相關主題詞基本分布在{(x,y)│x∈(1,2),y∈(-1,1)}區域內,空氣污染的相關主題詞基本分布在{(x,y)│x∈(-1,1),y∈(-2.5,-1)}區域內,說明主題模型對不同生態風險類型的主題詞進行了合理地分類,且聚類效果好。同時,根據主題關鍵詞的語義關系的二維分布,可以發現:(1)景觀破壞、廢水污染和土壤污染三類生態風險存在相關關系,鐵路工程產生的廢水污染破壞自然水體后,可能會同時導致土壤污染,影響植被生長從而造成景觀破壞;(2)噪聲污染、棲息地分割和隧道涌水存在部分相關性,這部分主要在于類似的生態風險受體,尤其是對鐵路工程沿線野生動物生活和遷徙的影響;(3)水土平衡破壞與廢水污染的相關性較強,同時也與土壤污染、隧道涌水等存在一定的相關關系;(4)大氣污染相對比較獨立,其中關于化石燃料、溫室氣體排放等關鍵詞空間集中分布。
在提取得到生態風險的基礎上,根據LDA模型得到的“文本—主題”分布結果,將每類風險主題下的相關文本先后輸入到Word2Vec模型中,訓練得到各類風險關鍵詞的相關詞。通過對相關詞的標注和歸納,得到各類生態風險下的風險源和應對策略,最終形成鐵路工程生態環境“風險識別—風險溯源—風險應對”框架(圖3)。

圖3 鐵路工程生態環境“風險識別—風險溯源—風險應對”框架
(1)棲息地分割風險。鐵路工程的建設中,鐵路主體工程會永久性占用土地,并對沿途地區強制性空間分割,這導致沿途動植物的活動和生長環境產生突變,將嚴重影響動物遷徙和繁衍。以青藏鐵路為例,青藏鐵路穿過可可西里自然保護區,該保護區是藏羚羊、野牦牛等珍惜野生動物的重要棲息地,在鐵路建設期間藏羚羊的警戒和臥息行為明顯上升,覓食時間減少,對繁衍行為產生了明顯影響。對此,青藏鐵路在沿途設計多個橋梁、涵洞和圍欄等供野生動物穿越青藏鐵路,調查發現沿途藏羚羊、野牦牛、山地鼬鼠和亞洲獾等動物借助這些“生態走廊”能夠有效克服棲息地分割帶來的不利影響[20]。因此,鐵路工程建設帶來的棲息地永久性分割是一類重要的生態風險。
(2)景觀破壞風險。鐵路建設過程中,沿途會有大量的土石方工程,在橋隧口、臨時輔助道路和施工營地等區域的取、棄土會造成施工場地植被和地表形態破壞,影響原有的景觀生態。在鐵路的運營過程中,由于鐵路交通帶來了人類活動的擴張,將會進一步對景觀環境產生影響[21]。整體上看鐵路工程的建設使得沿途生態擾動區內的歸一化植被指數(normalized difference vegetation index,NDVI)降低,以麗香鐵路為例,鐵路廊道破壞了沿線的自然景觀,產生了較大的正中切割作用[11],因此鐵路工程帶來的景觀破壞風險不能忽視。
(3)大氣污染風險。在工程建設階段產生的大氣污染主要有兩類:一是使用大型機械產生的各類溫室氣體,如COX、NOX和SO2等;二是在土石方運輸、臨時道路建造和橋隧開挖中產生的粉塵污染,粉塵中可能含有施工過程中產生的有毒氣體和金屬顆粒污染大氣環境。大氣污染會對沿途的動植物生長產生不良影響,這種影響在含氧量低、空氣稀薄的高原高海拔地區更加嚴重。
(4)噪聲污染風險。現有的鐵路工程案例表明,鐵路的建設和運營期都存在噪聲污染的情況。在工程建設期,包括山體爆破、大型機械的運作以及施工營地的人類活動等都會產生噪聲污染,這些活動對沿途人類和野生動物的正常生活產生影響。類似的情況也出現在運營期,比如成蘭鐵路運行的噪聲和振動會減少大熊貓活動。相關研究建議火車應該減少夜間運行以保護大熊貓正常活動[22],對此現有鐵路設計了橋梁吸振器、聲屏障和吸音材料等一系列措施來降低噪聲污染。
(5)土壤污染風險。工程對土壤的污染主要包含施工中產生的棄渣、廢液,以及施工營地產生的生活廢料,如果不能合理地處理這類廢渣和廢液,將對工程沿線的土壤造成嚴重的污染。如青藏鐵路沿線土壤中的鉛、鎘和鋅等重金屬的濃度與鐵路干線的距離呈顯著負相關關系,說明鐵路工程使土壤中的重金屬濃度升高,在鐵路20米范圍內這幾類重金屬的富集水平從無污染到顯著污染不等[23]。由于青藏高原的土壤中含有豐富的真菌和微生物,重金屬等污染物會對土壤中的微生物平衡產生影響,導致土壤肥力下降、高寒草甸退化[24]。因此,妥善處理生產生活的廢料,避免土壤污染是鐵路工程建設中一項十分重要的工作。
(6)隧道涌水風險。鐵路工程一般地理跨度大,時常要穿過山嶺重丘地區,施工方式以隧道為主,隧道工程開挖過程中開挖、爆破、支護等極易破壞原有的地下水分布,致使大量的地下水涌出,這不僅改變了原始的自然水系,也給隧道中的施工人員帶來巨大的風險。在云南、河北等地區的鐵路工程建設中,部分隧道施工區的斷面日排水量達到2萬立方米,大量的涌水造成山體巖下水資源大量流失,使得施工后進行生態恢復的成本高、難度大,山體中排出的水也對周邊的工農業生產造成影響。針對涌水問題,我國的《鐵路隧道設計規范》中明確提出“防、排、截、堵結合,因地制宜,綜合治理”的防排水原則,可見隧道涌水帶來的生態影響在鐵路工程施工中需要格外重視。
(7)廢水污染風險。鐵路工程建設中產生的污染廢水主要有:施工營地的生活廢水、爆破后的降塵用水、使用混凝土澆筑時的廢水、施工設備工作時產生的廢水等。施工中的含污廢水會對地表水體和周邊水體產生影響,如隧道開挖過程中掘進機產生的油污和重金屬顆粒會混在涌水中排出,破壞地下水環境的同時污染其他水體。一般鐵路工程時空跨度大,可能途經多個自然保護區和水源保護區,如天目山隧道工程靠近千島湖風景區,建設期產生的工程廢水中懸浮物、重金屬和酸堿度超標,必須經過多項工藝處理后才能排放[25]。
(8)水土平衡破壞風險。工程建設中頻繁地取棄土可能會導致區域水土流失。取土一般會破壞土層上的植被,使得土壤保水能力減弱。如果對取土區的裸露地面不進行生態修復,會導致土壤水分流失。由于棄渣的力學性質與原土不同,棄土難以與原有土壤融合,甚至可能導致山體滑坡、泥石流等地質災害,造成水土流失的惡性循環。這一風險在復雜艱險的施工環境中尤為突出,比如青藏鐵路穿過多年凍土區,若在施工后不及時采取水土保持措施,將加劇工程沿線的水土流失。因此,工程采用“繞、護、擋、防、攔、排、整、植”的模式進行系統生態恢復,制定了具有青藏高原特色的水土保持方案[26]。
本文綜合使用LDA、Word2Vec和PCA三種機器學習模型,根據“生態風險識別—風險源挖掘—風險應對策略”構建的邏輯主線,提出“風險識別—風險溯源—風險應對”的鐵路工程生態風險框架。利用LDA模型訓練得到的“主題—單詞”分布得出鐵路工程存在的8類主要生態風險,分別是:棲息地分割、景觀破壞、大氣污染、噪聲污染、土壤污染、隧道涌水、廢水污染和水土平衡破壞。進一步,根據“文本—主題”分布,通過Word2Vec和PCA模型實現各類生態風險的溯源與應對,并將各類生態風險主題詞的關系可視化。最后,結合青藏鐵路、麗香鐵路等工程生態風險識別與應對的案例,對各類重大生態風險、風險源和應對策略進行討論,驗證和完善了鐵路工程生態風險框架。通過研究得到如下啟示:
(1)“風險識別—風險溯源—風險應對”的研究架構對鐵路工程生態風險管理和保護具有重要意義。本文從主要生態風險的識別到風險源的追溯,再根據風險源匹配應對策略,形成鐵路工程生態風險“識別—溯源—應對”的閉環研究架構,這豐富了鐵路工程生態風險管理和保護的理論內涵,也為研究和分析工程風險提供了新思路。
(2)有效地融合機器學習模型能夠客觀、系統、高效地解決鐵路工程生態風險識別等研究問題。本文在大量文本數據的基礎上,利用三種機器學習模型的互補優勢,提出了一種鐵路工程生態風險識別與應對的模型方法。這不僅保證了風險識別結果的客觀性和系統性,也顯著地縮減了分析時間,能為鐵路工程實踐中的生態風險識別、管理和修復提供及時可靠的決策參考。
本文基于大量文本數據研究鐵路工程生態風險問題,但并未考慮文本數據的時間因素。因此未來可以加入更加豐富的數據,在時間維度上研究鐵路工程生態風險變化情況,進而識別生態風險管理在不同建設階段的重難點領域。此外,本文提出了生態風險“識別—溯源—應對”的研究架構,并利用鐵路工程相關數據進行分析,但并未在其他類型的重大工程中進行驗證。所以未來的研究可以在此架構的基礎上,通過考慮加入不同工程的特性,不斷豐富重大工程生態風險管理理論體系。