施光耀,周 宇,桑玉強,張勁松**,孟 平,蔡露露,4,裴松義,王 堯
基于隨機森林方法分析環境因子對空氣負離子的影響*
施光耀1,2,周 宇1,2,桑玉強3,張勁松1,2**,孟 平1,2,蔡露露3,4,裴松義5,王 堯1,2
(1.中國林業科學研究院林業研究所/國家林業局林木培育重點實驗室, 北京 100091;2.南京林業大學南方現代林業協同創新中心,南京 210037;3.河南農業大學,鄭州 450002;4.河南省地球物理空間信息研究院,鄭州 450016;5.國有建平縣黑水機械化林場, 朝陽 122000)
空氣負離子是衡量一個地區空氣清潔度的重要指標,對人體的心理和生理機能的調節發揮著重要作用。隨著森林生態旅游的興起,空氣負離子的發生過程及影響機制已成為研究熱點。本研究基于華北低丘山地森林植被主要生長季的氣象數據和栓皮櫟人工林空氣負離子濃度觀測資料,利用機器學習中隨機森林模型從非線性角度全面分析確定影響空氣負離子濃度變化的重要環境因子,通過獨立樣本對構建的隨機森林模型進行模擬和檢驗,確定模型的預測精度,同時篩選出對空氣負離子影響程度最大的環境因子。結果表明:隨機森林模型在分析環境因子對空氣負離子影響方面具有較高的精度以及較好的擬合效果,通過對模型的擬合值與實測值進行驗證,均方根誤差(RMSE)為59.349,決定系數R2達到了0.887。同時利用獨立樣本數據對隨機森林模型進行十折交叉驗證,決定系數R2均達到了0.904以上,且均方誤差(RMSE)較小,為24.851。此外,模型篩選出影響空氣負離子的主要因素,按重要性排序依次為顆粒物PM2.5(48.037)、飽和水汽壓差(46.169)、土壤濕度(43.984)、風速(43.779)、紫外輻射(41.130)、土壤溫度(40.107)、總輻射(36.838)、大氣壓力(34.532),其中對模型重要性貢獻相對較高的3個變量分別為顆粒物PM2.5、飽和水汽壓差和風速,它們對空氣負離子的影響起決定性作用。因此,隨機森林模型適合分析環境因子對空氣負離子影響,且擬合效果精度高,穩定性強。
空氣負離子;環境因子;機器學習;隨機森林;栓皮櫟
空氣負離子(Negative air ion, NAI)是指獲得多余電子的帶負電荷的空氣離子,因空氣中氧分子化學性質活潑優先獲得電子,故也稱為負氧離子,廣泛分布于自然環境中,如森林和濕地[1?2]。NAI是森林有效清除空氣中有機污染物、提升空氣質量的重要載體[1],已成為衡量一個地區空氣清潔度的重要指標之一[2],同時具有多種抗菌作用和生物學效應,對人體的心理和生理機能具有重要的促進作用[3?4],被譽為“空氣維生素”[5]。
近年來,隨著森林生態旅游的興起,NAI備受關注,對NAI的研究也越來越活躍[1,6?7],NAI發生過程及影響機制已成為生物氣象、森林生態和森林康養等相關領域共同關注的研究熱點[8]。空氣負離子復雜多變,受多種環境因子的共同制約,氣候條件、森林覆蓋率、大氣流動、微粒吸附和自然地理條件等,都會影響NAI的濃度[9]。總的來說,自然界中NAI的來源及影響因素可歸納為物理、生物兩大類,物理類指閃電、雷暴、雪暴、風暴、火山爆發的放電現象以及雨水的分解等[10?11];生物類指森林中樹冠、枝葉的尖端放電以及綠色植物光合作用中的光電效應等[12?16]。環境因子是影響NAI的重要因素,既是物理類,也是生物類的影響因素,前者涉及空氣中NAI的擴散和電離以及與顆粒物的作用,后者通過改變小氣候間接影響植被的生理過程,進而影響NAI。然而,目前環境因子對NAI的影響是促進或抑制以及主導環境因子是什么,已有的研究結果無法給出統一的定論[17?18],有的甚至出現了相互矛盾的結論[18?20]。例如,Goldstein等[21?22]研究表明,潮濕空氣中的超氧化物可以產生低濃度過氧化氫(H2O2),其分解產物中的OH?是NAI的重要組成部分,從而有助于NAI產生;Fujioka等[23]研究表明NAI的遷移率隨濕度的增加而降低,空氣濕度的增加不利于NAI的產生;而黃世成等[24]研究發現空氣濕度與NAI的關系在不同條件下不盡相同;張雙全等[20]研究表明NAI年變化與溫度和濕度均無相關性。此外,由于NAI在空氣中滯留時間短且產生和消亡過程復雜,受多種環境因子的共同制約,空氣中NAI波動大且表現出很強的可變性,致使有關環境因子與NAI關系的研究結論存在著諸多不確定性[13,18?19]。因此,采用傳統統計學方法可能難以全面分析環境因子的共線性以及復雜的非線性關系[25?27]。此外,由于長時間序列的數據資料堆砌,數據的冗雜、缺失和異常以及計算分析條件的限制,使得環境因素對NAI的影響程度、氣象要素對NAI的貢獻大小等問題存在爭議。
因此,本研究依托黃河小浪底森林生態系統國家定位觀測研究站,以華北低丘山地栓皮櫟(BI.)人工林為試驗對象,在2018年和2019年的6?9月定位觀測獲取NAI及微氣象參數。通過應用機器學習中隨機森林(Random Forest, RF)[28]的方法篩選出影響NAI濃度變化的重要環境因子,確定隨機森林模型在提取影響NAI變化的敏感因子中的潛在適用性,構建隨機森林估算模型,提出并討論所選變量的重要程度和模型的預測準確性,并對相關結果進行驗證,旨在為進一步深入研究揭示NAI對環境要素變化的響應機制、預測NAI變化提供工作基礎。
研究區位于黃河小浪底森林生態系統國家定位觀測研究站(35°01'45''N,112°28'08''E,海拔高度410m),站點面積約7210hm2。該地區屬暖溫帶大陸季風氣候,年平均氣溫12.4℃,全年日照時數為2367.7h,年平均降水量641.7mm,年蒸發量為1400mm,無霜期220~230d,0℃以上年平均有效積溫為5282℃·d,10℃以上年均積溫達4847℃·d,植物生長期為210~220d。受季風氣候的影響,降水季節性分配不均勻,6?9月平均降水量為438.0mm,占全年的68.3%。土壤成分主要為棕壤和石灰巖風化母質淋溶性褐土,土壤結構不良,土壤中石礫含量大,平均土壤深度為50cm,pH值為7.7~8.5,春季經常發生季節性干旱,夏季有暴雨時易受侵蝕。研究區域主要樹種為栓皮櫟,平均株高為8m,林分密度為998棵·hm?2,郁閉度為0.75,造林時間為1972年。
空氣負離子的觀測采用RR-9411A型空氣負離子自動監測儀(中國),NAI測量范圍0~1.2×107ion·cm?3,遷移率≥0.4cm2·V?1·S?1,測量精度≤±10%,采集頻率為1s·次?1,存儲周期為5min,儀器安裝在研究區域的栓皮櫟人工林中,安裝高度垂直地面1.8m且無遮擋物,觀測時間為2018年和2019年的6?9月。此外,利用便攜式標準氣象站同步觀測此區域林冠下方空氣溫濕度、風速、大氣壓、太陽輻射、土壤溫濕度以及顆粒物濃度等11個氣象要素,上述監測指標均通過CR1000型采集器(美國)進行存儲,通過DTU900C型GPRS遠程傳輸模塊實現數據實時快速傳輸并自動上傳存儲至服務器,具體變量類型詳見表1。
由于飽和水汽壓差(VPD)是表現空氣溫濕度的一個綜合指標,相比于氣溫和相對濕度更具有代表性,因此,利用Smith[22]經驗公式計算VPD,用于研究空氣溫濕度對NAI的影響,其計算式為

式中,Ta為氣溫(℃);RH為空氣相對濕度,取值(0,1),無量綱。
1.3.1 數據篩選
利用R語言對空氣負離子數據進行初步篩選,篩選過程如下,(1)對時間序列進行篩選,排除因設備存儲中斷、故障引起的時間序列不連續以及異常數據;(2)將每個數值與其前后的值進行對比,若該值小于前后一數值的3倍或1/3,舍棄并記錄為NA;(3)將連續6個或以上的相同數據值判定為異常值,記錄為NA;(4)對小于10的數值進行差值計算,以前后2個數據取均值并取整,記錄為該時刻插值后的數值;(5)賦值后再次篩選,將仍小于10的數值剔除,記錄為NA,輸出所有有效數據;而對氣象因子的篩選只進行前兩部分的篩選,剔除異常值。試驗期間共收集34000組完整數據,剔除異常值后選取有效數據約30000組進行分析。

表1 試驗觀測的環境因子變量類型
注:精度一列中PP為“百分點”。
Note: PP in the precision means percent point.
1.3.2 隨機森林模型的建立與分析
1.3.2.1 隨機森林模型簡介
隨機森林模型是一種通過聚集大量決策樹來提高預測準確性的組合模型,該模型可用于處理非線性關系、分類、回歸、高階相關、評估變量的重要性以及插值丟失的數據等[29]。已有研究表明隨機森林在篩選一些復雜多變的因素干擾方面具有準確的預測能力[30?32],該方法已應用于生態學研究,顯示了高精度和預測建模變量間復雜相互作用的能力。首先,對訓練數據利用自助抽樣形成N個樣本;其次,對每個樣本分別建立回歸樹模型,每一回歸樹都是由部分獨立樣本生成;最后,以N個回歸樹模型結果的平均值來確定因變量的預測值。此外,該模型要求每個二叉分裂點僅考慮預測變量的一個子集,從而使得弱相關性變量獲得更多參與回歸樹模型構建的機會,因此所得到的回歸樹具有更高的可信度[28,33]。為了獲得優化的隨機森林模型,本研究采用替換取樣法將原始數據分為6個隨機子樣本集(每個樣本5000組數據),選取其中任意1個樣本集作為獨立樣本,其余5個樣本作為模型樣本,每個模型樣本集隨機分為訓練樣本(70%)和驗證樣本(30%),對隨機森林模型進行訓練和驗證,而獨立樣本對通過測試的模型進行模擬,再次驗證模擬的精度。隨機森林模型構建利用R語言RandomForest包來實現。
1.3.2.2 隨機森林模型精度評價
采用均方根誤差(RMSE)和決定系數(R2)對模擬結果進行精度檢驗,其計算式為



為了進一步檢驗模型泛化能力,基于獨立樣本數據進行十折交叉驗證法(10-fold cross-validation)評價已構建好的隨機森林模型的預測誤差。十折交叉驗證法是將所有數據隨機分成大小相近的10組,先以第1組數據作為驗證數據,剩下9組數據作為擬合模型;再以第2組數據作為驗證數據,剩下9組用作擬合模型。依次類推,重復10次,以10次測試誤差的平均值作為最后精度評價。
1.3.2.3 隨機森林模型中重要性評價
隨機森林模型中,在擬合或分類時會用到每個通過自助抽樣形成的大約2/3樣本數據,剩余樣本數據稱為袋外樣本數據(OOB),用于評估模型整體誤差以及變量的重要性。若Xj為輸入變量之一,則計算變量Xj在第n株樹的重要性VIn時,首先利用自助抽樣的樣本數據建立回歸樹模型Tn,計算OOB的預測誤差,然后隨機置換變量Xj的觀測值,再次建立回歸樹模型Tn',計算OOB'(隨機置換變量觀測后袋外數據)的預測誤差,將2次袋外數據預測誤差的差值進行標準化處理后,將所有回歸樹結果取均值即為變量Xj在第n株樹的重要性VIn(Xj)[34],其計算式為

變量Xj在整個隨機森林中的重要性得分VI(Xj),這個指標代表準確度的平均下降程度,數值越大,自變量對因變量的影響越大,負值表示模型預測受到因變量的負面影響[35],其計算式為

式中,NOOB為袋外樣本數;f(Xi)為袋外數據中第i個觀測值;fn(Xi)為在隨機置換變量Xj的觀測值前第n株樹上袋外數據第i個觀測值所對應的預測值;fn(X'i)為在隨機置換變量Xj的觀測值后第n株樹上袋外數據第i個觀測值所對應的預測值;I[f(Xi)=fn(Xi)]和I[f(Xi)=fn(X'i)]為判別函數,當f(Xi)=fn(Xi)或f(Xi)=fn(X'i)時,取值為1,否則為0;Nt代表隨機森林模型中樹的數量。
1.3.2.4 隨機森林模型輸入環境變量
以空氣負離子濃度為因變量,隨機森林模型輸入的環境因子包括VPD、Ws、AP、PAR、Dr、UV、Rn、Ms、Ts和PM2.5為自變量,其中VPD由式(1)計算得到,代表空氣溫濕度的綜合指標,其余9個環境因子均由便攜式移動氣象站觀測獲取。皮爾遜相關分析表明,這10個環境因子與空氣負離子(NAI)均極顯著相關(P<0.001)。
以輸入參數對模型的重要性得分及其影響顯著性為依據,評價環境因子對空氣負離子的影響。環境因子重要性得分及顯著性檢驗通過R語言rfPermute包實現。
隨機森林模型中有2個基本參數,一是模型中每次拆分時嘗試的變量個數(M);二是模型中樹的數量(Nt)。變量數(M)是通過內部隨機森林函數確定的,該函數從默認值變量總數的1/3開始計算最佳變量數。目前,隨機森林模型中M的取值大多基于經驗公式,本研究采用逐次篩選的方法確定最優參數M,即嘗試所有M的取值(輸入變量數1~10),取模型誤差最小時對應的M。圖1a顯示,當M取值為6時,模型誤差達到最小。隨機森林模型中樹的數量(Nt)是為了避免潛在的過度擬合,首先使用訓練樣本數據對模型進行預處理,運行時將樹的數量(Nt)設置為1000,運行結果見圖1b,在樹的數量(Nt)達到300以后模型誤差趨于平穩,而變量數(M)達到6以后模型誤差最低,因此最終變量數(M)和樹的數量(Nt)的取值分別為6和300。
根據隨機森林模型的參數優化結果對5個訓練樣本數據進行分析,模擬得到了5個訓練樣本集的重要性得分VI(Xj),根據重要性得分的高低對所選變量進行排序,結果見圖2。由圖中可見,5個訓練樣本得到的結果較為一致,所選的10個變量重要性得分均超過了20,其中PM2.5在影響空氣負離子(NAI)變化方面發揮了決定性作用。利用對應的5個驗證數據集對結果進一步驗證表明,使用隨機森林模型創建的5個中間模型顯示了88%以上的方差解釋比例,空氣負離子觀測值與預測值的相關性均在0.93以上(表2)。為了使用較少的變量也能較好地反映模型的預測精度,剔除部分重要性得分較低的變量,如圖2所示,5個樣本的重要性得分顯示在重要性得分約30時出現了閾值,因此將低于該閾值的變量進行剔除,選取高于該閾值的變量作為隨機森林模型的最終變量。因此,對5個樣本的重要性得分綜合考慮,最終選取以下8個變量作為最終模型變量,根據重要性從高到低排序依次為顆粒物(PM2.5)、飽和水汽壓差(VPD)、土壤濕度(Ms)、風速(Ws)、大氣壓(AP)、土壤溫度(Ts)、總輻射(Dr)和紫外輻射(UV),而光合有效輻射(PAR)和凈輻射(Rn)被排除在模型之外。

圖1 模型參數M和Nt對模型誤差的影響

圖2 基于隨機森林模型輸出的5個訓練樣本集的環境因子重要性排序

表2 隨機森林模型的結果及相關值
基于重要性得分較高的8個變量建立最終的隨機森林模型,利用修正后的5個訓練樣本建立隨機森林模型,并基于平均值的方法對預測結果進行綜合評價,最終得到的隨機森林模型由表3所示的8個變量建立,該模型的方差解釋率為88.9%。從隨機森林模型可以看出,環境因子對NAI影響的重要性得分表現為PM2.5(48.037)>VPD(46.169)>Ms(43.984)>Ws(43.779)>UV(41.130)>Ts(40.107)>Dr(36.838)>AP(34.532),PM2.5和VPD在影響NAI變化方面發揮了決定性作用,說明這兩個因子是影響NAI變化的重要因素。

表3 隨機森林模型變量重要性得分
利用獨立樣本數據對隨機森林模型的擬合值和實測值進行擬合檢驗,結果見圖3。由圖中可見,實測值與擬合值之間均方根誤差(RMSE)為59.349,線性相關系數R2為0.887,表明模型具有較高的預測精度,顯示出良好的擬合效果。為了進一步驗證隨機森林模型的穩定性,再次利用獨立的測試數據對隨機森林模型進行十次交叉驗證,結果如表4所示,其R2平均值為0.904,均方誤差平均值為24.851,說明隨機森林模型模擬精度高,且具有很好的穩定性。

圖3 隨機森林模型對空氣負離子濃度的模擬精度評價

表4 模型十折交叉驗證結果
空氣負離子受環境條件的影響是高度可變的,是多維的,而且變量之間存在高度復雜的非線性關系。加之測量過程中的不可控因素諸多,如山區供電與信號傳輸、儀器損耗與損壞、極端異常天氣等,都可能導致數值丟失[36]。因此,傳統統計分析方法可能無法提供令人滿意的結果,不足以揭示復雜過程中的模式和關系[37?38]。因此,通過R語言應用隨機森林的方法,研究NAI與環境因子之間的關系,從非線性角度全面分析確定影響NAI濃度變化的重要環境因子。模型中變量的篩選應具有較強的代表性,從而使模型更加簡潔穩定而易于推廣[39?40],本研究中隨機森林模型從原始的10個因子中選擇了8個變量,其中重要性較高的3個變量分別為,顆粒物(PM2.5)、飽和水汽壓差(VPD)和風速(Ws),表明它們對NAI的影響具有重要意義。
顆粒物(PM2.5)是隨機森林模型篩選出來的最重要變量,主要是因為自由離子不容易在空氣中長期存在,容易附著在粒子上,通過顆粒污染物與負離子結合,形成大分子沉淀物,降低了環境中NAI濃度[41?42]。相關文獻[43]表明PM2.5與空氣離子呈負相關關系,空氣離子參與了顆粒形成過程。例如,在研究城市熱島問題時有關學者發現[44?45],城市的空氣污染程度越大,NAI的濃度越低,同時NAI在城鄉梯度上的差異主要是由PM2.5等大氣污染物和空氣溫濕度等氣候因素決定的,因此NAI是衡量一個地區空氣清潔度的重要指標之一。
飽和水汽壓差(VPD)是模型中篩選出來的重要變量,在隨機森林中處于第二位,飽和水汽壓差是空氣溫濕度的綜合表現形式,由二者共同作用,其對NAI的影響不能忽略。溫度的升高主要增加了分子運動速度和分子間碰撞的可能性,同時也提高了氧分子被電離的水平,從而有助于NAI的形成[46]。空氣濕度對NAI的影響主要是水分子存在會形成大量的OH?,是NAI的重要組成成分,其大小取決于相對濕度[22]。例如,當NAI在濕潤空氣中,其穩定狀態的主要團簇離子為O2?(H2O)n和CO3?(H2O)n水合物,二者共同影響NAI濃度的高低[47?48];Reiter等[49]研究表明,空氣濕度的增加可以改變顆粒碰撞和凝結的主要作用力,增強凝結效果,使小顆粒凝結并沉降成大顆粒,從而減少NAI的損失,維持NAI濃度;Bowers等[1]研究發現瀑布附近的負離子濃度增加主要與水汽有關,這些中間離子在很大程度上可以由一個OH?和一個水團簇離子組成。
土壤濕度也是最重要的變量之一,在隨機森林中處于第三位。土壤濕度的高低直接影響植被水分的吸收和傳遞,影響植被的生理狀態,而森林植被是NAI產生的主要穩定來源[50],對NAI的影響具有重要意義。相關文獻表明[51],植物能夠通過氣孔釋放揮發性有機化合物,其中一部分在植物釋放過程中電離,另一部分由于太陽輻射或其它輻射而電離,這個因素增加了正、負空氣離子的濃度。此外植物釋放揮發性有機化合物的速度還取決于植物體內的代謝過程,這在很大程度上取決于植物的種類、光照以及土壤的濕度。本研究在植被主要生長季的6?9月開展試驗,此時期為當地降水的主要季節,雨量充沛,土壤濕度不是影響植物正常生理活動的限制因子,因此土壤濕度對NAI的影響需要在具有明顯干濕季的地區進一步加以分析。
風速是隨機森林模型篩選出來的對NAI影響較大的第4位重要變量。首先,風速大小是決定空氣潔凈度的一個關鍵因素,而空氣潔凈度與NAI的存活密切相關;其次,從微觀上分析,在NAI形成過程中,需要從分子態獲得能量才能到達離子態,強風條件下分子獲得能量的機會增加,分子態向離子態轉變的過程會加快[52]。相關研究表明[13,53?54],風速與NAI呈正相關,風速能加速林冠產生的NAI的擴散速度以及空氣的流動和污染物的擴散,風速的增加有利于NAI的形成。例如,王薇等[55]研究顯示,NAI濃度與風速有較為密切的關系,其中最主要的影響因素是水,其次是風;然而,相關研究[56]發現,在多雨和非多雨條件下,熱帶雨林地區NAI濃度與風速的關系不顯著。這可能是由于研究區處的氣候帶不同,風速不是影響NAI的主要限制因子。
在隨機森林模型中,土壤溫度的重要性得分處于第六位,說明土壤溫度對NAI的形成具有重要作用,這是以往研究未涉及或者忽略的,土壤溫度對NAI的影響可能與植被根系的生理活動有關。土壤溫度可以通過影響植被根系的呼吸作用以及其它生理活動,包括水分以及營養元素的吸收,從而影響整個植株的生理狀態,促進或抑制植被氣孔的開放,影響負離子的釋放。此外,考慮到空氣離子濃度與土壤中氡的析出直接相關,而影響氡析出的動力學的主要因素是濕度和土壤熱梯度[57]。因此,土壤溫度的變化可能與氡的析出有關[58],從而影響負離子濃度。
模型中輻射對NAI的影響處于相對較低的位置,但其作用不能忽視。例如,光合有效輻射的增強有利于提升森林植被光合作用,植物可以通過光合作用向大氣釋放更多的氧氣和負離子,而氧分子具有較強的吸收空氣中自由電子的能力,因此空氣中負離子的濃度隨著光合有效輻射的增加而升高[59]。相關研究結果表明,NAI濃度與光合有效輻射強度呈正比[60]。例如,徐兆輝等[61]在分析天堂寨風景區NAI濃度日觀測資料的基礎上,選取晴天和陰天天氣類型的NAI濃度及相應的氣象因子進行單因素相關分析,結果表明,NAI濃度與光合有效輻射量呈極顯著的線性正相關。
模型中大氣壓的重要性最低,但大氣壓對NAI的影響是存在的,這在以往的研究中也有涉及。例如,馮建濤等[62]研究選取大氣壓作為與NAI相關的氣象因子,建立了模型方程,用來預測空氣負氧離子濃度。
綜上所述,森林作為NAI形成的主要穩定來源,其協同作用機制較為復雜,不是簡單的線性關系。基于非線性關系的隨機森林能較好地預測環境因素對NAI的影響[59],這是以往研究常忽略的。當使用隨機森林模型對環境因子的重要性進行排序時,由于在回歸過程中不可能超出訓練集的數據范圍進行預測,也不可能引入所有指標[63],這可能是本研究所使用模型的限制。本研究結果與以往研究有所不同,主要是環境條件對NAI影響的是復雜多變的,研究必須明確地區環境和社會條件是否一致,排除人為因素的干擾。引入機器學習[64]中隨機森林的分析方法,可以檢驗變量之間的非線性關系,確定了隨機森林方法在NAI建模中的潛力。通過對模型變量進行相對重要性排序,從而強調了它們在解釋環境因子對NAI影響關鍵因子的重要性,為更好地了解NAI對環境因子的響應機制提供重要的理論基礎。模型應用表明,隨機森林模型顯示出較高的預測精度,反映了非線性趨勢的存在。未來研究可以考慮不同時空尺度下預測因子的變化,以評估自變量在不同氣候區的解釋力;可以應用于其它不同類型的氣候區,以了解氣候區差異對所選變量重要性水平和模型整體預測能力;還可以利用支持向量機、神經網絡和結構方程等深層次的數據挖掘方法,為研究森林以及城市中NAI的影響因素提供新的手段。
本研究基于機器學習中隨機森林模型研究環境因子對空氣負離子影響的關鍵因子,結果表明,隨機森林模型從原始的10個因子中選取8個因子作為自變量,利用所選變量建立的隨機森林模型具有較高的預測精度,在擬合NAI變化方面具有較好的適用性,顯示出較好的擬合效果,決定系數R2達到了0.887,均方根誤差(RMSE)為59.349。對模型重要性貢獻相對較高的3個變量分別為顆粒物(PM2.5)、飽和水汽壓差(VPD)和風速(Ws),表明了它們對空氣負離子的影響起決定性作用。顆粒物(PM2.5)主要通過吸附NAI至表面,形成大分子沉淀物,從而降低了環境中的NAI;飽和水汽壓差(VPD)是空氣溫濕度的綜合表現,通過空氣溫濕度升高增強水分子間運動速度和分子間碰撞的可能,促進了分子向離子態轉化的過程;風速(Ws)可以加快林冠產生的NAI的擴散速度以及空氣的流動和污染物的擴散,從而有利于NAI的形成。
[1]Bowers B,Flory R,Ametepe J,et al.Controlled ttrial evaluation of exposure duration to negative air ions for the treatment of seasonal affective disorder[J].Psychiatry Research,2017,259:7-14.
[2] 邵海榮,賀慶棠.森林與空氣負離子[J].世界林業研究,2000(5):20-24.
Shao H R,He Q T.Forest and air anion[J].World Forestry Research,2000(5):20-24.(in Chinese)
[3] 吳楚材,鄭群明,鐘林生.森林游憩區空氣負離子水平的研究[J].林業科學,2001,37(5):75-81.
Wu C C,Zheng Q M,Zhong L S.A study of the aero-anion concentration in forest recreation area[J].Scientia Silvae Sinicae,2001,37(5):75-81.(in Chinese)
[4] Jovani? B R,Jovani? S B.The effect of high concentration of negative ions in the air on the chlorophyll content in plant leaves[J].Water Air and Soil Pollution,2001, 129(1-4):259-265.
[5] 王薇,余莊.中國城市環境中空氣負離子研究進展[J].生態環境學報,2013,22(4):705-711.
Wang W,Yu Z.Research progress on negative air ions in urban environment in China[J].Ecology and Environmental Sciences,2013,22(4):705-711.(in Chinese)
[6] Virkkula A,Hirsikko A,Vana M,et al.Charged particle size distributions and analysis of particle formation events at the Finnish Antarctic research station Aboa[J].Boreal Environment Research,2007,12(3):397-408.
[7] Miao S,Zhang X,Han Y,et al.Random forest algorithm for the relationship between negative air ions and environmental factors in an urban park[J].Atmosphere, 2018(9):463-476.
[8] Ling X,Jayaratne R,Morawska L.Air ion concentrations in various urban outdoor environments[J].Atmospheric Environment,2010,44(18):2186-2193.
[9] Tikhonov V P,Tsvetkov V D,Litvinova E G,et al.Generation of negative air ions by plants upon pulsed electrical stimulation applied to soil[J].Russian Journal of Plant Physiology,2004,51(3):414-419.
[10]Zhang J,Yu Z.Experimental and simulative analysis of relationship between ultraviolet irradiations and concentration of negative air ions in small chambers[J]. Journal of Aerosol Science,2006,37(10):1347-1355.
[11]Luts A,Parts T.Evolution of negative small air ions at two different temperatures[J].Journal of Atmospheric and Solar Terrestrial Physics,2002,64(7):763-774.
[12]單晟燁,齊超,張冬有.漠河針葉林空氣負離子濃度日變化特征研究[J].中國農學通報,2015,31(25):13-18.
Shan S Y,Qi C,Zhang D Y.Daily variation of negative air ions concentration in the coniferous forest in Mohe county[J].Chinese Agricultural Science Bulletin,2015, 31(25):13-18.(in Chinese)
[13]齊冰,邵碧嘉.杭州市空氣負離子變化特征分析[J].氣象與減災研究,2011,34(4):68-71.
Qi B,Shao B J.Characteristics of anion variation in Hangzhou[J].Meteorology and Disaster Reduction Research, 2011,34(4):68-71. (in Chinese)
[14]Shao H R,He Q T,Yan H P,et al.Spatio-temporal changes of negative air ion concentrations in Beijing[J].Journal of Beijing Forestry University,2005,27(3):35-39.
[15]柏智勇,吳楚材.空氣負離子與植物精氣相互作用的初步研究[J].中國城市林業,2008,6(1):58-60.
Bai Z Y,Wu C C.A preliminary study on interaction of negative air ion with plant aromatic substance[J].Journal of Chinese Urban Forestry,2008,6(1):58-60. (in Chinese)
[16]Liang H,Chen X,Yin J,et al.The spatial-temporal pattern and influencing factors of negative air ions in urban forests,Shanghai,China[J].Journal of Forestry Research, 2014,25(4):847-856.
[17]Iwama H.Negative air ions created by water shearing improve erythrocyte deformability and aerobic metabolism[J]. Indoor Air,2004,(14):293-297.
[18]陳歡,章家恩.空氣負離子濃度分布的影響因素研究綜述[J].生態科學,2010,29(2):181-185.
Chen H,Zhang J E.Review on factors influencing the concentration distribution of negative air ions[J].Ecological Science,2010,29(2):181-185.(in Chinese)
[19]季玉凱.棋盤山風景區空氣負離子分布與變化規律的研究[D].沈陽:沈陽農業大學,2007:1-46.
Ji Y K.Study on the concentration of negative air ions in Qipanshan scenic spot[D].Shenyang:Shenyang Agricultural University,2007:1-46.(in Chinese)
[20]張雙全,譚益民,吳章文.空氣負離子濃度與空氣溫濕度的關系研究[J].中南林業科技大學學報,2011,31(4):114-118.
Zhang S Q,Tan Y M,Wu Z W.The relationship between air anion concentration and air temperature and air relative humidity[J].Journal of Central South University Of Forestry And Technology,2011,31(4):114-118.(in Chinese)
[21]Goldstein N I,Goldstein R N,Merzlyak M N.Negative air ions as a source of superoxide[J].International Journal of Biometeorology,1992,36(2):118-122.
[22]Smith W L.Note on the relationship between precipitable water and surface dew point[J].Journal of Applied Meteorology,1966,(5):726-727.
[23]Fujioka N,Tsunoda Y,Sugimura A,et al.Influence of humidity on variation of ion mobility with life time in atmospheric air[J].IEEE Trans Power Syst,1983,102(4): 911-917.
[24]黃世成,徐春陽,周嘉陵.城市和森林空氣負離子濃度與氣象環境關系的通徑分析[J].氣象,2012,(11):1417-1422.
Huang S C,Xu C Y,Zhou J L.Path analysis on negative air ion concentration and the meteorologieal environmention urban and forest zones[J].Meteorologial Monthly,2012,(11): 1417-1422.(in Chinese)
[25]吳甫成,姚成勝.岳麓山空氣負離子及空氣質量變化研究[J].環境科學學報,2006,26(10):1737-1744.
Wu F C,Yao C S.Distribution of negative air ions and its relation to air quality of the Yuelu Mountain[J].Acta Scientiae Circumstantiae,2006,26(10):1737-1744.(in Chinese)
[26]Lin H F,Lin J M.Generation and determination of negative air ions[J].China Pulp & Paper Industry,2017,1(1):1-6.
[27]李愛博,周本智,李春友,等.基于控制實驗的6個典型亞熱帶樹種空氣負離子效應[J].林業科學研究,2019,(4): 120-128.
Li A B,Zhou B Z,Li C Y,et al.Negative air ion effect of six typical subtropical tree species based on control experiment [J].Forestry Research,2019(4):120-128.(in Chinese)
[28]Cutler D R,Edwards T C,Beard K H,et al.Random forests for classification in Ecology[J].Ecology,2007, 88(11): 2783-2792.
[29]Lam K L,Cheng W Y,Su Y,et al.Use of random forest analysis to quantify the importance of the structural characteristics of beta-glucans for prebiotic development[J]. Food Hydrocolloids,2020,108:1-13.
[30]Lozano F J,Suárez-Seoane S,Kelly M,et al.A multi-scale approach for modeling fire occurrence probability using satellite data and classification trees:a case study in a mountainous Mediterranean region[J].Remote Sensing of Environment,2008,112(3):708-719.
[31]Amatulli G,Rodrigues M J,Trombetti M,et al.Assessing long-term fire risk at local scale by means of decision tree technique[J].Journal of Geophysical Research Biogeosciences, 2006,111(4):15.
[32]秦鵬程,劉志雄,萬素琴.基于決策樹和隨機森林模型的湖北油菜產量限制因子分析[J].中國農業氣象,2016,37(6): 691-699.
Qing P C,Liu Z X,Wan S Q.Identification of yield limiting factors for oilseed rape in Hubei province based on CART and random forest model[J].Chinese Journal of Agrometeorology, 2016,37(6):691-699.(in Chinese)
[33]Archer K J,Kimes R V.Empirical characterization of random forest variable importance measures[J]. Computational Statistics and Data Analysis,2008, 52(4): 2249-2260.
[34]Delgado B M,Maestre F T,Reich P B,et al. Microbial diversity drives multifunctionality in terrestrial ecosystems[J]. Nature Communications,2016(7):1-8.
[35]Genuer R,Poggi J M,Tuleau-Malot C.Variable selection using random forests[J].Pattern Recognition Letters,2010, 31(14):2225-2236.
[36]Prasad A M,Iverson L R,Liaw A.Newer classification and regression tree techniques:bagging and random forests for ecological prediction[J].Ecosystems,2006,9(2):181-199.
[37]Peters J,Baets B D,Verhoest N E C,et al.Random forests as a tool for ecohydrological distribution modelling[J]. Ecological Modelling,2007,207:304-318.
[38]De A G,Fabricius K E.Classification and regression trees:a powerful yet simple technique for ecological data analysis[J].Ecology,2000,81:3178-3192.
[39]Miao S,Zhang X,Han Y,et al.Random forest algorithm for the relationship between negative air ions and environmental factors in an urban park[J]. Atmosphere, 2018,9:463-476.
[40]Vilar L,Woolford D G,Martell D L,et al.A model for predicting human-caused wildfire occurrence in the region of Madrid,Spain[J].International Journal of Wildland Fire,2010,19(3):325-337.
[41]Tammet H,Hrrak U,Laakso L,et al.Factors of air ion balance in a coniferous forest according to measurements in Hyyti?l?,Finland[J].Atmospheric Chemistry and Physics,2006,6(11):3377-3390.
[42]Vana M,Ehn M,Petaejae T,et al.Characteristic features of air ions at mace head on the west coast of Ireland[J]. Atmospheric Research,2008,90(2):278-286.
[43]Kolar? P,Filipovi? D.Measurements and correlations between several atmospheric parameters[J].Facta universitatis- series:Physics,Chemistry and Technology,2008,6(1): 99-104.
[44]Zhang K,Wang R,Shen C,et al.Temporal and spatial characteristics of the urban heat island during rapid urbanization in Shanghai,China[J].Environmental Monitoring and Assessment,2010,169:101-112.
[45]Zhao S,Da L,Tang Z,et al.Ecological consequences of rapid urban expansion:Shanghai,China[J].Frontiers in Ecology and the Environment,2006(4):341-346.
[46]葉彩華,王曉云.空氣中負離子濃度與氣象條件關系初探[J].氣象科技,2000,28:51-52.
Ye C H,Wang X Y.Preliminary study on the relationship between the concentration of negative ions in the air and meteorological conditions [J].Meteorological Science and Technology,2000,28:51-52.(in Chinese)
[47]Reiter R.Frequency distribution of positive and negative small ion concentrations,based on many years recordings at two mountain stations located at 740 and 1780m ASL[J].International Journal of Biometeorology, 1985, 29(3):223-231.
[48]Luts A.Evolution of negative small ions at enhanced ionization[J].Journal of Geophysical Research Atmospheres, 1995,100(1):1487-1496.
[49]Skalny J D,Mikoviny T,Matejcik S.An analysis of mass spectrometric study of negative ions extracted from negative corona discharge in air[J].International Journal of Mass Spectrometry,2004,233:317-324.
[50]Wang J,Li S H.Changes in negative air ions concentration under different light intensities and development of a model to relate light intensity to directional change[J]. Journal of Environmental Management,2009, 90(8): 2746-2754.
[51]Sinicina N,Skromulis A,Martinovs A.Impact of microclimate and indoor plants on air ion concentration[J]. Reformation and Strategy, 2015,1(1): 66-73.
[52]Liu X,Guanter L,Liu L.Downscaling of solar-induced chlorophyll fluorescence from canopy level to photosystem level using a random forest mode[J].Remote Sensing of Environment,2019,231:110772.
[53]Zhang Z P,Yu Y W,Meng M H,et al.Progresses of aeroanion in tourism environments[J].Journal of Zhejiang Forestry College,2006,28(11):1417-1422.
[54]Kalivitis N.Night-time enhanced atmospheric ion concentrations in the MBL[J]. Atmospheric Chemistry and Physics,2012,(12):3627-3638.
[55]王薇,余莊,鄭非藝.不同環境場所夏季空氣負離子濃度分布特征及其與環境因子的關系[J].城市環境與城市生態,2012(2):38-40.
Wang W,Yu Z,Zheng F Y.Characteristics of negative air ion concentration and its relationships with environmental factors in various environments in summer[J].Urban Environment and Urban Ecology,2012(2):38-40.(in Chinese)
[56]Si T,Luo Y, Zhao Z.Relationship between negative air ion concentration and meteorological elements in Diaoluoshan tropical rainforest[J].Resources Science,2014, 36(4): 788-792.
[57]Duenas C,Fernandez M C,Carretero J,et al.Release of 222Rn from some soils[J].Ann Geophysicae,1997,15: 124-133.
[58]Kolar P,Vaupoti J,Kobal I,et al.Thoron,radon and air ions spatial distribution in indoor air[J].Journal of Environmental Radioactivity,2017,173:70-74.
[59]Deng L.Review on research of the negative air ion concentration distribution and its correlation with meteorological elements in mountain tourist area[J].Earth Sciences,2019,8(1):60-68.
[60]Laakso L,Hussein T,Aarnio P,et al.Diurnal and annual characteristics of particle mass and number concentrations in urban,rural and Arctic environments in Finland[J]. Atmospheric Environment,2003,37(19):2629-2641.
[61]徐昭暉.安徽省主要森林旅游區空氣負離子資源研究[D].合肥:安徽農業大學,2004:1-45.
Xu Z H.Study on air anion resources in main forest tourism areas of Anhui province[D].Hefei:Anhui Agricultural University,2004:1-45.(in Chinese)
[62]馮建濤.城市帶狀綠地空氣負離子分布規律研究[D].吉林:北華大學,2017:1-69.
Feng J T.Study on the distribution of negative air ions in urban belt green space[D].Jilin:Beihua University,2017: 1-69.(in Chinese)
[63]陳紀波,胡慧,陳克垚,等.基于非線性PLSR模型的氣候變化對糧食產量的影響分析[J].中國農業氣象,2016, 37(6):674-681.
Chen J B,Hu H,Chen K Y,et al.Effects of climate change on the grain yield based on nonlinear PLSR model[J].Chinese Journal of Agrometeorology,2016,37(6):674-681.(in Chinese)
[64]馮禹,崔寧博,龔道枝.機器學習算法和Hargreaves模型在四川盆地ET0計算中的比較[J].中國農業氣象,2016, 37(4):415-421.
Feng Y,Cui N B,Gong D Z.Comparison of machine learning algorithms and Hargreaves model for reference evapotranspiration estimation in Sichuan basin[J].Chinese Journal of Agrometeorology,2016,37(4):415-421.(in Chinese)
Influence of Environmental Factors on Negative Air Ion Using Random Forest Algorithm
SHI Guang-yao1,2, ZHOU Yu1,2, SANG Yu-qiang3, ZHANG Jin-song1,2, MENG Ping1,2, CAI Lu-lu3,4, PEI Song-yi5, WANG Yao1,2
(1. Research Institute of Forestry, Chinese Academy of Forestry/Key Laboratory of Tree Breeding and Cultivation, State Forestry Administration, Beijing 100091, China; 2. Co-Innovation Center for Sustainable Forestry in Southern China, Nanjing Forestry University, Nanjing 210037; 3. Henan Agricultural University, Zhengzhou 450002; 4. Henan Geophysical Space Information Research Institute, Zhengzhou 450016;5. State Owned Jianping County Heishui Mechanized Forest Farm, Chaoyang 122000)
Negative air ion(NAI) is an essential indicator for measuring the air cleanliness of a given area, which plays an important role in promoting the psychological and physiological functions of the human body. With the development of forest eco-tourism, NAI has attracted substantial attention, while research on NAI has become increasingly active, especially for the topics of the occurrence process and impact mechanism of NAI in related fields. Based on meteorological data and observation data of NAI during the main growing season ofBI. plantation in the hilly area of North China, the random forest model in machine learning was used to analyze the environmental factors that affected NAI concentration changes from a non-linear view, and independent samples were used to simulate the random forest model to determine the prediction accuracy of the model. The estimation model of NAI was established for revealing the response mechanism and predicting the response pattern of NAI to environmental factors for further research. Results showed that the random forest model had higher accuracy and better fitting effect in analyzing the impact of environmental factors on NAI, and by verifying the fitted and measured values of the model, the root mean square error(RMSE) was 59.349, and the coefficient of determination R2reached 0.887. While using independent test data to 10-fold cross-validation of the random forest model, the average R2was above 0.904 and the root mean square error(RMSE) was small at 24.851. In addition, the model screened out that the main factors affecting NAI were particulate matter PM2.5(48.037), vapor pressure deficit(46.169), soil moisture(43.984), wind speed(43.779), ultraviolet radiation(41.130), soil temperature(40.107), direct radiation(36.838) and atmospheric pressure(34.532) sorted by importance scores. Among them, the three variables contributed relatively high importance to the model were particulate matter PM2.5, vapor pressure deficit and wind speed, which prove that they play a decisive role in the variations of NAI. Therefore, the random forest model is better to simulate the NAI with high accuracy and strong stability.
Negative air ion; Environment factor; Machine learning; Random forest model;BI.
10.3969/j.issn.1000-6362.2021.05.004
施光耀,周宇,桑玉強,等.基于隨機森林方法分析環境因子對空氣負離子的影響[J].中國農業氣象,2021,42(5):390-401
2020?10?25
中央級公益性科研院所基本科研業務費專項資金項目(CAFYBB2018ZA002)
張勁松,研究員,研究方向為林業氣象,E-mail:zhangjs@caf.ac.cn
施光耀,E-mail:shiguangyao01@163.com