周游宇



【摘要】本文的主要工作分為兩塊:1.植被空間分布形式也即空間點過程種類的識別:2.植被分布模式的空間點過程擬合。研究客體源于美國密西根州克林頓縣某地區一個林木分布數據,并且,我們的所有計算工作都是通過R包spatstat實現。在第1項工作中,主要通過K-方程、L-方程等工具對點過程類型進行識別:第2項工作通過對強度函數構建泊松模型,擬合出空間點過程,模型的篩選采取AIC準則,模型的檢驗采用蒙特卡洛包絡擬合方法。最終本文得到了一個聚類的點過程擬合模型。
【關鍵詞】空間點過程 K-方程 AIC準則
1概述
生態破壞后的一項重要工作就是植被重新種植,但是僅靠經驗的指導往往導致很低的成活率,所以,為了更好的恢復生態,有必要對植被原有的空間分布情況進行分析,空間點過程分析方法就是一個有效的工具[1]。
目前,關于空間點過程方面的研究,已有劉志華、楊健等人在黑龍江大興安嶺呼中林區火燒點格局分析及影響因素[9]方面的探索,該研究運用點過程方法對林火發生事件影響因素進行過相關討論;陳佳等人在白冠破碎[10]分布模式識別方面,也應用了空間點過程方法,在白冠破碎研究方面算是一種創新。本文,我們要探討的是:任意良好生態下生長的植株到底是一種怎樣的空間分布形式,如何構建一種合適空間點過程模型用以刻畫這種空間分布形式。
空間點過程方法的研究最早可以追溯到上世紀60年代在地理學領域的研究[2]。后來,研究者們又將這種空間點過程方法推廣到其他領域[3]。Ripley在1977年第一次提出空間點過程分析理淪[4],之后又有Diggle、Baddeley、Stoyan和Moller等科學家的不斷完。21以來,已經在地震學、生態學以及森林學等各個領域獲得過成功的應用[5]。
2空間點過程方法理論
2.1空間點過程
空間中隨機分布的點就是點過程[6],它的實現結果是一個點格局,在相同條件下可以重復試驗,實驗的結果也即每次觀測到的點格局不同[8]。以二維平面點過程為例,假設觀測區域為W,則W內任意的隨機子集X就是一個空間點過程。假如X在W內進行實現一次,也即對X進行一次取樣即得到x,則x稱為空間點過程X的觀測模式。對于任意的區域AW,N(A)為A中包含X點的個數,并定義強度函數為單位面積內含有X點的個數
其中E[N(XnA)]表示區域A內含點個數的均值,are(A)表示A的面積[7]。
點過程主要分為三類:齊次泊松點過程、Cox點過程和Gibbs點過程。齊次泊松點過程具有空間完全隨機性(complete spatialRandomness, CSR),該過程在任意等面積區域內事件發生次數服從泊松分布,且均值為相同常數,即其強度不隨區域位置改變而改變。Cox點過程,簡單來講,就是點與點之間具有相互作用關系,常常表現為一種聚類現象。此方法最早由Cox提出,故由此得名,該方法還有許多細分種類,具體可以參考[7]。Gibbs點過程是一種規則的分布過程,其點與點之間是規則分布的。
2.2常用推斷工具介紹
2.2.1點過程類型識別
點過程類型的統計推斷的實質是由觀測點格局來推斷點過程的類型。常用的點過程類型識別工具有K-方程、L-方程。K-方程最早由
2.2.3擬合變量的選擇
通過R包spatstat中的ppm函數求解模型參數,用AIC準則選擇模型中的白變量,AIC越小擬合模型越好。
2.2.4擬合模型的檢驗
按照以上規則擬合出一個最恰當的模型,接下來就是檢驗該擬合模型是否與樣本點格局相匹配,我們采用的方法是蒙特卡洛包絡線擬合檢驗f8];判斷的依據是樣本點格局的K-方程估計曲線是否在擬合模型K-方程估計曲線的包絡線內,一個好的擬合模型的包絡曲線必然將包絡在內,反之,則擬合模型不恰當。
3密西根州蘭辛林木分布模式統計推斷示例
3.1點格局分布圖
為蘭辛觀測點格局的圖像,該數據來源于美國密西根州克林頓縣蘭辛地區的一個924*924英尺范圍內的林木點格局數據,包含2251棵植株5個物種。本文,我們針對物種之一的hickory做點過程分析,圖1為該物種的點格局圖像。
3.2點過程類型判別及模型推斷
圖2給也了hickorv點格局的L-方程檢驗圖像,圖中虛線Ltheo(r)為CSR理論L-方程,淺色實線Lhi(r)、Llo(r)分別代表模擬1000次CSR模式所產生的估計值的上下界,中間為包絡線,表示由樣本點格局估計的L-方程。從L-方程可以看到在之上,且超出包絡線,所以我們認為hickory點格局存在聚類現象,即不是CSR過程的樣本。
4結論
本文通過K-方程、L-方程對hickory的點格局樣本數據的識別結果是:該點格局存在聚類現象;緊接著,在已識別模型的基礎上,我們構建的非齊次泊松點過程模型,在AIC準則下得到了一個二階指數形式的泊松點過程擬合模型;最后,運用蒙特卡洛包絡擬合檢驗方法對該擬合模型檢驗,擬合模型通過檢驗。通過整篇文章的分析,我們最終得到了hickory物種的空間分布信息。
文章的不足之處在于本文的T作只是初步階段的點過程分析,對數據的利用不夠充分,比如,lansing數據包含5個物種的點格局數據,但只利用到其中一個物種的點格局信息,更好的處理方法可以考慮建立一個標記點過程。