摘要:本文首先對統計流形的基本幾何量及其統計意義進行闡述,探究了隨機游走模型度量平坦的一個條件,并計算出了J-散度。
關鍵詞:統計流形;隨機游走;散度
統計學中的微分幾何方法已經成為統計學的令人矚目的分支,在統計推斷、隨機分布控制等領域有著成功的應用。Karl Pearson在1905年第一次提出了random walk,隨機游走是由一系列隨機步伐所形成的的活動模型。如今隨機游走模型已被應用于諸多領域:生態學、經濟學、心理學、計算機科學等。隨機游走模型的幾何結構屬于信息幾何的研究領域,是應用幾何的新領域。應用信息幾何的方法去研究隨機游走模型的幾何結構可以更加直觀、系統地把握隨機游走模型的統計分布性質,為其在更多領域的的應用帶來了新的研究方法。
1 統計流形的概念
對于統計分布流形 ,其中 為歐氏空間 中的開集, 是密度函數,我們引入Fisher信息矩陣:
這里E為數學期望.這樣便在S上引入了黎曼度量,稱為Fisher度量。其Levi-Civita聯絡 系數為:
進一步可定義 聯絡
其中
統計流形 的黎曼曲率張量為
令 ,則
里奇曲率張量 為:
若統計流形(M,g)上一對無撓的仿射聯絡 和 滿足:
則稱 和 是關于g的對偶聯絡。顯然 和 是一對對偶聯絡。
2 散度函數
散度函數是刻畫兩個統計分布差異程度的量,其定義為:
定義2.1 在局部坐標系下,散度函數D :M×M→R定義為一個光滑函數,滿足 :
(1) , ? ∈ V 等式成立當且僅當 ;
(2)
(3) 是正定的
引理2.1(Eguchi,1983).散度函數可導出一對無撓的仿射聯絡滿足:
對于兩個給定的臨近的密度函數, 和 ,我們定義J-散度為:
運用泰勒展式可以得到:
即J-散度函數是距離微元的平方。
3 隨機游走模型
隨機游走模型的概率密度函數為:
,
的期望和方差分別為: .
運用公式 可以得到 信息陣為:
協方差矩陣 .
相應的黎曼聯絡系數:
由黎曼曲率張量: 得:
其余分量為0
于是我們得到:
定理3.1 隨機游走模型是平坦統計結構當且僅當
類似地可以得到里奇曲率張量由里奇曲率張量為:
.
4 隨機游走模型上的J-散度
定理4.1 隨機游走模型的J-散度(2.1)滿足下列方程:
證明:
而
由于密度函數滿足 故可得到
同理可得
于是 證畢。
參考文獻:
[1]韋博成.統計推斷與微分幾何[M].清華大學出版社,1983.
[2]ZHANG,Jun: A note on curvature ofαconnectoins ona statistical anifold[J]. Annals of Institute of Statistical Mathematics,2006.
[3]何會民.基于隨機游走模型和KL-divergence的聚類算法[J].計算機工程,2008.