摘 要:變點是模型中突然發生變化的某個或某一些量變化的點。研究突變點,通常能夠發現事物的某種質的變化,差異基因表達檢測就是尋找基因表達譜數據中樣本數據相對于正常組樣本數據有過表達的有變化的現象。該文探討變點理論的統計方法在差異基因表達檢測中的應用。
關鍵詞:變點理論 統計方法 差異表達基因檢測
中圖分類號:P618.13 文獻標識碼:A 文章編號:1674-098X(2013)03(b)-0-02
變點是是模型中突然發生變化的某個或某一些量發生變化的點。研究突變點,通常能夠發現事物的某種質的變化[1]。隨著科學發展,在臨床醫學上分析癌癥病理時,通常都要挖掘基因表達譜數據中是否存在過高或者過低表達的“過表達”數據,也就是致癌基因表達值反映出來的突變點。差異表達基因檢測就是研究單基因水平的基因表達譜數據,從而發現不同環境實驗條件下過表達的致癌基因。
1 基于變點理論的統計方法
國外對于變點的研究中涉及比較早的是突變點,漸變式變點的研究也有一些成果。針對位置參數模型,有人提出了變點的最小二乘法的估計。中國科學院院士陳希孺教授認為:變點分析是數理統計以及非線性時間序列的范疇,統計判斷變點問題,能夠分析估計量的性質[1]。
變點問題涉及的模型主要有三種情況,即均值有突然變化的均值變點、回歸系數有突然變化的回歸變點和實踐的概率有突然變化的概率變點。變點問題中,可以是一系列的樣本觀察值按一定次序的先后排列,也可以是空間中的位置或者界面[2]。……