謝忠翔,武杰,項華中
上海理工大學醫療器械與食品學院,上海200093
在信號恢復和重要成分識別等應用中,稀疏表示(包括壓縮感知)受到了研究者的關注,該方法最主要的一個特點是:要恢復的信號或要檢測的重要成分數量通常等于樣本數[1-2]。然而,在基因組數據或生物醫學成像數據分析中,樣本數量通常遠遠少于變量數量。由于現有壓縮感知方法不能直接應用于這些數據進行變量選擇[3-4],因此,本研究在傳統稀疏回歸模型基礎上,改進了它在不同范數條件下進行變量選擇能力,形成一種基于稀疏表示變量選擇算法(Sparse Representation-based Variable Selection Algorithm,SRVS),且結果表明,SRVS 能更準確地選擇精神分裂癥影像遺傳學特征,篩選有效性更高。
本研究利用基于稀疏回歸模型的SRVS,改變Lp(p=0、0.5 和1)范數,對208 名受試者(96 名精神分裂癥患者和112 名健康對照者)的41 236 個功能磁共振成像(function Magnetic Resonance Imaging,fMRI)體素和722 177 個單核苷酸多態性(Single Nucleotide Polymorphisms,SNP)進行聯合分析,以識別精神分裂癥影像遺傳學特征。精神分裂癥是一種復雜疾病,它是由多種遺傳因素(如基因調控的改變、mRNA和SNP 的改變)和環境效應相互作用的結果[5-6]。近年來,許多研究集中于探索與精神分裂癥相關的關鍵基因或SNP[7]。除了遺傳學研究,fMRI還為精神分裂癥的研究增加了一個維度,因為fMRI能夠識別精神分裂癥患者大腦區域的結構和功能異常。然而,在大多數研究中,fMRI和SNP 都是分開單獨分析[8]。本研究將結合fMRI和SNP,使用SRVS來選擇精神分裂癥的影像遺傳學特征。
本研究采用由Mind Clinical Imaging Consortium(MCIC)收集的數據,所選取的數據均符合《美國精神障礙診斷與統計手冊》第4 版(DISM-IV)精神分裂癥診斷標準[9]。……