999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于非負分解方法的質譜成像數據特征提取

2012-04-12 00:00:00熊行創方向歐陽證江游黃澤建張玉奎
分析化學 2012年5期

摘 要 [HTSS]質譜成像技術能夠在同一個實驗里無需標記手段而獲得樣品表面的分子信息及其分布信息,是當前質譜分析的熱點。其分析所得數據量大且復雜,使其特征難以提取。多元統計分析方法,特別是主成分分析法已應用于質譜成像數據的壓縮和特征提取。然而由于主成分分析常產生負的數據結果,其意義難以解釋且不易分解為單一的特征。本研究開發出一種基于非負分解的質譜成像數據提取方法,能夠提取單一的分子特征及其在樣品上的分布特征,并將多個單一的特征分布通過紅、綠、藍三色疊加顯示,獲得輪廓直觀的綜合特征分布。應用本方法對小鼠腦組織切片質譜成像數據進行分析,可直觀分解出灰質區域、白質區域和背景區域,相對主成分分析方法更直觀且易于解釋。應用本方法對在同一個樣品靶上的人膀胱癌變組織和其相鄰非癌變組織切片質譜成像數據進行分析,癌變與非癌變組織間差異清晰直觀。本研究設計的質譜成像軟件可由http://www.msimaging.net獲取。

本文系國家科技支撐計劃課題(No. 2009BAK59B03)和國家重大科學儀器設備開發專項(No. 2011YQ0900501)資助

* Email:xingchuangxiong@gmail.com

1 引 言

質譜成像技術(Mass spectrometry imaging,MSI)能夠在同一個實驗中同時獲取樣品表面的分子信息及分子的空間分布信息\\[1~3\\]。MSI分析對象隨著離子源的發展從元素成像發展到小分子成像,生物組織的蛋白、多肽和脂質分子成像。MSI技術從二維成像發展到三維成像\\[4~6\\]。MSI的應用從早期材料成像分析拓展到法庭科學\\[7\\]、字畫鑒定\\[8\\],藥物及其代謝物在組織內的分布研究\\[9~11\\],癌變組織邊界測定\\[12\\]、腫瘤標志發現\\[13\\]、醫學診斷、分子病理研究等領域\\[14~19\\]。MSI成為當前質譜分析的研究熱點。

MSI分析所得的數據往往包括樣品表面上每個采樣點的質譜全譜數據。隨著樣品表面積、空間分辨率(單位面積內樣品采樣點數)、分析的質量數范圍及質量分辨率的增加,數據量及復雜度遞增。在復雜的表面質譜成像分析中,空間分辨率、質量分辨率和質量范圍的增長呈越來越明顯的要求和趨勢。對復雜基質的大量質譜成像數據,靠手動挑選每一個離子譜圖的方法,不僅耗時乏味,而且越來越不能滿足MSI高通量分析的需求\\[20\\]。為此,多元統計分析方法被用于處理MSI數據,實現數據降維和特征提取\\[21,22\\]。其中應用最廣泛的是主成分分析方法,主成分分析能夠有效對數據降維、壓縮數據,但其結果數據中常有負數據,使結果難以解釋。非負分解是一種多元變量數據因子分解方法,已成功應用于圖像分析,提取局部圖像特征\\[23\\]。非負分解的約束條件是分解所得數據均為非負。原數據可以由分解所得數據線性組合近似表示,易于解釋其結果數據的意義,適合于MSI數據的分解和特征提取。

2 實驗部分

2.1 質譜成像數據非負分解算法描述

設X是質譜成像數據集,是N×M階矩陣,其中N表示樣品采樣點的個數(N通常有r行,c列; M表示質量數的個數)。從行向量看是N個樣品點對應的質譜圖數據,從列向量看是M個質量數對應的離子圖像。非負分解方法就是尋找能夠近似表達X的非負矩陣W和非負矩陣H,其中W為N×P矩陣,H為P×M階矩陣,這兩個矩陣的每個元素都是非負數。P的選取通常遵守P<(N×M)/(N+M),由于P小于M和N,因此非負分解有降維、壓縮數據的功能。X=WH+E,其中E為N×M階矩陣,通常表示噪音或誤差。因此X≈WH,即

Xnm≈(WH)nm=∑Pa=1(WnaHam)(1)

其中,a,n,m變量分別是整數(a=1,...P; m=1,...M; n=1,...N),在本文的后續表述中,意義相同。

為了更好地解釋其意義,將等式(1)元素形式改寫為等式(2)向量形式:

 分 析 化 學第40卷

第5期熊行創等: 基于非負分解方法的質譜成像數據特征提取 

xm≈∑Pa=1(Wahma)=Whm(2)

其中,向量xm是X(N×M)的第m列,是列向量(N×1),表示第m個質量數對應的離子圖像。Wa是W(N×P)的第a列(a=1,..., P),也是列向量(N×1)。W可以看作是由P個Wa數據塊(“數據積木”)組成。hm是H(P×M)的第m列,是列向量(P×1),而hma是該列向量中第a個元素,表示第a個數據塊Wa(“數據積木”)在第m個離子圖像上的強度值(或系數值)。

從(2)式可見,每個質量數對應的離子圖像都可以分解為P個公共基本圖像(P個Wa“數據積木”)與P個系數值的線性組合。因此,如果P選擇合理,由P個公共基本圖像組成的W可以表示為X的圖像特征,即分子在表面上的分布特征;而由P條譜圖數據組成的H可表示為質譜成像的分子組成特征。

應用等式(3)——誤差平方(歐式距離)函數表示非負分解結果與原數據間的誤差。

E(W,H)=‖X

Symbolm@@ WH‖2=∑nm(Xnm-(WHnm))2(3)

通過最小化E(W,H)誤差平方來尋找能夠近似表示X的非負W和H的分解因子。通過等式(4)進行多次迭代,計算最優的W和H。

Ham←HamWTX(WTWH)am Wna←Wna(WHT)na(WHHT)na(4)

算法的原理參照相關文獻\\[24,25\\]

2.2 質譜成像數據三色疊加顯示

從質譜成像數據非負分解獲得的圖像特征數據集中,任選W1, W2和W3, 分別用紅、綠、藍3種顏色表示其信號強度,即RGB(IW1,0,0),RGB(0, IW2,0),RGB(0,0, IW3)。其中IW1、IW2和IW3分別表示強度的映射值,其數據范圍為\\[0,255\\],0表示強度的最小值、255表示最大值。然后將W1,W2,W3三幅圖疊加顯示,新合成圖的每個像素信號強度值的顏色表示RGB(IW1, IW2, IW3)。

2.3 代碼開發

應用Matlab語言(The MathWorks, Natick, MA, USA)開發質譜成像數據非負分解及三色疊加顯示軟件工具。數據輸入包括原始數據集X(樣品的行數r和列數c)及質量軸列表信息,需要調節的運行參數包括成分數P和迭代次數,輸出結果包括圖像特征W和分子特征H以及分解誤差系數(Mean squared normalized error)。通過任選3個基本圖像, 用三色疊加方式顯示其疊加圖,獲得不同分子分布特征的輪廓。

3 結果與討論

3. 1 小鼠腦組織切片質譜成像數據的非負分解與主成分分析

對小鼠腦組織切片質譜成像數據(由美國普渡大學Cooks教授課題組提供)分別進行主成分分析和非負分解。該原始數據由DESI離子源(負離子模式)結合Thermo LTQ質譜儀進行質譜成像分析獲得。對原始質譜數據(質量范圍m/z 150~1100,單位質量分辨)進行圖像重構和譜峰歸一化到\\[0,1\\]范圍內,獲得950個質量數,無數據平滑、譜峰篩選等處理過程。組織切片采樣數據行數r為75,列數c為104,共7800個采樣點。因此,原始質譜成像數據X為7800×950。

3.1.1 主成分分析方法 應用主成分分析方法(應用Matlab開發小工具)處理X數據。主成分分析也可表示為X=WH+E或者X≈WH,類似于非負分解的表達形式。主成分分析與非負分解主要區別在于分解的限制條件不同,非負分解中W, H限制其每個元素都是非負值;主成分分析中的W和H要求分別各自正交(即HHT為單位矩陣,WTW為對角矩陣),因此W和H中常常有負值。通常,將W稱為得分數據集,將H稱為載荷數據集。主成分所占總信息量依次減少,即第1主成分最多,第2主成分次之。

選取前3個主成分(數據信息量共占原數據的74.01%)示于圖1。

[TS(][HT5”SS]圖1 應用主成分析方法處理小鼠腦組織切片質譜成像數據結果圖

Fig.1 Principal component analysis (PCA) result maps of mass spectrometry imaging data of a mouse brain section tissue

(a) 圖為前3個主成分的載荷數據圖。 (b) 圖左列為m/z 256, m/z 835和m/z 889的載荷數據,分別提取于載荷圖(a),用3種顏色標示。(b)圖中間列為前3個主成分的得分圖。(b)圖右列為重構后的m/z 256, 835和889離子圖。前3個主成分占原數據總信息量74.01%(其中,PC1:47.18%,PC2:15.01%,PC3:11.82%)。應用(hm)TWT=Whm=xm等式,將分解得到的m/z 256, m/z 835和m/z 889的載荷數據(示于(b)圖左列)與得分圖數據(示于(b)圖中間列)重構出相應的離子圖數據(示于(b)圖右列)。重構圖與原始離子圖的均方根差分別為:0.8395, 0.1312和0.1366,基本反應了原始數據的主要特征。但是其載荷數據和得分數據中都存在負值,使其結果難于解釋。

(a) Loading plots of the frist three principal components (PCs). (b) Loading data of m/z 256, 835 and 889 in the left column, the corresponding scores maps in the middle column, the reconstructed ion maps in the right column.. The three PCs kept 74.01% of the total variance (PC1: 47.18%, PC2: 15.01%, PC3: 11.82%). By applying the equation (hm)TWT=Whm=xm, the ion maps shown in the right column of (b) were reconstructed from the linear combination of the loading data shown in the left column of (b) and the scores shown in the middle column of (b). The rootmeansquareerror between the reconstructed maps and the corresponding original maps were 0.8395, 0.1312 and 0.1366, which indicated the reconstructed maps kept the principal feature of the original maps. However, there were negative value in both the loading plots and the scores maps, which made the interpretation of the results data from PCA very difficult.[HT][TS)]

從圖1可見,3個質譜峰m/z 835(實際上是m/z 834.7,phosphatidylserine 18∶0/22∶6,在小鼠腦組織灰質區域有較高含量),m/z 889(實際上是m/z 888.8,sulfatide 24∶1,在小鼠腦組織白質區域有較高含量)和m/z 256特征突出。在第1主成分載荷圖(H1)中,m/z 835和m/z 889系數較高,為正值,而m/z 256系數也較高,為負值;在其相應的得分圖(W1)中,可以看出灰質區域(淺藍色表示)、白質區域(藍色表示)為正值,背景區域為負值。第1主成分占了總信息量的主要特征。第2主成分載荷圖(H2)中,m/z 256和 835系數較高,為正值,m/z 889系數也較高,為負值,在其相應的得分圖(W2)中,可以看出白質區域為負值,背景區域為正值,但是灰質區域不明顯。而在第3主成分載荷圖(H3)中,m/z 835系數較高,為正值,m/z 889系數也較高,為負值,在其相應的得分圖(W3)中,可以看出白質區域為負值,灰質區域為正值,背景區域不明顯。

從離子圖的重建過程可以看出,m/z 256的系數(h1= m/z 256)有正值和負值,與得分數據(W有正值和負值)線性組合后,所得m/z 256離子圖(x1= m/z 256)正值部分為背景區域,與原始數據相似,但存在負值(白質區域)。每一個離子圖的重構可以表示為xm =Whm=(hm)TWT, 即載荷系數與得分數據的線性組合,但是各成分數值有正有負,重構過程有加有減,難以解釋為單一的特征。

主成分分析所得的得分圖像與載荷圖譜,在提取特征時存在兩個問題:(1)由于存在負值,其解釋較為困難。此處的正負值不能簡單用大小區別,屬于同一符號的可以區分大小,但是符號不同需要分別對待。因此,需要將載荷數據的正值與相應得分數據正值聯系起來,載荷數據的負值與相應得分數據負值聯系起來解釋,而且在得分圖中,需要將正值與負值的表示用不同的顏色表示,以便區分;(2)由于主成分的所占的信息量是依次遞減,第1主分成分占最大信息,所以第1主成分就盡可能多地綜合了多個特征信息(能夠有效地降維、壓縮數據),信息的過分綜合就不易分解,很難直觀地解釋為單一分子特征譜和特征圖像。這是由主成分分析原理所決定的。以此圖為例,第1主成分綜合了白質、灰質和背景特征信息,第2主成分綜合了白質和背景特征信息,第3主成分綜合了白質和灰質特征信息。

3.1.2 非負分解方法 應用非負分解方法處理同一組數據。選取3個成分變量,即P=3,應用非負分解方法處理結果示于圖2。由圖2可見,系數譜1(H1)主要質譜峰是m/z 835,其相應的公共基本圖像1(W1)為小鼠腦組織灰質區域;系數譜2(H2)主要質譜峰是m/z 256,其相應的公共基本圖像2(W2)為非樣品組織區域,即背景區域;系數譜3(H3)主要質譜峰是m/z 889,其相應的公共基本圖像3(W3)為小鼠腦組織白質區域。系數譜和公共基本圖像均無負值。各成分間沒有主次之分。

[TS(][HT5”SS]圖2 應用非負分解方法(選取3個成分變量)處理小鼠腦組織切片質譜成像數據結果圖

Fig.2 Nonnegative matrix factorization (NMF) result maps (3 components) of mass spectrometry imaging data of mouse brain tissue

(a)圖為3個成分的系數譜圖。 (b)圖左列為m/z 256, 835和889的系數,分別提取于系數譜圖(a),用不同的顏色標示。(b)圖中間列為3個成分的公共基本圖像。(b)圖右列為重構圖后m/z 256, 835和889的離子圖。應用(hm)TWT=Whm=xm等式將分解得到的m/z 256, 835和889的系數(示于(b)圖左列)與得分圖數據(示于(b)圖中間列)重構出相應的離子圖數據(示于(b)圖右列)。重構圖與原始離子圖的均方根差分別是:0.0916, 0.1329和0.0535,基本能反應原始數據的主要特征。

(a) Coefficient plots of three components. (b) Coefficient data of m/z 256, 835 and 889 in the left column, base images of the three components in the middle column, reconstructed ion maps in the right column. By applying the equation (hm)TWT=Whm=xm, the ion maps shown in the right column of (b) were reconstructed from the linear combination of the coefficient data shown in the left column of (b) and base images shown in the middle column of (b). Root mean square error between the reconstructed maps and the corresponding original maps were 0.0916, 0.1329 and 0.0535, which indicated the reconstructed maps kept the principal features of the original maps.[HT][TS)]

從離子圖的重建過程可以看出,m/z 256的系數(h1= m/z 256)為非負值,與得分數據(W,3個公共基本圖像)線性組合后,所得m/z 256離子圖(x1=m/z 256)正值部分為背景區域,與原始數據相似。每一個離子圖的重構可以表示為xm =Whm=(hm)TWT, 即載荷系數與得分數據的線性組合,由于各成分數值非負,過程有加無減,是線性“加和”,可以解釋為若干個特征單一公共基本圖像(積木數據),按照相應的系數加權疊加而成。因此,非負分解,如果組分P選擇合理,系數譜圖可以看作是質譜成像數據的分子組成特征,而公共基本圖像可以看作是分子在表面上的分布特征。

對比圖1和圖2,可清晰地看出,由于主成分分析存在負值,其載荷圖和得分圖難以解釋, 不夠直觀;而非負分解無負值,一張離子圖可以表達為由各基本圖的線性“加和”,較容易解釋其意義,圖像直觀。

再應用RGB三色疊加顯示,將非負分解所得的公共基本圖像通過紅、綠、藍三色疊加,示于圖3。從疊加圖可看出,其輪廓清晰直觀。

[TS(][HT5”SS]圖3 小鼠腦組織切片質譜成像數據經過非負分解方法處理所得特征分布圖及其RGB疊加圖

Fig.3 Nonnegative matrix factorization (NMF) feature maps of mass spectrometry imaging (MSI) data of a mouse brain section and their RGB (redgreenbule) color overlaid map

(a) 為第一成分的分布圖(腦組織灰質區域,用紅顏色表示);(b)為第二成分的分布圖(非樣品組織區域,用綠色表示);(c)為第三成分的分布圖(腦組織白質區域,用藍色表示);(d)為這3個成分的RGB疊加圖

(a) First component distribution map with the grey matter regions of the mouse brain tissue highlighted in red, (b) Second component distribution map with the background regions in the whole sample highlighted in green, (c) Third component distribution map with the regions of white matter in the mouse brain tissue highlighted in blue, (d) RGB color map overlaid by (a), (b) and (c)[HT][TS)]

3.2 同一樣品靶上人膀胱癌組織和其鄰近正常組織質譜成像數據的非負分解

用非負分解法及三色疊加法分析同一樣品靶上人膀胱癌組織和其鄰近非癌變組織質譜成像數據(由美國普渡大學Cooks課題組提供)。該癌變組織及其鄰近非癌變組織均由提供該組織的臨床醫生嚴格確

[TS(][HT5”SS]圖4 人膀胱癌組織及其鄰近組織切片質譜成像數據經過非負分解方法(選取3個成分變量)處理所得特征分布圖及其RGB疊加圖

Fig.4 Nonnegative matrix factorization result maps of mass spectrometry imaging (MSI) data of a human cancerous and adjacent normal bladder tissue sections and their RGB overlaid map

(a), (b), (c)分別是3個成分的系數圖譜,即分子特征圖譜。(d), (e), (f)分別是相應的公共基本圖像,即分子分布特征圖像。(g)為(d), (e), (f)三圖的RGB三色疊加圖。(h)為組織染色圖

(a), (b) and (c), Coefficient plots of three components with their feature mass spectral highlighted individually. (d), (e) and (f), Base images of three components showing the distribution of corresponding molecules on tissue sections. (g) RGB color overlaid map of (a), (b) and (c). (h) HE stained tissue sections of tumor tissue and its adjacent tissue.[HT][TS)]

認。質譜原始數據均由DESI離子源(負離子模式)結合Thermo LTQ質譜儀進行質譜成像分析獲得\\[26\\]。

對原始質譜數據(質量范圍m/z 150~1000,單位質量分辨)進行圖像重構和質譜峰強歸一化\\[0,1\\],獲得850個質量數,無數據平滑、譜峰篩選等處理過程。組織切片采樣數據行數r為32,列數c為69,共2208個采樣點。因此,原始質譜成像數據X為2208×850。

應用非負分解方法處理此質譜成像數據。選取3個成分變量,即P=3,應用非負分解方法處理結果示于圖4。從圖4可見,(a)為癌變區域的質譜特征峰,

(e)為其相應的癌變組織分布圖像;(b)為非癌變組織區域的質譜特征峰,(d)為其相應的非癌變組織分布特征;(c)為非組織區域的質譜特征峰,(f)為相應的背景區域。公共基本圖像三色疊加圖(g)與組織染色圖(h)非常相似,而且癌變與非癌變差異明顯,一目了然。該方法有可能發展為病變組織差異快速確認的數據分析方法。4 結 論

基于非負分解的質譜成像數據特征提取方法,通過非負分解得出單一的分子組成特征及相應分布特征,然后將多個單一特征分布進行三色疊加顯示,可直觀清晰顯示其輪廓。能夠快速有效提取成像數據的分子組成特征以及分子在表面上的分布特征。本方法相對于主成分分析,其數據結果更易解釋,更加直觀,而且具有原始數據前處理簡單等優點,可作為快速特征提取方法應用于基于生物分子質譜成像臨床醫學研究和生命科學研究。

致 謝 感謝美國普渡大學Cooks教授課題組提供的質譜成像原始數據。

References

1 Pacholski M L, Winograd N. Chemical Reviews, 1999, 99(10): 2977~3006

2 McDonnell L A,Heeren R M A. Mass Spectrometry Reviews, 2007, 26(4): 606~643

3 Caprioli R M. Proteomics, 2008, 8(18): 3679~3680

4 Sinha T K, KhatibShahidi S, Yankeelov T E, Mapara K, Ehtesham M, Cornett D S, Dawant B M, Caprioli R M,Gore J C. Nature Methods, 2008, 5(1): 57~59

5 Andersson M, Groseclose M R, Deutch A Y,Caprioli R M. Nature Methods, 2008, 5(1): 101~108

6 Eberlin L S, Ifa D R, Wu C, Cooks R G. Angewandte ChemieInternational Edition, 2010, 49(5): 873~876

7 Ifa D R, Manicke N E, Dill A L, Cooks G. Science, 2008, 321(5890): 805~805

8 Liu Y, Ma X, Lin Z, He M, Han G, Yang C, Xing Z, Zhang S, Zhang X. Angewandte ChemieInternational Edition, 2010, 49(26): 4435~4437

9 Wiseman J M, Ifa D R, Zhu Y X, Kissinger C B, Manicke N E, Kissinger P T,Cooks R G. Proceedings of the National Academy of Sciences of the United States of America, 2008, 105(47): 18120~18125

10 Rubakhin S S, Jurchen J C, Monroe E B,Sweedler J V. Drug Discovery Today, 2005, 10(12): 823~837

11 KhatibShahidi S, Andersson M, Gillespie T A, Caprioli R M. Anal. Chem., 2006, 78(18): 6448~6456

12 Oppenheimer S R, Mi D, Sanders M E,Caprioli R M. Journal of Proteome Research, 2010, 9(5): 2182~2190

13 Lemaire R, Ait Menguellet S, Stauber J, Marchaudon V, Lucot JP, Collinet P, Farine MO, Vinatier D, Day R, Ducoroy P, Salzet M, Fournier I. Journal of Proteome Research, 2007, 6(11): 4127~4134

14 YANG ShuiPing, CHEN HuanWen, YANG YuLing, HU Bin, ZHANG Xie, ZHOU YuFen, ZHANG LiLi, GU HaiWei. Chinese J. Anal. Chem., 2009, 37(3): 315~318

楊水平, 陳煥文, 楊宇玲, 胡 斌, 張 燮, 周瑜芬, 張麗麗, 顧海威. 分析化學, 2009, 37(3): 315~318

15 Eberlin L S, Dill A L, Golby A J, Ligon K L, Wiseman J M, Cooks R G,Agar N Y R. Angewandte ChemieInternational Edition, 2010, 49(34): 5953~5956

16 Cazares L H, Troyer D, Mendrinos S, Lance R A, Nyalwidhe J O, Beydoun H A, Clements M A, Drake R R, Semmes O J. Clinical Cancer Research, 2009, 15(17): 5541~5551

17 LIU Nian, LIU Feng, XU Bin, GAO YaBing, LI XiangHong, WEI KaiHua, ZHANG XueMin, YANG SongCheng. Chinese J. Anal. Chem., 2008, 36(4): 421~425

劉 念, 劉 鋒, 許 彬, 高亞兵, 李向紅, 魏開華, 張學敏, 楊松成. 分析化學, 2008, 36(4): 421~425

18 LIU Hui, CHEN GuoQiang, WANG YanYing, LI ZhiLi. Chinese J. Anal. Chem., 2011, 39(1): 87~90

劉 輝, 陳國強, 王艷英, 李智立. 分析化學, 2011, 39(1): 87~90

19 CHEN HuanWen , HU Bin, ZHANG Xie. Chinese J. Anal. Chem., 2010, 38(8): 1069~1088

陳煥文, 胡 斌, 張 燮. 分析化學, 2010, 38(8): 1069~1088

20 Watrous J D, Alexandrov T, Dorrestein P C. Journal of Mass Spectrometry,  2011, 46(2): 209~222

21 Dubey M, Emoto K, Cheng F, Gamble L J, Takahashi H, Grainger D W,Castner D G. Surface and Interface Analysis, 2009, 41(8): 645~652

22 Park J W, Min H, Kim Y P, Shon H K, Kim J, Moon D W, Lee T G. Surface and Interface Analysis, 2009, 41(8): 694~703

23 Lee D D, Seung H S. Nature, 1999, 401(6755): 788~791

24 Lee D D, Seung H S. Algorithms for Nonnegative Matrix Factorization, in Advances in Neural Information Processing Systems 13, Leen, Editor. 2001: 556~562

25 Hoyer P O. Journal of Machine Learning Research, 2004, 5: 1457~1469

26 Dill A L, Eberlin L S, Costa A B, Zheng C, Ifa D R, Cheng L A, Masterson T A, Koch M O, Vitek O, Cooks R G. Chemistrya European Journal, 2011, 17(10): 2897~2902

Feature Extraction Approach for Mass Spectrometry Imaging

Data Using Nonnegative Matrix Factorization



XIONG XingChuang1,2, FANG Xiang2, OUYANG Zheng3, JIANG You2, HUANG ZeJian2, ZHANG YuKui1

1(School of Life Science, Beijing Institute of Technology, Beijing 100081, China)

2(National Institute of Metrology Beijing 100013, China)

3(Weldon School of Biomedical Engineering, Purdue University, West Lafayette 47907, USA)

Abstract Mass spectrometry imaging (MSI) provides molecules composition information and corresponding spatial information on complex biological surfaces in a single experiment without label. It is getting significant amount of attention in the mass spectrometric community currently. However, due to the large mount and complexity of MSI data, its data reduction and feature extraction are always a problem. Some multivariate statistical analysis methods, for example, the famous principal component analysis (PCA), were developed to address this issue. But the results with negative value are hard to be interpreted as features about molecules. A feature extraction approach for MSI data by applying nonnegative matrix factorization was developed. It could extract single molecules composition feature and the corresponding distribution (basic images), and further integrated the basic images to create a profile showing the whole sample by RGB (redgreenblue) color overlaid model clearly. The MSI data of a mouse brain section were used to test the efficiency of this approach compared with PCA. The white matter regions, the grey matter regions and the background regions were clearly shown and the corresponding molecules mass spectra were extracted, which indicated the approach is easier than PCA in result interpreting. Moreover, the MSI data of a human cancerous and adjacent normal bladder tissue sections on the same sample target were analyzed by the approach, the cancerous regions and the normal regions were clearly differentiated. The software developed in this paper could be downcoaded from the website http://www.msimaging.net.

Keywords Mass spectrometry imaging; Feature extraction; Nonnegative matrix factorization; Principal component analysis

(Received 25 October 2011; accepted 5 December 2011)

主站蜘蛛池模板: 亚洲综合色吧| 成人午夜免费观看| 一区二区在线视频免费观看| 久久国产V一级毛多内射| 老司机午夜精品网站在线观看 | 免费看黄片一区二区三区| 国产精品美女网站| 国产精品福利导航| 欧美日韩成人| 乱色熟女综合一区二区| 国产欧美在线观看精品一区污| 亚洲人成影院午夜网站| 日韩成人午夜| 国产福利在线免费| 在线免费亚洲无码视频| 国产成人亚洲综合a∨婷婷| 国产不卡国语在线| 国产激情无码一区二区三区免费| 97精品国产高清久久久久蜜芽| h网站在线播放| 色婷婷综合激情视频免费看| 亚洲一级无毛片无码在线免费视频 | 欧美自慰一级看片免费| 中文字幕日韩视频欧美一区| 国产91高清视频| 国产精品一区在线观看你懂的| 国产91精品调教在线播放| 婷婷午夜影院| 国产成熟女人性满足视频| 曰AV在线无码| 在线观看亚洲人成网站| 三级国产在线观看| 女人爽到高潮免费视频大全| 欧美日本激情| 国产精品污视频| 亚洲精品无码久久毛片波多野吉| 性做久久久久久久免费看| 国产青榴视频| 久草中文网| 亚洲一区网站| 日韩精品一区二区三区中文无码| 亚洲欧州色色免费AV| 欧美一区二区精品久久久| 日本一区二区不卡视频| 亚洲日韩高清无码| 青青久视频| 国模视频一区二区| 亚洲欧美一区二区三区麻豆| 91在线播放免费不卡无毒| 成人午夜福利视频| 国产91特黄特色A级毛片| 男女性色大片免费网站| 久久久久国色AV免费观看性色| 2024av在线无码中文最新| 国产精品jizz在线观看软件| 青青操国产| 亚洲男人的天堂在线观看| 孕妇高潮太爽了在线观看免费| 一级片一区| 国产黑丝视频在线观看| 日本亚洲国产一区二区三区| 又大又硬又爽免费视频| 国产精品久久久久久搜索| 一级毛片在线免费视频| 99视频在线免费观看| 永久在线播放| 国产精品流白浆在线观看| 亚洲人成亚洲精品| 免费午夜无码18禁无码影院| 国产成人亚洲毛片| 免费看美女自慰的网站| 91小视频版在线观看www| 日韩一区二区三免费高清 | 99久久精品视香蕉蕉| 视频二区欧美| 国产精品久久久精品三级| 欧美亚洲第一页| 毛片在线区| 日韩二区三区无| 亚洲国产系列| 五月婷婷精品| 久久国产成人精品国产成人亚洲|