999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

DeltaGen在植物育種中的應用

2019-09-02 09:59:54馬甜甜羅東文JAHUFERMohamedzainzulfiqhar張吉宇
草業科學 2019年7期
關鍵詞:分析設計

馬甜甜,羅東文,JAHUFER Mohamed zain zulfiqhar,駱 凱,李 潔,張吉宇

(1. 蘭州大學草地農業生態系統國家重點實驗室 / 蘭州大學農業農村部草牧業創新重點實驗室 / 蘭州大學草地農業科技學院,甘肅 蘭州 730020;2. 新西蘭國家草地農業研究所,新西蘭 11008)

植物育種是一門綜合性學科,改良植物各性狀以取得良好的生態或經濟效益。育種研究的過程中,從種質資源的鑒定到新品種評價,涉及數量遺傳學原理、基因型與環境的互作、育種策略的選擇等方面。育種周期長,步驟復雜,從而產生大量的數據,這些數據既是育種工作的基礎,也是育種手段的體現,更是檢驗育種成果的重要途徑,因此對育種數據的分析顯得格外重要。

目前大多數育種者選用Excel、SPSS和GenStat進行數據分析。Excel作為一款辦公軟件,具有數據處理、圖表可視化和初步統計分析等豐富的功能[1],但在進行數據分析時信息量少且操作繁瑣[2]。SPSS是較為權威的統計分析軟件,廣泛應用于各類研究中[3-4],具有操作簡便、易學易用等優點,但是SPSS圖表可視化效果不明顯,而且更側重于商業和社會學研究領域。GenStat是由VSNi開發的商用統計分析軟件,歷史悠久并且不斷更新,始終活躍在生物統計學技術的前沿[5],統計功能強大,但是更側重于農業研究領域,且需購買軟件。

北京中農博思科技發展有限公司基于“育種數據管理第一重要”的育種理念開發了農博士育種家軟件,用于育種數據采集、管理和分析[6],但推廣范圍有限,沒有得到很好的應用。國外也有許多基于數量遺傳學原理的軟件為育種者提供育種策略選擇等方面的幫助。例如,QU-GENE[7]和在其基礎上建立的QuLine(又稱QuCim)[8-9],模擬育種過程,提出最佳親本選配、雜交和后代選擇策略,從而提高育種效率;AlphaSim,模擬動植物育種計劃,允許用戶模擬多種性狀和多種環境進行基因組預測,應用最佳選擇[10];還有免費軟件Selegen-REML/BLUP,可以用于估計方差分量、遺傳加性模型和遺傳增益[11]。但它們都不能為植物育種者提供完備的統計服務。

本文介紹一款專為植物育種工作者設計的免費統計分析軟件DeltaGen(http://agrubuntu.cloudapp.net/PlantBreedingTool/)。DeltaGen是由新西蘭國家草地農業研究所Zulfi Jahufer和羅東文基于R語言shiny包開發的一款分析工具。DeltaGen基于數量遺傳學原理,可以為育種者提供從試驗設計到數據質量控制、統計和數量遺傳分析、選擇策略評估、模擬和成本評估、模式分析、指數選擇,直至生成研究報告的所有過程[12]。其簡便易學,步驟清晰,免費向用戶開放使用,是一款非常實用的植物育種綜合分析和教學工具。

此外,DeltaGen生成的圖表都可以在界面上調整顏色和字體大小,進行圖表美化,選擇顯示生成圖表的數據處理過程概述,下載圖表。DeltaGen是一款面向用戶的開源軟件,可隨時根據用戶的使用體驗,合理要求以及分析方法的發展進行更新優化。

1 DeltaGen的主要功能

打開DeltaGen網址,啟動網頁服務端可以得到圖1所示的用戶界面示意圖。

DeltaGen用戶界面的一級菜單有介紹(Introduction)、試驗設計(Trial Design)、數據輸入(Data Input)、圖表(Graphs and Tables)、模型(Models)、模式分析(Pattern Analysis)、保存和退出(Save & Quit)、幫助(Help)和致謝(Acknowledgements)欄。

1.1 介紹(Introduction)

DeltaGen簡介及軟件所屬的科研項目和資助情況。

1.2 試驗設計(Trial Design)

可以根據用戶需求進行田間試驗設計,設計類型有完全隨機設計(Completely Randomized)、完全隨機區組設計(Randomized Completely Block)、因子設計(Factorial)和行列設計(Row and Column),設計結果可以生成電子版田間試驗設計示意圖和數據表格并下載保存。

1.3 數據輸入(Data Input)

DeltaGen輸入數據可以選擇自帶舉例數據(Examples)、上傳(Upload)或粘貼(Clipboard)。一般選擇上傳選項,DeltaGen上傳數據為CSV格式數據。數據中的缺失值可以用空格“ ”,星號“*”或點“.”表示,在數據上傳時界面的缺失數據(Missing value shown as)可以相應選擇 Empty(代表空格)、Dot(代表.)或者*,點擊“Run”數據上傳完成。接下來必須對變量進行重新命名,這一步驟非常重要,首先,它設定了育種試驗的結構為Year/Season/Location/Replicates/(Row+Column)/Sample+Check+Line,其次,后續的相關分析(單變量分析中的混合效應線性模型,模式分析,選擇指數)都是基于這個結構展開的。同時注意在這一步驟中,不僅重新命名了變量,也改變了變量的性質為因子(factor)。

圖1 DeltaGen用戶界面示意圖Figure 1 The DeltaGen user interface

1.4 圖表(Graphs and Tables)

基于輸入的數據,選擇plot進入作圖,圖的類型(Plot-type)有直方圖(Histogram)、密度圖(Density)、散點圖(Scatter)、線形圖(Line)、條形圖(Bar)和箱線圖(Box-plot),選擇Pivot Table進入數據透視表界面。通過作圖和表格,可以檢驗原始數據是否符合正態分布,發現缺省值和異常值,以及數據間的關系。

1.5 模型(Models)

根據試驗數據的特征和試驗的目的選擇單變量分析(Univariate)或多變量分析(Multivariate)。

單變量分析用混合效應線性模型(Linear Mixed Effects Model)處理重復測量數據,針對處理效應是隨機效應(Random terms)或固定效應(Fixed terms),基于所用混合效應線性模型分別生成測量數據均值的最佳線性無偏估計(Best linear unbiased estimation,BLUE)值或最佳線性無偏預測(Best linear unbiased prediction,BLUP)值,以去除田間試驗中環境對表型的影響。擬合混合效應線性模型后還應注意檢查殘差圖(Residual Plots),如果殘差圖顯示模型的假設要求未被滿足(如原始數據不符合正態分布),可能需要對響應變量進行數據轉換(Data transformation),可以選擇對數函數轉換(log_e)、平方根轉換(sqrt)和反三角函數轉換(arcsin)。對于兩個變量交互作用的隨機效應,還可以進行聚類分析(Cluster)和主成分分析(PCA)。此外在擬合混合效應線性模型后,點擊遺傳增益和模擬(Genetic Gain and Simulation),程序會自動提取擬合結果中的相關信息,計算選擇周期中各性狀遺傳增益,模擬育種過程并計算育種成本。

多變量分析可進行繪圖(Plot)、多變量方差分析(MANOVA)和選擇指數(Selection Index)選項,可以作主成分分析散點圖(Biplot)和多重相關圖(Matrix Plot)、多變量方差分析和Smith-Hazel選擇指數,計算各個體的指數值,依據指數值選擇留種或淘汰。

模式分析(Pattern Analysis)。在模式分析中基于去除了環境影響之后的標準化數據(缺省選項)可以進行聚類分析(Cluster Analysis)和生成熱圖(Heatmap plot),也可以進行主成分分析生成主成分分析散點圖(PCA Biplot)。

1.6 保存和退出(Save & Quit)

按Download下載數據分析報告,按Quit App離開應用。

1.7 幫助(Help)

DeltaGen有兩個幫助選項。一個是主菜單欄上的DeltaGen快速使用指導,和關于網頁服務端的開發者信息。一個是在每個數據分析窗口出現的,提供分析使用的數量遺傳模型信息,以及相關指導。

1.8 致謝(Acknowledgements)

2 DeltaGen的應用舉例

以蘭州大學草地農業科技學院育種與種子研究團隊草木樨(Melilotus)育種數據[13]來舉例說明DeltaGen的應用。草木樨為豆科二年生自花或異花授粉植物[14]。前期試驗,從國外引進19份草木樨種質進行農藝學與品質性狀的初步評價[15],對草木樨的香豆素含量[16]和屬內的系統發育關系[17]進行了研究,基于草木樨轉錄組數據開發了SSR標記輔助育種[18-19]。2014-2015年試驗選擇的40份草木樨半同胞家系種質在榆中和臨澤兩個試驗點進行農藝性狀評價,表現好的家系用于后續育種[20]。本文選擇草木樨多年多點評價的部分農藝性狀數據作為實例說明DeltaGen的應用,這些農藝性狀包括干重 (dry matter yield,YLD)、株高 (plant height,PH)、莖粗(stem diameter, SD)、分枝數(stem number,SN)、春季活力(spring vitality,SR)、葉面積(leaf area,LA)。

2.1 試驗設計

打開DeltaGen網址,點擊主菜單工具欄Trial Design進入設計頁面,設計類型選擇完全隨機區組設計(Randomized Completely Block),區組數(Number of Block)為3,處理數(Number of Tre)為40,填寫合適的行(Row):5和列(Column):8,點擊Run,設計完成后點擊Design Check查看設計圖,拖動設計圖下載。行列試驗設計圖如圖2所示。

設計結果保存為csv格式的文件,為收集試驗數據做準備。

2.2 數據輸入

點擊主菜單工具欄Data Input,點擊Upload,Browse選擇文件上傳原始數據,原始數據在Excel中整理,上傳格式為CSV格式并對性狀重新命名(如果數據取自Examples則無需重新命名),點擊Run,上傳完成。

2.3 數據檢驗

在數據分析之前以原始數據作圖或數據透視表檢驗數據是否符合正態分布。點擊主菜單工具欄Graphs and Tables,點擊Plot,選擇直方圖(Histogram),X變量(X-variable)選擇要檢驗的性狀,按Ctrl鍵選擇多個性狀。本文選擇干重(YLD)、株高(PH)、莖粗(SD)、分枝數(SN),點擊Density顯示數據分布曲線,生成直方圖如圖3所示,符合正態分布,不進行數據轉換。

2.4 數據分析

2.4.1 混合線性模型分析

點擊主菜單工具欄(Models)。

圖2 田間試驗設計圖Figure 2 Field trial design

選擇單變量分析(Univariate)。點擊Modelling,依次選擇性狀作為主要處理(Primary Trait),計算出每個性狀基于最佳線性無偏預測(BLUP)的混合線性模型的平均值,去除環境對表型的影響,使用BLUP標準化后的性狀平均值進行后續分析;點擊遺傳增益和模擬(Genetic Gain and Simulation),基于在Modelling中選擇的作為主要處理的性狀進行遺傳增益計算和育種模擬。本例選擇干重作為主要處理性狀進行模擬。在模擬變量(Simulation Variables)中填寫行業標準(Industry Standard)、策略(Strategy)、選擇壓力(Selection Pressure)、田間試驗成本(Field Trial Cost),點擊update,輸出界面如圖4所示。按照20%的選擇壓力對干重進行單一性狀選擇,在這一選擇周期遺傳增益為17.07%,在Modelling中選擇其他性狀作為主要處理性狀,重復上述步驟可計算其他性狀的遺傳增益,如表1所列。在這6個性狀之中,干重經過一個選擇周期之后預期遺傳增益(ΔG)和相對親本的遺傳增益(%ΔG)增加百分比都最高,為17.07%和16.42%,莖粗的遺傳增益百分比增加最低,為0.16%,株高的相對親本遺傳增益增加百分比最低,為1.22%。育種成本為虛擬數值,僅用于說明DeltaGen進行育種過程模擬計算育種成本的功能。

圖3 檢驗原始數據是否符合正態分布的直方圖Figure 3 A histogram used to verify that the raw data conforms to a normal distribution

選擇多變量分析(Multivariate)。點擊Plot,選擇性狀(可選擇多個),生成基于原始數據的表型相關Biplot或Matrix Plot圖(圖5)。40份種質中6個性狀的表型相關性分析表明,產量與莖粗正相關性最大,相關性系數為0.66;產量與株高正相關性次之,相關性系數為0.48;春季活力與其余5個性狀均表現為正相關關系,與產量正相關性極強,相關性系數為0.83(春季活力從優到劣分為1~5個等級,表型值越大活力越弱,與其他5個性狀表現相反);分枝數與葉面積表現為負相關關系,相關性系數為-0.07。

2.4.2 模式分析

點擊主菜單工具欄Pattern Analysis,使用標準化BLUP值進行分析。點擊Cluster Analysis,進行聚類分析和生成聚類熱圖(圖6)。聚類分析后的各分組詳情如表2所列。

使用標準化BLUP值去除環境影響,只考慮基因型的作用,基于6個性狀在40份種質中的表現將40份種質分為3類(表2)。熱圖從紅色到藍色性狀表型值依次降低,第1類種質中株高(PH)、干重(YLD)、莖粗(SD)、分枝數(SN)、葉面積(LA)、春季活力(SR)(春季活力從優到劣分為1~5個等級,表型值越大活力越弱,與其他5個性狀表現相反)均表現最高;第2類種質株高、產量、莖粗、葉面積、春季活力表現居中,分枝數表現最低;第3類種質分枝數表現居中,株高、產量、莖粗、葉面積、春季活力均表現最低(圖6)。

圖4 遺傳增益和模擬輸出界面Figure 4 Genetic gain and simulation output interface

表1 基于兩個地點評價的草木樨經過一個選擇周期獲得的預期遺傳增益Table 1 Predicted genetic gain (ΔG) obtained from per selection cycle based on the Melilotus across two sites evaluation%

圖5 各性狀的表型皮爾遜相關矩陣圖(Matrix Plot)Figure 5 Pearson correlation matrix (Matrix Plot)of phenotypic traits

點擊PCA Biplot,進行主成分分析。按Ctrl+A選擇所有性狀,選擇使用標準化數據、顯示主成分概述,點擊Run。生成主成分分析散點圖(圖7),和PCA特征值概述(表3)。對草木樨種質的6個表型相關性狀進行主成分分析,結果表明前2個主成分特征值大于1,入選為主成分,累積貢獻率77.0%。第一主成分解釋了總體性狀變異的58.3%,第二主成分解釋了總體性狀變異的18.7%(表3)。

主成分分析散點圖選擇特征值較大的前3個成分作為主成分解釋了總體性狀變異的87.9%。紅色代表第一主成分,包括產量、株高、莖粗、分枝數等與牧草產量相關的性狀;綠色代表第二主成分葉面積,與牧草質量相關;藍色代表第三主成分春季活力。性狀間的相互關系由兩個性狀位置及夾角表示。數字表示40份種質。去除環境對表型的影響之后產量與莖粗呈極強正相關關系,與株高和分枝數呈正相關關系,分枝數與葉面積呈負相關關系(圖7)。

圖6 標準化BLUP值的40份種質的聚類分析和6個性狀的表達熱圖Figure 6 Cluster analysis of 40 accessions with standardized BLUP values and expression heat map of 6 traits

表2 標準化BLUP值的40份種質聚類表Table 2 40 accessions cluster tables using standardized BLUP values

圖7 主成分分析散點圖Figure 7 Principal component analysis scatter plot

表3 主成分特征值的分析Table 3 Analysis of principal component eigenvalues

3 討論與結論

植物育種是一個多學科交叉的過程,沒有豐富經驗的育種者難以理解和把握,依靠Excel和SPSS等工具處理育種數據,不能夠很好地挖掘數據中的信息。隨著信息技術的興起,人們逐漸認識到計算機模擬為植物育種計劃提供決策支持的重要性[21],隨之出現了一系列模擬育種過程,為育種者提供策略選擇幫助的工具,例如Plabsoft[22]、QUGENE[7]和Selectiongain[23]。這些軟件作為戰略育種工具具有很高的應用價值。但是,由于其是基于計算機模擬,在野外育種計劃中應用較為不穩定,并且操作需專業技術支持、實施困難,造成這類軟件不易推廣,使用人數少。直至現在仍然有大多數育種者在使用Excel和SPSS處理育種數據。而簡便易學、步驟清晰的DeltaGen集試驗設計生成、數據質量控制、統計和數量遺傳分析、育種策略評估和指數選擇等功能于一體,可以為育種者提供綜合解決方案,縮短育種周期,減少盲目性,節省大量人力、物力和財力。

對草木樨育種數據進行分析,證明了使用DeltaGen可以成功完成關鍵分析程序。對此,駱凱等[24]使用GenStat進行了預期遺傳增益和模式分析,結果與本研究所用DeltaGen的分析結果基本相同(表1、圖7)。

此外,DeltaGen除了作為試驗設計、數據分析和策略選擇工具,在其Help工具欄有詳細的使用步驟和理論指導,可以作為學習數量遺傳學基礎知識的工具。軟件現已用于蘭州大學草地農業科技學院研究生和本科生草類植物育種學教學。DeltaGen的終端還在繼續改進,希望能為更多的植物育種者提供幫助。

猜你喜歡
分析設計
隱蔽失效適航要求符合性驗證分析
何為設計的守護之道?
現代裝飾(2020年7期)2020-07-27 01:27:42
《豐收的喜悅展示設計》
流行色(2020年1期)2020-04-28 11:16:38
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
瞞天過海——仿生設計萌到家
藝術啟蒙(2018年7期)2018-08-23 09:14:18
設計秀
海峽姐妹(2017年7期)2017-07-31 19:08:17
有種設計叫而專
Coco薇(2017年5期)2017-06-05 08:53:16
電力系統及其自動化發展趨勢分析
中西醫結合治療抑郁癥100例分析
在線教育與MOOC的比較分析
主站蜘蛛池模板: 天天综合天天综合| 呦女亚洲一区精品| 亚洲欧美成aⅴ人在线观看| 中文字幕永久视频| 国产午夜精品鲁丝片| 人妻21p大胆| 中文精品久久久久国产网址 | 2020国产在线视精品在| 任我操在线视频| 啪啪永久免费av| 在线观看免费AV网| 精品国产美女福到在线不卡f| 538国产视频| 亚洲性视频网站| 在线国产综合一区二区三区| 亚洲全网成人资源在线观看| 国产精品青青| 国产午夜一级淫片| 国产成人综合日韩精品无码首页 | 久久精品视频亚洲| 亚洲区欧美区| 国产杨幂丝袜av在线播放| 国产高潮流白浆视频| 亚洲国产精品无码AV| 91丝袜在线观看| 女人一级毛片| 国产青青操| 国产精品主播| 欧美性猛交xxxx乱大交极品| 免费黄色国产视频| 风韵丰满熟妇啪啪区老熟熟女| 国产高清色视频免费看的网址| 精品国产中文一级毛片在线看| 国产精品美女在线| 亚州AV秘 一区二区三区| 高清久久精品亚洲日韩Av| 亚洲无线观看| 日韩在线播放欧美字幕| 丁香六月激情婷婷| 91精品小视频| 中文无码精品a∨在线观看| 91午夜福利在线观看| 亚洲一区二区在线无码| 国产视频欧美| 影音先锋亚洲无码| 无码综合天天久久综合网| 免费a级毛片视频| 天天综合网亚洲网站| 久久狠狠色噜噜狠狠狠狠97视色| 园内精品自拍视频在线播放| 欧美色视频在线| 伊人久久综在合线亚洲2019| 国产午夜福利在线小视频| 黄色网站在线观看无码| 中文字幕永久在线看| 国产97视频在线| 久久这里只有精品66| 女人18一级毛片免费观看| 国产成人精品18| 久久99国产视频| 香蕉视频在线观看www| 免费在线a视频| 国产精品亚洲一区二区三区在线观看| 国产91高清视频| 九色在线观看视频| 伊人色婷婷| 国产女人18水真多毛片18精品| 国产男女免费视频| 国产成人乱码一区二区三区在线| 尤物精品国产福利网站| 国产白浆一区二区三区视频在线| 高清无码一本到东京热| 亚洲色欲色欲www在线观看| 67194成是人免费无码| 99视频在线看| 亚洲人成人无码www| 精品国产成人国产在线| 日韩亚洲综合在线| 亚洲性影院| 伊人久久综在合线亚洲2019| 在线精品亚洲一区二区古装| 日韩不卡免费视频|