何 勇,李禧堯,楊國峰,俞澤宇,楊寧遠,馮旭萍,2,許麗佳
·農業信息與電氣技術·
室內高通量種質資源表型平臺研究進展與展望
何 勇1,李禧堯1,楊國峰1,俞澤宇1,楊寧遠1,馮旭萍1,2※,許麗佳3
(1. 浙江大學生物系統工程與食品科學學院,杭州 310058;2. 浙江大學新農村發展研究院,杭州 310058;3. 四川農業大學機電學院,雅安 625014)
種質資源是作物育種改良的重要物質基礎,精確高通量獲取作物表型信息是進行種質資源評估的重要途徑。基于表型數據獲取、解析與管理技術的室內高通量植物表型平臺具備環境精確調控、成像自動無損、效率顯著提升等特點,為種質資源評估提供了高效、集成且規模化的解決方案,對作物育種改良、種業高質量發展具有深遠影響。該研究主要闡述了四類室內高通量種質資源表型平臺的研究現狀,對目前室內植物表型數據解析及管理技術進行介紹與分析,并總結了室內高通量表型平臺與數據解析管理方法存在的問題與挑戰,對未來種質資源表型評估研究方向與趨勢進行展望,以期為植物表型研究提供指導和建議。
作物;植物表型;室內表型平臺;表型數據解析與管理;高通量;種質資源評估
種業是農業的“芯片”,農業種質資源則是種業的“芯片”,保護好、利用好農業遺傳資源,對提升現代種業發展水平、推動農業高質量發展、實施鄉村振興戰略意義重大[1-3]。收集作物種質資源,進行綜合評價,保證資源的多樣性是作物改良育種工作的基礎,也是獲得優異育種材料的關鍵[4-6]。近年來,高通量測序技術的迅猛發展使植物基因組信息呈指數級別上升,大大促進了對調控作物重要性狀基因的研究與挖掘,為闡明作物起源和演化、全面評估種質資源群體多樣性提供了核心理論和技術支撐[7-10]。
在種質評估過程中,很多數量表型性狀,比如植株高度、葉片大小,葉傾角等性狀,由微效多基因控制,易受環境影響,需要進行多年多點的表型鑒定[11-14]。相對于高通量的測序技術來說,種質表型考察主要依靠人力手工測量,效率低、精度差且破壞性大,是功能基因組學研究和作物育種改良進展的關鍵制約因素[15]。由此導致了大量可用的基因組信息與表型性狀無法相匹配,限制了作物育種改良效率和能力[16-18]。因此,為篩選、培育出更高產、優質、耐脅迫的作物,進一步研究提升植物表型獲取與解析技術及裝備迫在眉睫[19-20]。
隨著大數據時代的到來,高通量種質資源表型平臺的開發與應用為提高表型信息獲取效率提供了新思路和新方案[21-24]。其采用自動化傳輸裝置、高度集成化傳感器(包括可見光、多光譜、高光譜、熒光、熱成像、激光成像等)和數據管理分析系統,每天可對至少數百株的植物進行無損、自動、快速、高通量成像與數據解析,進而實現與遺傳變異等密切相關的植物動態生長發育表型數據的監測、量化和評估,是深入挖掘作物“基因型-表型-環境型”內在關聯的有效途徑[25-27]。目前,世界各地的表型研發機構大規模開發了多生境、多維度的室內高通量種質資源表型平臺和田間高通量種質資源表型平臺,實現多尺度植株的表型數據獲取[28-29]。田間高通量種質資源表型平臺主要包含車載式、自走式、懸索式、軌道式、無人機和遙感衛星等形式[30-32]。采用田間平臺獲取的表型數據通常時效性高、信息量大、環境信息、地理信息等附加數據多,但具有獲取表型數據之間標準不統一及重復性低等問題[33]。
與野外大田試驗相比,采用室內高通量種質資源表型平臺進行室內試驗雖然不能提供土壤系統的真實性以及植物生物和非生物脅迫的復雜性,但可通過對各種環境條件的精細調控和對植物生長發育條件的嚴格控制,定性、定量地研究代表性或感興趣的植物對特定環境的響應,避免了基因型與自然環境相互作用引起的不可預測的表型變異,并可針對植物生長情況開展復雜試驗條件下的模擬分級研究[34]。此外,室內試驗可預選縮小數千種基因型的范圍,為進行田間試驗評估真實生長環境下的作物性狀奠定了基礎。
因此,部署在溫室或生長室中的室內高通量種質資源表型平臺具備精確調控、分級模擬和自動化精準采集等優勢,滿足種質資源相關表型的精準鑒定需求,是提升種質資源表型評估研究廣度和深度的有效手段。本文主要闡述室內高通量種質資源表型平臺的研究現狀,綜述室內植物表型數據解析及管理技術,并分析目前高通量表型平臺存在的問題與挑戰,對未來種質資源表型評估研究方向與趨勢進行展望。
在Web of Science中搜索2002—2022年間“植物高通量表型平臺”“室內表型平臺”“室內高通量種質資源表型平臺”相關論文,并分別按照年份、國家和地區、文獻類型及研究領域進行統計分析,如圖1所示。近二十年各國對室內高通量表型平臺的研究日益增長,特別是美國、中國和歐洲國家。這些國家研發應用了大量表型平臺和設施,為各類種質資源表型提供可靠的鑒定評估工具,如圖2所示為各類高通量種質資源表型平臺及測量植株尺度。而植物科學、農業和遺傳學是相關出版物貢獻最多的3個領域。由于室內表型平臺仍屬于技術研發階段,因此研究論文仍然是出版物的主要類型。由此可見,室內高通量種質資源表型平臺蘊含著廣闊的研究發展前景。

圖1 2002-2022年室內高通量種質資源表型平臺相關出版物統計分析

圖2 各類高通量種質資源表型平臺及測量植株尺度
基于平臺的結構設計及與傳感器之間的運動模式,室內高通量種質資源表型平臺主要分為臺式、傳送帶式、軌道式和室內植物表型機器人。表1詳細羅列了各類典型室內高通量表型平臺所搭載傳感器、通量及適用作物等。

表1 室內高通量種質資源表型平臺介紹
注:“√”代表各類典型室內高通量種質資源表型平臺所搭載的傳感器類型。
Note: “√” represents the type of sensors mounted on various typical indoor high-throughput germplasm phenotyping platforms.
臺式室內高通量種質資源表型平臺主要通過在氣候生長箱中安裝可見光、近紅外、紅外、熒光等成像傳感器小批量獲取小型植物的表型參數。該類平臺沒有傳送裝置,需要手工更換植物樣本。
德國Lemna Tec公司研發的Scanalyzer HTS是一款專為小型植物(如擬南芥)和單子葉、雙子葉植物幼苗而設計的2D高通量表型平臺。該平臺一次可容納6個托盤,每個托盤18株植物。其通過搭載可見光、熒光、近紅外和紅外攝像頭獲取高分辨率圖像,從而提取葉面積、葉綠素含量、莖直徑、植物高度及寬度、生長速率、生物量、顏色、葉卷等多種植物性狀[49]。
近年來,Lemna Tec公司研發的多傳感器實驗室表型分析平臺HyperAlxpert添加了3D傳感器選項,實現了三維點云圖像采集,同時可對擬南芥等植物幼苗、真菌或微生物培養皿等多種樣品獲取表型數據。特別地,其通過配備自動托盤裝載模塊TrayProvider實現了高通量樣本測量[50]。
奧地利科學院研究所研發的臺式表型分析平臺PhenoBox/PhenoPipe將RGB相機或高光譜相機固定在植物側端,通過轉盤旋轉植物實現不同角度的拍攝,進而提供了一種更為靈活且經濟實惠的自動化開源成像工具和表型數據分析解決方案[51]。但該平臺一次只能拍攝一株,需要手工更換樣品,自動化程度相對較低。
除了對小型植株的葉片等組織器官進行表型獲取外,臺式室內高通量種質資源表型平臺還可結合X射線計算機斷層掃描技術(X-CT)對植物根系進行無損三維成像[61-63]。三英精密儀器有限公司研制的nanoVoxel系列顯微CT系統采用微納焦點X射線源,分辨率達到微米或亞微米級,具有無損性、無需制樣、三維全息結構等優點,可獲得植物根系、果實、莖稈和葉片的諸多三維表型結構信息[52]。
綜上,臺式室內高通量種質資源表型平臺主要針對小型植株,或是幼苗進行表型研究,高通量程度相對較低。但相較于其他類型溫室高通量表型平臺,其可以更為精確地控制溫度、水、CO2、光照條件、病害感染程度以及其他生物和非生物脅迫,進而更準確地量化受控環境條件下植物表型性狀[64-65]。
傳送帶式室內高通量種質資源表型平臺利用“植物到傳感器”的原理,將多種傳感器固定放置于暗室的上方和側面進行成像,盆栽植物放置于傳送帶上向前運輸,當植株運輸至暗室則隨即進行表型數據的采集,采集完成后再繼續移動并返回原本生長的位置。荷蘭WPS公司研發的大型傳送帶式室內表型平臺WPScan Conveyor是世界上第一臺高通量表型分析平臺。該平臺利用傳送帶將植物傳輸至指定成像位置,獲取植物可見光圖像、多光譜圖像、高光譜圖像、熒光圖像、激光三維圖像和熱圖像等,進而對圖像進行參數提取,掌握植物生長發育情況[12]。每個植株均通過條形碼加以標識,因此在不同生長發育階段產生的各種表型數據均能定時、自動地加以檢測,適合于盆栽和小型作物。
德國Lemna Tec公司研制的Scanalyzer 3D作為世界上最為經典的傳送帶式全自動高通量表型平臺,在全球范圍內安裝了各種版本。如內布拉斯加大學基于Scanalyzer 3D建立的高通量種質資源表型平臺可同時容納672株高達2.5 m的植物進行表型分析,并可在植物的頂部和側視圖收集可見光、熒光、紅外和高光譜圖像[53]。同時,該平臺每個成像室均配備一個旋轉電梯以獲取植株360°側視圖[66]。另外,澳大利亞國家植物表型中心建造的植物加速器同樣安裝了2套Scanalyzer 3D平臺,每套容量達2 400株植物,并配備4個成像室獲取可見光圖像、近紅外圖像、根系近紅外圖像、熒光圖像和熱圖像。同時,所有植物均使用條碼或射頻標簽進行各生長發育階段表型數據的定期檢測[54]。
捷克Photon Systems Instruments公司研發的超大型植物表型成像平臺PlantScreen集成了LED植物智能培養、RGB真彩三維成像、葉綠素熒光圖像分析、熱圖像分析、近紅外圖像分析、高光譜圖像分析、自動條形碼標識管理等多種先進技術,實現從模式植物擬南芥到小麥、玉米等大規模糧食作物的全方位表型性狀獲取,可對植物表型組進行全面、自動、高通量且無人值守的長期研究分析,進而獲取和研究植物整個生活史的生理變化和表型分析的所有相關海量數據[67-68]。
中國針對高通量表型數據測量平臺的自主研發起步相對較晚,目前研制的種質資源表型平臺大多只能實現某一種植物固定性狀的獲取,整體研發水平相較于國外仍有一定差距。其中,華中農業大學建造的室內水稻高通量表型平臺HRPF為中國自主開發的典型平臺。該平臺總容量為5 472株植物,可通過RGB成像和X射線計算機斷層掃描監測多達1 920種水稻植物種群中的至少15種農藝性狀,一些難以手動評估的基于圖像的性狀(如耐旱水稻的卷葉)也可進行量化[55-56]。同時,通過對圖像分析軟件的微小調整,HRPF平臺還可以擴展到分析其他物種的表型,包括獲取小麥植物三維點云圖像、油菜幼苗的葉片性狀和玉米生長變異的遺傳結構等[69-71]。
大多數傳送帶式高通量表型平臺需要將植物運送到特定的成像室,可能導致小氣候異質性,影響植物的生長和對環境變化的反應,從而使獲取的表型數據不準確。因此,Tisné等設計了一種可獲取可見光圖像的循環傳送帶式表型平臺Phenoscope,通過連續旋轉平臺上735盆植株使其經歷相同的外部條件,從而最大限度地減少單個植物的環境變化,補償環境異質性,進而獲取植物的芽生長和含水量信息[57]。類似的,普渡大學建造的可進行高光譜成像的傳送帶式室內高通量表型平臺使植物在整個生育期均生長在循環傳送帶上,克服了微氣候差的干擾[72]。
雖然傳送帶式室內高通量種質資源表型平臺可以攜帶大尺寸(如高粱和玉米)和大容量的植物,但傳送帶的搖晃可能會影響莖稈脆弱的植物,從而降低表型信息質量,增大圖像噪聲。此外,植物的光譜信息并非在原位收集,生長位置和成像室之間存在環境差異,因此表型數據存在一定程度的不準確。另一方面,建立基于傳送帶的表型平臺昂貴且耗時,單位成本取決于吞吐量,且靈活性較弱,功能性單一。未來,傳送帶式室內高通量種質資源表型平臺應致力于提高運行穩定性、環境均勻性、功能多樣性和設施靈活性,為植物提供平穩的運輸和精確的氣候控制,并在整個生育期實現多種植物性狀的完整精確表型分析。
根莖較為脆弱的小型植物的表型性狀易受環境變化(溫度、風等)的影響。軌道式室內高通量種質資源表型平臺采用“傳感器到植物”的原理,無需植物移動,使其最接近自然生長狀態。通過計算機控制搭載多個成像傳感器的機械臂沿著軌道在XYZ軸方向移動,對植物生長位置進行自動定位并獲取其表型數據。因此,軌道式室內高通量種質資源表型平臺更傾向于研究尺寸較小的植物,通過確保生長環境的同質性使植物不受干擾的生長發育,進而獲取與細微表型變化相關的性狀數據。
中國科學院研發的小型軌道式種質資源表型平臺Crop 3D以激光雷達為核心傳感器,采用俯拍方式實現單行掃描、多行掃描和定點定位掃描,對室內作物的各生長時期進行可見光圖像、多光譜圖像、熱圖像和激光掃描圖像的多源數據獲取。同時,通過自主研發軟件對圖像數據進行解析,可獲得株高、株幅、葉長、葉寬、葉傾角和葉面積等物理表型性狀[58]。
荷蘭PhenoSpex公司研發的軌道式高通量平臺FieldScan通過集成多光譜激光三維掃描測量儀PlantEye及其他多種成像傳感器和環境氣象傳感器,可在任何光照條件下,同時實現田間和溫室環境下的植物表型高通量、高精度、全自動無損測量。其中,PlantEye通過獲取植物頂部三維多光譜圖像可實現葉面積、葉傾角、冠層等表型數據獲取,且相較于其他傳感器精度與通量更高。該平臺一天可對上萬個植株及小區進行十余次重復測量,以去除低質量數據的負面影響,為使用者提供有實用價值的表型信息,便于實時掌握植株生長發育狀況。
中國PhenoTrait公司設計的軌道式高通量種質資源表型平臺TraitDiscover同時適用于溫室和大田,可搭載葉綠素熒光成像儀、光合表型測量儀、三維激光掃描儀、高光譜相機、熱成像儀、可見光相機等多種表型傳感器進行全自動測量[59]。根據系統設計的大小每天最多可以實現上萬株植物或成百上千個群體小區的測量。目前,該平臺已在水稻、小麥、大豆及園藝作物等植物中得到應用與推廣。
軌道式室內高通量種質資源表型平臺自動化程度高,可以收集高分辨率的時間序列表型數據。同時,軌道式表型平臺有效載荷大,連續運行能力強,為探究植物晝夜節律的動力學機制提供了途徑與可能。但受平臺規模限制,多項試驗無法同時進行,且每次試驗對于植株的擺放布局要求較高。此外,平臺從植物上方進行掃描無法獲得隱藏在冠層下方的莖、葉的表型性狀。未來,軌道式溫室高通量表型平臺應注重擴大獲取單株植物表型面積,解決冠層葉片遮擋問題,縮小傳感器載荷與體積,降低植株手工擺放要求,設置植株側面信息獲取的傳感器,提升使用操作的便利性與智能化,降低建造、安裝和運行成本。
農業機器人是精準農業、數字農業的重要組成部分,在農業現代化進程中發揮著重要作用[73-74]。目前,農業機器人在病蟲草害防治、收獲采摘等農業生產作業環節得到研究與應用[75-77]。其中,室內植物表型機器人是近年來快速興起與發展的一種室內高通量種質資源表型平臺。其將機械臂和無人駕駛地面車輛作為平臺并連接各類傳感器,進而實現植物表型性狀的快速感知獲取。相較于其他室內高通量種質資源表型平臺,表型機器人大范圍提升了植物表型性狀測量的能力、速度、覆蓋范圍、可重復性和成本效益[78]。
針對軌道式表型平臺因冠層葉片遮擋無法獲取完整植株的表型數據問題,室內表型機器人能夠靈活的操縱相機定位與定向,以獲得最佳視點,為解決遮擋問題提供了可行性方案。如Wu等[79]研發了一種自動表型機器人并基于深度學習設計了“下一個最佳視點”選取算法評估最優視點。該機器人由3個機械臂組成,每個機械臂均配備一個深度相機,根據最佳視點位置操縱機械臂獲取植物的三維點云數據。相較于其他表型機器人,其在解決遮擋問題方面更加高效與靈活。然而,系統能否找到最佳視點取決于深度學習網絡的訓練效果與預測能力,目前仍然具有一定難度和挑戰。
此外,大多數室內表型機器人試圖接觸和探測植物器官,進而將機器人獲取植物表型性狀信息的范圍從外部形態結構延伸擴展至生理生化性狀[80-81]。因此,此類表型機器人被設計成模仿人類動作來操縱植物并測量目標植物器官的表型性狀。如美國愛荷華州立大學定制設計的植物生長室Enviratro 采用表型機器人定期進入并進行植物精確表型測量[60]。該機器人由無人駕駛地面車輛,六軸機械臂和一系列傳感器組成,采用同步定位和建圖技術、兩臺SICK S300激光掃描儀實現室內自主導航。傳感器具體包括RGB相機、高光譜相機、近紅外相機,熱成像相機、飛行時間相機,激光輪廓儀和電流脈沖幅度調制熒光計。上述傳感器通過機械臂自主定位實現植物俯視圖與側視圖成像,并根據計算機視覺算法獲取各種生理測量值。特別的是,該機器人可在葉片表面精確放置傳感器探針以實現高精度測量。
室內植物表型機器人大大提高了表型數據獲取的速度、容量、可重復性和準確性。但在傳感、定位、路徑規劃、物體檢測和避障方面仍存在許多問題,需要通過跨學科深入研究開發更有效、更強大的傳感器、控制器和算法,以提高其精確性、安全性和可靠性。
綜上所述,各類室內高通量種質資源表型平臺采用先進的傳感器和數據采集系統,無損且高通量的獲取大規模農業試驗的特定表型,可以有效完成傳統表型獲取方法無法完成的任務。表2闡述了各類室內表型平臺的優勢、使用限制及未來研究方向。但如何利用大數據分析挖掘技術從海量多源表型數據中整合發現有生物學意義的信息,進而為種質資源評估提供指導意見,目前的表型數據解析與管理技術仍處于探索階段。因此,海量數據管理,圖像數據處理和表型性狀分析是新一代植物表型組學面臨的主要挑戰。

表2 各類室內高通量種質資源表型平臺的應用范圍、使用限制及研究方向
隨著非侵入性成像技術在高通量表型獲取中的廣泛應用,高通量種質資源表型平臺通過搭載各類成像技術所對應的傳感器,對植物的形態結構、生理生化等信息進行精確、自動和重復的成像[82-84]。但植物表型數據獲取只是表型研究的第一步。如何從原始圖像數據中提取表型性狀,并進行表型數據的標準化存儲管理和跨尺度、跨維度的性狀分析,從而實現種質資源篩選與鑒定是研究的重點與難點。因此,本節重點闡述了室內植物表型圖像數據的解析與管理技術。
為實現針對植物農藝性狀、產量性狀、品質性狀及生物與非生物脅迫性狀的種質資源評估,采集表型圖像與數據的各類室內高通量種質資源表型平臺迅猛發展,而研究開發相應準確的圖像數據解析技術與算法,進而自動提取多樣的植物表型性狀顯得至關重要[85-88]。但由于不同品種之間的植物外觀形態表型千差萬別,且即便是同一品種的植株,隨著其生長發育,植株的形態結構、顏色大小等外觀表型也將不斷變化,導致自動化解析圖像的難度陡然增大。
大型表型平臺公司主要通過研發較為成熟的集成解析軟件以實現表型性狀提取與表型數據分析。如德國LemnaTec公司基于Scanalyzer 3D平臺研發的LemnaGrid軟件能夠依據表型圖像進行表型性狀解析[89-91]。荷蘭PhenoSpex公司基于多光譜激光三維掃描測量儀PlantEye研發的Leasyscan系統能夠根據葉面積、葉面積指數和蒸騰作用評估影響水分利用的冠層性狀,并開發了Hortcontrol軟件按照動態時間序列實時可視化上述參數信息[92]。然而,大多數開發的圖像分析工具與軟件是為特定任務和特定植物種類設計。當面對熒光、高光譜、激光雷達等不同傳感器獲取的信息或是小麥、玉米、擬南芥等不同物種的表型圖像時,分析軟件往往無法較好的滿足新的分析要求,調整時缺乏靈活性。Klukas等[93]對此基于Lemna Tec系統研發了一種開放式的集成分析平臺IAP,可進行小麥、大麥及玉米等禾本科作物的可見光圖像、熒光圖像、近紅外圖像和紅外圖像的高通量表型分析。
雖然上述各種商業表型圖像數據分析軟件層出不窮,但需依賴于特定硬件平臺定制,安裝維護成本高且使用門檻高,阻礙了圖像分析工具向通用性、實用性和標準化的趨勢方向發展與廣泛應用。因此,許多研究團隊與學者針對各類作物多尺度、多時序的表型圖像研發了獨立于平臺系統的表型分析軟件。如Zhou等[94]研發了一種開源可拓展且易于使用的植物生長表型分析軟件Leaf-GP,可輕松解析低成本成像設備捕獲的擬南芥、小麥等作物的圖像,有效提取葉片數、投影葉面積、葉周長、緊湊度及顏色等表型性狀。Minervini等[95]開發了一種經濟實惠且便于部署使用的表型解析軟件Phenotiki,并采用擬南芥二維俯視圖像驗證了軟件獲取的形狀、顏色、葉片數及生長曲線等表型信息的可靠性。Gaggion等[96]基于卷積神經網絡設計了一種植物根系高通量表型分析軟件ChronoRoot,實現根系生長動態表型參數的自動提取。表3列出了上述典型植物表型圖像數據分析軟件。

表3 典型植物表型圖像數據分析軟件
研發穩健、準確、自動的種質資源表型解析算法是實現植物表型原始圖像數據的解析和上述各類表型分析軟件開發的基礎與關鍵。目前,常用的表型原始數據解析方法主要包括經典統計分析方法、圖像處理方法、傳統機器學習和深度學習,如表4所示。傳統的經典統計分析方法主要針對數字類型的表型數據,如為了驗證高通量表型平臺獲取表型數據的準確性和可靠性,將其與傳統手工測量的表型數據進行相關性分析[55-56, 67-68]。為建立植物生長參數反演模型,將其與平臺獲取表型數據進行回歸分析等。該方法簡單易行,計算設備無需較高的硬件性能,但通常只可提煉和總結基礎數據中的一般規律與趨勢,無法對植物表型原始圖像數據進行深層次解析。圖像處理方法在表型原始二維、三維圖像解析中使用最多且范圍最廣,其通過形態學和顏色特性進行植株個體和莖、葉、果實等植物器官與復雜背景的目標邊緣和輪廓的提取,進而獲取植物外在形態、顏色等表型性狀[97-100]。因此,開發更為精準且魯棒的圖像提取與分割算法非常重要。
而近年來飛速演變發展的計算機視覺與機器學習在處理高通量表型平臺獲取的大型圖像數據集方面具有不可替代的優勢。傳統機器學習采用各種工具和方法從大量作物表型數據中“學習”特征,以便對新的數據進行識別、分類、評估與預測[101]。較為經典常見的機器學習算法包括K-Means聚類、支持向量機、多層感知機、決策樹、線性判別分析、人工神經網絡等[102-107]。如Ebersbach等[108]基于Scanalyzer 3D平臺獲取油菜株高、寬度、體積、葉面積及花序數量等表型性狀,并采用有監督機器學習算法實現了花序個數預測,準確率達91%。Zhou等[109]利用室內高通量表型平臺收集了2個生長階段的75株大豆植物的三維點云圖像,并采用boosting算法、支持向量機和K-Means聚類3種機器學習方法進行葉片分割,結果表明K-Means聚類針對無重疊大豆圖像的分割效果最佳,錯誤率為0.2%,支持向量機對有重疊大豆圖像的分割效果最佳,錯誤率為2.57%。

表4 植物表型原始數據解析方法
深度學習是機器學習領域中一個迅速興起且蓬勃發展的研究方向,其利用大型植物表型數據集,直接進行端到端的訓練,被有效地應用于植物的圖像目標識別、分割、分類和計數等[110-113]。如Misra等[114]基于LemnaTec平臺獲取的200種小麥的可見光圖像,提出一種新的深度學習網絡SpikeSegNe,實現了小麥穗數的識別和計數,計數平均精度、準確率和魯棒性分別為99%、95%和97%。Du等[115]采用室內高通量表型平臺構建了500個生菜品種的2 000張RGB圖像數據集,并提出一種基于卷積神經網絡的新型目標檢測-語義分割-表型分析方法,對圖像中植物的定位檢測精度達到99.8%,劃分花盆尺寸的測量誤差小于3%。同時其解析了生菜15個靜態性狀和動態性狀,與人工測量值進行擬合2達0.88,實現了生菜生長狀況監測。相較于傳統機器學習,深度學習在卷積網絡中具有多個隱藏層,每層連續對圖像執行簡單的操作,從而提高了其識別分類和預測能力,通常具有更高的準確率、精確率和召回率[116-118]。但目前公開可用的植物表型數據集仍然十分有限,無法通過遷移學習方法提高模型性能、減少數據搜集時間和訓練時間。此外,環境因素、成像角度、葉片遮擋及背景噪聲等問題均在一定程度上影響圖像數據質量,對訓練結果準確率具有較大影響。因此,應用于植物表型圖像解析的深度學習模型應具有較強的魯棒性和泛化能力。
為進行高效的種質資源鑒定,高通量、自動化、準確解析海量表型原始圖像數據,獲取感興趣的表型信息具有重要意義。深度學習在提高植物表型解析準度與通量,擴展表型性狀數量方面蘊藏著深遠前景。因此,進一步提升針對不同成像方式的圖像數據的定制化表型解析算法,突破多尺度、多維度、多模態表型數據之間的融合解析,升級應用于海量表型數據分析挖掘的硬件與軟件系統,構建人機友好交互的可視化表型分析平臺是未來的研究方向與必然趨勢。
傳統的植物表型數據管理大多是針對結構化的數字類型及字符串類型數據的管理,通過常見的關系型數據庫即可實現此類數據的高效存儲、查詢與維護。而采用高通量表型平臺采集表型信息將會產生諸如圖像、點云、光譜等大量復雜且非結構化的數據。此類數據格式不一、長度各異,利用傳統數據庫的二維邏輯表現數據并不方便。如何有效管理類型各異的海量表型數據,進而實現數據整合與共享,推動種質資源評估和多重組學分析進一步發展是當今研究的熱點與難點。
而隨著計算機技術的日新月異,針對非結構化植物表型數據構建數據庫,以實現標準化與集成化的數據管理是行之有效的解決方案。植物表型數據庫采用計算機硬件與軟件技術,對各類非結構化數據添加充足的注釋并儲存為標準化文件格式,進而將多個不同來源的數據集有效整合鏈接在一起,便于數據的檢索、管理與共享,打破信息孤島。
近年來,多樣的植物表型組學數據庫及管理系統得到開發與使用,助力推動全球作物育種改良、種質資源評估和作物產量提升的研究,如表5所示。雖然表型數據庫的建立使數據源數量和多樣性增加,但每個數據庫間相互獨立,阻礙了表型大數據之間的比較、組合與集成。對數據創建應用程序編程接口是解決這一瓶頸的有效途徑。如Selby等[119]設計的植物育種應用程序編程接口BrAPI,通過構建Web服務標準與規范,促進育種應用程序之間的互操作性,使客戶端應用程序可以依靠標準接口實現與任何BrAPI數據源的集成。
目前,數據庫通常可按照數據對象組織方式劃分為結構化數據庫和非結構化數據庫;按照數據處理場景劃分為事務性數據庫、分析型數據庫和HTAP數據庫;按照數據分布方式劃分為集中式數據庫和分布式數據庫[120-122]。本文基于數據分布方式,將現有主流植物表型數據庫劃分為集中式植物表型數據庫和分布式植物表型數據庫分別闡述。

表5 典型植物表型數據庫
2.2.1 集中式植物表型數據庫
集中式植物表型數據庫作為一種傳統數據庫類型,是表型數據被數據庫實例集中管理且不與其他計算機系統交互的數據庫系統。
如Reynolds等構建的如圖3所示的小麥表型數據管理平臺CropSight,基于云端服務器和分布式設備對表型數據進行集中式實時存儲,為表型分析和農業決策提供了先進手段[123]。此外,該平臺通過存儲歷史試驗的地理、環境及傳感器信息,可進行作物多站點多年數據的比較分析。如圖4所示的數據集成管理和信息系統(DMIS)考慮到作物生長發育過程中對時間與空間的依賴性,基于動態PostgreSQL數據庫建立能夠存儲和管理包括圖像數據的CPED數據庫,并使時間與地理坐標自動鏈接到所有數據,從而精確解釋與環境相關的表型性狀數據[124]。
2.2.2 分布式植物表型數據庫
隨著表型數據的指數級增長與數據庫技術的不斷革新,分布式存儲技術與系統成為表型數據庫的主流選擇[129]。分布式植物表型數據庫由多個位置上的多臺計算機構成,通過將表型數據分散存儲到多個通過網絡連接的數據存儲節點上,實現了更大的存儲容量與并發訪問量。同時,其可根據需要增減結點,個別結點發生故障時仍可降級工作,數據分散管理、統一協調,具有堅固性強、可靠性高、可擴充性好且自治性優等特點[130]。

注:A:CropSight方便用戶使用有線(即以太網電纜)或無線連接(如WiFi網絡)與分布式表型設備進行交互;CropSight 客戶端支持遠程控制和板載數據管理。B:用戶可以通過集中式CropSight服務器近乎實時地連接、監控和管理試驗;通過專用網絡,CropSight 后端服務器在SQL數據庫中整理和集成基于傳感器的大規模表型數據集。
注:用戶通過瀏覽器對服務器上的應用程序進行身份驗證和訪問。系統組件安裝在Dockers中,并通過HTTP相互通信。客戶端在網絡層中本地化,數據層包括PostgreSQ和PostGIS數據庫組件,GeoServer和中間件組成的服務層連接客戶端應用程序和數據庫。
Note: Users authenticate and access the application on the server via browsers. The system components are installed in Dockers and communicate with each other via HTTP. The GUI (Client) is localized in the Weblayer. The PostgreSQL and PostGIS database components in the Datalayer. The GeoServer and a Middleware are acting in the Servicelayer, connecting the client application and the database.
圖4 數據集成管理和信息系統(DMIS)體系結構圖[124]
Fig.4 System architecture of Data Management and Information System (DMIS)[124]
數據庫Planteome是一個包含植物表型組學、基因組學和遺傳學數據的可免費訪問的共享型平臺。為實現數據格式的標準化,其提供了一套公開可用、相互關聯的參考本體,并采用參考本體術語對95個植物的表型性狀數據、基因表達數據等進行注釋[125]。應用于植物基因組學與表型組學研究的數據存儲庫PGP涵蓋了高通量表型平臺采集的圖像數據、基因分型數據、質譜數據等各類跨域數據集,且提供對其數據的訪問功能,滿足可發現,可訪問,可互操作,可重用的FAIR數據原則[126]。如圖5所示的開源表型混合信息系統(PHIS)采用本體驅動架構實現來自受控環境和野外環境下的多源、多尺度植物表型數據的集成、管理、共享與可視化,同時其可通過Web服務與外部數據庫進行互操作[127]。類似地,植物表型組學數據存儲庫GnpIS可存儲包括環境數據的田間與溫室試驗數據,并能夠與其他數據存儲庫進行互操作[128]。
挖掘并解析高通量表型平臺采集的植物表型數據是種質資源研究的有效手段。隨著多尺度、多生境、多源異構的表型數據的不斷積累,提升數據管理技術迫在眉睫[131]。云存儲技術為植物表型大數據的存儲、管理與共享提供了新思路。如Debauche等將云基礎設施鏈接到應用程序托管平臺,近乎實時地收集、存儲和處理大量與時間序列相關的二維、三維和高光譜圖像數據,并確保了研究團隊之間交換、共享和訪問數據的同時數據的可追溯性、隱私性和安全性[132]。因此,為提高數據傳輸、存儲與解析效率,推動數據檢索、追溯與訪問的便利化,應基于“云技術”等數據存儲管理手段,著力建設大型綜合性植物表型標準數據庫與平臺,促進表型組學大數據共享與協同交叉合作研究。

注:PHIS由5個主要組件組成,這些組件以不同的層構建,其中包括Web用戶界面,數據和知識存儲層,Web服務層,智能層和科學計算和工作流層。
規模化環境可控的室內高通量種質資源表型平臺集成了不斷發展的無損成像技術、表型圖像數據解析技術、海量多源異構表型數據管理技術,是未來高通量種質資源鑒定與評估的關鍵助推力,也為基因型-表型-環境融合育種新模式提供了可行性方案與工具[29]。但目前,其在設計研發構建、圖像獲取解析、數據管理共享等方面仍然存在諸多問題和挑戰亟待完善與解決。
目前國內外研發的各類室內高通量種質資源表型平臺可以實現自動化、高通量、全生育期的植物表型數據獲取。但表型平臺的測量精度會受到環境變化、傳送帶移動、葉片遮擋等因素的影響,且平臺建設安裝、運行維護成本高,限制了大部分科研單位對植物表型、種質資源鑒定及育種改良的研究。此外,傳送帶式和軌道式表型平臺使用區域擴展性低,靈活性較差[28]。室內表型機器人雖能夠有效提升表型獲取的便捷性與吞吐量,但目前仍處于研發初期,在算法、控制器及傳感器等方面有較大改善空間。
同時,現有表型平臺采用的數據傳輸方式大多為硬盤讀寫,限制了實時查看與解析能力,通過整合在線傳輸技術,提高傳輸效率是改善用戶體驗、提高平臺可用性的有效措施。因此,為符合大多數科研機構及實驗室對表型平臺的需求,提升植物表型信息獲取的靈活性、準確性和高效性,亟待研發改進高精度、多樣化、便捷式、低成本的室內高通量種質資源表型平臺。
人工智能、深度學習等計算機技術的高速發展推動著植物表型圖像數據解析技術進入新紀元,但其需要足夠多的數據量和足夠長的訓練時間。由于公開植物表型數據集的缺乏,現有訓練模型通常不具備較強的魯棒性和泛化能力。此外,深度學習雖對海量表型數據具有強大的特征提取與分類預測的能力,但其基于神經網絡提取的特征通常缺乏生物學意義的解釋。未來應注重窺視“黑匣子”并了解神經網絡決策過程,打破“信息瓶頸”,提升特征可解釋性,從而與已識別特征相關聯,進一步提高挖掘數據能力。
對于不同表型平臺及其所搭載的不同傳感器獲取的多尺度、多生境、多模態和多維度的表型信息,目前的解析技術大多只能分析單個尺度、維度的表型數據,或者對多維度表型數據解析的結果進行簡單融合與分析,數據整合效率較低,挖掘表型性狀信息有限[7]。因此,為更高精度、高效率、高通量的識別、分類、評估和預測植物表型性狀,亟待創新植物表型數據深度融合解析技術,以建立表型-基因型-環境信息之間、不同傳感器之間的表型數據紐帶,加強表型信息整合提取的深度與廣度。
隨著高通量種質資源表型平臺的研發與應用,各類非結構化表型數據不斷積累,植物表型標準化數據庫成為數據管理的主要解決方案。但目前構建的表型數據庫大多規模較小,彼此獨立,挖掘潛力有限,各研究團隊之間的表型信息難以高效訪問與共享。且由于缺乏統一的表型數據標準與規范體系,不同表型平臺采集的數據在命名、格式、精度、標注、完整性等各方面大相徑庭,增大了數據解析、存儲、傳輸與管理的難度與成本。
盡管FAIR數據原則已被提議作為表型數據管理共享的標準并被普遍接受,但由于不同國家和不同研究團隊試驗獲取的表型數據缺乏可訪問性,一定程度上阻礙了數據標準的建立和開放。而國際植物表型網絡IPPN、歐洲植物表型網絡EPPN、北美植物表型網絡NAPPA等植物表型研究組織和相關機構網絡的發展與壯大有望為實現表型數據的標準共享化提供途徑與可能[85]。因此,為推動作物育種研究和植物表型組學發展,促進全球研究團隊與機構交叉合作,亟待建設一套植物表型數據標準體系與一個存儲、處理、開放和共享的綜合性植物表型大數據平臺。
綜上所述,室內高通量種質資源表型平臺自動化、規模化獲取、解析與管理植物表型信息,彌補了基因組數據挖掘對表型數據的迫切需求,對種質資源評估具有不可替代的重要作用。為推動表型平臺建設和表型數據解析管理的進一步發展,應打破表型組學單一領域研究的壁壘,促進基因組學、遺傳學、表型組學等多重組學和多學科的交叉協作研究,以實現植物表型大數據的價值最大化。
[1] 王曉鳴,邱麗娟,景蕊蓮,等. 作物種質資源表型性狀鑒定評價:現狀與趨勢[J]. 植物遺傳資源學報,2022,23(1):12-20.
Wang Xiaoming, Qiu Lijuan, Jing Ruilian, et al. Evaluation on phenotypic traits of crop germplasm: Status and development[J]. Journal of Plant Genetic Resources, 2022, 23(1): 12-20. (in Chinese with English abstract)
[2] Bohra A, Kilian B, Sivasankar S, et al. Reap the crop wild relatives for breeding future crops[J]. Trends in Biotechnology, 2021, 40(4): 412-431.
[3] 張鳳蘭. 我國蔬菜種業發展成效和趨勢[J]. 蔬菜,2022,41(5):1-5.
Zhang Fenglan. The development effect and trend of vegetable seed industry in China[J]. Vegetables, 2022, 41(5): 1-5. (in Chinese with English abstract)
[4] 張雪松,蘇彥斌,陳小文,等. 我國植物種質資源的搜集、保護與發展[J]. 中國野生植物資源,2022,41(3):96-102.
Zhang Xuesong, Su Yanbin, Chen Xiaowen, et al. Collection, conservation and development of plant germplasm resources in China[J]. China Wild Plant Resources, 2022, 41(3): 96-102. (in Chinese with English abstract)
[5] Reynolds M, Atkin O K, Bennett M, et al. Addressing research bottlenecks to crop productivity[J]. Trends in Plant Science, 2021, 26(6): 607-630.
[6] Breman E, Ballesteros D, Castillo-Lorenzo E, et al. Plant diversity conservation challenges and prospects: The perspective of botanic gardens and the millennium seed bank[J]. Plants, 2021, 10(11): 2371.
[7] 趙春江. 植物表型組學大數據及其研究進展[J]. 農業大數據學報,2019,1(2):5-18.
Zhao Chunjiang. Big data of plant phenomic and its research progress[J]. Journal of Agricultural Big Data, 2019, 1(2): 5-18. (in Chinese with English abstract)
[8] Sobkowiak S, Janiszewska M, Stefańczyk E, et al. Quantitative trait loci for resistance to potato dry rot caused by fusarium sambucinum[J]. Agronomy, 2022, 12(1): 203.
[9] Amas J, Anderson R, Edwards D, et al. Status and advances in mining for blackleg (leptosphaeria maculans) quantitative resistance (QR) in oilseed rape (brassica napus)[J]. Theoretical and Applied Genetics, 2021, 134(10): 3123-3145.
[10] Jasani M D, Kamdar J H, Bera S, et al. Novel and stable major QTLs conferring resistance to peanut bud necrosis disease and identification of resistant high yielding peanut breeding lines[J]. Euphytica, 2021, 217(6): 1-13.
[11] Chen D, Neumann K, Friedel S, et al. Dissecting the phenotypic components of crop plant growth and drought responses based on high-throughput image analysis[J]. The Plant Cell, 2014, 26(12): 4636-4655.
[12] 張慧春,周宏平,鄭加強,等. 植物表型平臺與圖像分析技術研究進展與展望[J]. 農業機械學報,2020,51(3):1-17.
Zhang Huichun, Zhou Hongping, Zheng Jiaqiang, et al. Research progress and prospect of plant phenotyping platform and image analysis technology[J]. Transactions of the Chinese Society for Agricultural Machinery, 2020, 51(3): 1-17. (in Chinese with English abstract)
[13] Huang Y, Shang M, Liu T, et al. High-throughput methods for genome editing: the more the better[J]. Plant Physiology, 2022, 188(4): 1731-1745.
[14] Campos M D, Félix M R, Patanita M, et al. High throughput sequencing unravels tomato-pathogen interactions towards a sustainable plant breeding[J]. Horticulture Research, 2021, 8(1): 171.
[15] Huang Y, Liu Y, Liu C, et al. Prospects and challenges of epigenomics in crop improvement[J]. Genes & Genomics, 2021, 44(3): 251-257.
[16] Gerland P, Raftery A E, ?ev?íková H, et al. World population stabilization unlikely this century[J]. Science, 2014, 346(6206): 234-237.
[17] Deery D M, Rebetzke G J, Jimenez-Berni J A, et al. Methodology for high-throughput field phenotyping of canopy temperature using airborne thermography[J]. Frontiers in Plant Science, 2016, 7: 1808.
[18] McCouch S, Baute G J, Bradeen J, et al. Feeding the future[J]. Nature, 2013, 499(7456): 23-24.
[19] Rahaman M, Ahsan M, Chen M. Data-mining techniques for image-based plant phenotypic traits identification and classification[J]. Scientific Reports, 2019, 9(1): 1-11.
[20] Prasanna B M, Araus J L, Crossa J, et al. High-throughput and Precision Phenotyping for Cereal Breeding Programs[M]. Berlin: Springer, 2013: 341-374.
[21] Granier C, Vile D. Phenotyping and beyond: Modelling the relationships between traits[J]. Current Opinion in Plant Biology, 2014, 18: 96-102.
[22] 程曼,袁洪波,蔡振江. 田間作物高通量表型信息獲取與分析技術研究進展[J]. 農業機械學報,2020,51(S1):314-324.
Cheng Man, Yuan Hongbo, Cai Zhenjiang. Review of field-based information acquisition and analysis of high-throughput phenotyping[J].Transactions of the Chinese Society of Agricultural Machinery, 2020, 51(S1): 314-324. (in Chinese with English abstract)
[23] Joshi S, Thoday-Kennedy E, Daetwyler H D, et al. High-throughput phenotyping to dissect genotypic differences in safflower for drought tolerance[J]. PLoS One, 2021, 16(7): e0254908.
[24] Dissanayake R, Kahrood H V, Dimech A M, et al. Development and application of image-based high-throughput phenotyping methodology for salt tolerance in lentils[J]. Agronomy, 2020, 10(12): 1992.
[25] Pieruschka R, Schurr U. Plant phenotyping: Past, present, and future[J]. Plant Phenomics, 2019, 2019: 7507131.
[26] Roitsch T, Cabrera-Bosquet L, Fournier A, et al. New sensors and data-driven approaches: A path to next generation phenomics[J]. Plant Science, 2019, 282: 2-10.
[27] Singh A, Jones S, Ganapathysubramanian B, et al. Challenges and opportunities in machine-augmented plant stress phenotyping[J]. Trends in Plant Science, 2021, 26(1): 53-69.
[28] 徐凌翔,陳佳瑋,丁國輝,等. 室內植物表型平臺及性狀鑒定研究進展和展望[J]. 智慧農業,2020,2(1):23-42.
Xu Lingxiang, Chen Jiawei, Ding Guohui, et al. Indoor phenotyping platforms and associated trait measurement: Progress and prospects[J]. Smart Agriculture, 2020, 2(1): 23-42. (in Chinese with English abstract)
[29] Yang W, Feng H, Zhang X, et al. Crop phenomics and high-throughput phenotyping: Past decades, current challenges, and future perspectives[J]. Molecular Plant, 2020, 13(2): 187-214.
[30] 蘇寶峰,劉昱麟,黃彥川,等. 群體小麥條銹病發病動態無人機遙感監測方法[J]. 農業工程學報,2021,37(23):127-135.
Su Baofeng, Liu Yulin, Huang Yanchuan, et al. Analysis for stripe rust dynamics in wheat population using UAV remote sensing[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2021, 37(23): 127-135. (in Chinese with English abstract)
[31] 盧少志. 田間作物表型檢測平臺設計與試驗[D]. 武漢:華中農業大學,2021.
Lu Shaozhi. Design and Experiment of Field Crop Phenotype Detection Platform[D]. Wuhan: Huazhong Agricultural University, 2021. (in Chinese with English abstract)
[32] 劉建剛,趙春江,楊貴軍,等. 無人機遙感解析田間作物表型信息研究進展[J]. 農業工程學報,2016,32(24):98-106.
Liu Jiangang, Zhao Chunjiang, Yang Guijun, et al. Review of field-based phenotyping by unmanned aerial vehicle remote sensing platform[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2016, 32(24): 98-106. (in Chinese with English abstract)
[33] 胡偉娟,傅向東,陳凡,等. 新一代植物表型組學的發展之路[J]. 植物學報,2019,54(5):558.
Hu Weijuan, Fu Xiangdong, Chen Fan, et al. A path to next generation of plant phenomics[J]. Chinese Bulletin of Botany, 2019, 54(5): 558. (in Chinese with English abstract)
[34] Langstroff A, Heuermann M C, Stahl A, et al. Opportunities and limits of controlled-environment plant phenotyping for climate response traits[J]. Theoretical and Applied Genetics, 2021, 135(1): 1-16.
[35] Virlet N, Sabermanesh K, Sadeghi-Tehran P, et al. Field Scanalyzer: An automated robotic field phenotyping platform for detailed crop monitoring[J]. Functional Plant Biology, 2016, 44(1): 143-153.
[36] Murman J N. Flex-Ro: A Robotic High Throughput Field Phenotyping System[D]. Lincoln: University of Nebraska-Lincoln, 2019.
[37] Shafiekhani A, Kadam S, Fritschi F B, et al. Vinobot and vinoculer: Two robotic platforms for high-throughput field phenotyping[J]. Sensors, 2017, 17(1): 214.
[38] Messina G, Modica G. Applications of UAV thermal imagery in precision agriculture: State of the art and future research outlook[J]. Remote Sensing, 2020, 12(9): 1491.
[39] Zheng C, Abd-Elrahman A, Whitaker V. Remote sensing and machine learning in crop phenotyping and management, with an emphasis on applications in strawberry farming[J]. Remote Sensing, 2021, 13(3): 531.
[40] Jin X, Zarco-Tejada P J, Schmidhalter U, et al. High-throughput estimation of crop traits: A review of ground and aerial phenotyping platforms[J]. IEEE Geoscience and Remote Sensing Magazine, 2020, 9(1): 200-231.
[41] Candiago S, Remondino F, De Giglio M, et al. Evaluating multispectral images and vegetation indices for precision farming applications from UAV images[J]. Remote Sensing, 2015, 7(4): 4026-4047.
[42] Shin Y K, Bhandari S R, Cho M C, et al. Evaluation of chlorophyll fluorescence parameters and proline content in tomato seedlings grown under different salt stress conditions[J]. Horticulture, Environment, and Biotechnology, 2020, 61(3): 433-443.
[43] Li D, Quan C, Song Z, et al. High-throughput plant phenotyping platform (HT3P) as a novel tool for estimating agronomic traits from the lab to the field[J]. Frontiers in Bioengineering and Biotechnology, 2021, 8: 623705.
[44] Cheng J C, Lertpiriyapong K, Wang S, et al. The role of the Arabidopsis ELD1 gene in cell development and photomorphogenesis in darkness[J]. Plant Physiology, 2000, 123(2): 509-520.
[45] Pineda M, Pérez-Bueno M L, Paredes V, et al. Use of multicolour fluorescence imaging for diagnosis of bacterial and fungal infection on zucchini by implementing machine learning[J]. Functional Plant Biology, 2017, 44(6): 563-572.
[46] Wendt T, Holme I, Dockter C, et al. HvDep1 is a positive regulator of culm elongation and grain size in barley and impacts yield in an environment-dependent manner[J]. PLoS One, 2016, 11(12): e0168924.
[47] Koc A, Odilbekov F, Alamrani M, et al. Predicting yellow rust in wheat breeding trials by proximal phenotyping and machine learning[J]. Plant Methods, 2022, 18(1): 1-11.
[48] Aboutalebi M, Torres-Rua A F, McKee M, et al. Incorporation of unmanned aerial vehicle (UAV) point cloud products into remote sensing evapotranspiration models[J]. Remote Sensing, 2019, 12(1): 50.
[49] Babst B A, Gao F, Acosta-Gamboa L M, et al. Three NPF genes in Arabidopsis are necessary for normal nitrogen cycling under low nitrogen stress[J]. Plant Physiology and Biochemistry, 2019, 143: 1-10.
[50] LemnaTec GmbH. HyperAlxpert[Z/OL]. (2018)[2022-05-25]. https://www.lemnatec.com/products-and-solutions/hyperaixpert/.
[51] Czedik‐Eysenberg A, Seitner S, Güldener U, et al. The ‘PhenoBox’: A flexible, automated, open‐source plant phenotyping solution[J]. New Phytologist, 2018, 219(2): 808-823.
[52] Hu X, Li X Y, Li Z C, et al. Linking 3-D soil macropores and root architecture to near saturated hydraulic conductivity of typical meadow soil types in the Qinghai Lake Watershed, northeastern Qinghai-Tibet Plateau[J]. Catena, 2020, 185: 104287.
[53] Das Choudhury S, Samal A, Awada T. Leveraging image analysis for high-throughput plant phenotyping[J]. Frontiers in Plant Science, 2019, 10: 508.
[54] 丁小明. 溫室環境下植物表型研究平臺[J]. 農業工程技術,2019,39(7):82-85.
Ding Xiaoming. Plant phenotype research platform in greenhouse environment[J]. Agricultural Engineering Technology, 2019, 39(7): 82-85. (in Chinese with English abstract)
[55] Yang W, Guo Z, Huang C, et al. Combining high-throughput phenotyping and genome-wide association studies to reveal natural genetic variation in rice[J]. Nature Communications, 2014, 5(1): 1-9.
[56] Duan L, Han J, Guo Z, et al. Novel digital features discriminate between drought resistant and drought sensitive rice under controlled and field conditions[J]. Frontiers in Plant Science, 2018, 9: 492.
[57] Tisné S, Serrand Y, Bach L, et al. Phenoscope: An automated large‐scale phenotyping platform offering high spatial homogeneity[J]. The Plant Journal, 2013, 74(3): 534-544.
[58] Guo Q, Wu F, Pang S, et al. Crop 3D: A LiDAR based platform for 3D high-throughput crop phenotyping[J]. Science China Life Sciences, 2018, 61(3): 328-339.
[59] Wang L, Liu F, Hao X, et al. Identification of the QTL-allele system underlying two high-throughput physiological traits in the Chinese soybean germplasm population[J]. Frontiers in Genetics, 2021, 12: 600444.
[60] Bao Y, Zarecor S, Shah D, et al. Assessing plant performance in the Enviratron[J]. Plant Methods, 2019, 15(1): 1-14.
[61] Piovesan A, Vancauwenberghe V, van De Looverbosch T, et al. X-ray computed tomography for 3D plant imaging[J]. Trends in Plant Science, 2021, 26(11): 1171-1185.
[62] Hou L H, Gao W, Weng Z H, et al. Use of X-ray tomography for examining root architecture in soils[J]. Geoderma, 2022, 405: 115405.
[63] Kurogane T, Tamaoki D, Yano S, et al. Visualization of Arabidopsis root system architecture in 3D by refraction-contrast X-ray micro-computed tomography[J]. Microscopy, 2021, 70(6): 536-544.
[64] Allen L H, Boote K J, Jones J W, et al. Sunlit, controlled‐environment chambers are essential for comparing plant responses to various climates[J]. Agronomy Journal, 2020, 112(6): 4531-4549.
[65] Jez J M, Topp C N, Yao L, et al. Recent developments and potential of robotics in plant eco-phenotyping[J]. Emerging Topics in Life Sciences, 2021, 5(2): 289-300.
[66] Das Choudhury S, Bashyam S, Qiu Y, et al. Holistic and component plant phenotyping using temporal image sequence[J]. Plant Methods, 2018, 14(1): 1-21.
[67] Marchetti C F, Ugena L, Humplík J F, et al. A novel image-based screening method to study water-deficit response and recovery of barley populations using canopy dynamics phenotyping and simple metabolite profiling[J]. Frontiers in Plant Science, 2019, 10: 1252.
[68] Paul K, Sorrentino M, Lucini L, et al. Understanding the biostimulant action of vegetal-derived protein hydrolysates by high-throughput plant phenotyping and metabolomics: A case study on tomato[J]. Frontiers in Plant Science, 2019, 10: 47.
[69] Fang W, Feng H, Yang W, et al. High-throughput volumetric reconstruction for 3D wheat plant architecture studies[J]. Journal of Innovative Optical Health Sciences, 2016, 9(5): 1650037.
[70] Xiong X, Yu L, Yang W, et al. A high-throughput stereo-imaging system for quantifying rape leaf traits during the seedling stage[J]. Plant Methods, 2017, 13(1): 1-17.
[71] Zhang X, Huang C, Wu D, et al. High-throughput phenotyping and QTL mapping reveals the genetic architecture of maize plant growth[J]. Plant Physiology, 2017, 173(3): 1554-1564.
[72] Ma D, Carpenter N, Amatya S, et al. Removal of greenhouse microclimate heterogeneity with conveyor system for indoor phenotyping[J]. Computers and Electronics in Agriculture, 2019, 166: 104979.
[73] Hassanijalilian O, Igathinathane C, Doetkott C, et al. Chlorophyll estimation in soybean leaves infield with smartphone digital imaging and machine learning[J]. Computers and Electronics in Agriculture, 2020, 174: 105433.
[74] Pandey P, Dakshinamurthy H N, Young S N. Frontier: Autonomy in detection, actuation, and planning for robotic weeding systems[J]. Transactions of the ASABE, 2021, 64(2): 557-563.
[75] Yan B, Fan P, Lei X, et al. A real-time apple targets detection method for picking robot based on improved YOLOv5[J]. Remote Sensing, 2021, 13(9): 1619.
[76] Gerhards R, Andujar Sanchez D, Hamouz P, et al. Advances in site‐specific weed management in agriculture: A review[J]. Weed Research, 2022, 62(2): 123-133.
[77] Tang Y, Chen M, Wang C, et al. Recognition and localization methods for vision-based fruit picking robots: A review[J]. Frontiers in Plant Science, 2020, 11: 510.
[78] Atefi A, Ge Y, Pitla S, et al. Robotic technologies for high-throughput plant phenotyping: Contemporary reviews and future perspectives[J]. Frontiers in Plant Science, 2021, 12: 611940.
[79] Wu C, Zeng R, Pan J, et al. Plant phenotyping by deep-learning-based planner for multi-robots[J]. IEEE Robotics and Automation Letters, 2019, 4(4): 3113-3120.
[80] Schulz H, Baranska M. Identification and quantification of valuable plant substances by IR and Raman spectroscopy[J]. Vibrational Spectroscopy, 2007, 43(1): 13-25.
[81] Biskup B, Scharr H, Fischbach A, et al. Diel growth cycle of isolated leaf discs analyzed with a novel, high-throughput three-dimensional imaging method is identical to that of intact leaves[J]. Plant Physiology, 2009, 149(3): 1452-1461.
[82] Fan J, Zhang Y, Wen W, et al. The future of Internet of things in agriculture: Plant high-throughput phenotypic platform[J]. Journal of Cleaner Production, 2021, 280(1): 123651.
[83] Kim M, Lee C, Hong S, et al. High-throughput phenotyping methods for breeding drought-tolerant crops[J]. International Journal of Molecular Sciences, 2021, 22(15): 8266.
[84] Danilevicz M F, Bayer P E, Nestor B J, et al. Resources for image-based high-throughput phenotyping in crops and data sharing challenges[J]. Plant Physiology, 2021, 187(2): 699-715.
[85] Sun D, Robbins K, Morales N, et al. Advances in optical phenotyping of cereal crops[J]. Trends in Plant Science, 2021, 27(2): 191-208.
[86] Ninomiya S. High-throughput field crop phenotyping: Current status and challenges[J]. Breeding Science, 2022, 72(1): 3-18.
[87] Fernandes A F A, Dórea J R R, Rosa G J M. Image analysis and computer vision applications in animal sciences: An overview[J]. Frontiers in Veterinary Science, 2020, 7: 551269.
[88] Liu H, Bruning B, Garnett T, et al. Hyperspectral imaging and 3D technologies for plant phenotyping: From satellite to close-range sensing[J]. Computers and Electronics in Agriculture, 2020, 175: 105621.
[89] Mazis A, Choudhury S D, Morgan P B, et al. Application of high-throughput plant phenotyping for assessing biophysical traits and drought response in two oak species under controlled environment[J]. Forest Ecology and Management, 2020, 465: 118101.
[90] Arvidsson S, Pérez-Rodríguez P, Mueller-Roeber B. A growth phenotyping pipeline for Arabidopsis thaliana integrating image analysis and rosette area modeling for robust quantification of genotype effects[J]. New Phytologist, 2011, 191(3): 895-907.
[91] Padilla-Chacón D, Valdivia C B P, García-Esteva A, et al. Phenotypic variation and biomass partitioning during post-flowering in two common bean cultivars (L.) under water restriction[J]. South African Journal of Botany, 2019, 121: 98-104.
[92] Vadez V, Kholová J, Hummel G, et al. LeasyScan: A novel concept combining 3D imaging and lysimetry for high-throughput phenotyping of traits controlling plant water budget[J]. Journal of Experimental Botany, 2015, 66(18): 5581-5593.
[93] Klukas C, Chen D, Pape J M. Integrated analysis platform: an open-source information system for high-throughput plant phenotyping[J]. Plant Physiology, 2014, 165(2): 506-518.
[94] Zhou J, Applegate C, Alonso A D, et al. Leaf-GP: An open and automated software application for measuring growth phenotypes for arabidopsis and wheat[J]. Plant Methods, 2017, 13(1): 1-17.
[95] Minervini M, Giuffrida M V, Perata P, et al. Phenotiki: An open software and hardware platform for affordable and easy image-based phenotyping of rosette-shaped plants[J]. The Plant Journal, 2017, 90(1): 204-216.
[96] Gaggion N, Ariel F, Daric V, et al. ChronoRoot: High-throughput phenotyping by deep segmentation networks reveals novel temporal parameters of plant root system architecture[J]. GigaScience, 2021, 10(7): giab052.
[97] Kumar J P, Domnic S. Image based leaf segmentation and counting in rosette plants[J]. Information Processing in Agriculture, 2019, 6(2): 233-246.
[98] Hartmann A, Czauderna T, Hoffmann R, et al. HTPheno: An image analysis pipeline for high-throughput plant phenotyping[J]. BMC Bioinformatics, 2011, 12(1): 1-9.
[99] Vasseur F, Bresson J, Wang G, et al. Image-based methods for phenotyping growth dynamics and fitness components in Arabidopsis thaliana[J]. Plant Methods, 2018, 14(1): 1-11.
[100] 李寒,張漫,高宇,等. 溫室綠熟番茄機器視覺檢測方法[J]. 農業工程學報,2017,33(增刊1):328-334.
Li Han, Zhang Man, Gao Yu, et al. Green ripe tomato detection method based on machine vision in greenhouse[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2017, 33(Supp.1): 328-334. (in Chinese with English abstract)
[101] Nabwire S, Suh H K, Kim M S, et al. Application of artificial intelligence in phenomics[J]. Sensors, 2021, 21(13): 4363.
[102] Sun S, Cao Z, Zhu H, et al. A survey of optimization methods from a machine learning perspective[J]. IEEE Transactions on Cybernetics, 2019, 50(8): 3668-3681.
[103] Ghosal D, Das A, Dhal K G. A comparative study among clustering techniques for leaf segmentation in rosette plants[J]. Pattern Recognition and Image Analysis, 2022, 32(1): 129-141.
[104] Liang X, Ye J, Li X, et al. A high-throughput and low-cost maize ear traits scorer[J]. Molecular Breeding, 2021, 41(2): 1-16.
[105] Tian Y, Xie L, Wu M, et al. Multicolor fluorescence imaging for the early detection of salt stress in arabidopsis[J]. Agronomy, 2021, 11(12): 2577.
[106] 柴宏紅,邵科,于超,等.基于三維點云的甜菜根表型參數提取與根型判別[J]. 農業工程學報,2020,36(10):181-188.
Chai Honghong, Shao Ke, Yu Chao, et al. Extraction of phenotypic parameters and discrimination of beet root types based on 3D point cloud[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2020, 36(10): 181-188. (in Chinese with English abstract)
[107] Kar S, Purbey V K, Suradhaniwar S, et al. An ensemble machine learning approach for determination of the optimum sampling time for evapotranspiration assessment from high-throughput phenotyping data[J]. Computers and Electronics in Agriculture, 2021, 182: 105992.
[108] Ebersbach J, Khan N A, McQuillan I, et al. Exploiting high-throughput indoor phenotyping to characterize the founders of a structured B. napus breeding population[J]. Frontiers in Plant Science, 2021, 12: 780250.
[109] Zhou J, Fu X, Zhou S, et al. Automated segmentation of soybean plants from 3D point cloud using machine learning[J]. Computers and Electronics in Agriculture, 2019, 162: 143-153.
[110] 孫國祥,汪小旵,劉景娜,等. 基于相位相關的溫室番茄植株多模態三維重建方法[J]. 農業工程學報,2019,35(18):134-142.
Sun Guoxiang, Wang Xiaochan, Liu Jingna, et al. Multi-modal three-dimensional reconstruction of greenhouse tomato plants based on phase-correlation method[J]. Transactions of the Chinese Society of Agricultural Engineering(Transactions of the CSAE), 2019, 35(18): 134-142. (in Chinese with English abstract)
[111] Jiang Y, Li C. Convolutional neural networks for image-based high-throughput plant phenotyping: A review[J]. Plant Phenomics, 2020, 2020: 4152816.
[112] 汪小旵,吳忠賢,孫曄,等. 基于葉綠素熒光成像技術的番茄苗熱害脅迫智能識別方法[J]. 農業工程學報,2022,38(7):171-179.
Wang Xiaochan, Wu Zhongxian, Sun Ye, et al. Intelligent identification of heat stress in tomato seedlings based on chlorophyll fluorescence imaging technology[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2022, 38(7): 171-179. (in Chinese with English abstract)
[113] 岑海燕,朱月明,孫大偉,等. 深度學習在植物表型研究中的應用現狀與展望[J]. 農業工程學報,2020,36(9):1-16.
Cen Haiyan, Zhu Yueming, Sun Dawei, et al. Current status and future perspective of the application of deep learning in plant phenotype research[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2020, 36(9): 1-16. (in Chinese with English abstract)
[114] Misra T, Arora A, Marwaha S, et al. SpikeSegNet: A deep learning approach utilizing encoder-decoder network with hourglass for spike segmentation and counting in wheat plant from visual imaging[J]. Plant Methods, 2020, 16(1): 1-20.
[115] Du J, Lu X, Fan J, et al. Image-based high-throughput detection and phenotype evaluation method for multiple lettuce varieties[J]. Frontiers in Plant Science, 2020, 11: 563386.
[116] Arya S, Sandhu K S, Singh J. Deep learning: As the new frontier in high-throughput plant phenotyping[J]. Euphytica, 2022, 218(4): 1-22.
[117] Gutierrez A, Ansuategi A, Susperregi L, et al. A benchmarking of learning strategies for pest detection and identification on tomato plants for autonomous scouting robots using internal databases[J]. Journal of Sensors, 2019, 2019: 5219471.
[118] Flores P, Zhang Z, Igathinathane C, et al. Distinguishing seedling volunteer corn from soybean through greenhouse color, color-infrared, and fused images using machine and deep learning[J]. Industrial Crops and Products, 2021, 161: 113223.
[119] Selby P, Abbeloos R, Backlund J E, et al. BrAPI: An application programming interface for plant breeding applications[J]. Bioinformatics, 2019, 35(20): 4147-4155.
[120] Pitman N C A, Suwa T, Ulloa Ulloa C, et al. Identifying gaps in the photographic record of the vascular plant flora of the Americas[J]. Nature Plants, 2021, 7(8): 1010-1014.
[121] Singh G, Kuzniar A, Brouwer M, et al. Linked data platform for solanaceae species[J]. Applied Sciences, 2020, 10(19): 6813.
[122] Yao L, Ge Z. Industrial big data modeling and monitoring framework for plant-wide processes[J]. IEEE Transactions on Industrial Informatics, 2020, 17(9): 6399-6408.
[123] Reynolds D, Ball J, Bauer A, et al. CropSight: A scalable and open-source information management system for distributed plant phenotyping and IoT-based crop management[J]. Gigascience, 2019, 8(3): giz009.
[124] Honecker A, Schumann H, Becirevic D, et al. Plant, space and time-linked together in an integrative and scalable data management system for phenomic approaches in agronomic field trials[J]. Plant Methods, 2020, 16(1): 1-13.
[125] Cooper L, Meier A, Laporte M A, et al. The planteome database: An integrated resource for reference ontologies, plant genomics and phenomics[J]. Nucleic Acids Research, 2018, 46(D1): D1168-D1180.
[126] Arend D, Junker A, Scholz U, et al. PGP repository: A plant phenomics and genomics data publication infrastructure[J]. Database, 2016, 2016: baw033.
[127] Neveu P, Tireau A, Hilgert N, et al. Dealing with multi-source and multi-scale information in plant phenomics: The ontology-driven Phenotyping Hybrid Information System[J]. New Phytologist, 2019, 221(1): 588-601.
[128] Pommier C, Michotey C, Cornut G, et al. Applying FAIR principles to plant phenotypic data management in GnpIS[J]. Plant Phenomics, 2019, 2019: 1671403.
[129] 王肇康. 分布式圖處理若干算法與統一圖處理編程框架研究[D]. 南京:南京大學,2021.
Wang Zhaokang. Research on Several of Distributed Graph Processing Algorithms and A Unified Graph Programming Framework[D]. Nanjing: Nanjing University, 2021. (in Chinese with English abstract)
[130] 牟帥. 分布式事務并發控制關鍵技術研究[D]. 北京:清華大學, 2015.
Mu Shuai. Extract More Concurrency from Distributed Transactions[D]. Beijing: Tsinghua University, 2015. (in Chinese with English abstract)
[131] Jin S, Sun X, Wu F, et al. Lidar sheds new light on plant phenomics for plant breeding and management: Recent advances and future prospects[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2021, 171: 202-223.
[132] Debauche O, Mahmoudi S A, De Cock N, et al. Cloud architecture for plant phenotyping research[J]. Concurrency and Computation: Practice and Experience, 2020, 32(17): e5661.
Research progress and prospect of indoor high-throughput germplasm phenotyping platforms
He Yong1, Li Xiyao1, Yang Guofeng1, Yu Zeyu1, Yang Ningyuan1, Feng Xuping1,2※, Xu Lijia3
(1.,,310058,; 2.,,310058,; 3.,,625014,)
Germplasm resources have been the important material fundamentals to improve crop breeding. It is a high demand for the accurate and high-throughput acquisition of crop phenotype information to evaluate germplasm resources. The indoor high-throughput germplasm phenotyping platform can be expected to provide precise environmental regulation, and automatic and non-destructive imaging with high efficiency using phenotypic data acquisition, analysis, and management technology. There is also an efficient, integrated, and large-scale solution to the germplasm resource evaluation. A profound impact can be found in crop breeding improvement and high-quality development of the seed industry. According to the structural design and the movement pattern between the sensors, this review aims to evaluate the indoor high-throughput phenotyping platform in terms of four types, including the desktop, conveyor belt, orbital phenotyping platform, and greenhouse plant phenotyping robot. The acquisition of plant phenotype data was only the first step in phenotype research. The screening and identification of germplasm resources were then realized to extract the phenotypic traits from the original image data. The standardized storage of phenotypic data was conducted for the cross-scale and cross-dimensional trait analysis. Simultaneously, a systematic investigation was made on the indoor plant phenotypic data interpretation and management techniques in recent years. The raw image data of plant phenotype and software greatly contributed to the robust, accurate, and automatic phenotype analysis. The commonly-used phenotype raw data analysis mainly included classical statistical analysis, image processing, traditional machine learning, and deep learning. Among them, deep learning presented far-reaching prospects in the resolution and throughput of plant phenotypes, as well as a large number of phenotypic traits. In addition, the phenotypic information also generated large amounts of complex and unstructured data, such as images, point clouds, and spectra. The data often originated in a variety of formats and lengths. An effective solution was to build the database for the unstructured plant phenotype in the standardized and integrated data management. A variety of plant phenotype databases and systems were developed to promote global crop breeding, germplasm resource assessment, and crop yield. Finally, some challenges were summarized for the indoor high-throughput phenotyping platforms and data interpretation. Three perspectives were proposed for the plant phenotype research of germplasm resource evaluation. 1) It was an urgent need to develop the high-precision, diverse, convenient, and low-cost indoor high-throughput germplasm phenotyping platforms. 2) An urgent need for innovation was the fusion analysis to identify, classify, evaluate and predict the plant phenotypic traits. 3) A big data platform was also needed to be constructed to store, process, open, and share the plant phenotypic information.In conclusion, the indoor high-throughput phenotyping platform can greatly contribute to the phenotypic data in genomic data mining, and the evaluation of germplasm.Cross-collaborative research should be implemented in genomics, genetics, and phenomics, in order to promote the phenotyping platform and data analysis.
crops; plant phenotyping; indoor phenotyping platform; phenotypic data analysis and management; high-throughput; germplasm resource assessment
10.11975/j.issn.1002-6819.2022.17.014
S-1
A
1002-6819(2022)-17-0127-15
何勇,李禧堯,楊國峰,等. 室內高通量種質資源表型平臺研究進展與展望[J]. 農業工程學報,2022,38(17):127-141.doi:10.11975/j.issn.1002-6819.2022.17.014 http://www.tcsae.org
He Yong, Li Xiyao, Yang Guofeng, et al. Research progress and prospect of indoor high-throughput germplasm phenotyping platforms[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2022, 38(17): 127-141. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2022.17.014 http://www.tcsae.org
2022-05-25
2022-08-02
浙江省重點研發計劃項目(2021C02023);浙江省“領雁”研發攻關計劃項目(2022C02032)
何勇,博士,教授,研究方向為數字農業、農業物聯網、數字鄉村和智能農業裝備等。Email:yhe@zju.edu.cn
馮旭萍,博士,副研究員,研究方向為利用作物多尺度的光譜圖像信息結合深度學習等計算機算法實現作物表型的快速獲取。Email:fengxp@zju.edu.cn