王曉麗 胡乾浩 樊景超* 李 壯
(1.中國(guó)農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所,北京 100081;2.中國(guó)農(nóng)業(yè)科學(xué)院果樹(shù)研究所,遼寧 125100;3.國(guó)家農(nóng)業(yè)科學(xué)數(shù)據(jù)中心,北京 100081;4.農(nóng)業(yè)農(nóng)村部農(nóng)業(yè)大數(shù)據(jù)重點(diǎn)實(shí)驗(yàn)室,北京 100081)

數(shù)據(jù)庫(kù)(集)基本信息簡(jiǎn)介
氮素對(duì)蘋(píng)果樹(shù)的生長(zhǎng)發(fā)育、蘋(píng)果的營(yíng)養(yǎng)及產(chǎn)量等都有著非常重要的作用。準(zhǔn)確高效地估算蘋(píng)果樹(shù)中的氮元素含量是蘋(píng)果樹(shù)科學(xué)施肥的重要環(huán)節(jié),也是蘋(píng)果業(yè)優(yōu)質(zhì)生產(chǎn)的重要因素。盡管使用傳統(tǒng)方法監(jiān)測(cè)葉片氮含量的精度較高,但是破壞性較大,而且時(shí)效性較低,尤其是對(duì)于大規(guī)模的快速監(jiān)測(cè)挑戰(zhàn)性較高。
隨著光譜技術(shù)和圖像處理技術(shù)的發(fā)展,利用光譜和圖像分析等技術(shù)可建立植物的生化組分估測(cè)模型,從而達(dá)到快速無(wú)損檢測(cè)目的。國(guó)內(nèi)外很多學(xué)者收集了光譜、圖像和生化組分的數(shù)據(jù)集。Laura Rustioni等通過(guò)反射光譜法鑒定和鑒別葡萄礦物質(zhì)缺乏癥狀,對(duì)9 個(gè)葡萄品種不同處理的基部葉、幼葉和頂端葉進(jìn)行光譜采集,采集部位在葉脈、脈間和葉緣處,收集的光譜范圍在341 和1025nm 之間,總共945 個(gè)反射光譜[1]。徐娟等利用傅里葉變換紅外光譜(FTIR)和電感耦合等離子體質(zhì)譜(ICP-MS)對(duì)白色蠶豆和綠色蠶豆進(jìn)行研究,收集了蠶豆葉中的多種礦質(zhì)元素和光譜數(shù)據(jù)[2]。呂海鵬收集了131個(gè)普洱茶樣品的近紅外光譜數(shù)據(jù)和茶多酚含量等化學(xué)成分,建立了近紅外光譜定量分析模型[3]。孟慶龍等人通過(guò)400~1000nm 高光譜成像系統(tǒng)采集了120 個(gè)“富士”蘋(píng)果光譜圖像數(shù)據(jù)[4]。
在蘋(píng)果葉片光譜、圖像及氮含量數(shù)據(jù)收集和研究方面,安靜等采集了秋末86 組蘋(píng)果葉片光譜和氮含量數(shù)據(jù)集[5]。房賢一采集了4個(gè)物候期的蘋(píng)果樹(shù)冠光譜及代表性葉片氮素含量數(shù)據(jù)集[6]。李丙智等測(cè)定了不同蘋(píng)果品種350 個(gè)葉片自然光下的光譜反射率及對(duì)應(yīng)的72 個(gè)氮數(shù)據(jù)集[7]。夏雪等收集了國(guó)家蘋(píng)果資源圃中種植的170 余個(gè)品種8184 張?zhí)O果葉片圖像數(shù)據(jù)集,并通過(guò)數(shù)據(jù)論文發(fā)表[8],鄭艷梅等利用這些數(shù)據(jù)結(jié)合深度學(xué)習(xí)和引導(dǎo)濾波對(duì)蘋(píng)果葉片圖像進(jìn)行分割,為蘋(píng)果葉片幾何參數(shù)的測(cè)定提供了一種新的測(cè)量方法[9]。
從前人的相關(guān)工作來(lái)看,多數(shù)研究?jī)H獲取了蘋(píng)果葉片近紅外光譜數(shù)據(jù)、礦質(zhì)元素?cái)?shù)據(jù)和圖像數(shù)據(jù)的一種或兩種,同時(shí)測(cè)定近紅外光譜數(shù)據(jù)、氮元素及圖像數(shù)據(jù)的數(shù)據(jù)集較少,本研究以嘎啦、華紅、富士以及4種不同樹(shù)齡的寒富蘋(píng)果樹(shù)為例,于2015 年5 月18 日—7 月22 日,每隔一周采集了光譜、圖像和氮含量數(shù)據(jù),以期為廣大科研工作者從三個(gè)不同角度聯(lián)合進(jìn)行數(shù)據(jù)挖掘分析工作,進(jìn)一步提高使用非破壞性手段測(cè)定蘋(píng)果葉片營(yíng)養(yǎng)診斷的數(shù)據(jù)支撐能力,并為今后利用高空遙感技術(shù)開(kāi)展精準(zhǔn)果業(yè)生產(chǎn)提供基礎(chǔ)數(shù)據(jù)。
本研究選用果樹(shù)為遼寧興城,中國(guó)農(nóng)業(yè)科學(xué)院果樹(shù)研究所資源圃中嘎啦、華紅、富士以及分別于2007、2011、2012、2013 年定植的寒富,各隨機(jī)選取1株,每株樹(shù)選取樹(shù)冠外圍向陽(yáng)主枝作為目標(biāo)主枝,并選取基部、中部和頂部3個(gè)部分各5片共15個(gè)樣品。
考慮到該實(shí)驗(yàn)對(duì)果樹(shù)具有破壞性,因此本研究從新梢生長(zhǎng)期開(kāi)始,每周摘取一次葉片(共10 周:2016年5 月18 日—7 月22 日)。每次采集葉片后,將葉片15 個(gè)一組放置于干凈的袋子中(并做標(biāo)記),放入帶有冰塊的恒溫箱中,統(tǒng)一帶回實(shí)驗(yàn)室。在實(shí)驗(yàn)室將葉片洗凈并用專(zhuān)業(yè)濾紙將殘留的水吸干后待測(cè)。
本實(shí)驗(yàn)使用美國(guó)ASD(AnalyticalSpectralDevice)公司的FieldSpec3 便攜式光譜輻射計(jì)進(jìn)行光譜測(cè)量;該儀器的有效光譜范圍在350~2500 nm 之間,光譜分辨率為1nm。光譜儀需搭配Windows 系統(tǒng)環(huán)境的筆記本,并安裝配套的采集軟件。本實(shí)驗(yàn)使用Field‐SpecRS3(以下簡(jiǎn)稱(chēng)RS3)軟件進(jìn)行光譜采集、儀器優(yōu)化和白板校正等。為保證儀器狀態(tài)穩(wěn)定,開(kāi)機(jī)預(yù)熱時(shí)間不少于1 小時(shí)[10-11]。探頭為裸光纖,前視場(chǎng)角25°,測(cè)量時(shí)固定在樣品正上方10cm 處,垂直于葉片的正面;使用光譜儀配套的50W 鹵化燈作為室內(nèi)光源(約3100 K 色溫,模擬太陽(yáng)光),并距離樣品45cm 左右,45°的入射角;葉片正面朝上放置,以黑色不反光的棉布為背景[12]。
光譜的采集步驟如下:在確保光譜儀和筆記本電腦充滿(mǎn)電的情況下進(jìn)行。準(zhǔn)備好用于校正的白板。打開(kāi)光譜儀電源,然后再打開(kāi)電腦電源,并將電腦進(jìn)行網(wǎng)絡(luò)連接,確保電腦與儀器連接成功。啟動(dòng)RS3軟件,在“Control/adjustconfiguration”窗口上調(diào)整光譜平均值、暗電流平均(一般為60)和白板采集次數(shù)(一般為30)。在“Control/spectrum save”窗口中選擇存儲(chǔ)路徑、命名規(guī)則及其他內(nèi)容。測(cè)量時(shí),鏡頭首先對(duì)準(zhǔn)白板,點(diǎn)擊OPT 進(jìn)行優(yōu)化,此時(shí)光譜呈一條直線(xiàn);然后點(diǎn)擊WR 采集參比光譜,此時(shí)軟件進(jìn)入測(cè)量狀態(tài);最后,將鏡頭移向被測(cè)葉片,按空格鍵保存反射光譜。使用完畢需先關(guān)電腦,后關(guān)閉儀器。在測(cè)量過(guò)程中需注意:白板校準(zhǔn)時(shí)確保白板充滿(mǎn)探頭視場(chǎng);每隔10 min 進(jìn)行一次白板校正和優(yōu)化,每隔3~5 分鐘采集一次暗電流。每次采集10 次光譜數(shù)據(jù)求平均后存儲(chǔ)在指定文件夾生成1 條.asd 數(shù)據(jù),每個(gè)樣本采集10次,生成10 條數(shù)據(jù)。采集的數(shù)據(jù)格式為ASCII 文件,后期可通過(guò)ASD公司的ViewSpecPro軟件查看,并可轉(zhuǎn)化為.txt 等格式,按照約定的協(xié)議進(jìn)行數(shù)據(jù)分析讀取工作。
本實(shí)驗(yàn)采用Tecator 凱氏定氮儀法測(cè)定葉片全氮濃度,將采集的葉片用蒸餾水洗凈后,在105℃殺青10~15min,80℃下烘干。每次將不同樣品分三份分別粉碎,經(jīng)過(guò)消煮、蒸餾后,進(jìn)行滴定,三份結(jié)果平均后得到當(dāng)日每種樣品的氮元素平均含量。采集的數(shù)據(jù)以excel文件格式保存。
本實(shí)驗(yàn)使用尼康D90 型數(shù)碼相機(jī)和尼克爾鏡頭進(jìn)行葉片圖像數(shù)據(jù)采集。D90 采用了有效像素為1230 的DX 格式CMOS 傳感器;感應(yīng)器尺寸為23.6x15.8mm;感光度為200~3200;具有11點(diǎn)自動(dòng)對(duì)焦區(qū)域;快門(mén)時(shí)滯大約65 毫秒;具有測(cè)光控制和自動(dòng)D-Lighting 功能,可彌補(bǔ)圖片中的細(xì)節(jié)丟失;支持NEF、JPEG、AVI 圖片存儲(chǔ)格式,文件自動(dòng)編號(hào);文件最大尺寸4288像素×2848像素,最多可拍1850 張左右。
在采集葉片圖像時(shí),將葉片置于配有標(biāo)尺的黑色平板上,通過(guò)標(biāo)尺可測(cè)量葉片的寬度和長(zhǎng)度。為避免陰影產(chǎn)生,同時(shí)確保光照強(qiáng)度穩(wěn)定,分別在左右兩側(cè)架設(shè)一盞攝影燈。將相機(jī)無(wú)傾斜的置于距離葉片上方40cm 左右,并使用自動(dòng)曝光模式進(jìn)行拍攝。圖像格式為JPEG,尺寸為4288像素×2848像素[8]。
不同蘋(píng)果品種或樹(shù)齡的葉片光譜數(shù)據(jù)單獨(dú)保存為一個(gè)文件夾,每10 條連續(xù)的.asd 數(shù)據(jù)為同一樣本的光譜數(shù)據(jù),如:“001_20160518_01_01”~“001_20160518_01_10”為同一葉片的光譜數(shù)據(jù)。文件夾命名方式為“序號(hào)+品種名+日期”,每個(gè)光譜數(shù)據(jù)命名方式為“序號(hào)+品種名+日期+樣本編號(hào)+同一樣本光譜序號(hào)”。部分樣本示例如圖1所示。
蘋(píng)果葉片圖像數(shù)據(jù)中每個(gè)品種的圖像按日期保存在獨(dú)立的文件夾中,每張圖像代表一個(gè)葉片樣本。文件夾命名方式為“序號(hào)+品種名+日期”,每個(gè)圖片數(shù)據(jù)的命名方式為“序號(hào)+品種名+日期+序號(hào)”。部分樣本示例如圖2所示。
由于測(cè)量礦質(zhì)元素需要一定數(shù)量的葉片,因此同一品種每日的15 個(gè)葉片分3 組測(cè)試,求平均測(cè)得1 條礦質(zhì)元素?cái)?shù)據(jù),excel包含品種名稱(chēng)、采集日期和氮含量等6列,如表1所示。

表1 部分蘋(píng)果葉片氮含量數(shù)據(jù)表Tab.1 Data sheet of nitrogen content in some apple leaves
為確保數(shù)據(jù)質(zhì)量和可靠性,所有蘋(píng)果葉片均采集于國(guó)家級(jí)蘋(píng)果標(biāo)準(zhǔn)資源圃,由中國(guó)農(nóng)業(yè)科學(xué)院果樹(shù)研究所的專(zhuān)業(yè)人員進(jìn)行果樹(shù)品種鑒別、實(shí)驗(yàn)操作規(guī)范指導(dǎo)和礦質(zhì)元素?cái)?shù)據(jù)測(cè)量。采用國(guó)際通用的光譜采樣方法采集葉片近紅外光譜數(shù)據(jù)。采用高清相機(jī)進(jìn)行圖像采集,并使用國(guó)際通用的JPEG 格式進(jìn)行存儲(chǔ)。圖像采集時(shí)使用標(biāo)準(zhǔn)刻度尺作為參考,刻度單位為毫米,可為使用者提取葉片大小提供依據(jù)。
數(shù)據(jù)采集與整理過(guò)程中,采用人工核準(zhǔn)和儀器檢測(cè)結(jié)合的方式來(lái)控制元數(shù)據(jù)質(zhì)量。在人工核準(zhǔn)時(shí),如果發(fā)現(xiàn)某樣本葉片存在顏色異常、葉面或葉背有斑等情況,則認(rèn)為葉片樣本數(shù)據(jù)可疑。隨后,使用檢測(cè)儀器進(jìn)行確認(rèn),如檢測(cè)結(jié)果為帶病葉片,則將問(wèn)題樣本數(shù)據(jù)剔除。
不同蘋(píng)果葉片在形狀、顏色和尺寸等方面會(huì)展示不同的圖像信息,同時(shí)光譜和氮元素值也不同,因此在使用此數(shù)據(jù)集時(shí)可對(duì)光譜、圖像和礦質(zhì)元素之間的關(guān)系進(jìn)行分析研究,探索使用光譜和圖像分析礦質(zhì)元素含量的方法。本數(shù)據(jù)集是每隔一周測(cè)試,共10 周,可考慮加入時(shí)間元素進(jìn)行分析。另外,使用數(shù)據(jù)集時(shí)可以對(duì)不同品種以及同一品系類(lèi)別(寒富)中的不同樹(shù)齡進(jìn)行對(duì)比分析。
數(shù)據(jù)作者分工職責(zé)
王曉麗(1982—),女,河北欒城人,博士,助理研究員,主要從事果園數(shù)據(jù)獲取與分析研究。主要承擔(dān)工作:數(shù)據(jù)整理與分類(lèi)匯總。
胡乾浩(1993—),男,北京人,碩士,助理研究員,主要從事果園數(shù)據(jù)獲取與分析研究。主要承擔(dān)工作:光譜和圖像數(shù)據(jù)采集。
樊景超(1980—),男,遼寧沈陽(yáng)人,博士,副研究員,主要從事果園數(shù)據(jù)獲取與分析研究。主要承擔(dān)工作:總體方案設(shè)計(jì)與組織實(shí)施。
李 壯(1975—),男,吉林蛟縣人,博士,副研究員,主要從事果樹(shù)資源數(shù)據(jù)集成與共享研究。主要承擔(dān)工作:數(shù)據(jù)采集組織實(shí)施和氮元素?cái)?shù)據(jù)采集。
農(nóng)業(yè)大數(shù)據(jù)學(xué)報(bào)2020年4期