李玉萍 葉 露 梁偉紅 鄧春梅 劉燕群
(中國熱帶農業科學院科技信息研究所∕海南省熱帶作物信息技術應用研究重點實驗室 海南???71101)
隨著大數據、物聯網、云計算等技術的快速發展,數據資源建設越來越受各行業的重視。在農業領域,隨著我國對“三農”工作的高度重視,數據資源開發與應用已逐步參透到生產、加工、銷售各環節,而針對作物產業開展數據資源建設已成為產業發展的重要需求。芒果素有“熱帶果王”之美稱,與香蕉、葡萄、柑桔、蘋果齊名世界五大水果,在全球水果貿易中占有重要的位置。我國芒果栽培歷史悠久,早在唐代就開始從印度引種,經過多年的發展,芒果已發展成為我國熱區農業發展的支柱產業之一。在芒果產業較長的生產、管理、科研活動實踐中,產生并積累了大量的基礎數據和科學數據,這些數據是推動我國芒果產業發展和科技創新重要保障,因此加大對芒果產業數據資源的開發與利用,用數據帶動產業活力,以數據價值促進產業發展,已成為當前支撐我國芒果產業科技創新的必然趨勢。
我國芒果產業的數據來源廣泛,主要來自于科研院所、高等院校、政府管理部門、行業協會學會、生產經營主體等。
1.1.1 科研院所
科研院所是我國芒果科學數據的主要來源之一。據初步統計,目前從事芒果研究的科研院所大概有二十余個,主要分布在海南、廣西、廣東、云南、福建、四川、貴州等省(區)科研院所,包括中國熱帶農業科學院的南亞熱帶作物研究所、環境與植物保護研究所、熱帶作物品種資源研究所、科技信息研究所等;海南省農業科學院的熱帶果樹研究所、農產品加工設計研究所等;廣西農業科學院的植物保護研究所、園藝研究所、農產品加工研究所等,以及廣西亞熱帶作物研究所、廣西百色市農業科學研究所;廣東省農業科學院的果樹研究所、植物保護研究所等;云南省農業科學院的熱帶亞熱帶經濟作物研究所、熱區生態農業研究所,以及云南省熱帶作物科學研究所;福建省農業科學院的植物保護研究所、果樹研究所,以及福建省亞熱帶植物研究所、福建省熱帶作物科學研究所;四川省攀枝花市農林科學研究院、四川省攀枝花市農業科學研究所、四川省涼山州亞熱帶作物研究所等;貴州省亞熱帶作物科學研究所等;中國科學院華南植物研究所。這些研究機構中,有開展芒果基礎性研究,也有開展芒果應用研究,在研究工作中著重解決芒果生產中存在的重大問題。在科研和活動實踐過程中主要產生實驗(試驗)數據、檢測數據、觀測數據、調查數據等,以及論文、專利、標準等成果數據及報告、規劃等產業基礎數據。
1.1.2 高等院校
據“中國知網CNKI”檢索結果,從發表論文作者所屬機構統計來看,我國涉及芒果研究的高等院校中有20多所,主要包括:海南大學、廣西大學、中國農業大學、廣西中醫學院、廣西中醫藥大學、廣西醫科大學、廣東海洋大學、華南農業大學、廣東藥學院、云南農業大學、福建農林大學、貴州大學、西南農業大學、百色學院、右江民族醫學院、攀枝花學院、華中農業大學等。這些高等院校以教學任務和基礎科學研究為主,在活動和實踐過程主要產生實驗數據、觀測數據、調查數據、專利、學術(位)論文等,也是我國芒果科學數據的主要來源。
1.1.3 政府管理部門
我國農業農村部農墾局、熱區各省農業農村廳、商務廳等,以及(市、區、縣)農業局、農墾局、商務局、氣象局、物價局、統計局等管理部門,是我國芒果生產、流通、消費、政策法規、成果、統計、監測預警、氣象觀測數據、戰略發展報告等數據的主要來源。由于各部門都在不同范圍內收集相關信息數據,目前尚處于分散管理階段。
1.1.4 行業協會及組織團體
我國芒果主產省區成立了多個芒果相關協會。如,海南省除了有省級協會海南省芒果協會外,還有三亞芒果協會、昌江縣芒果協會、保亭縣半弓芒果行業協會等市縣級協會;廣西有百色市芒果協會、田東縣芒果行業協會、田陽縣東江芒果生產技術協會、田陽縣芒果協會等;四川有攀枝花市仁和芒果專業技術協會、仁和芒果專業技術協會、金河鄉金江村芒果協會、寧南縣芒果專業技術協會等;云南有華坪縣芒果專業技術協會、龍頭村芒果專業技術經濟合作協會等;貴州有望謨金煌芒果培育專業合作社、望謨縣平卜芒果種植農民專業合作社、興義市壩艾種養殖農民專業合作社、貞豐縣魯容種養殖專業合作社等。這些協會或組織作為政府與企業之間的橋梁,主要進行芒果生產、經營、技術指導和信息服務,開展新品種引進、新技術培訓和示范,組織內外經濟協作,此外也會關注并分析當地及銷地芒果產業和市場價格動態情況,因此這類協會組織也會產生芒果產業基礎數據、市場價格數據、銷售數據等。
1.1.5 其他
我國芒果的生產者、加工者、銷售者以及消費者,在從事相關活動中,也會產生如產量、面積、投入品使用量、加工量、價格、消費、成本等相關產業數據,這類數據和市場活動關系密切,但采集難度相對較大,需要深入一線做好調查和統計。此外網絡數據庫、網站、社交平臺等也是芒果數據的來源渠道。
1.2.1 資源豐富
我國芒果的數據資源極其豐富,包括產前、產中和產后各環節產生的各類數據。其中產前數據包括地塊、種子、種苗、農藥、化肥、農膜等;產中數據包括栽培、水肥管理、病蟲害防治等;產后數據主要包括采收、儲藏保鮮、加工、流通、市場銷售、貿易等。此外,還有產業鏈環節中的支撐基礎數據,如政策法規、科技文獻、專利、標準等[1]。
1.2.2 分布廣泛
我國芒果種植主要分布在海南、廣西、云南、四川、貴州等省區[2]。其中海南主要分布在三亞、東方、樂東、陵水、昌江等地;廣西主要分布在右江區、田陽、田東等地;云南主要分布在保山、臨滄、麗江、普洱、西雙版納、玉溪、紅河、元江等地;四川主要分布在攀枝花、安寧、會東、會理等地;貴州主要分布在望謨、冊亨、興義、貞豐、羅甸、安龍、關嶺等地。因此,芒果數據的來源地分散,分布非常廣泛,遍布熱區各地,數據的空間分布呈零星分散狀態,而且生產、儲藏、加工、流通、銷售等產前、產中、產后的各環節數據分別屬于不同的單位。
1.2.3 數據結構復雜多樣
伴隨著互聯網、大數據技術的快速發展,傳感器、移動終端、RFID射頻等快速推廣和應用,包括芒果在內的作物產業數據,在獲取的時間、空間、方式、范圍、力度等都發生很大變化[3]。數以萬計的農業數據不斷產生,數據結構越發復雜多樣[4],有結構化數據(農業生產、流通、消費數據等)、半結構化數據(農業種植圖像、視頻等)和非結構化數據(分析文檔等)。
芒果產業作為我國熱帶農業中具有競爭力的一個重要產業,數據資源建設支撐和服務產業發展顯得尤為重要。近年來,我國芒果數據資源開發和利用取得了一定的進展,常見的有各類系統、數據庫、綜合的網絡信息平臺及相關網站。
1.3.1 專家系統
2006年,陸玉英等人建立了集智能決策、農業科普、新技術成果、專家在線等內容的廣西芒果電腦農業專家系統,其中包括果園規劃、品種選擇、種植密度、修剪技術等決策模塊19個,規則500條,為廣西芒果生產提供產前、產中和產后的全程技術服務[5]。2012年,李貴利等應用模仿農業專家進行決策的計算機技術,開發建立了攀枝花市芒果農業專家系統。該系統由7個子系統組成,包含新品種介紹、管理技術、科研成果、視頻播放、決策系統等,將單項技術進行組裝,實現高層次的多項技術集成,通過數據庫決策樹算法進行數據查詢和挖掘,對需要解決的農業問題解答、解釋和判斷,提出決策建議[6]。2012年謝龍蓮等將案例推理和模糊推理技術相結合,研發出芒果病蟲害診斷系統,為農戶正確識別芒果病蟲害提供科學指導[7]。
1.3.2 專題信息系統
車秀芬等研發了集成氣象數據、芒果生育期數據、模型參數、結果計算及等級認證5個模塊的海南芒果氣象災害監測及氣候品質認證系統。該系統結合氣象數據和芒果生育期生理生化檢測數據,可實現芒果的氣候品質等級認證和評價[8]。江昌旭等研發了基于RFID技術的芒果品種識別與信息追溯系統,通過信息技術手段自動采集芒果從生產、加工、流通、銷售各環節的信息,并采用電子標簽進行標識,完成對芒果品種的識別和芒果信息追溯[9]。
1.3.3 基于芒果建立的網站
目前國內針對芒果所建網站,在內容中更有針對性,主要以信息發布和服務為主,數值型數據較少。如中國芒果產業網(http://mangguo‐cyw.99114.com/),是專業的芒果交易平臺,為廣大芒果商家提供各類不同的芒果服務,包括最新的采購、供應、招商、企業、資訊等。中國芒果商情網(https://www.lvguo.net/)是綠果網旗下芒果價格信息網站,為行業農友提供全面的芒果供求信息、價格信息、行情分析等信息服務。海南芒果網站(http://www.hainanmangguo.com/),是集芒果種類、芒果資訊、芒果種植、芒果行情為主的專業海南芒果信息服務網站。
1.3.4 專業及綜合性數據庫
1.3.4.1 針對熱帶作物建立的數據平臺
熱帶作物種質資源信息平臺(http://tc‐gris.catas.cn)是針對我國主要熱帶作物種質資源數據進行建設的平臺,通過平臺可以查找和獲取包括芒果在內的熱帶作物種質資源收集、保存、評價、新品種、共享利用等信息數據。國家農業科學數據共享中心熱帶作物科學數據分中心(http://trop.agridata.cn),是集成我國熱帶農業科學數據資源的重要平臺,該中心已建成5個主體數據庫,43個熱帶農業特色專題數據庫,其中也對芒果產業的部分數據進行了一定程度的建設和整合。熱帶農業大數據平臺(http://agridata.catas.cn),致力于整合、優化國內外熱帶農業產前、產中、產后全產業鏈數據資源,其中匯集了芒果種質資源、生產與加工、病蟲害、價格與貿易等數據,可對各類數據進行查詢和檢索。
1.3.4.2 綜合性的農業網絡數據庫
我國很多綜合性數據庫如中國知網、萬方數據、維普等數據平臺也涵蓋了農業領域的很多數據,通過篇名、主題、全文、作者、作者單位、關鍵詞等檢索途徑,都可以獲得芒果相關的論文、成果、專利、標準等信息資料。
芒果的數據資源是在科學研究取得長足進步的同時,產生的大量科學數據,類型豐富多樣。但由于缺乏整體建設規劃,加上各部門條塊分割嚴重,目前數據資源多處于分散管理、自成體系、封閉使用的狀態[10]。而在目前已建立的相關系統或數據庫中,多數小而散,相互獨立,缺乏開放性、兼容性和可擴展性。因此數據共享不到位,數據孤島比較突出,現有數據資源還很難滿足產業發展和市場經濟的需求,不能有效支撐芒果產業發展。
據粗略估計,目前在農業產業數據采集中,80%的數據獲取依然以人工采集和填報等傳統的方式為主,僅有20%是用運用物聯網傳感器、網絡自動抓取、文本挖掘、圖像識別等新型工具和方法。生產、資源本底、消費等數據缺失還較嚴重,國際貿易信息不夠充分,市場信息混雜。
長期以來,由于體制和利益等原因,對數據的采集、分類、管理等沒有形成統一的標準和規范,數據存儲、處理、分析、服務等方面標準缺乏,已制定的仍然存在諸多問題。由于標準的缺乏和不統一,必然導致低水平重復建設、數據利用率低、信息資源零亂分散和大量冗余等。此外,因缺乏共享標準體系,數據的管理與共享機制還未形成,影響芒果產業數據資源的共建共享,限制了數據資源的跨地區、跨部門、跨學科的廣泛應用。
目前,芒果產業數據資源利用大多停留在表面,數據挖掘與分析應用尚不深入,應用領域相對較窄,數據與場景融合不夠,多數數據以空間數據庫和關系數據庫的形式進行管理,數據之間缺乏關聯,沒有形成體系,仍然是“碎片化”數據,導致數據之“沙”難以匯聚成“塔”,數據資源無法有效盤活。此外,通過數據建模、數據挖掘、智能數據分析處理等大數據技術,提供預警研判決策支持等方面少有涉及,數據優勢及潛力得不到充分釋放。
立足我國芒果數據資源建設現狀及數據資源內容特點,堅持數據資源統籌管理,加強數據資源建設的總體規劃,統一部署,使多部門、多單位、多學科的數據建設整體協調發展。參考借鑒現有農業信息資源分類體系,從整個產業鏈出發,對芒果產前、產中、產后不同來源、不同結構的的數據資源進行梳理和分類,建設匯集融合的芒果產業數據資源體系框架,在此基礎上開展對數據資源進行開發利用和科學的整合利用,避免數據資源的重復建設,同時促進數據資源的有效利用。
數據標準是數據實現共享的基礎支撐條件,是實現互聯互通、數據共建共享的重保障。建立科學、統一、先進、實用的標準規范體系能夠有效破解“孤島”問題,促進信息共享,避免數據低水平開發和重復建設。因此在芒果數據資源建設中,必須從數據采集、加工處理、存儲、分析、服務、共享標準等全流程做好標準規范的制定,建立起完善的標準體系,突破農業大數據集成與融合的工作瓶頸。
科學全面布局數據調查渠道,在傳統數據采集渠道的基礎上,不斷健全采集體系,拓展物聯網數據采集渠道,通過視頻監控、物聯網傳感器、網絡通信和遙感等物聯網技術的應用,實時采集產業鏈各環節數據,基本形成現代采集手段為主、傳統采集手段為輔、優勢互補、相互融合的數據采集體系。
建立對內開放和對外開放兩種機制。對內要摸清家底,建立數據資源共享目錄;整合資源,建立數據共享平臺;開展部門協作,建立數據會商制度。對外要加強合作,參與國際數據交流,明分類、確順序,制定數據公開路線圖。同時解決數據開放共享核心問題,包括數據自身質量問題、數據開放技術與格式、數據開放安全性評估等。
數據資源建設的核心環節是數據應用,因此要加強芒果產業宏觀經濟數據分析、市場數據、銷量走勢等數據分析,通過數據建模、數據匯聚、數據挖掘、智能數據分析處理等大數據技術,提供預警研判決策支持,指導產業的種植、銷售、加工、貿易,提高產業鏈全要素生產率,實現綠色可持續發展。