李輝
對農業而言,大數據既是機遇,又是挑戰,只有挑戰大數據,使信息技術處于農業領域的制高點,才能充分發揮大數據的優勢為農業發力。
關于農業大數據的認識
農業大數據是指以大數據分析為基礎,運用大數據的理念、技術與方法處理農業生產、銷售整個鏈條中所產生的大量數據,從中得到有用的信息以指導農業生產、經營、農業流通和消費的過程。農業數據應用作為農業大數據產業的落地點,要分析挖掘數據的價值,還原大數據結論,反映行業問題。換言之,將農業大數據應用于糧食安全、土地經營、病患防治、動植物育種、農業結構調整、農產品價格、農副產品消費等領域,解決農業生產過程中遇到的問題。但農業數據是很復雜的,具體表現為數據源分布廣、可控度低、作物干擾大、類型多樣、結構復雜和獲取困難等,因此導致我國農業大數據面臨著諸多挑戰和問題:首先,大數據研究普遍存在著只有數據、沒有充分應用取得價值的問題,導致搜集數據、存儲數據的付出被讓位;其次,數據類型單一,只有結構化數據,半結構化、非結構化數據的缺失導致數據的不完整。同時,也缺乏農業現代化與信息化的深度融合,區域視角缺乏全國視角;最后,基礎數據采用業界的Hadoop開源技術簡單堆砌,很難保證未來的實用性。
目前,專門從事數據科學與應用研究的人才比較緊缺,大數據人才的招募、培養、使用是農業大數據研究面臨的最大挑戰。因此,大數據產業的發展對大數據人才提出了新的需求,國內各高校陸續進行大數據學術研究的同時,也在考慮將大數據相關課程納入培養體系,以滿足社會對大數據人才的需要。在我國,除以山東農業大學為首的農業大數據產業技術創業聯盟之外,還有江蘇、中科院大數據實驗室等陸續成立。中國農業大學作為中國農業院校的領軍者,在大數據領域集中圈地建立農業大數據實驗室。同時,在全國農業領域的積累以及聯合全國優秀的企業共同建立農業大數據實驗室,并將農業大數據實驗室教學盡快納入培養體系之中,確保中國農業大學在農業大數據領域后來居上,達到國家級大數據重點實驗室和農業大數據領域的領先地位。
在人才培養中,結合農業行業的相關應用特點的實驗室教學是關鍵環節,滿足農業行業的人才技能要求,需在本科的相關學科中強化基于農業行業相關數據的實驗教學環節。首先要立足于信息與電氣工程專業,面向全校本科生開展雙學位大數據教學,從驗證性、實際性和創新性三個層次設置實驗,確保中國農業大學各個專業的學生可以通過此課程,了解大數據發展的新趨勢和新動向,及其對現代農業的影響和意義。其次,信息技術的發展為豐富教學手段提供了可能,通過開放共享大數據實驗室資源,以聯合大數據的科研院所開展農業大數據教學科研工作,全面提高整個農業院校的科技現代化教育水平。綜上所述,為培養大數據教育的高新技術加農業相關分析技術結合的教育是一個大的嘗試,從而為中國的農業現代化與信息化的快速發展提供合格的后備人才。
農業大數據本科實驗室教育建設的目標
按照中國農業大學厚基礎、寬口徑、重實踐、重交叉學科的要求,科學設立大數據人才培養方案,既要熟悉數據分析,又針對相關業務的不同要求,開始醞釀本科的農業大數據實驗室教學設置,可以讓學生了解農業大數據分析技術原理和實驗方式,掌握大數據對農業相關專業所能帶來的幫助及變革。為此,要達成四個建設目標:
目標一:建設業界領先的農業大數據實驗室。結合中國農業大學在農業領域的豐厚積累和寶貴資源,以大數據技術與應用概論這門學科為公共課,使各專業本科均能受益,成為各大院校農業大數據實驗室建設的樣本,進而成為國家級農業大數據重點實驗室。
目標二:建設融合農業行業經驗、業界最新技術、科研教學實踐與業界實際案例同時運行的新一代農業大數據實驗室教育平臺。此平臺的建設不是一蹴而就的,而是隨著大數據技術的發展及農業實際案例的不斷發展迭代更新,保證教學內容與時俱進,最大程度避免傳統教育知識陳舊,為農業現代化、信息化與先進技術的接軌和同步奠定基礎。
目標三:運用先進的“互聯網+”教育的線上線下相結合的教學模式,進一步擴大農業大數據實驗室的覆蓋范圍。其中的重點是在上述的農業大數據實驗室平臺上建立相應的大數據技術與應用概論課程,包括實際案例教學材料、教師教案實驗用書、學生案例實驗用書、答疑等相關教學工具與教學輔助材料。
目標四:面向學生就業和社會既定需求為前提的方向轉變。針對農業經濟、農業氣象、生物信息、食品營養、食品安全、食品風險監測等專業的實際案例,實現大數據行業應用范例教學材料,可以考慮分期實施并根據需要進一步擴充和優化。
農業大數據本科實驗室建設的可行性
為達成面向本科的大數據實驗課程目標,中國農業大學采用了業界先進的平臺和貼近農業實際的相關案例分析,充分考慮技術和專業的融合,從而保證課程的可行性和有效性。考慮到中國農業大學除信息與電氣工程專業的學生之外,以及其他學院的學生并非為農業大數據相關專業。因此,課程的設計過程必須考慮廣泛的實用性,進而將其細分為農業大數據技術應用課程與農業大數據創新與開發課程。
首先,學校師資資源的充裕保證。因為中國農業大學已建立了數據科學研究中心。同時,基于信息與電氣工程學院的師資資源可充分保證農業大數據實驗室的授課資料。
第二,本科生樂于擁抱大數據技術。以中國農業大學之前開設的大數據選修課基本情況反饋來看,本科生普遍熱衷于學習新的技術,并運用新的技術解決新的問題。無論是校內大數據科研中心還是外部企業,對大數據的巨大人才缺口都是潛在的要求。
第三,校企聯合可保證大數據實驗室的先進性和實用性。實驗室的搭建與農業案例的開發可以聯合業界優秀企業保證其先進性、可靠性、實用性,同時通過后期服務不斷地進行升級,保證技術不斷地更新與同步。
農業大數據本科實驗室建設的方案
基于農業大數據實驗室的建設目標與可行性分析,提出了建設方案,主要包括農業大數據源數據包、農業大數據實驗室軟硬件平臺、農業大數據實驗室平臺、農業大數據實驗室教學資源開發、大數據實驗平臺設計方案和大數據實驗案例教學開發等六個方面的內容。
第一,農業大數據源數據包。數據是大數據分析的基礎,主要包含農業經濟、農業跡象、生物信息等數據來源,數據來源多種多樣,數據類型除來自各個應用系統傳統意義上的結構化數據、半結構化數據外,更多的是非結構化數據源,這些是大數據平臺的原材料,我們將其稱為“裸數據”。
第二,農業大數據實驗室硬件平臺。大數據的分析必須要有硬件平臺做支撐,農業大數據實驗室硬件平臺包括服務器、存儲設備、網絡投影儀和大屏幕等硬件,這些是大數據軟件平臺的定性基礎。
第三,農業大數據實驗室平臺。農業大數據實驗室平臺主要包括數據準備、數據處理、數據建模和展現等軟件平臺。在數據準備方面,與商業智能類似,如果數據需要通過大數據平臺進行處理,數據的前期準備工作顯得尤為重要,如數據的抽取、清洗、轉換和加載,相當于對于原材料進行粗加工,以便為大數據處理做好充分的前期準備。在數據處理方面,主要用ETL工具準備好數據,首先存儲到分布式文件系統中,利用一系列商務智能分析對結構化數據進行分析和處理,進而達到數據挖掘和價值發現的目的,這是實現數據變為有效信息的第一步。數據的建模與展現方面,結果數據處理后,數據的價值可以通過進一步的建模工具、可視化工具從不同應用進行深度數據挖掘、決策支持等工作,讓大數據針對某一行業或應用場景進行二次開發,這一步是信息變為知識的關鍵一步。
第四,農業大數據實驗室資源的開發。數據實踐運營中都存在開發實踐教材資源,農業大數據實驗室資源的開發主要是教學案例的開發,包括農業相關專業的數據模型開發、數據可視化等內容,農業大數據實驗室資源的開發主要包括大數據應用實驗教程、大數據實際開發實驗課程,農業大數據實驗課程幕后的開發將知識供學生立即使用,農業大數據實驗室教材的開發主要針對于教室和學生兩個方面進行編寫。
第五,大數據實驗平臺設計方案。大數據實驗室平臺的搭建以多節點、集群服務器平臺作為農業大數據建設的硬件平臺,提供大數據機能和分布式存儲平臺,以Hadoop作為應用的分布式存儲平臺,這個平臺可以形成六大優勢:第一,一個平臺可以覆蓋從數據到信息、從知識到支配全生命周期的流程;第二,數據模型可支持99%的數據接口,降低數據的接口難度,同時可支持結構化和非結構化的數據類型;第三,高度提升系統,無需面對多種系統混雜在一起,堆積模式帶來的管理或復雜難題;第四,高性能,采用共享式文件系統,大大提高數據處理和分析速度;第五,采用對等架構,降低故障風險;第六,基于GUI的管理模式,大大降低管理難度。
第六,大數據實驗室案例教學的開發。為讓學生真正了解大數據在農業相關專業具體的應用場景和關鍵作用,有著感性和理性的認識,大數據作為當今的先進技術,對傳統農業的升級有著巨大的推動作用,可以激發學生的學習熱情,提高學生的創新思維能力,從而為學生將來的就業及推動農業現代化和信息化的發展奠定堅實的基礎。為此,在大數據實驗平臺,針對農業專業方向提供相關的案例也是很重要的,如農業經濟大數據案例、農業氣象大數據案例、農業生物信息大數據案例等等,對于案例的設計和研發建議本著忠于實際、分步實施的原則應用于教學,在教學反饋中快速迭代后續的案例開發,從而始終保證案例的真實性、可用性和有效性,更好地將大數據理論、實驗平臺與案例相結合,從而達到學以致用的目的。
隨著實驗教學的展開,越來越多的學生會對新技術產生興趣,從而成為我國農業教育的領航者,打開教育改革的新篇章,為大數據教學提供很好的思路,加快大數據在我國支柱產業農業方面的應用和發展。
(作者系中國農業大學信息與電氣工程學院博士)