孫興蓮 楊欣 丁思惠 李宗俊



摘要:為加強江蘇省農業種質資源收集保護,推動種質資源共享利用,采用互聯網和大數據技術設計構建江蘇省農業種質資源數據服務平臺,通過建設多層次、多維度、多用戶的資源服務體系,建成集種質信息發布、共享、服務于一體的一站式線上服務平臺。平臺實現了種質資源共享服務云平臺和數據管理后臺兩大子系統的功能建設,能夠推動種質信息互聯互通和共享融合,促進資源的有效共享。主要介紹數據服務平臺的系統架構、總體功能、業務流程及關鍵技術。
關鍵詞:種質資源;數據共享;線上服務平臺;數據管理;系統設計與構建
中圖分類號:S32;S126 ? 文獻標志碼: A ?文章編號:1002-1302(2021)13-0192-06
農業種質資源是保障糧食安全、建設生態文明、支撐農業可持續發展的戰略性資源,是農業科技原始創新與現代種業發展的物質基礎[1-2]。江蘇省位于南北氣候過渡帶,種質資源種類繁多、類型豐富。為更好地保護特色資源,促進種質資源的開發利用,江蘇省于2004年啟動農業種質資源保護與利用平臺建設,經過多年的努力,已初步建成了覆蓋全省主要農業種質資源保護與利用體系,建有包括農作物、林木、水產、家養動物四大類共計30個省級種質資源庫(圃),收集并安全保存種質資源6.97萬份,積極開展優異種質資源的鑒定評價和創新研究,通過構建種質資源信息共享服務系統對外共享種質資源信息,近10年來累計向省內外300多家單位提供實物種質共享6.6萬份次,在支撐現代農業發展與科技創新中發揮了重要作用[3-4]。
近年來,江蘇省貫徹落實國務院《關于加強農業種質資源保護與利用的意見》文件精神,結合全省農業種質資源共享服務工作需要、種質資源保護要求和種質創新服務需求,加強農業種質資源數據服務平臺建設研究。本研究擬通過運用云計算、大數據、人工智能等新一代信息技術,匯聚集成農業種質資源數據信息,建立面向社會服務的農業種質資源目錄,構建集種質資源整合、共享、展示、對接、咨詢、培訓等服務于一體的新型農業種質資源數據服務平臺,以推動種質信息互聯互通和共享融合,促進種質資源的有效共享。
1 系統架構
江蘇省農業種質資源數據服務平臺包括種質資源共享服務云平臺和數據管理后臺兩大子系統。其中,種質資源共享服務云平臺主要實現種質資源檢索、種質資源申請、服務咨詢、對接洽談、科普園地、種質講壇等功能,通過線上Web服務形式面向外部用戶提供種質資源信息和實物共享服務。數據管理后臺主要包括種質資源數據管理、種質資源申請管理、信息發布、服務流程及用戶反饋管理、庫(圃)運行建設管理和系統管理等模塊,根據種質資源庫(圃)人員和平臺管理人員2種用戶角色設定權限,分別實現了種質資源分類管理、數據填報和審核、標簽管理、畫像分析和智能檢索等功能。總體系統邏輯架構如圖1所示。
2 系統功能設計
江蘇省農業種質資源數據服務平臺主要包括兩大功能模塊:一是面向農業科研人員、企業等用戶的種質資源共享服務云平臺,二是面向種質資源庫(圃)人員和平臺管理人員的數據管理后臺,其主要功能設計如下。
2.1 種質資源共享服務云平臺
種質資源共享服務云平臺總體功能結構如圖2所示。
2.1.1 種質資源檢索 種質資源檢索模塊可用多種方式實現用戶對種質資源信息的檢索和瀏覽,支持按多級分類列表方式進行種質資源信息展示,用戶可按照農作物、林木、水產、家養動物等大類進行瀏覽,也可根據各大類細分物種(如水稻、小麥、玉米等)進行查看;支持按關鍵詞模糊查詢和選擇具體過濾條件精準檢索,用戶可通過種質名稱、種質外文名等文本字段進行模糊查詢,也可按照種質類型、主要特性等選擇字段進行篩選查找,如根據主要特性字段可查詢高產、優質的種質資源等;支持系統主動推薦,根據用戶種質資源的申請歷史、瀏覽歷史,系統自動推薦相關種質資源,提高檢索結果的豐富度[5]。
2.1.2 種質資源申請 用戶檢索到所需種質資源即可發起在線申請,首先查看申請須知和申請流程說明,將所需種質資源加入待申請列表并填寫申請信息,填寫完成后下載打印并簽字蓋章,將蓋章材料上傳提交至種質庫(圃)審核。用戶提交種質申請后可隨時查看申請進度,若庫(圃)人員審核通過,可根據申請表填寫的種質獲取方式進行現場獲取或快遞到付,若為快遞到付,在種質寄出后系統支持查看物流單號和第三方物流進度。
2.1.3 服務咨詢和對接洽談 該模塊針對種質資源共享服務提供電話咨詢和在線咨詢,包括數據服務平臺咨詢內容提交、通訊軟件留言等;支持借助互動視頻,實現多人在線咨詢洽談、活動直播、知識教學等功能,促進資源共享;支持對線下活動做線上對接,主要包括對接優異資源展示會、專題服務和技術咨詢服務等,提供活動需求調研、宣傳發動、在線報名、組織舉辦以及總結宣傳等全流程線上對接,并形成活動檔案。
2.1.4 科普園地和種質講壇 該模塊實現農業種質資源科普信息的發布瀏覽,系統支持用戶查看各類種質資源科普信息,支持按多種主題類目、分類標簽、熱度等方式查找和瀏覽科普文章、優異種質資源信息和種質資源熱點報道等。系統支持以文字、圖片、視頻、直播等方式發布信息,支持直播活動的訂閱并接收活動提醒。
2.2 數據管理后臺
數據管理后臺總體功能結構如圖3所示。
2.2.1 供需信息發布 供需信息發布模塊主要實現種質資源供需信息的上傳、審核、發布、查詢等功能,為資源供給方和需求方提供多維度、多形式的資源供需信息發布和查詢服務,如需方專題服務需求發布、供方特色資源介紹發布等。
2.2.2 種質資源數據管理 種質資源數據管理是整個系統的核心模塊,主要負責維護共享服務云平臺的種質資源數據,是種質資源檢索引擎的基礎數據來源。主要功能包括維護種質資源類目數,方便用戶進行分類導航瀏覽;實現各類種質資源的數據模型定義管理,支持針對不同的物種設置種質資源共性和特性描述數據字段,可設定數據字段的類型和范圍,以及可顯示字段、篩選條件字段和字段讀取權限等;實現種質資源數據的增、刪、改、查等功能,可查看和編輯種質資源詳細數據;支持種質資源數據的批量導入和導出,方便數據的錄入和存檔;實現資源數據信息的查重和校驗功能,所有上傳的服務資源信息均需經過管理員審核后才能正式對外發布和共享;支持庫(圃)人員在種質資源共享服務云平臺中對種質資源進行上架和下架操作,可設置申請數量,并支持批量上下架[6-7]。
2.2.3 種質資源申請管理 該模塊實現了種質資源申請流程的管理,系統可管理申請流程和訂單的狀態流轉,直至用戶收到種質資源并進行評價。用戶發起并提交種質資源申請后,庫(圃)人員可在訂單管理頁面中查詢已提交申請并進行審核處理,若審核通過,庫(圃)人員可根據申請要求準備種質等待自取或郵寄,相關物流信息可錄入系統。在種質資源申請過程中,用戶可隨時查詢申請進度,系統記錄各項流程節點的操作人、操作時間、描述信息等,并通過和第三方物流平臺對接,實現訂單物流狀態的記錄和跟蹤。
2.2.4 服務流程及用戶反饋管理 該模塊實現對服務流程以及用戶服務和反饋等過程中的各種信息數據進行電子存檔,方便后續優化服務流程和改進用戶服務質量。同時系統將云平臺的服務咨詢和對接洽談數據進行存檔,并提供數據檢索功能。
2.2.5 庫(圃)建設運行管理 庫(圃)單位是農業種質資源數據服務平臺的重要服務機構,為了提高庫(圃)運行服務質量,本模塊主要實現對庫(圃)單位的建設運行管理,包括種質庫(圃)征集流程管理、運行服務數據審核統計和可視化展示三大功能。其中種質庫(圃)征集流程管理負責新增種質資源庫(圃)的工作流程管理,實現新增庫(圃)單位的征集、資料匯總、專家評審、結果審核等過程的信息化;運行服務數據審核統計是根據庫(圃)實際運行情況,從多個維度進行庫(圃)運行服務數據的收集、填報和審核,以種質資源收集保存、鑒定評價、共享服務和服務成效等運行服務數據為基礎,平臺績效考核指標為依據,對種質庫(圃)運行服務數據進行統計,能客觀地評價各種質庫(圃)運行服務情況;運行服務數據可視化展示是以庫(圃)運行服務數據為基礎,實現管理駕駛艙和各類分析圖表可視化,直觀地展示各種質庫(圃)的運行服務情況,為平臺的管理和決策提供可視化數據支撐。
2.2.6 系統管理 系統管理模塊主要包括認證管理、系統日志、系統幫助和系統配置等4個功能。其中認證管理主要實現用戶管理和權限管理,可創建各種角色的用戶,包括管理員、庫(圃)人員、普通用戶等,支持對不同用戶角色設置相應的權限等;系統日志記錄關鍵的用戶操作日志,提供操作日志查詢服務;系統幫助提供各項菜單的操作文檔說明;系統配置可設置各項系統參數配置,如數據導入模板格式配置等。
2.2.7 信息安全 農業種質資源數據服務平臺支持多種方式的信息安全保護。對外網站服務通過應用防護防火墻提供安全保護,并通過第三方滲透測試安全認證;數據庫安全系統支持敏感數據保護和數據訪問審計,防止數據泄露;系統安全審計平臺記錄用戶的訪問和操作日志,對違規網絡行為實時告警。
3 系統業務流程
江蘇省農業種質資源數據服務平臺的主要業務流程如圖4所示。平臺管理員通過管理后臺發布科普園地、種質講壇等信息,維護各類科技信息資源,用戶可瀏覽種質資源共享服務云平臺,選擇感興趣的內容瀏覽或發起在線服務咨詢,平臺在線客服可及時回復服務咨詢,響應服務洽談和工作對接,實現線上工作流。種質資源庫(圃)人員可以通過管理后臺進行種質資源信息的完善和提交、維護庫(圃)信息、配置種質資源的圖片展示信息和上下架狀態,信息通過管理員審核后可對外提供服務。平臺管理員結合種質資源標簽平臺維護和更新相關標簽索引信息后,支持用戶在種質資源共享服務云平臺中進行靈活的信息檢索,對于需要的種質資源可在線發起種質資源申請請求,庫(圃)人員審核通過后提供種質自取和郵寄服務并在系統中更新物流信息,用戶能在線查看申請進度及物流信息跟蹤,可在收到種質資源后進行服務評價[8-9]。
4 系統關鍵技術
本系統的關鍵實現技術在于種質資源標簽管理平臺和基于種質資源標簽特征的智能推薦技術,為了更好地滿足用戶種質資源檢索需求,并對種質資源相關特征特性做更全面多維的分析,本系統構建種質資源標簽平臺,通過特征標簽管理和大數據相關技術實現種質資源標簽體系的管理,實現架構如圖5所示。
數據采集層實現對種質資源共性特征、特性特征、用戶瀏覽記錄、用戶申請種質記錄等數據源進行數據采集和實時同步。種質資源標簽平臺利用上述數據源通過數據平臺技術進行整合加工,標簽平臺的作用是在現有的數據表之上構建跨計算存儲的邏輯模型,直接在視圖層上對數據進行管理、加工、查詢,屏蔽下層的多個大數據計算存儲資源,簡化數據的使用。通過標簽平臺實現了種質資源數據靈活動態的特征工程,支持在標簽平臺中隨時添加、組合新的標簽定義。例如可將大豆的銹病抗性、灰斑病抗性、霜霉病抗性、紫斑病抗性、細菌性斑點病抗性等各種特性組合起來形成一個綜合性的抗病性等級標簽。
基于種質資源標簽數據,可以對系統中的種質資源數據做一些相關數據分析,包括通過指定不同的標簽篩選來定義種質資源群組,并進行群組的相關畫像分析,支持對群組進行交集、差集、并集等集合運算。支持對標簽數值進行數據分布統計和可視化分析,如可通過箱線圖等直觀方式體現種質資源特征的分布。系統支持將篩選條件保存起來形成常用查詢分組,用戶可利用種質資源標簽信息進行全方位的信息檢索,方便查找到最符合要求的種質資源信息。
結合用戶瀏覽記錄和用戶已申請的種質資源記錄數據,系統還支持基于種質資源特征的智能推薦,根據用戶瀏覽數據中反映出的用戶感興趣的種質資源信息,與種質資源標簽平臺中保存的特征數據進行匹配,計算出符合用戶興趣的種質資源特征,再聯想查找出相似特征的其他種質資源,提高檢索結果的滿意度[10]。
5 系統實現
本系統通過Web方式對外提供服務,通過前后端分離架構開發實現,通過Java微服務實現后臺相關應用程序接口(API)服務,使用Vue實現前端相關頁面,借助于大數據平臺以及Spark技術實現種質資源標簽和畫像計算任務,計算結果存入ElasticSearch并對外提供種質資源檢索服務,系統部分界面如圖6和圖7所示。系統具有良好的穩定性、擴展性和易用性,支持面向公眾和各外部機構提供農業種質資源相關的共享服務,提高了資源共享服務效率。
6 總結
江蘇省農業種質資源數據服務平臺運用云計算、大數據等相關信息技術,進一步整合江蘇省農業種質資源數據信息,實現了種質資源標簽計算、智能檢索、服務咨詢、科普服務、庫(圃)建設運行管理等功能,提高了種質資源開放共享效率,優化了用戶體驗。后續可進一步結合人工智能算法技術,分析和整合數據,為用戶提供更加準確、便捷的服務。
參考文獻:
[1]劉 旭,李立會,黎 裕,等. 作物種質資源研究回顧與發展趨勢[J]. 農學學報,2018,8(1):10-15.
[2]曹永生,方 溈. 國家農作物種質資源平臺的建立和應用[J]. 生物多樣性,2010,18(5):454-460.
[3]楊 欣,朱 銀,狄佳春,等. 江蘇農業種質資源平臺運行管理信息系統建設[J]. 植物遺傳資源學報,2021,22(2):309-316.
[4]顏 偉,楊 欣,朱 銀,等. 江蘇省農業種質資源保護與利用平臺建設現狀與發展建議[J]. 江蘇農業科學,2020,48(15):52-57.
[5]葉錫君,孫 敬,張天真.農作物特種遺傳資源共享平臺的建立[J]. 南京農業大學學報,2011,34(6):7-12.
[6]方 溈,曹永生. 中國作物種質資源信息系統[J]. 科研信息化技術與應用,2012,3(6):66-73.
[7]潘 愷,方 溈,陳麗娜,等. 基于云計算的農作物種質資源數據挖掘平臺研究[J]. 植物遺傳資源學報,2015,16(3):649-652.
[8]楊 欣,朱 銀,徐婷婷,等. 基于移動平臺的農業種質資源信息共享服務系統研究[J]. 江蘇農業科學,2018,46(23):267-270.
[9]楊 華,王國軍,朱天生,等. 上海農作物種質資源庫管理信息系統建設[J]. 植物遺傳資源學報,2019,20(2):459-465.
[10]李 峰,李軍懷,王瑞林,等. 基于商品特征的個性化推薦算法[J]. 計算機工程與應用,2007,43(17):194-197.