李建新,席蒙慧,張嘉瑋,席蒙娟,田丁,魯懿哲,陳曉陽,李衛華,張雪海,湯繼華
(1河南農業大學農學院/省部共建小麥玉米作物學國家重點實驗室,鄭州 450002;2南陽師范學院化學與制藥工程學院,河南南陽 473061;3新鄉醫學院管理學院,河南新鄉 450003;4鄭州工程技術學院中德學院,鄭州 450000)
【研究意義】玉米是世界上主要的糧食、飼料與工業原料,對保證全球糧食安全發揮了重要作用[1]。在玉米增產的諸多因素中,品種改良的貢獻率約為35%[2],因此,新品種的選育與推廣是促進中國玉米產量不斷提高的重要因素。由于玉米是利用雜種優勢的作物,優良自交系的選育是組配出強優勢雜交組合的前提,而明確不同自交系的血緣關系是自交系改良與雜交組合組配的重要基礎[3]。然而,中國玉米種質資源主要來源于外來種的引進。此外,隨著中國種子法的頒布實施及玉米試驗與審定制度的改革,玉米育種逐漸由科研單位主導的公益性研究向以企業為主的商業化育種模式轉變,形成了科研單位、企業和獨立育種人并行的局面。商業化育種在一定程度上限制了種質資源的交流利用,導致不同單位間選育的自交系系譜關系并不十分明確,已成為不同來源種質資源進一步改良利用的限制因素[4]。在自交系選系基礎材料組配過程中,育種家如果想要了解基礎材料的血緣與系譜關系,往往需要翻閱大量資料。另外,在種質資源交流與利用過程中,許多育種人員對自交系的來源與系譜關系并不一定全面了解,致使在基礎材料組配過程中存在一定的盲目性,從而限制了育種效率的提高。【前人研究進展】隨著計算機和互聯網技術的快速發展,互聯網思維逐漸滲入到育種行業[5],一些商業化育種軟件及考種系統被逐漸開發。而在品種系譜數據庫方面,目前,僅有水稻和花生兩大作物構建了詳細的品種系譜數據庫[6-7],并且被廣泛使用。而玉米上,僅有諸如種業商務網[8]、中國種業大數據平臺[9]、第一種業網[10]、《中國玉米品種及其系譜》[11]等可以查詢自交系或品種信息的網站或書本,未見可以查詢自交系或品種詳細系譜數據庫的報道。【本研究切入點】玉米是中國第一大糧食作物,且播種區域跨度大,品種類型繁多,加之不同自交系之間相互雜交改良,親緣信息沒有得到有效梳理,造成很多自交系的系譜難以有效追溯,給自交系的進一步改良利用造成一定困難[12]。【擬解決的關鍵問題】本研究以現有玉米自交系及品種審定信息為基礎,構建了中國玉米品種及其親本系譜數據庫,彌補了現有玉米品種信息數據庫的不足,尤其是添加了系譜追溯、子代查詢、定制化查詢、糾錯系譜信息及他人上傳自交系及品種系譜信息等功能,供國內玉米育種及科研工作者共同使用、開發和維護。
數據庫以省級及中國農業農村部網站的玉米品種審定公示公告、引種公示公告、更名公示公告(僅有2017年及以后審定的品種信息)等信息作為第一數據源;以百度文庫、種業商務網、中國種業大數據平臺、第一種業網[8-10]的自交系及品種信息作為第二數據源;以書本[11-16]及相關文獻[3,17-30]的自交系及品種信息作為第三數據源。
數據庫采用基于LNMP(Linux系統+Nginx服務器軟件+MySQL數據庫管理系統+PHP超文本預處理軟件)的服務器環境配置[31],相比于 Windows+IIS+SQL服務器環境配置,LNMP具有成熟、開源、穩定、免費等特點,已被各大網站廣泛使用[32-34]。MySQL數據庫根據《主要農作物品種審定辦法》第五章第三十二條內容,通過查閱大量審定品種的詳細信息并總結規律,確定了基本信息、特征信息和其他信息三張數據表。其中,基本信息表包括8個字段:品種名稱(name)、審定編號(certification code)、審定年份(year)、審定地點(certification place)、審定單位(certification organization)、選育單位(breeding organization)、母本(mother)和父本(father);特征信息表包括5個字段:來源類型(origin)、種植區域(area)、特征特性(feature)、產量表現(yield)和栽培要點(point);其他信息表包括2個字段:數據來源(data source)和備注(note)。每個字段根據其文字數量配置不同的字段類型,確保數據庫信息被充分利用。
在服務器上運行織夢內容管理系統(DedeCMS),用于數據庫管理、網站制作及對數據庫進行快速操作[35]。系譜樹的實現通過 AJAX(Asynchronous Javascript And XML)異步請求方式向服務器提交查詢請求,經PHP處理后從數據庫提取相關自交系及品種信息,并將處理后的信息以詳細信息及系譜樹返回給網頁前端展現給用戶(圖1和圖2)。

圖1 客戶端向服務端發送ajax請求后處理流程圖Fig.1 The processing flowchart of an ajax request sent by the client to the server

圖2 系譜樹顯示原理Fig.2 The principle of genealogical tree
利用 DedeCMS管理并更新數據庫,可實現玉米品種及自交系系譜信息的增加、修改、刪除等操作。同時使用phpMyAdmin軟件對數據庫結構進行后期優化和新功能的添加,滿足玉米育種及科研工作者的需求。
第一數據源采用通配符、正則表達式等方式匹配并整合到數據庫對應的字段中。第二和第三數據源因數據格式不統一,無法采用通配符和正則表達式等方式匹配數據,則采用人工錄入整合到數據庫。為方便第二、三數據源的錄入,網頁前端設置了數據提交入口(https://maizedata.cn/submit/genealogy/),采用前臺提交數據,后臺審核發布的方式將采集到的數據開放給用戶瀏覽,訪客也可自行通過該入口提交信息。目前總共收錄玉米自交系及品種信息10 000余條,其中涉及自交系1 218個,雜交種7 823個,每個雜交種因審定編號不同,收錄的品種信息從1至10條不等。
網站采用自適應頁面,自適應不同屏幕尺寸的PC、手機及平板電腦端,無需安裝客戶端,即可快捷查詢。此外,本網站(https://www.maizedata.cn)已被百度、360搜索、必應等搜索引擎收錄;亦可通過小麥玉米作物學國家重點實驗室(http://foodcrop.henau.edu.cn/)頁面的常用網站鏈接進入。
網站首頁搜索欄中輸入自交系或品種名稱,即可檢索出相應自交系和品種信息;網頁搜索欄下方為定制化查詢板塊(圖 3)。“按關鍵詞搜索”欄,可根據品種名稱、審定編號、母本名和父本名等任意一條或多條信息組合,檢索自交系和品種的系譜及信息;此外,在審定編號欄輸入年份,即可查詢該年份審定的所有品種及其系譜信息;輸入父(母)本信息,可查詢該自交系所有子一代品種及其系譜信息;按此方法循環查詢該檢索結果頁面的所有品種信息,則可查詢到一份既有親代又有子代的完整系譜樹。
高級搜索板塊“按時間跨度搜索”欄(圖 3),訪客可輸入起始時間(左邊輸入框)和結束時間(右邊輸入框)或拖動輸入框上方的滑塊來確定查詢時間區間,點擊“提交”按鈕即可查詢到該時間區間內的所有自交系、品種及其系譜信息。
在高級搜索板塊“按地點搜索”欄中(圖 3),用戶只需點擊相應省份或直轄市即可查詢該地區不同時期的玉米自交系及歷年審定品種信息。

圖3 高級搜索頁面Fig.3 Advanced Search page
詳情頁可同時查看品種信息和系譜樹,為節省服務器帶寬,系譜樹默認不展開(圖4,以必祥101為例)。訪客點擊“”展開下一級系譜樹(父母本縮進約2個字符);已展開系譜的品種左邊顯示為“”,再次點擊即可收起。若品種左邊顯示為“□”,表示該品種已無父母本。點擊自交系或品種名稱即可查看其詳細信息。
子代查詢模塊位于詳情頁中系譜樹模塊下方,該模塊列出了該自交系或品種的所有子代及子代的子代(圖5,以黃早四為例,所有雜交種前面均注明雜交種,未注明的為自交系)。訪客點擊“”展開下一級系譜樹(每一代縮進約2個字符),已展開系譜的自交系或品種左邊顯示為“”,再次點擊即可收起。若用戶點完“”,子一代左邊顯示為“”,但下一級卻不顯示,則表示數據庫中沒有該自交系或品種的子代。點擊自交系或品種名稱即可查看其詳細信息。

圖4 必祥101系譜Fig.4 Genealogical of Bixiang 101

圖5 黃早四的子代及子代的子代Fig.5 Offsprings of Huang Zaosi and their offsprings
玉米品種及其親本系譜數據庫的創建,在一定程度上集合了更多的玉米自交系信息及品種審定信息,解決了系譜追溯困難等問題,節約了玉米育種及科研工作者查詢玉米自交系和品種信息及系譜追溯的時間。截止到目前,本數據庫收錄的玉米自交系及品種信息最為齊全(10 000余條)。此外,本數據庫的查詢功能更豐富,擁有強大的系譜樹組件、子代查詢及定制化查詢等功能。然而由于從網上及文獻搜集的系譜信息有限,導致有些品種僅能查詢到品種本身信息,無父母本信息,加之近幾年玉米審定品種數量大幅度增加,部分品種信息可能未被及時收錄。未來隨著數據量的增多,仍有需要優化和完善的地方,比如品種權、推廣面積等查詢功能;或根據品種特征的定制化查詢功能,如查詢畝產大于特定重量或生育期低于特定天數的所有品種;或根據用戶需求開發出滿意且實用的功能等。鑒于此,呼吁玉米育種及科研工作者一起向數據庫添加更多系譜數據,及時補充更新相關自交系及品種信息,完善數據庫/網站,相信在用戶+互聯網+大數據的支持下,數據庫會建設的更加完善。需要注意的是編寫本網站采用的 css代碼版本較高(frontawsome5.0,jquery1.9.8),使用IE瀏覽器瀏覽本網站時會出現模塊無法加載的情況,故不兼容internet explorer全系瀏覽器,遇此情況,建議根據頁面提示更換瀏覽器。
為明確不同自交系的血緣與系譜關系,育種工作者需要查閱審定品種信息、追溯親本來源,特別是對親本信息不詳的品種需要查閱大量文獻資料,而建立基于互聯網的玉米系譜數據庫可減少系譜查詢時間,提高工作效率,為育種家在基礎材料組配過程中選擇合適的種質資源提供重要參考依據。本數據庫在搜集、整合多個網站及文獻中自交系和品種信息的基礎上,通過完善并優化數據結構,可以為用戶提供更完善的信息支撐。
玉米自交系及品種的系譜來源及系譜樹的繪制一般通過查閱系譜資料手工繪制,費時費力,不易保存且出錯率高。現有玉米品種信息數據庫均無系譜樹功能,雖然某些紙質版文件提供系譜樹,但查詢不方便;單機版系譜查詢軟件存在數據更新不及時問題;本數據庫添加了可快速對某一品種或親本進行系譜追溯的系譜樹功能,且系譜樹和子代樹均為系統自動生成,降低了錯誤率,保證了系譜的完整性及準確性。
傳統紙質版系譜如《中國玉米品種及其系譜》[14],僅能通過目錄查詢相關自交系或品種的系譜,系譜樹因紙質媒介而固定,可用性及靈活性不高,數據更新難度大,存在一定的滯后性。現今,新審定玉米品種數量飛速增長,紙質版系譜已無法滿足育種需求,利用互聯網優勢構建的系譜數據庫,更新速度快,可以顯著提高查詢效率。
本數據庫添加定制查詢功能,用戶可通過關鍵詞、時間區間、審定地點、審定編號、模糊和自動分詞查詢等方式進行查詢,方便用戶快速查詢所需品種信息。此外,還提供了用戶上傳、糾錯系譜信息等功能,供國內玉米育種及科研工作者共同使用、開發和維護。
基于LNMP服務器環境配置創建了中國玉米品種及其親本系譜數據庫(https://www.maizedata.cn);目前總共收錄玉米自交系及品種信息10 000余條,其中涉及自交系1 218個,雜交種7 823個;實現了品種信息檢索、系譜追溯、子代查詢、定制化查詢、用戶上傳及糾錯系譜信息等核心功能。