黃曉林 王輝 黃卉 蔣欣宏



[摘要] 科技報告是與科研項目緊密相關的特種文獻?;诳萍紙蟾鏀祿捎梦墨I計量學和復雜網絡的方法,對湖南省現代農業領域的研發現狀進行了分析。研究發現,湖南省現代農業領域研發目前側重在種植業、現代種業和農技推廣應用等方向;各研究熱點間聯系較多,也較緊密;不同主要研究熱點所屬的研究主題不同,研究的內容也有所區分。
[關鍵詞]湖南;現代農業;研發現狀;科技報告
[中圖分類號]F327;G358[文獻標識碼]A
1? ? 引言
當前,我國正由傳統農業向現代農業轉型,已進入發展現代農業,加快構建新型農業經營體系,深入推進農業發展方式轉變,建設社會主義新農村的關鍵時期。農業科技創新是推進農業現代化的重要動力。我國農業科技進步貢獻率已達到57.5%,但仍與發達國家有較大差距。湖南省作為農業大省,總體R&D投入占GDP比重偏弱,2016年僅為1.5%。因此了解區域農業領域的研發現狀,對做好農業產業規劃布局,合理分配有限的農業領域研發資金,最終促進區域農業的健康發展,具有重要意義。
科技報告是科技人員為了描述其從事的科研、設計、工程、試驗和鑒定等活動的過程、進展和結果,按照規定的標準格式編寫而成的特種文獻。在我國,科技報告由國家和各級政府采取一定的行政手段強制形成,是國家和地區的重要戰略資源。由于科技報告與科技項目關系的特殊性,科技報告不僅記錄了科技項目的基本信息,它同時還有對科技項目科學研究和技術實施內容的完整描述。我國于2014年建立國家科技報告共享服務系統,目前已收錄各類科技計劃項目提交的科技報告10萬余份。湖南省于2015年啟動科技報告工作,截止2018年4月,湖南省科技報告共享服務系統已收錄科技報告1377份。
2? ? 數據來源及分析方法
本研究數據來源于“湖南科技報告共享服務系統”(http://www.hnstrs.cn/)。在科技報告技術領域中,以“農業”為主題詞進行檢索,得到的結果有“農業-種植”、“農業-養殖”和“農業-農產品加工”等技術領域分類,為了提高檢索結果覆蓋的準確性,對“資源與環境”,“生物與醫藥-中藥”等領域分類下與農業領域存在交叉的科技報告進行人工篩選。對選中的科技報告信息進行采集,采集的字段包括科技報告題名、關鍵詞和立項年度等信息。為更準確的體現湖南省農業領域的研發現狀,本研究只采集了2013年(含)以后立項相關科技項目產生的科技報告。截止2018年4月,湖南科技報告共享服務系統共收錄2013年(含)以來立項科技項目產生的農業領域相關科技報告248份。
為提高分析的準確性,本文將每份科技報告的題名和關鍵詞分別合并為一條信息,并且進行切分詞處理,刪除虛詞,并且人工剔除研究(research)、關鍵(key)、方法(method)和進展(development)等一些在題名中普遍存且干擾分析的詞匯,從而形成包含248條熱點詞信息的文本語料庫。本文語言處理及分析采用python語言及gensim工具包實現。詞頻統計采用bibexcel軟件實現。
復雜網絡在現實社會中廣泛存在,節點和邊是復雜網絡中的基本要素,在復雜網絡中,個體或事物即為節點,節點之間存在的關系(關聯)即為邊。兩個不同熱點詞在同一篇文獻中出現,即表示熱點詞存在一條邊,稱之為詞共現。基于此,不同的熱點詞在一定的文獻樣本中可形成廣泛的聯結,即基于詞共現的復雜網絡。通過對復雜網絡的可視化,可以發現網絡中的研究熱點。本文復雜網絡計算及可視化采用Gephi 0.9.2軟件實現。
圍繞某個或某幾個研究熱點往往會形成特定的研究主題,但在復雜網絡中由于節點之間邊關系復雜,不一定形成明顯的社團結構,不同主題之間往往難以區分。為挖掘出隱藏在復雜網絡中的研究主題及其網絡,本文采用python語言環境下自然語言處理工具模塊word2vec實現。Word2vec通過神經網絡的方法進行學習,其中的連續詞袋(Continuous Bag-of-Words,CBOW)模型,在輸入某一個特定詞的上下文相關的詞對應的多維詞向量后,經過模型訓練,可以輸出這一個特定詞的詞向量。從而計算不同詞向量與特定詞向量的余弦相似度(余弦距離),最后可輸出經過歸一化處理的余弦距離最近的相關詞匯。Word2vec工具中CBOW模型原理如圖1,具體的實現模型及算法參見Mikolov的相關論文,這里不再贅述。
3? ? 湖南省現代農業領域研發現狀分析
3.1? ? 高頻詞分析
對詞頻進行計量統計,排名前20的熱點詞如表1所示。從表1中可以發現湖南省現代農業領域,種植業的栽培(cultivation)方向,在分析的248份報告中,有53份與栽培有關,占比超過20%,這與湖南省農業以種植業為主的產業結構相符。其次,對新產品、工具、方法、技術的應用(application),也受到廣大科研工作者的重視,這表明湖南省的農業研究仍然以應用研究為主。此外,育種(breeding)也是湖南省現代農業關注的重要方向,這表明新品種研發是湖南省現代農業發展的重要發力點,這與《湖南省“十三五”科技創新規劃》中將現代種業列為10大領域產業技術創新鏈之一的情況一致。除此之外,水稻(rice)、產業化(industrialization)、品種(variety)、系統(system)、品質(quality)、資源(resoures)和有機的(organic)也是湖南省現代農業的研發熱點詞,這其中既有湖南省傳統的研究熱點,也體現了近年來一些研究方向正成為新的研究熱點。
3.2? ? 熱點共現關系分析
為了更好的研究不同熱點之間的關系,我們以熱點詞為節點,其在科技報告中的共現關系為邊,進行復雜網絡分析。將從科技報告題名和關鍵詞中經過分詞處理的單詞,詞頻3次以上,利用gephi軟件進行共現可視化作圖,保留共現3次以上的邊關系,其結果如圖2所示。由圖2可知,湖南省農業領域研究熱點為栽培(cultivation)、水稻(rice)、育種(breeding)、應用(application)和系統(system)等,這與表1的結果也一致。其中以栽培和應用的關注度最高,與其它研究熱點的聯系也最多。但是由于所分析的科技報告都同屬于現代農業領域的緣故,各節點之間關系較為緊密,僅系統(system)節點為核心的子網絡與其他節點的聯系相對較少,各節點未形成明顯的子網絡。
3.3? ? 核心熱點及其主題分析
雖然整個領域的熱點聯系整體較緊密,但是不同熱點之間的聯系緊密程度卻不一。結合表1和圖2,根據熱點詞的分布情況,選取部分頻次較高、邊關系較多的研究熱點為核心熱點詞,利用Word2Vec工具,計算核心熱點與其他所有熱點的余弦相似度(cosθ),對與之相關的研究主題進行了分析。Word2Vec模型參數如下:最小丟棄詞頻min_count=3,學習速率alpha=0.05,高頻詞匯隨機采樣配置閾值sample=0.0015,訓練算法sg=0(C-Bow算法),迭代次數iter=30。選取余弦相似度最高的10個詞,部分結果如表2所示。
由表2可知,不同核心熱點詞形成的研究主題,其研究內容是有所區分的。例如在栽培(cultivation)為核心的主題中,主要關注新技術、新品種和新裝備等的采用(introduction)、示范(demonstration)以及生產效率(efficient)的提高。以水稻(rice)為核心的研究主題則主要關注雜交水稻尤其是超級雜交稻(super hybrid rice)以及作物抗性(resistance)和適應性(adaptability)。以育種(breeding)為核心的主題中,則可以看出研究者主要采用聯合(combination)育種、分子(molecular)育種、雜交(hybrid)育種等育種方法,育種方向主要在提升(promotion)品種的適應性(adaptability)、產量(yield)和抗性(resistance)等。而以系統(system)為核心的研究主題,則明顯與信息(information)、服務(service)、智能(intelligent)、云(cloud)、在線(online)等熱點詞關系緊密,這表明借助新一代信息技術發展現代農業,已成為農業信息化的必然趨勢。
4? ? 結論與建議
本文基于湖南省科技報告數據,采用文獻計量、復雜網絡和模型分析等情報學手段和方法,分析了湖南省現代農業領域的研發現狀。結果表明,湖南省現代農業領域研發側重在種植業、現代種業和農技推廣應用等方向;農業產業化、農業信息化等正成為研究的新熱點;各研究熱點間聯系較多,也較緊密,除信息農業外,未有形成較獨立的研究子網絡。不同主要研究熱點所屬的研究主題不同,研究的內容也有所區分。
根據研究結果,本文對湖南省現代農業領域研發提出如下建議:(1)立足省情,扎實做好種植業研發投入和農技推廣。結合湖南省以種植業為主的農業結構和科技水平較低的現狀,做好作物新品種、先進農業裝備和生產新技術的推廣示范工作,促進農業科技成果轉移轉化,提高農業科技進步貢獻率。(2)大力發展現代種業。依托《湖南省“十三五”科技創新規劃》強有力的政策支撐和袁隆平院士、官春云院士等育種團隊的雄厚科研實力,發揮優勢,培育高產、高效和優質的作物和畜禽水產新品種,做大做強湖南現代種業。(3)重視農業產業化、農業信息化和生態農業等新興熱點的發展。要注重產學研結合,科技成果必須服務于產業,才能產生直接的經濟效益。注重農業生產的產業化、標準化,并積極融合互聯網+和物聯網等新一代的信息技術,以提高生產效率。同時還要將生態環保的綠色發展理念植入到現代農業的研發工作中,使新的農業科研成果對資源節約型社會、環境友好型社會的建設起到積極的推動作用。
[參考文獻]
[1] 常理.農業不平衡不充分問題將有效解決[N].經濟日報,2018-06-01(007).
[2] 金麗華,張學友,錢選詩,等.我國農業科技的發展及其對農業生產的貢獻率[J]. 長江大學學報(自科版),2006,3(1):206-208.
[3] 湖南省科技廳. 湖南科技年鑒(2017卷)[M]. 長沙:湖南科學技術出版社,2018.
[4] 賀德方. 中國科技報告制度的建設方略[J]. 情報學報,2013,32(5):452-458.
[5] Mikolov, T., Yih, W., Zweig, G. Linguistic regularities in continuous space word representations[J]. NAACL HLT,2013:746-751.
[6] Mikolov, T., Chen, K., Corrado, G., Dean, J.. Efficient estimation of word representations in vector space[J]. Computer Science,2013:1-12.