蘇 文
中國科學院地理科學與資源研究所生態系統網絡觀測與模擬重點實驗室, 北京 100101
生態系統觀測研究網絡通過對不同類型生態系統開展聯網觀測, 研究各種生態因子的相互作用及生態過程, 可以揭示生態系統和環境的長期變化規律,為生態系統評價及管理提供科學依據。中國科學院中國生態系統研究網絡(Chinese Ecosystem Research Network,CERN)成立于1988年,目前由44個生態站、5個學科分中心和1個綜合研究中心組成[1- 2]。2005 年在科技部領導和組織下, 組建了國家生態系統觀測研究網絡(Chinese National Ecosystem Research Network,CNERN),由隸屬于中國科學院、農業部、國家林業局和教育部等不同主管部門,包括CERN在內的51個國家生態站、1個國家土壤肥力站網、1個國家種質資源圃網和綜合研究中心共同組成。生態系統觀測研究網絡(CERN/CNERN)覆蓋了不同區域和不同類型的生態系統,是集動態觀測、科學研究和試驗示范于一體的生態系統觀測與研究野外基地平臺、數據資源共享平臺、生態學研究的科學家合作與人才培養基地[3- 5]。
生態系統觀測研究網絡(簡稱生態網絡[6])是數據密集型的野外觀測研究科技平臺,各生態站從1998年開始,按統一的監測指標和技術規范對我國農田、森林、草地、荒漠、湖泊、海灣、濕地、城市等典型生態系統開展長期定位觀測,監測和分析水分、土壤、大氣、生物等4個學科大類的近300個項目,獲取了大量觀測數據[7]。這些數據是生態學和相關學科研究重要的第一手資料,是國家的寶貴財富。為了促進聯網長期觀測數據的共享,生態網絡開展了一系列卓有成效的工作,包括2006年構建由綜合中心數據信息系統和生態站數據信息系統組成[8]的分布式數據資源共享信息系統,在不同層次上提供生態系統聯網觀測數據的共享服務;2012年完成出版《中國生態系統定位觀測與研究數據集》叢書,共4卷51冊,系統收集、整理、發布了50個生態站、1個子網2008年之前的長期聯網觀測數據與相關研究數據。
盡管生態網絡長期觀測數據的匯聚與開放共享基本進入規范化運行服務階段,并已經取得一定的成效,但對于滿足日益增多的我國生態系統研究、環境治理與生態保護、資源高效利用等方面對生態觀測數據的需求仍然存在一定的差距。如何充分發揮生態網絡長期觀測數據的價值,服務國家生態文明建設是生態網絡面臨的一個重要問題。全面了解生態網絡長期觀測數據應用的整體發展狀況,定量分析數據應用的特征,對完善生態網絡長期觀測數據的共享機制、提高數據的共享服務能力具有重要的參考意義,但目前鮮見此方面研究的相關文獻。
現有科學數據應用的常用分析方法主要有文獻調查與計量、Web使用挖掘等[9- 12]。Web使用挖掘能夠通過數據服務系統的服務記錄信息與日志統計數據的訪問量、下載頻率、下載量等[13],分析用戶的分布、興趣和需求,但難以進行數據應用的學科領域、研究主題等方面的深度挖掘。本文基于中國知網(CNKI),通過搜集有關應用生態系統長期觀測數據開展研究的文獻,采用文獻計量和知識圖譜的方法對文獻進行分析,探討生態網絡長期觀測數據的應用領域、具體用途、用戶特點及不同生態站數據的應用狀況與研究主題。
本文所使用的數據全部來自我國收錄中文研究文獻最為全面的中國知網。由于目前生態網絡尚無統一的數據引用和著錄標準,給相關文獻的檢索帶來一定難度。為了能夠比較全面地獲取原始數據,本文采取了以下檢索方法:
(1)《中國生態系統定位觀測與研究數據集》作為公開數據出版物,在利用其中數據開展研究所形成的論文和專著中,能夠作為使用的相關文獻信息資源[14],因此利用CNKI的高級檢索功能(http://kns.cnki.net/kns/brief/result.aspx?dbprefix=SCDB),檢索引用《中國生態系統定位觀測與研究數據集》的文獻。檢索方式為:檢索標簽為“文獻”,選擇“參考文獻”為檢索項,在檢索詞中輸入“中國生態系統定位觀測與研究數據集”,匹配模式為精確。根據檢索條件得到99篇文獻。

圖1 文獻的年度分布Fig.1 Number of documents per year from 2001 to 2018
(2)應用專業檢索功能,采用“(AB=監測數據+觀測數據) AND (FT=生態站 OR FT=生態臺站 OR FT=定位站 OR FT=研究站)”為檢索式,進行跨庫(期刊、博士、碩士)檢索,再在檢索結果中通過查閱摘要或全文,查找到涉及應用生態網絡長期監測數據開展研究的文獻61篇。
最終得到有效文獻160篇(檢索日期為2018年10月18日),其中期刊論文101篇,學位論文59篇。通過CNKI的導出功能,在自定義輸出模式下選擇所有輸出字段,將全部文獻導出為EXCEL文件保存,作為進行分析和研究的樣本文獻。
這些文獻中最早的一篇發表于2001年,是《農業系統科學與綜合研究》第4期上題為“COUPMODEL模擬土壤水熱變化過程的研究”的論文;最新發表年份為2018 年。圖1展示了文獻的年度分布情況。可以看出,2001—2018年期間文獻數量呈波動上升趨勢,說明生態網絡長期觀測數據受到越來越多學者的關注。
通過分析160 篇文獻的學科分布,可以直觀地了解生態網絡長期觀測數據在各專業領域應用的總體狀況。
CNKI根據《中國圖書館分類法》(簡稱《中圖法》)為每一篇文獻標注了所屬的學科領域,通過查詢所標注的分類碼,得到每篇文獻的學科分類名稱,繪制出生態網絡長期觀測數據在各學科應用的具體分布狀況圖(圖2)。圖中顯示,生態網絡長期觀測數據應用在21個不同學科,其中應用數據最多的為林業,67篇文獻與之有關;農業基礎科學緊隨其后,文獻數量為21篇;環境污染及其防治、大氣科學(氣象學)、農作物、植物學等學科的應用也相對較多。這說明生態網絡長期觀測數據應用的主要專業領域為林業、農業基礎科學,同時不斷拓展到其他學科中,數據應用呈多元化態勢。
關鍵詞是一篇論文主題的高度概括及凝練,能夠反映論文主題內容和研究重點,分析關鍵詞之間的相互關系可以幫助人們發現研究熱點或主題的結構關系[15- 17]。CiteSpace 是著名信息可視化專家陳超美博士在引文分析理論的基礎上,基于Java語言開發的可視化共引網絡分析軟件[18]。利用樣本文獻題錄中的關鍵詞,借助CiteSpace軟件生成關鍵詞共現可視化圖譜,可以通過識別文獻的研究熱點,來揭示生態網絡長期觀測數據的用途與價值。
關鍵詞是一種未經規范的自然語言,不同作者對于著錄關鍵詞的把握會存在不一致,為了便于分析,需要對關鍵詞進行相應的處理[19-20]。具體處理內容包括:(1)提取所有關鍵詞;(2)對部分同義詞或近義詞進行歸并,如將“碳儲量”、“碳貯量”合并為“碳儲量”;(3)對一些關聯詞匯的歸屬進行重新劃分,例如:“人工林”、“南亞熱帶人工林”、“杉木人工林”歸并為“人工林”;(4)將原始關鍵詞替換為歸并后的關鍵詞。

圖3 文獻關鍵詞共現可視化圖譜Fig.3 Keyword co-occurrence network of documents
利用計算機程序將Excel數據轉換成CiteSpace軟件能夠處理的格式,導入CiteSpace中,網絡節點確定為關鍵詞,選擇適當的閾值,繪制樣本文獻的高頻關鍵詞共現網絡圖譜(圖3),圖中每個圓點代表關鍵詞節點,圓點的越大表示該關鍵詞出現的頻次越多。
根據關鍵詞共現可視化圖譜,結合相關文獻的題目與摘要,歸納出生態網絡長期觀測數據主要在以下幾個方面的研究發揮作用。
生態系統服務研究。主要研究森林、農田、荒漠等不同生態系統服務功能與經濟價值的評價方法、價值估算等。
模型模擬。涉及作物模型、生態水文模型、碳循環模型、森林生態系統管理模型、水熱傳輸模型、遙感模型等多種模型的改進與驗證。
人工林研究。研究人工林地力等級評價新方法,重點在機器學習算法的改進;同時涉及人工林的固碳能力、生態恢復、生態系統綜合效益 、生產力、水循環與水量平衡等方面研究。
水污染研究。主要研究典型陸地生態系統地表水、地下水及水體生態系統湖泊、海灣的污染發生機理、污染物遷移轉化過程與空間分布特征等。
生物多樣性研究。集中在研究海南尖峰嶺地區熱帶山地雨林的群落維持機制、生物多樣性與生態系統功能關系、物種多樣性空間分布格局及其形成機制等。
小麥、玉米研究。圍繞小麥、玉米兩類糧食作物的優質高產高效,主要研究長期施肥對農作物產品重金屬累積的影響、水分高效利用及種植結構調整等。
土壤水分研究。重點研究森林、草地、農田、荒漠等生態系統土壤水分性質、土壤水分與植物關系、土壤水分異質性等。
根據文獻第一作者所屬單位來對生態網絡長期觀測數據的用戶構成與特點進行分析。由于作者署名單位的名稱存在不一致的問題,因此需要先對單位名稱進行標準化,具體處理方式為:科研院所名稱保留至研究所級別,若未列出則通過查看文獻查出并添加;高等院校保留至校級,二級單位如學院、系等不作保留。

圖4 數據用戶構成統計Fig.4 Percentage of users in different types
對標準化處理后的第一作者單位進行統計,結果顯示,樣本文獻所涉及的生態網絡長期觀測數據用戶共有62家,分為三大類:高等院校、科研院所和企業(圖4),其中高等院校和科研院所為主要用戶群體,分別占53%和45%。進一步對這兩類用戶進行分類統計(圖4),可以總結出生態網絡長期觀測數據的主要用戶機構有五類:(1)中國科學院下屬研究機構,包括中國科學院地理科學與資源研究所、中國科學院華南植物園、中國科學院海洋研究所等15家;(2)林業、農業類大學,包括中南林業科技大學、西北農林科技大學、華南農業大學等12所;(3)綜合性大學,包括蘭州大學、長安大學、河海大學等11所;(4)師范類大學,包括華東師范大學、東北師范大學、北京師范大學等7所;(5)中國林業科學院下屬研究機構,包括中國林業科學研究院森林生態環境與保護研究所、中國林業科學研究院林業研究所等4家。
根據文獻數量統計結果,排名前十二位的機構如表1所列。其中,發文量最多的是中南林業科技大學,累計有18 篇文獻;中國科學院地理科學與資源研究所與中國林業科學研究院熱帶林業研究所以12 篇并列第二。由表1可以發現,不同機構結合其所處地理位置、研究方向與優勢學科,應用生態網絡長期觀測數據開展的研究各有側重。

表1 文獻數量排名前12個機構發文情況及文獻關鍵詞
生態站是獲取第一手科學數據的基本平臺,是開展科學試驗和研究的重要基地[7],有必要了解生態站數據應用的狀況與特征。
根據本文所討論的160 篇文獻的具體內容,查出文獻應用的觀測數據所屬生態站。通過統計生態站出現的頻次(圖5)可以看出,158篇文獻(其中有兩篇未注明生態站名稱)涉及了53個生態站和1個子網,并且不同生態站/子網的出現頻次差異很大。其中,出現頻次最多的為長白山站,其次是會同杉木林站,會同站位居第三位。附錄1列出了出現頻次大于14的15個生態站的位置與區域代表性。

圖5 生態站出現頻次統計圖Fig.5 The frequency of field stations

圖6 生態站與關鍵詞關系網絡圖Fig.6 Network of field stations and keywords
按照生態系統類型進行統計,53個生態站包含了森林站20個、農田站16個、荒漠站7個、草地站3個、海灣站3個、湖泊站2個及濕地站、城市站各1個,基本涵蓋了生態網絡主要的生態系統類型。從生態站個數上看,森林站和農田站較多,這一方面與應用數據開展的研究相關,另一方面與生態網絡的生態站布局有一定關聯,農田站與森林站數量多、分布廣。
同時對生態站、關鍵詞進行分析,挖掘生態站與關鍵詞間的隱含關系,識別不同生態站數據應用的研究主題。統計排名前15的生態站所關聯的關鍵詞,整理出每個生態站出現頻次在2 次以上的關鍵詞,與15個生態站構成生態站—關鍵詞2—模數據矩陣,利用Pajek軟件繪制2—模網絡可視化圖譜,直觀展現生態站與關鍵詞之間的內在聯系。繪制的可視化圖譜見圖6,圖中正方形節點代表生態站,圓形節點代表關鍵詞,連線表示生態站與關鍵詞的關系,連線的粗細表示頻次的多少。
通過圖6可以發現,各生態站數據應用的研究主題相對鮮明,各有特點。例如,長白山站的數據主要用于揭示森林生態系統結構與功能的關系及其動態變化規律、氣候變化對環境的影響等;會同杉木林站與會同站的數據在研究湖南會同地區杉木人工林可持續經營的生態學機理、在區域碳平衡中的作用等方面應用較多;鼎湖山站的數據主要用于森林群落演替、生物多樣性維持機制、生態系統對環境變化的響應與適應等研究;尖峰嶺站的數據集中應用在海南熱帶森林生物多樣性及其生態學過程的研究方面;欒城站的數據主要應用在農田生態系統能量、水分、養分傳輸過程及其內在調節機制方面的研究;太湖站的數據應用側重在探索湖泊富營養化的特征、演化過程與發生機制等方面;長武站的數據在研究黃土高原南部高原溝壑區農田生態系統的結構、功能與生產力方面發揮了一定作用。結合圖5、附錄1,可以認為,生態站長期、連續的觀測數據積累,為揭示其所代表的生態區和生態系統類型的生態系統結構與功能、能量流動和養分循環的變化規律[3],分析主要生態環境問題的現狀、動態變化及驅動機制等方面提供了重要支撐。
通過上文對利用生態網絡長期觀測數據開展研究文獻的統計分析,得出以下關于長期觀測數據應用現狀的結論:
(1)生態網絡長期觀測數據由于具有生態系統類型全、生態站數量多、指標比較全面與規范、時間序列較長等優勢,受到越來越多學者的關注,其應用學科領域以林業、農業基礎科學為主,同時不斷滲透到其他學科中,呈多元化態勢。
(2)生態網絡長期觀測數據主要在生態系統服務研究、模型模擬、人工林研究、水污染研究、生物多樣性研究、小麥玉米研究、土壤水分研究等方面發揮作用,支撐生態系統過程的空間格局分析與環境驅動機制研究、不同生態系統的共性規律的發現和驗證等。
(3)生態網絡長期觀測數據的主要用戶群體為高等院校和科研院所,主要用戶機構包括中國科學院下屬研究機構、林業與農業類大學、綜合性大學、師范類大學和中國林業科學院下屬研究機構等五類;不同機構應用生態網絡長期觀測數據開展的研究各有側重。
(4)生態站的長期觀測數據能夠支撐揭示其所代表的生態區和生態系統類型的生態系統結構與功能、能量流動與養分循環的變化規律,分析主要生態環境問題的現狀、動態變化及驅動機制等。
根據分析結果,對生態網絡長期觀測數據應用的相關方面提出幾點建議:
(1)健全數據引用機制,制定相應的科學數據引用和著錄標準,在有利于數據的定位、發現與長期保存的同時,有效保護數據生產者的知識產權,也便于進一步開展數據集成、數據利用狀況分析、數據共享成效評價[21]等方面的工作。
(2)發揮生態網絡長期觀測數據優勢,對數據進行深度分析、挖掘,開展專題數據產品的生產,充分開發生態網絡長期觀測數據的潛在價值,服務于國家尺度的長期生態科學問題研究和生態評價,拓展生態網絡長期觀測數據開放共享的廣度與深度。
(3)加大和穩定生態站的經費投入,更新完善、改造升級生態站主要觀測、實驗儀器設備,提高生態站的觀測能力和水平,為獲取準確度高、可比性好的長時間序列聯網觀測數據提供基礎技術支撐保障;同時還要完善、優化生態站布局,使生態網絡布局更為科學、完整。
本文盡管得出了一些結論,還是存在不足之處,主要是由于文獻檢索帶有一定的主觀性、局限性,可能會因為漏掉個別有價值的文獻而使研究結論無法全面概括生態網絡長期觀測數據應用的現狀,但是這并不影響本文的參考價值。

附錄1 出現頻次大于14的生態站基本信息