袁曉園 華薇娜
(1. 南京大學圖書館,江蘇 南京210093;2. 南京大學信息管理學院,江蘇 南京210023)
地理信息系統(Geographical Information Systems,GIS)是在計算機硬件、軟件系統的支持下,對整個或部分地球表層(包括大氣層)空間中的有關地理分布數據進行采集、儲存、管理、運算、分析、顯示和描述的技術系統[1]。從20 世紀60 年代早期,在核武器研究的推動下,計算機硬件的發展導致通用計算機“繪圖”的應用。1967 年,由加拿大的羅杰·湯姆林森博士開發的CGIS 系統是世界上第一個真正投入應用的地理信息系統,它由聯邦林業和農村發展部聯合研發,被稱為加拿大地理信息系統(CGIS),用于存儲、分析和利用加拿大土地統計局(CLI)收集的數據,并增設了等級分類因素來進行分析。此后在1970-1980 年期間,GIS 獲得了巨大的發展,特別是美國對GIS的研究和運用一直處于世界的主導地位。從那以后,GIS技術在全世界范圍內、多個研究領域被廣泛地應用,包括自然、社會、醫學和工程學領域[2-4]。
在林學領域,GIS 方法也被用于國內外多項研究中。國外研究者布朗等[5]根據森林類型和林分蓄積量,采集生物量密度和規模數據,利用地理信息系統制作森林生物空間分布地圖。研究者Brzeziecki 等[6]構建了植被分布概率模型,此模型與地理信息系統對接,基于12 個環境變量的數字地圖數據,用來構建瑞士的數字植被地圖。研究者Band 等[7]介紹了一種大尺度的流域水生態分布模型,模型由數據和模擬系統、區域水文生態仿真系統組合,并且結合遙感、GIS 技術整合而成的水文和生態模型,此模型使參數自動化,可以模擬通過流域的水文通量、蓄水過程。而國內研究者則著眼于GIS 技術在林業、植被、生態中的實際運用和系統數據的維護,如研究者王思遠[8]等在遙感技術和GIS 技術的支持下,對土地利用的時間動態特征和空間動態特征進行了定量分析,包括土地利用類型、土地利用程度、耕地狀況、森林植被覆蓋、城市擴展等。國內研究者鐘林生[9]等采用GIS 技術對公園的生態旅游適宜度進行計算,針對不同的適宜程度,提出公園開發的建議。
總體來說,GIS 在林學相關研究領域中的使用已較為廣泛,但是我們發現針對林學相關專業的GIS 研究熱點,卻很少有研究者進行分析與歸納。本文采用了信息計量學方法,是一種數學和統計學的方法,它可以定量分析一切知識的載體[10]。經過50 多年的發展,信息計量學已經漸居核心的地位,是與科學傳播及基礎理論關系密切的研究方法。現在全世界每年發表的信息計量學學術論文約為10 000 ~15 000篇。由于在世界范圍內,GIS 在林學領域的發展越來越專業化,筆者認為有必要對它的國際研究熱點作分析,從而掌握該領域的國際前沿和發展脈搏。
學科界定
本研究選擇Web of Science 數據庫(簡稱WOS),它是美國費城湯姆森科技信息集團基于WEB 開發的產品,是大型綜合性、多學科、核心期刊引文索引數據庫。本研究選擇WOS 數據庫下3 個子庫SCIE 、SSCI 和A&HCI。
本研究以主題檢索(TS)和學科分類(Web of Science)作為檢索策略,檢索式設計為((TS = (GIS or″Geograph*Informati*System*″)AND WC = (Forestry)))NOT PY=2014 進行檢索,排除了2014 年的發表文獻,得到954篇,在分析國家時,將英格蘭、北愛爾蘭、蘇格蘭、威爾士歸在英國下面,將臺灣、香港歸在中國下面。檢索結果包括8 種文獻類型,分別是:論文(Article)927 篇(占97.2%),會議論文(Proceeding Paper)71 篇(占7.4%),綜述(Review)12 篇(占1.3%),新聞items 5 篇 (占0.5%),editorial material 5 篇(占0.5%),note 3 篇(占0.3%),correction addition 1 篇 (占0.1%),再版1 篇(占0.1%)。語種包括7 種語言,有:英語881 篇 (占92.4%),葡萄牙語36 篇 (占3.8%),德語15 篇 (占1.6%),西班牙語7 篇 (占0.7%),波蘭語6 篇 (占0.6%),克羅地亞語5 篇 (占0.5%),法語4 篇 (占0.42%)。檢索時間2014-09-01。
本研究采用信息計量法對文獻的外部特征作分析,包括文獻指數增長模型和期刊分布,然后針對不同時間段、高產國家、高被引文獻中,作者關鍵詞的變化趨勢進行比較。采用社會網絡分析法對高頻關鍵詞作共現分析,借助UCINET6.0 軟件對其可視化,以此追蹤和歸納林學領域GIS 研究主題的變化。
科學文獻量是衡量科學知識量的重要尺度之一,某領域年代論文量的變化可以直觀反映該領域內學科發展的態勢。如圖1,繼1986 年發表6 篇文獻后,1987-1990 年為零增長,此后1991-2013 年,總文獻量呈穩步上升的發展趨勢,在2000-2013 年,論文的增長幅度明顯增加,上升率超過總發文的增長幅度,論文和總文獻的發表均在2010年達到峰值82 (78)篇。因此近20 年,林學相關的GIS國際研究成果一直處于穩步發展的階段,其中年平均載文量=文獻總量/年度數=954/23 =41.48,2007 年后的文獻量均大于年平均載文量。

圖1 年代文獻量趨勢圖
根據研究者普賴斯(D.Price)在1961 年正式出版的《巴比倫以來的科學》中,系統闡述了科技文獻按指數增長的經驗規律,設t 時間的文獻信息數量為Q =F(t),則有:Q=F(t)=aebt=aexp(bt)[11]。
根據本研究的數據及SPSS 統計分析,發現它的年度累積發文量與出版年之間存在高度相關性,符合指數增長曲線(如圖2)。我們采用SPSS 擬合曲線,得到指數模型y=9.911* x(1.427),(調整R2=0.997)。根據1991-2013 年的指數模型,我們推測2020 年林學領域中的GIS 研究文獻量將為2013 年的1.5 倍。
本研究對954 篇文獻的來源期刊進行分析,共涉及期刊64 種,平均每種期刊的載文量=文獻總量/期刊種數=954/64 =14.91,將期刊按載文量進行排序,選擇文獻量≥ 15 的前19 種期刊,列出表1。

圖2 累積文獻發文量隨時間增長的曲線圖(從1991 年)

表1 期刊分布表(文獻量≥15)
表1 中的19 種期刊占期刊總數的29%,卻刊載了文獻總量的76.42%,尤其是前8 種期刊,載文量達到了52.41%,遠遠高于其他期刊。根據Bradford 核心期刊和文獻分布的“二八定律”,即20%的核心期刊上刊載了80%的重要論文,因此這19 種期刊可以作為研究GIS 林學研究的重要信息載體。
數據調查結果顯示,很多智庫都有與之相匹配的數據庫源,這些特色數據庫可以為智庫研究提供一定的理論支持與政策支撐。我們可以借鑒國內外智庫建設的成功案例,將圖書館的資源分門別類設置,通過多種渠道獲取海量的信息資源,并加以鑒別,“取其精華、去其糟粕”,建設有高校特色的數據庫。這樣既可以提高圖書館的服務工作效率,也可以滿足智庫建設的發展需要。
此外我們對64 種期刊的影響因子進行排序,發現影響因子最高的期刊是AGRICULTURAL AND FOREST METEOROLOGY,影響因子為3.894,載文24 篇,占文獻總量的2.516%。根據統計,影響因子大于3 的期刊有3 種,載文量為83 篇,占8.7%;影響因子在2 ~3 的期刊有5 種,1 ~2 之間有21 種,0 ~1 之間有28 種,其余7 種沒有查到影響因子。在能查出影響因子的57 種期刊中,出版國分別來自24 個國家,其中前4 個國家的期刊量分別為美國12 個、荷蘭6 個、德國5 個、英國4 個,幾乎占到總數的一半。
作者關鍵詞是學術論文的重要組成部分,它反映了作者對文獻核心內容的集中概括,體現了論文的精髓。通過對作者關鍵詞的演變分析和高頻關鍵詞的聚類分析,可以發現一些研究領域的主題分布與熱點。
本研究首先對提供作者關鍵詞的881 篇文獻進行收集,得到4 155個關鍵詞。然后采用數據分析軟件對它們進行抽提和機器自動識別處理,將同根詞、同義詞、近義詞、單復數形式或復合形式進行合并,如GIS、Geographic Information system、Geographical Information systems 等,land-use 和land use 進行合并,得到關鍵詞3 795個,選擇不同時間段、不同國家(表3),分析和比較作者關鍵詞的演變(表2、表4)。

表2 不同時間段內作者關鍵詞的變化

表3 高產國家發文量
經過統計,3 795個作者關鍵詞中,2 757個(72.65%)只出現1 次,453 個(11.94%)出現2 次,198 個(5.22%)出現3 次。大量只出現1 次的關鍵詞表明了該研究領域中的連續性研究相對缺乏,研究點之間存在差異。
本研究以GIS 為主題詞進行檢索,因此所有列表均顯示出現頻率最高的關鍵詞為GIS。在2000-2013 年整個研究期內(表2), “管理”、 “模型”、 “森林”、 “植被”、“模式”、“景觀”是出現頻率最高的作者關鍵詞,它表明這些主題可以成為林學領域中GIS 的研究熱點。值得關注的是,之前(2000-2006)排名較后的“土地利用”、“景觀”和“管理”在近期(2007-2013)明顯上升,其中“景觀”的發文文獻和百分比從“15,0.804”增加到“43,0.991”,土地利用從“11,0.54”上升至“22,0.919”,管理從“28,0.962”也增加至“56,0.99”,而“模型”、“森林”、“植被”、“模式”等變化不大,這反映了近幾年“管理”、“景觀”和“土地利用”吸引了越來越多的研究關注,它們可能成為潛在的研究熱點[12-14]。

表4 高產國家、中國、世界范圍內作者關鍵詞的演變

表4(續)
接著表3 列出了發文排名前3 的國家,表4 分別將不同高產國、中國和世界范圍內,排在前15 位的作者關鍵詞進行列出。根據表4,我們發現各國都關注GIS 技術在國家、區域中的應用,如高頻關鍵詞“美國”、 “加拿大”、“巴西”、 “中國”,加拿大的“不列顛哥倫比亞省”和“亞洲”,同時“管理”和“模型”均有出現。但是經過仔細地比較,各國的研究點也存在明顯的差異。
首先美國注重GIS 技術在“植被”、“森林”、“景觀”、“模式”中的應用;加拿大關注“森林”、 “氣候變化”、“遙感”和植物“保護” (如“道格拉斯冷杉”);而巴西的研究則突出“遙感”、“景觀生態”、“亞馬遜”、“亞馬遜森林”、“森林管理”和“棲息地破碎化”。和其他3 個國家不同,中國比較關注模型、技術和系統管理的研究,如“數字高程模型”、 “生態系統”、 “生態系統管理”、“航空攝影”、“氣流模型”和“海拔區”出現較多,同時我們發現“空氣污染”是中國獨有的研究主題。
接著我們作進一步的分析,根據被引次數,將954 篇文獻從高到低進行排序,選擇被引次數最多的前10 篇文獻,其中4 篇來自美國,共收集到80 個作者關鍵詞。除去GIS,“植被”和“模型”出現的頻率較多,同時發現高被引文獻比較注重研究方法和技術手段,作者關鍵詞中出現了“廣義線性模型”、“陸地衛星制圖儀”、“遙感”、“數字高程數據”、 “數字地形模型”和“直接梯度分析”等[15-16]。
接著選擇詞頻不少于20 次的38 個關鍵詞(表5),對其作共現矩陣,采用Ucinet6.0 軟件繪制高頻關鍵詞的共現網絡圖(圖3)。圖3 中的節點表示關鍵詞,連線表示其兩端的兩個關鍵詞節點在同一篇文章中存在共現,節點大小表示關鍵詞的點度中心度,即關鍵詞出現的總頻次,連線的粗細表示關鍵詞的共現次數,連線越粗,即關鍵詞的共現越多,反之越少。本研究發現“模型”、 “管理”、 “森林”、“植被”、“模式”、“遙感”、“景觀”等關鍵詞的點度中心度較高。同時這些高頻關鍵詞之間的連線相互交錯,形成了一個連通圖,在GIS、森林、管理、干擾、破碎片;GIS、模型、土地利用;GIS、地區、景觀、保護;GIS、模式、社區;GIS、植被、生態系統、規模、生長;GIS、遙感;GIS、美國、力學、規模等各組關鍵詞之間的連線較粗,即表明它們在一篇文章中共同出現的次數較高,當高頻關鍵詞在同一篇文章中共同出現的次數多,則可以初步反映該領域的研究熱點。

表5 高頻關鍵詞的統計表(文獻量≥20)

圖3 高頻關鍵詞的共現網絡圖
本文采用信息計量學方法對林學領域中GIS 國際研究進行多角度分析。經過數據統計,發現林學領域中GIS 國際研究處于穩步發展的態勢,年度累積發文量與出版年之間存在高度相關性,符合指數增長曲線,推測在2020 年林學領域中GIS 的研究文獻量將為2013 年的1.5 倍。通過來源期刊分析,我們發現19 種期刊可以作為研究的重要信息載體,FOREST ECOLOGY AND MANAGEMENT 作為標桿性研究期刊,它刊載的文獻量最多。根據期刊影響因子統計,林學領域中的GIS 國際研究主要分布在影響因子0 ~2 的期刊中。
通過比較不同國家、不同時間段的作者關鍵詞的發展,可以發現“管理”、“模型”、“森林”、“植被”、“模式”、“景觀”已經成為研究熱點, “土地利用”、 “景觀”和“管理”受關注的程度越來越高,可以成為潛在的研究熱點。同時發現各國都在關注GIS 技術在國家、區域中的應用,美國注重GIS 在“植被”、“森林”、“景觀”、“模式”中的應用;加拿大關注“森林”、“氣候變化”、“遙感”和植物“保護”(如“道格拉斯冷杉”);而巴西則突出“遙感”、“景觀生態”、“亞馬遜”、“亞馬遜森林”、“森林管理”和“棲息地破碎化”,中國的“空氣污染”是中國獨有的研究熱點。
通過分析高被引文獻的作者關鍵詞,我們發現研究方法和技術手段相關的關鍵詞出現較多。根據高頻關鍵詞的共現矩陣和共現網絡圖,發現“模型”、“管理”、“森林”、“植被”、“模式”、“遙感”、“景觀”等關鍵詞的出現頻率較高;同時高頻關鍵詞之間相互交錯,形成了一個連通圖,各組關鍵詞如GIS、森林、管理、干擾、破碎片;GIS、模型、土地利用;GIS、地區、景觀、保護;GIS、模式、社區;GIS、植被、生態系統、規模、生長;GIS、遙感;GIS、美國、力學、規模等各組關鍵詞之間的連線較粗,可以初步反映該領域的研究熱點。
本文選擇林學領域中GIS 國際研究作為研究樣本,在今后的研究中,可以在此基礎上,將樣本擴大至不同學科、不同的主題分類,對GIS 研究做多角度、更深入的分析。
[1] http:∥baike. baidu. com/view/5201. htm?fromtitle = GIS&fromid=31541&type=syn [EB].
[2] Anselin L. Local indicators of spatial association—LISA [J].Geographical analysis,1995,27 (2):93-115.
[3] Guisan A,Zimmermann N E. Predictive habitat distribution models in ecology [J]. Ecological modelling,2000,135 (2):147-186.
[4] Ohashi T,Ebisawa K,Fukazawa Y,et al. The gas imaging spectrometer on board ASCA [J]. Publications of the Astronomical Society of Japan,1996,48 (2):157-170.
[5] Brown S L,Schroeder P,Kern J S. Spatial distribution of biomass in forests of the eastern USA [J]. Forest Ecology and Management,1999,123 (1):81-90.
[6] Brzeziecki B,Kienast F,Wildi O. A simulated map of the potential natural forest vegetation of Switzerland [J]. Journal of Vegetation Science,1993,4 (4):499-508.
[7] Band L E,Patterson P,Nemani R,et al. Forest ecosystem processes at the watershed scale:incorporating hillslope hydrology[J]. Agricultural and Forest Meteorology,1993,63 (1):93-126.
[8] 王思遠,張增祥. 基于遙感與GIS 技術的土地利用時空特征研究[J]. 遙感學報,2002,6 (3):223-228.
[9] 鐘林生,肖篤寧,趙士洞. 烏蘇里江國家森林公園生態旅游適宜度評價[J]. 自然資源學報,2002,17 (1):71-77.
[10] 羅式勝. 文獻計量學概論[M]. 廣州:中山大學出版社,1994.
[11] De Solla Price D J,Page T. Science since Babylon [J]. American Journal of Physics,1961,29 (12):863-864.
[12] Labich W G,Hamin E M,Record S. Regional Conservation Partnerships in New England [J]. Journal of Forestry,2013,111 (5):326-334.
[13] Haines A L,Kennedy T T,McFarlane D L. Parcelization:forest change agent in northern Wisconsin [J]. Journal of Forestry,2011,109 (2):101-108.
[14] Galanes I T,Thomlinson J R. Relationships between spatial configuration of tropical forest patches and woody plant diversity in northeastern Puerto Rico [M] ∥Forest Ecology. Springer Netherlands,2009:101-113.
[15] Reed B C,Brown J F,VanderZee D,et al. Measuring phenological variability from satellite imagery [J]. Journal of Vegetation Science,1994,5 (5):703-714.
[16] McCune B,Keon D. Equations for potential annual direct incident radiation and heat load [J]. Journal of vegetation science,2002,13 (4):603-606.