孫曉燕, 李希彬(1. 南開大學 商學院, 天津 00071; 2. 國家海洋信息中心, 天津 00171; . 國家海洋局 天津海洋環境監測中心站, 天津 00451)
?
2004~2013年中國海洋科學研究熱點分析
——基于期刊論文關鍵詞的計量分析
孫曉燕1, 2, 李希彬3
(1. 南開大學 商學院, 天津 300071; 2. 國家海洋信息中心, 天津 300171; 3. 國家海洋局 天津海洋環境監測中心站, 天津 300451)
為了解近10年來中國海洋科學研究的重點和熱點主題, 作者運用科學計量分析方法以及社會網絡分析方法中的聚類分析、主成分分析和可視化展示等研究手段, 對主要海洋核心刊物在2004~2008 和2009~2013年兩個階段共10年間發表論文的高頻關鍵詞進行計量分析。分析和對比結果發現, 海洋生物、海洋水產養殖、海洋沉積環境和海洋環境污染這4個研究主題始終是10年來中國海洋科學研究的重點, 新階段也出現了海洋災害、海洋權益等新研究主題。中國的海洋科學研究緊跟形勢發展, 研究主題逐漸明確, 研究內容進一步擴展, 研究方法和手段不斷豐富。
海洋科學; 情報科學; 共詞分析; 聚類分析; 共詞網絡; 研究熱點; 研究主題
作者應用文獻計量學對主要海洋類核心期刊在2004~2008年和2009~2013年兩個階段發表的論文進行統計, 提取高頻關鍵詞, 分析近10年來中國海洋科學研究的熱點, 同時利用社會網絡分析方法,探尋中國海洋科學研究主題, 通過兩個階段研究熱點和研究主題對比, 總結近10年來中國海洋科學研究發展趨勢, 旨在為中國未來海洋科研工作側重點、經費投入及管理決策提供借鑒和參考。
1.1 數據來源
研究數據來自《中國學術期刊全文數據庫》的主要海洋類核心期刊, 選擇條件是期刊在2004~ 2013年都屬于《中文核心期刊要目總覽》范圍內, 符合條件的期刊有9種, 對選取的9種期刊發表的論文按照2004~2008年和2009~2013年兩個階段分別進行統計, 提取關鍵詞進行分析。9種主要海洋類核心期刊各年刊登的論文數量見表1。
1.2 研究方法
第一步對2004~2008年的6511篇期刊論文和2009~2013年的7963篇期刊論文進行關鍵詞提取,提取書目共現分析系統(Bibliographic Item Co-Occurence Matrix Builder, BICOMB)軟件可以直接處理接處理的notefirst格式數據; 第二步, 利用BICOMB軟件進行關鍵詞詞頻統計, 得出高頻關鍵詞列表并構建高頻關鍵詞共現矩陣; 第三步, 運用Ucinet和Netdraw軟件對共現矩陣進行處理計算,并繪制高頻關鍵詞共現網絡圖; 第四步, 將高頻關鍵詞共現矩陣轉化為相似矩陣后, 使用SPSS軟件進行聚類。最后, 結合共詞網絡和聚類結果對兩個階段中國海洋科學的研究熱點、研究主題和發展趨勢進行比較和分析。
關鍵詞詞頻分析法是利用能夠表達文獻核心內容的關鍵詞在文獻中出現的頻次高低來確定該領域研究熱點。關鍵詞出現頻率表明對其研究的熱度, 但詞頻只能反應某一關鍵詞的使用頻率和受關注程度,不能反映關鍵詞之間的相互關系, 無法揭示相關研究主題[1]。
共詞分析法是通過文獻中關鍵詞共同出現的頻次, 確定該文獻所反映學科中各關鍵詞之間的關系。兩個關鍵詞在同一篇文獻中同時出現的次數越多,就表示這對關鍵詞的關系越緊密。這些關鍵詞所構成的共詞網絡中, 節點之間的遠近反映了主題內容的親疏關系[2-3]。社會網絡分析的程度中心性反映一個節點與其他節點直接相連的次數, 體現節點地位的優越性。派別分析是通過比較子群內、外部成員之間的關系強度來區分派別。作者采用程度中心性和派別分析對論文的關鍵詞進行共詞網絡的可視化展示與分析, 以揭示海洋科學的研究熱點和研究主題。

表1 2004~2013年9種主要海洋類核心期刊刊登論文數量Tab. 1 Number of papers published in nine major marine core journals during the time period 2004~2013
聚類分析指將物理或抽象對象的集合分組成為由類似對象組成的多個類的分析過程。將最緊密的對象合并為一類, 直到全部對象聚成一個大類, 每個類可表達一個研究主題。作者采用層次聚類法, 對高頻關鍵詞進行聚類并與共詞網絡進行對比分析。
2.1 高頻關鍵詞統計分析
利用BICOMB軟件對2004~2008年間的6511篇論文的關鍵詞進行統計分析時, 對論文使用不規范的關鍵詞進行了規范處理, 例如將“南海”、“中國南海”和“南中國海”, 碳14和14C, 等同義詞和近義詞進行統一處理。得到關鍵詞頻次排列順序表, 選擇出頻次排列前100位的關鍵詞見表2。
從表2可見, 2004~2008年的5年間中國海洋科學研究的熱點有以下幾個方面:
海洋科學研究的重點研究區域: (1)中國近海包括南海、渤海、東海和黃海; (2)河口地區包括長江口、珠江口和黃河口; (3)海灣地區包括: 膠州灣、萊州灣和臺灣海峽; (4)其他地區還包括沖繩海槽和黃河三角洲等。
海洋科學研究的主要內容: (1)海洋物理特征,如溫度、鹽度、潮流、波浪、風暴潮、溫躍層和波浪力等; (2)海洋化學特征, 如化學成分、葉綠素a、磷, pH、稀土元素和多環芳烴等; (3)海洋環境污染方面, 如富營養化、重金屬、赤潮等; (4)海洋生物方面,如生物量、生物多樣性、初級生產力、群落結構、種類組成、浮游植物、浮游動物、大型底棲動物、海洋微藻等; (5)海水養殖方面, 如網箱養殖、凡納濱對蝦(Litopenaeus vannamei)、櫛孔扇貝(Chlamys (Azumapecten)farreri)、中國對蝦(Penaees chinensis)、大菱鲆(Scophthalmus maximus)和中華絨螯蟹(Eriocheir sinensis H.Milne-Edwards)、中肋骨條藻(Skeletonema costatum)、赤潮異彎藻(Heterosigma akashiwo)、塔瑪亞歷山大藻(Alexandrium tamarense)、中國明對蝦(Fenneropenaeus chinensis)等; (6)海洋沉積物特征, 如沉積環境, 古環境、古氣候、沉積物粒度, 元素地球化學、礦物特征、沉積物來源等; (7)海洋資源開發方面, 如富鈷結殼、天然氣水合物、稀土元素等; (8)其他還包括海洋工程類的海洋平臺建設, 以及海洋生態環境方面, 如紅樹林等。
海洋科學研究的主要方法: 數值模擬、時空分布、沉積物粒度分析、元素地球化學分析、化學分析、遙感、GIS、綜合評價、數學模型、序列分析、數值計算等。
2.2 高頻關鍵詞的共詞網絡和聚類分析

表2 2004~2008年9種主要海洋類核心期刊出現的高頻關鍵詞及其詞頻Tab. 2 High-frequency keywords and their frequencies appearing in the nine major marine core journals during the time period 2004~2008

表3 2004~2008年高頻關鍵詞聚類結果Tab. 3 Cluster results of high-frequency keywords during the time period 2004~2008
由表3和圖1可見, 有5個團體結合的相對較為緊密, 分別為圓形、方形、倒三角形、盒子形和十字形。(1)圓形團體: 長江口、膠州灣、渤、黃、東海區域的赤潮、生物多樣性、浮游植物、大型底棲動物等的生物多樣性、生物生產力、時空分布、季節變化、群落結構和種類組成等內容; (2)方形團體: 海洋沉積物方面,主要是沉積環境、古環境、古氣候方面的研究; (3)倒三角形團體: 萊州灣、珠江口等區域海水的富營養化、海洋環境污染方面的研究; (4)盒子形團體: 主要是海水養殖方面的內容; (5)十字形團體: 主要是為海洋工程建設服務的潮流、波浪的數值模擬、數值計算方面的研究; 從總體整體上看, 共詞網絡呈現的5個團體與聚類結果的前5個聚類分別有對應關系。綜合共詞網絡和聚類分析, 可以看出2004~2008年中國海洋科學集中研究主題包括這樣幾個方面:

圖1 2004~2008年高頻關鍵詞共詞網絡可視圖Fig. 1 Co-word network diagram of high-frequency keywords during the time period 2004~2008
海洋生物研究方面(圓形團體、聚類1)。從共詞網絡和聚類結果可以看出, 近海以及海灣區域, 特別是對潮間帶附近的浮游植物、大型底棲動物的生物量、豐度、種類組成、群落結構、數量分布、季節變化等是重要的研究主題, 此外還包括生物多樣性、初級生產力、赤潮和葉綠素a等的研究。
海洋沉積環境方面(方形團體、聚類4)。研究重點主要涉及南海和沖繩海槽等較遠海域, 主要通過沉積物粒度分析、沉積速率、元素地球化學分析等手段開展全新世以來的海洋沉積環境、古環境、古氣候方面的研究; 此外還包括富鈷結殼、天然氣水合物等海洋礦產資源的調查、評價和分析等研究主題。
海洋環境污染方面(倒三角形團體、聚類2)。研究重點主要是三大河口地區包括: 黃河口、長江口和珠江口, 以及萊州灣地區海水的富營養化、營養鹽,以及海洋沉積物中磷、重金屬等的分布, 綜合評價方面的研究主題。
海洋水產養殖方面(盒子形團體、聚類5)。研究重點主要集中在魚類、蝦類、貝類等的海水養殖, 胚胎發育以及生物多樣性等研究主題。
海洋數值模擬方面(十字形團體、聚類3)。研究重點只要是利用數值模擬、數值計算和數學模型的方法對海水的動力環境, 如波浪、潮汐、潮流進行模擬, 對海洋工程類、海洋平臺建設等服務。
此外其他一些研究主題, 還包括中國和日本關于海洋權益問題的研究, 人類活動作用于海洋對氣候變化的影響, 海水的溫度、鹽度和pH值, 紅樹林生態環境, 遙感和地理信息系統等研究手段在海洋領域應用的研究等。
3.1 高頻關鍵詞統計分析
在利用BICOMB軟件對2009~2013年的7963篇論文的關鍵詞采用與2004~2008年相同的分析和處理方法。得到關鍵詞頻次排列列表, 提取出現頻次最高的100個關鍵詞(表4)。
2009~2013年中國海洋科學研究關注的區域還是中國近海、主要河口和海灣地區, 但增加了“西北太平洋”這一研究區域, 美國取代日本成為新的重點研究對象。對于重金屬的研究熱度明顯提高。研究內容方面出現了一些新熱點, 如滸苔、溢油、石油烴、釣魚島、海冰、臺風等。研究方法更為多元, 出現了相關分析、聚類分析、主成分分析等新方法。

表4 2009~2013年9種主要海洋類核心期刊出現的高頻關鍵詞及其詞頻Tab. 4 High-frequency keywords and their frequencies appearing in the nine major marine core journals during the time period 2009~2013
同樣對表4中出現的高頻關鍵詞采用如上的分析方法, 分別利用BICOMB、Ucinet和Netdraw等統計得出高頻關鍵詞共現網絡, 計算網絡的程度中心性, 并進行派別分析, 最終得到高頻關鍵詞共詞網絡可視圖(圖2), 相同的節點形狀表示其屬于派別相同, 節點的大小表示其中心性程度。將高頻關鍵詞共現矩陣轉換為相似矩陣后采用SPSS19.0軟件進行聚類分析, 聚類結果見表5。
3.2 高頻關鍵詞的共詞網絡和聚類分析
由圖2可見, 有5個團體結合的相對較為緊密,分別為圓形、方形、倒三角形、正三角形和十字形。(1)圓形團體: 渤、黃、東海、長江口、膠州灣、黃河口、潮間帶等區域的浮游植物、浮游動物、大型底棲動物等的生物量、生物多樣性等的時空分布、季節變化、群落結構和種類組成等內容; (2)方形團體: 主要是蝦類、貝類和蟹類等海水養殖方面的內容; (3)倒三角形團體: 海洋沉積物方面, 主要是黃河三角洲的沉積環境研究; (4)正三角團體: 遙感和數值模擬等研究方法進行海冰、溢油等的監測研究; (5)十字形團體: 海洋災害、海洋權益和大尺度氣候變化等方面的研究。(6)盒子形團體: 海洋環境污染方面。從總體整體上看, 共詞網絡呈現的五個團體與聚類結果的10個聚類分別有不同程度的對應關系。綜合共詞網絡和聚類分析, 可以看出2009~2013年中國海洋科學研究主要圍繞以下幾個主題:

圖2 2009~2013年高頻關鍵詞共詞網絡可視圖Fig. 2 Co-word network diagram of high-frequency keywords during the time period 2009~2013

表5 2009~2013年高頻關鍵詞聚類結果Tab. 5 Cluster results of high-frequency keywords during the time period 2009~2013
海洋生物方面(圓形團體、聚類1)。與2004~2008年相似, 近海以及海灣區域, 特別是對潮間帶附近的生物群落結構、生物量分布、海洋生物分類、生物多樣性等仍是一個主要的研究主題。此外還包括生物遺傳多樣性、克隆、基因表達等研究主題。
海洋水產養殖方面(方形團體、聚類6和9)。2004~2008年關于櫛孔扇貝、凡納濱對蝦和大菱鲆等養殖問題的研究仍就是熱點。此階段也出現了如刺參(Stichopus japonicus)、三疣梭子蟹、大黃魚和半滑舌鰨、等養殖技術、育苗技術以及基因結構等研究主題, 以及溫度和鹽度對水產品生長、發育和存活的影響等主題。
海洋沉積環境方面(倒三角團體、聚類7)。主要是黃河三角洲地區沉積環境、古環境的研究, 對海洋沉積物利用沉積物來源分析、相關分析、粒度分析和生物標志物分析等重建全新世以來該區域的古環境, 以及人類活動的影響。
海洋數值模擬方面(正三角團體、聚類3和8)。相對于2004~2008年, 數值模擬方法應用范圍進一步擴大, 出現利用數值模擬方法對潮汐、海冰和溢油問題的研究, 此外還出現遙感和地理信息系統等新的研究手段。
海洋災害和海洋權益問題方面(十字形團體、聚類4和10)。海洋災害主要是臺風、風暴潮、潮汐、海氣相互作用事件(ENSO)等預報和理論方面的研究;海洋權益方面主要涉及中國的釣魚島問題, 以及美國的立場等研究主題。
海洋環境污染方面(盒子形團體、聚類2)。珠江口、黃河口以及黃、東海海域的赤潮問題研究, 溶解氧、營養鹽、重金屬、石油烴等的分布、來源和評價研究。
通過對兩個階段研究主題的對比可以看出, 2009~ 2013年比2004~2008年階段中國海洋科學研究的領域進一步擴展, 緊隨新的研究問題的出現, 新的研究領域的熱度迅速提升, 重點研究主題的研究更為深入, 研究方法和研究手段進一步豐富, 對兩個階段研究主題進行比較, 發現有以下特點和變化:
海洋生物、海洋水產養殖、海洋沉積環境、海洋環境污染這4個大方面始終是近10年來中國海洋科學研究的主要研究主題, 這與當今形勢緊密相連。當前隨著全球變化加劇和中國經濟的快速發展, 資源和環境成為兩大制約因素, 海洋生物和海洋水產養殖等的研究可為人類提供食品資源和藥用資源。同時海洋是全球氣候系統的重要組成部分, 研究海洋動力過程, 以及海氣相互作用機制是預估未來氣候變化的重要科學依據。近年來, 海洋環境污染特別是海洋富營養化問題日趨嚴重, 赤潮災害頻發, 河口和海灣地區生態環境功能減退, 海水荒漠化問題突出,海洋環境污染問題的研究和治理具有重要意義。
海洋防災減災, 海洋權益與國家安全等研究主題成為新研究熱點, 這與目前的國際國內形勢密切相關。近年來, 中國海洋災害頻發, 海冰、風暴潮和臺風等已經成為沿海地區經濟發展主要的制約因素,海洋災害預測和減輕災害影響已成為重要的研究議題。在海洋權益和國家安全方面, 中國面臨的形勢更為嚴峻, 與鄰國存在關于島嶼、大陸架和專屬經濟區劃界等爭議問題, 像釣魚島問題和南海問題等都曾一度引起緊張局勢, 因此加強海洋權益和國家安全維護的研究勢在必行。
研究主題更為明晰, 研究內容更為擴展。隨著海洋科學研究的逐步規范和成熟, 研究主題逐漸明確,各主題圍繞資源、環境、災害、權益、污染和建設等問題開展, 海洋科學各研究領域關系國計民生,并逐漸發展穩定, 奠定并形成研究基礎和理論體系,但各研究主題內容不是固定不變的, 隨著新形勢發展、新現象和新問題出現, 研究內容不斷豐富。例如,近年來, 由于近岸水體富營養化和全球氣候變化等原因, 造成大規模滸苔綠潮頻發, 成為新的研究熱點; 溢油事故頻發也帶來應對海洋環境污染的新挑戰。海洋養殖方面出現刺參、三疣梭子蟹和大黃魚等新養殖品種。海冰也成為最新關注的海洋災害。
研究方法和研究手段不斷豐富和加強。隨著新技術的發展, 新的研究手段和方法成為海洋科學研究主要使用的研究方法, 數值模擬, 沉積物粒度分析、元素地球化學分析、遙感和地理信息系統、序列分析和綜合評價等方法一直是海洋科學的傳統研究方法。2009~2013年, 相關分析、主成分分析和聚類分析等數理統計分析方法也得到廣泛使用, 表明海洋科學研究更為趨向定量化研究。此外, 隨著新生物技術的發展, 生物標志物技術和分子標記技術(AFLP技術)廣泛應用于海洋生物遺傳育種研究。
[1] 尹相旭, 張更平, 李曉菲. 基于關鍵詞統計的情報學研究現狀分析[J]. 情報雜志, 2009, 28 (11):38-40.
Yin Xiangxu, Zhang Gengping, Li Xiaofei. A research situation analysis of information sciences based on keywords statistics[J]. Journal of Intelligence, 2009, 28(11): 38-40.
[2] 鐘偉金, 李佳, 楊興菊. 共詞分析法研究(三)——共詞聚類分析法的原理與特點[J].情報雜志, 2008(7): 118-120. Zhong Weijin, Li Jia, Yang Xingju. The research of co-word analysis (3)——the principle and characteristics of the co-word cluster analysis [J]. Journal of Intelligence, 2008, 27(7): 118-120.
[3] 廖勝姣, 肖仙桃. 基于文獻計量的共詞分析研究進展[J]. 情報科學, 2009, 26 (6): 856-858.
Liao Shengjiao, Xiao Xiantao. Research advances on the bibiometrics based on co-word analysis[J]. Information Science, 2009, 26(6): 856-858.
[4] 賀玲, 吳玲達, 蔡益朝. 數據挖掘中的聚類算法綜述[J]. 計算機應用研究, 2007, 1:10-12.
He Ling, Wu Lingda, Cai Yichao. Survey of clustering algorithms indata mining[J]. Application Research of Computers, 2007, 1: 10-12.
(本文編輯: 譚雪靜)
Focus of marine scientific research in China during 2004~ 2013 based on bibliometric analysis of keywords from scientific papers
SUN Xiao-yan1, 2, LI Xi-bin3
(1. Business school of Nankai, University Tianjin, Tianjin 300071, China; 2. National Marine Data and Information Service, Tianjin 300171, China; 3. Tianjin Marine Environmental Monitoring Central Station, State Oceanic Association (SOA), Tianjin 300451, China)
Sept. 5, 2014
Oceanographic science; information science; co-word analysis; cluster analysis; co-word network research focus; research themes
To understand the focus of and hottest topics in marine scientific research during the past decade, in this study, we analyzed papers published in the major marine core journals during the time periods 2004~2008 and 2009~2013 using the following methods: quantitative analysis, social network analysis, cluster analysis, principal component analysis, and visual display analysis. The results show that four research themes-marine biology, marine aquaculture, marine sediments, and marine environmental pollution-have been the focus of most marine scientific research. New research topics, including marine disasters and maritime rights and interests, have emerged during the more recent period. Marine scientific research in China has followed suit with the development of the national situation, whereby various research topics have gradually subsided, research content has expanded, and research methods and tools have been continuously enriched.
G353
A
1000-3096(2016)02-0110-08
10.11759//hykx20140905002
2014-09-05;
2014-12-03
孫曉燕(1982-), 女, 山東煙臺人, 博士研究生, 副研究員,主要從事海洋情報分析、海洋信息資源管理研究, 電話: 13821806320, E-mail: luckysunxy@126.com