999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于文獻計量學的國內水生態環境研究知識圖譜構建與應用

2019-12-20 03:19:20毛文山趙紅莉蔣云鐘
水利學報 2019年11期
關鍵詞:生態分析研究

毛文山 ,趙紅莉 ,蔣云鐘 ,段 浩 ,郝 震 ,5

(1.蘭州交通大學 測繪與地理信息學院,甘肅 蘭州 730070;2.地理國情監測技術應用國家地方聯合工程研究中心,甘肅 蘭州 730070;3.甘肅省地理國情監測工程實驗室,甘肅 蘭州 730070;4.中國水利水電科學研究院 水資源研究所,北京 100038;5.大連理工大學 建設與工程學部,遼寧 大連 116024)

1 研究背景

隨著經濟社會的高速發展,水生態環境問題成為21世紀全世界面臨的新的重大挑戰,黨的十八大明確提出推進水生態文明建設,加強污染治理,持續改善生態環境質量。《水利改革發展“十三五”規劃》開展全國105個水生態文明城市建設試點工作,以加快推進水生態文明建設。水生態環境成為政府和學術界關注的焦點[1]。對水生態環境領域內的研究主題、研究熱點、研究前沿進行梳理,以知識圖譜的方式展現,可為水生態文明領域的研究與建設提供參考。

以往關于科學知識圖譜的分析大都建立在對大量文獻量化分析的基礎上,但在數據采集和分析內容的選擇上存在較強的主觀性[2]。自2006年以來,在科學計量學、數據可視化、知識圖譜構建與應用等一系列領域發展背景下,以CiteSpace、VOSviewer等為主流的信息可視化軟件,實現某研究領域內熱點主題、知識演進等的可視化,為學者后續研究提供了知識儲備和創新轉向,在眾多研究領域中得到了廣泛應用。目前利用科學知識圖譜進行計量分析的領域主要有金融證券、生物醫療、圖書情報等[3],水生態環境領域研究起步較晚且數量少。Xiong等4]以定量研究代替定性分析的方法對文獻進行關鍵詞分析,總結出不同時期的水政策影響下,水文化變遷的階段性特點、水利開發階段及水文極端事件的協同性特征;胡秀芳等[5]以定性和定量分析相結合的方法繪制出生態安全研究知識圖譜,梳理出研究主題、經歷發展階段、影響生態安全研究的階段和未來研究方向;許振亮等[6]以關鍵詞共現網絡的視角,采用社會網絡分析方法,揭示了國際生態城市研究前沿的知識結構變化;林卓等[7]通過關鍵詞共現分析出生態資產/價值研究領域的熱點與發展趨勢,明確了生態資產/價值的研究界限,生態資產變化的內在機制是生態資產研究未來趨勢的切入點;伍新木等[8]利用CiteSpace中探測詞頻突發增長的突現詞功能,繪制出國內水資源管理研究領域前沿知識圖譜,分析出各研究階段及未來一段時間的關注熱點。這些研究成果對水生態環境研究知識圖譜的構建與應用提供了案例參考,但仍需做進一步調整:①生成表征不同研究內容的知識圖譜,需選取合適的分析對象;②中文文獻研究主題的識別需選取合適的分析對象和方法,避免以關鍵詞共現聚類分析或英文文獻共被引分析方式代替。

國內關于水生態環境研究知識圖譜分析較為少見,以及不同分析方法在分析對象選擇上存在一定的局限性。本文采用定性分析和定量研究相結合的信息分析方法,針對不同研究視角的知識單元,選擇合適的分析方法,選取主題詞、關鍵詞和名詞短語作為分析對象,選取共詞矩陣分析、共現聚類分析和突變檢測分析作為相對應的分析方法,對水生態環境領域內的權威文獻數據進行分析,通過提取聚類標簽和附加時間標簽,繪制出研究主題、研究熱點和研究前沿三類科學知識圖譜,選取相對應的指標用于分析和評價,客觀揭示主題漂移規律、熱點聚類分布和前沿研究趨勢,為該領域繼續深入相關研究的科研人員提供知識參考和新的研究思路。

2 數據來源與知識圖譜構建方法

2.1 文獻數據來源本文選擇中國知識基礎設施工程(簡稱“CNKI”)權威數據庫作為數據來源,以CNKI檢索采集的文獻數據作為水生態環境研究知識圖譜構建的實驗數據。考慮到國內數據庫存在檢索方式和數據格式上的差異性,本文采用六元組檢索模型在CNKI上進行數據采集檢索,六元組模型包含檢索式、檢索字段、檢索模式、時間跨度、文獻類型、數據來源六方面的檢索設定。利用六元組模型構建本文的檢索策略(表1)。

國內水生態環境研究是在水環境和水生態領域探索的基礎上發展而來,包括:水質評價、生態水文、生態需水、流域生態、淡水生態等研究內容,由此確定中文文獻數據的檢索式為:TS1=“水環境保護or水生態保護與修復or生態需水or流域生態or水生態環境管理or流域生態環境改善or生態水文”,TS2=“水污染or水資源保護or海綿城市or河流生態or河口近岸海域生態or湖沼濕地生態or坡面生態or水土保持”,根據TS1對CNKI進行主題(Topic)檢索,可保證查全率,根據TS2對CNKI進行“篇名(Title)or關鍵詞(Keywords)or摘要(Abstract)”檢索,可保證查準率,對檢索條目進行檢查,去除報告、新聞、會議通知等不相關條目。

2.2 知識圖譜構建方法知識圖譜(Knowledge Graph)以特定知識領域為對象,顯示知識發展進程與結構關系的一種圖形,具有“圖”和“譜”雙重性質與特征:既是可視化的知識圖形,又是序列化的知識譜系,本質上是具有屬性的實體通過關系鏈接,由“點-邊”組成的大規模網絡圖,其中,節點表示概念/實體,邊表示概念/實體間的語義關系[9]。本文知識圖譜是水生態環境知識工程的形式化表達,以知識網絡形態展現該領域的類別、實體、屬性或關系關聯,顯示該研究領域中各知識單元或知識群之間網絡、結構、交叉、演化或衍生等諸多復雜的關系,實現事實型知識和過程型知識的陳述,形成對水生態環境知識的專業性認識。核心是建立水生態環境知識庫,然后通過引文分析、聚類分析生成特定的知識語義網,最終具備對主題詞、關鍵詞和名詞短語等文獻關鍵要素進行大規模實時關聯和特征分析的能力[10]。其中,“節點”表示水生態環境類別、主題及對應的屬性值,“邊”表示的關系包括:“類別-類別”、“類別-主題”、“主題-主題”、“主題-屬性”和“屬性-屬性”。

表1 中文文獻檢索六元組模型

水生態環境知識圖譜的構建分為數據模式層定義與數據層構建兩部分。數據模式層定義研究領域的知識類別、主題(實體)、屬性或關系關聯等,本文在對數據模式層的定義上,采用CNKI標引的文獻字段規則來識別文獻中的類別和主題(實體)、關系和屬性等[11],數據模式層對文獻字段識別規則的定義如表2所示;數據層建設包括:知識獲取、知識融合、知識存儲、知識推理、知識更新5個階段(圖1)。

表2 數據模式層定義的文獻字段識別規則

圖1 水生態環境研究知識圖譜數據層構建流程

(1)知識獲取。從采集的文獻中抽取知識,包括實體、屬性和屬性值、關系,首先,實體抽取根據數據模式層定義的文獻字段識別規則識別出命名實體(分布在標題、關鍵詞、摘要中的主題詞、關鍵詞和名詞短語)[12];其次,屬性和屬性值抽取是為每個研究類別構造屬性列表,并為研究類別中的實體附加屬性值(各命名實體的出現時間、分布時段、出現頻次等)[13];最后,關系抽取是施引文獻和被引文獻之間引文關系和相似性關系的抽取[14],引文關系包括共現關系和共引關系(圖2),相似性關系包括字符相似、屬性相似和結構相似。

(2)知識融合。知識融合包括數據模式層、數據層的融合[15],數據模式層融合是根據數據模式層定義的文獻字段識別規則建立數據映射時,通過設置合并規則來確保數據的統一;數據層融合包括實體合并、實體屬性與關系的合并、屬性值的規范化[16],其中,實體合并是將具有歧義的實體指稱項鏈接到文獻字段識別規則中的符號項,實現實體消歧,實體屬性與關系的合并是更新具有時態特性的屬性,將再次出現的實體并入該實體首次出現的時段屬性中。

(3)知識存儲。融合后的知識通過建立圖數據庫中概念和文獻字段識別規則的映射關系實現存儲和查詢,實體查詢及重要性排序是通過計算實體屬性與關系的相關度來實現[17]。

圖2 引文關系網絡

(4)知識推理。首先,基于文獻字段識別規則進行引文分析和相似性分析,再對分析結果進行聚類分析,采用面向引文網絡鏈接關系的聚類,避免由節點屬性聚類引起的局部最優缺陷,形成關系網絡,提取隱含的知識和關系[18];其次,對聚類結果進行網絡剪枝,尋徑網絡算法(Pathfinder)對每一時段的網絡結構和整體網絡結構進行剪枝,獲得最優網絡結構,最后,使用LLR(Log-Likelihood Ratio)算法提取優化后的網絡結構標簽,得到的聚類標簽會有效減少重復項[3]。

(5)知識更新。隨時間變化,水生態環境知識會發生不斷變化,對新發表的相關文獻再次進行知識抽取和知識融合,完成領域中知識類別、主題(實體)、屬性或關系關聯的周期性更新,最后將其存入水生態環境知識庫。

2.3 研究方法和分析指標選取本文采用定性分析與定量研究相結合的信息分析方法,對經六元組模型檢索整理后的文獻數據進行知識圖譜構建和分析。選取發文量、學科、主題詞、關鍵詞和名詞短語作為研究對象,進行時序分布、學科分布、研究主題、研究熱點、研究前沿等五個方面的特征分析,形成對水生態環境研究領域發展變化的初步認知:①時序分析。對發文量按時序進行統計分析,根據不同時段發文量的變化趨勢,分析研究重心的轉移特征,探究1992—2017年不同時段內水生態環境研究的發展變化及其影響因素;②學科分析。對水生態環境研究的學科分布進行統計分析,揭示該領域權威文獻的研究層次、學科分布現狀和研究主題在學科中的受關注程度;③研究主題分析。借助共被引形成的主題相似性思想,建立主題詞兩兩共被引矩陣,聚類分析生成的主題詞譜系圖反映主題之間的親疏關系,多維尺度分析生成的多維尺度圖反映主題知識結構特征和核心主題內容,進一步揭示不同主題詞相互影響下的時段分布特征,加上時間標簽,探究不同時段以主題詞為主要表征方式的主題漂移特點[19-20];④研究熱點分析。關鍵詞共現聚類分析生成研究熱點圖譜,通過對整體網絡、聚類子網絡的橫向和縱向分析,探究不同時段內由各研究熱點聚類生成的知識群組;⑤研究前沿分析。研究領域內的最新演變趨勢和相互影響,通過Kleinberg突變檢測算法的研究前沿分析,探究不同時段下的研究前沿及未來研究方向。本文提出面向水生態環境研究領域的知識分析框架(圖3),考慮領域專業知識的所有表征方式,主要通過詞間關系的數據挖掘進行知識發現,為將來更深入的信息挖掘提供一些借鑒。

從發文量探究國內水生態環境研究的時序分布特征及同國際間的區別,從學科分類分布揭示國內水生態環境研究的科學領域結構,完成該研究領域的宏觀分析。其次,從微觀視角出發,主題詞共詞矩陣分析確定該研究領域的主題知識結構,通過多維尺度分析,進一步揭示研究主題之間的親疏關系和研究主題所處的發展階段;關鍵詞共現聚類分析則從復雜、整體上按聚類的時段分布和聚類之間的關聯程度,展現研究領域的熱點知識結構,每個時段局部的典型聚類分析,得到其研究熱點。最后,研究前沿分析是從特殊視角出發,以時區視圖的方式反映各個子領域發展演進的時間跨度和下階段的研究方向。

圖3 水生態環境知識量化分析流程

表3 知識圖譜分析指標說明

本文選取文獻量、學科分類作為水生態環境研究統計分析的指標。以研究主題、研究熱點、研究前沿分析為例,進行水生態環境研究知識圖譜的應用研究。選取主題詞、關鍵詞和名詞短語作為知識圖譜分析的具體對象,探索研究主題、研究熱點和研究前沿。相關分析評價指標選取說明(表3):

(1)研究主題。主題詞是文獻核心內容的高度概括,反映某研究領域的研究方向。確定受控的、被統一標引的主題詞作為共詞矩陣分析的基本單元,其在檢索平臺規范化處理之后在檢索性能方面優于關鍵詞[5,20]。選取主題詞的被引詞頻作為研究主題的分析指標,被引詞頻記錄一組主題詞被同一篇或同一組文獻引證的次數,以測度之間的依賴關系。研究主題知識圖譜的評價指標選取,主題詞R型因子分析的載荷系數反映研究主題的顯著程度,因子得分(貢獻率、方差累計貢獻率≥60%)確定研究主題分類。相關系數度量主題詞之間的相似性,各研究主題分支聚類時,合并兩個相關系數最大的類。熵值和基于類的F值用于評價、驗證單個或整個聚類結果[21]。擬合度量值Stress確定維度數,值越小,說明模型適合度越高,效度估計值RSQ越大,說明分布在戰略坐標中各主題詞間的距離與實際輸入距離(被引詞頻)越合適,Stress和RSQ確定水生態環境研究領域內的核心研究主題和研究主題整體網絡結構。

其中,主題詞提取通過源文獻共被引檢索手段,對1992—2017年國內水生態環境文獻數據中的主題詞歸納整理,獲得961個,利用《水利水電科技主題詞表》、《水利水電工程技術術語》(SL 26-2012)等中出現的科技主題詞,對語料庫中的文獻進行分詞,分詞結果數據清洗后,借助TF-IDF計算方法從文獻中提取反映不同時段知識群組研究特色的高頻主題詞,時段高頻主題詞的提取結果為:

其中:

式中:TF(x)為主題詞在某時段中的詞頻;IDF(x)為主題詞在全時段中的詞頻,IDF(X )為平滑處理后主題詞在全時段中的詞頻;N(x)為原始主題詞表中某主題詞的時段詞頻,N為整個時段的主題詞總數。

為防止新主題詞(N(x)=0)的出現,常用的IDF通過式(2b)進行平滑處理。該矩陣為鄰近矩陣,對角線值取該主題詞與其它主題詞共被引頻次最高值+1表示,為測度多個研究主題之間的相似性,且保證共被引矩陣中0存在條件下的穩定性,原矩陣系統聚類方法為:組間連接法,將共被引矩陣轉化為Pearson’s相關系數矩陣,并進行標準化處理。假設主題詞的聚類結果為C={C1,C2,…,Cm}(1 ≤i<m ),m是樣本 個數,人工判 定主題 結構為 P={P1,P2,…,Pn}(1 ≤j≤n),n是數據分析指標,則可計算C中每一個聚類Ci的熵值:

對每一個聚類Ci存在:表示在人工判定主題范圍內循環一次后聚類Ci的最大值,計算最終F值:

(2)研究熱點。關鍵詞是文章的核心議題,關鍵詞共現(Keyword Co-appearance Analysis,KCA)網絡揭示某一領域當前及過去產生的熱點研究[22]。選取關鍵詞的共現詞頻、出現年份和分布時段作為研究熱點的分析指標,共現詞頻記錄一組關鍵詞在同組文獻中出現的次數,以測度之間的耦合關系。研究熱點知識圖譜的評價指標包括:①圖譜整體網絡結構的評價指標:節點數、連線數和密度,用來描述網絡鏈接程度;②圖譜聚類指標:聚類模塊值(Modularity,Q值),Q>0.3認為圖譜聚類結構明顯,聚類平均輪廓值(Silhouette,S值),S>0.5認為聚類合理,S>0.7認為聚類具有較高的可信度;③圖譜節點指標:結構洞、中心性和突現度,突現度是一定時間段內關鍵詞的頻次變化率較高,預示著研究熱點的轉變[23],借助社會網絡分析(Social Network Analysis,SNA)中不同個體構成整體網絡的結構及相互關系概念,構建的“結構洞+中心性”分析體系可研究知識實體的關系鏈接及結構[24]。

式中:i、 j、q為節點,P為節點間連接關系的權重比例,C為所求節點的限制度指標,g為節點之間存在的捷徑數,C(n)為所求節點的中介中心度指標。

(3)研究前沿。名詞短語反映某研究領域中未來研究熱點問題的新動向,為研究者提供該學科領域的最新演化動態[27]。選取名詞短語的詞頻、頻次變化率、出現年份和分布時段作為研究前沿的分析指標,頻次變化率較高的名詞短語可反映當前時期領域中的關鍵研究。研究前沿知識圖譜的評價指標包括:信息熵、中心性和突現度,信息熵是對研究前沿中知識變化不確定性的一種度量,根據整個時期累積的詞匯量進行回顧性計算,預示著領域前沿研究總體格局改變的必要性,若分析指標的信息熵越小,表明指標值變異程度越大,指標所提供的信息量越多,相應權重越大,在綜合評價中該分析指標所起作用越大。

3 水生態環境研究的結果分析

3.1 水生態環境研究統計分析

3.1.1 文獻量時序分布特征 為比較國內水生態環境研究發展同國際間的差距,本文另統計了中文社會科學引文索引數據庫(簡稱“CSSCI”)和WOS(Web of Science)中水生態環境研究主題的發文量。圖4是體現文獻量時序分布特點和變化規律的時序分布圖。從水生態環境研究領域文獻發布的年代來看,國內進展符合“Shneider四階段理論”[28],WOS與CNKI、CSSCI在發文量及變化趨勢上存在明顯差異,前者處于穩步提升階段,CNKI波動較大,在2014年停止增長,之后處于波動狀態;CSSCI則一直處于持平階段,表明在水生態環境研究領域中國內與國際研究進展存在較大差距,國內該研究領域地位的提升未來需更深入的研究積累,其中的科技類研究發展進程豐富,而人文社科類研究達到飽和狀態。通過指數曲線回歸模型對累計百分比進行偏差分析,y=0.0116e0.1856x(R2=0.9538)表明曲線與數據線擬合效果較好,表明該領域總體發文量呈現指數式增長規律,說明水生態環境研究逐漸受到國內眾多學者的關注和重視。

圖4 水生態環境研究領域中外文文獻時序分布

國內水生態環境研究由1970年代末水資源研究擴展至1980年代初水環境保護研究演變而來,依據圖2該研究領域發展歷程大致分為3個階段:①1992—2004年是水生態環境研究的萌芽起步階段,國內學者在傳統水資源研究的基礎上,逐步開展水環境保護方面的研究,主要是全國城市飲用水水源地安全保障規劃提出了調查評價的理論方法和技術體系,解決了水源地保護中存在的監控及標識等若干關鍵技術問題[29]。該階段文獻發表較少但研究范圍不斷擴大,其理論體系不斷完善,相關研究逐步開展,已引起相關領域研究學者的關注;②2004—2012年處于曲折增長階段,是我國生態需水研究、生態水文研究、典型地區流域水循環過程中水文水資源的生態效應研究的高峰期。為緩解我國干旱西北地區水資源供需矛盾,開展了以生態需水計算方法為主的生態需水及生態水文理論及技術研究[30]。1980年代至1990年代初水土保持的減水減沙效應研究為水土保持的水資源和水環境效應研究(2005—2007)提供了理論支撐,形成了面向水生態與環境多任務需求的水土保持規劃理論及技術體系,自此國內生態需水研究及探索流域生態水文規律為主的基礎研究已基本成型[31-32]。2009年CNKI趨勢線出現波動,國內水生態環境研究以支撐流域水資源調配與管理的生態環境需求為前提,轉向流域生態環境相關的計算及工程技術研究;③2012—2017年該領域呈現迅速繁榮態勢,該階段主要面向水生態環境保護和修復的理論及技術應用研究。開展了針對不同地貌類型區域的植被恢復、修復技術及產生的水文效應研究[33];關注點轉向河流生態健康評價理論、水生態環境保護與修復等方面,促進了生態水利的提出(2012年)和發展,面向最嚴格水資源管理制度下的水資源論證技術得以完善[34]。2015年《水污染防治行動計劃》發布,旨在解決我國面臨的水生態環境問題,也是CNKI趨勢線從2014年開始呈波浪式變化的主要原因,說明當前水生態環境研究需擴展研究思路,提高創新力度。黨的十八大提出水生態文明建設,水生態環境研究領域從支撐水生態環境管理為目標的應用技術研究轉向促進流域生態環境改善為前提的工程實踐研究,國內水生態環境研究進入全新階段。研究領域呈現出以生態水利相關理論與實踐研究為基礎,以國內水生態環境問題和國家關于水生態環境恢復與建設的戰略方針為導向的特征[35-36]。

3.1.2 學科分類分布特征 對國內水生態環境研究文獻統計分類,得到其學科分類分布圖(圖5)。左側是其施引文獻所在的學科分布,主要學科:環境科學與資源利用(28.13%)、生態(15.30%)、水利水電工程(13.59%)、城鄉規劃與市政(12.08%)、資源科學(9.87%)、農業經濟(7.01%)、建筑科學與工程(4.37%)、農業資源與環境(2.90%)等,表明水生態環境研究的領域應用。右側是對應被引文獻所在的學科分布,其引用的主要學科具體為環境科學、水資源研究、自然資源學、生態學、生物學(水生物學)等,表明水生態環境研究的研究基礎,水生態環境是多學科共同關注的研究。當前水生態環境研究的期刊來源中共30個研究子學科左右,主要集中于地理環境(9.39%)、流域生態(8.18%)、水環境保護(7.15%)、生態補償(6.83%)、生態環境(6.23%)、水資源(5.89%)、水生態文明建設(3.92%)、可持續性發展(3.65%)、水生態(3.37%)、生態補償機制(2.48%)等,同時,該領域研究具有理論基礎研究向應用技術和工程實踐轉型的特征,呈現多學科交叉。

圖5 水生態環境研究文獻學科分類分布

3.2 基于主題詞共詞矩陣分析的研究主題識別通過主題詞提取方法獲得49個時段高頻主題詞作為分析對象(表4),通過這些主題詞之間的被引詞頻構建49×49共被引矩陣,即因子模型,因子分析確定研究分支數后,轉化為Pearson’s相關系數矩陣,作為系統聚類分析、多維尺度分析的基礎,綜上,繪制水生態環境研究領域中研究主題的知識圖譜。

因子分析是在少損失信息或盡可能不損失信息的情況下,將多個變量指標降維為少數幾個因子的多元統計分析方法。主題詞共詞矩陣(49×49)下的R型因子分析,提取到12個因子,每個主題載荷系數的大小表示該主題在各個因子中的載荷程度,值越高表示主題研究在水生態環境領域的顯著程度越強。15個主題詞在單個因子中具有較高的負載值(得分≥±0.60以上),特別是“指標體系”(因子1)和“生態需水”(因子3)各自連接的分支5和分支3研究在該領域有顯著體現(得分≥±0.70以上),12個主題詞在組間連接下的多個研究分支中具有顯著體現(得分≥±0.40以上),如流域治理、生態補償機制、水利水電工程等。其中,累積貢獻率約78.067%的總方差存在12個潛在因子,前7個主因子累計貢獻率為62.900%且取值均大于1,表示其所代表的主題是水生態環境研究領域的主要研究方向,貢獻率依次為:18.888%、10.975%、8.180%、7.780%、6.621%、5.935%、4.521%,說明主題詞共被引矩陣降維至12,能表達整體信息的78.067%。借助因子分析結果,結合聚類分析中的R型聚類方法進行共引聚類分析,得到主題詞聚類分析譜系圖(圖6),縱軸為各研究主題詞,反映研究內容親疏關系的主題詞相互連接,譜系圖更揭示了水生態環境領域中各研究分支之間的內在關聯及歸屬層次,每個研究分支由不同親屬關系的研究主題聚合而成。計算Pearson’s相關系數的聚類評價指標的平均得分,熵值為0.3917,基于類的F值為0.7145,熵值較小,基于類的F較大,說明聚類結果較為合理;同時,與因子分析結果相比有較高的一致性,圖中虛線為各主題詞聚類最優解。綜合因子得分≥±0.40的12個潛在因子,根據聚類結果可解釋水生態環境領域中存在12個研究分支:分支1,水資源保護科學的理論方法及技術研究;分支2,面向流域(區域)的水功能區劃研究;分支3,不同典型區域下的生態需水計算模型及生態水文研究;分支4,水生態保護和修復的理論及技術研究;分支5,評價指標體系研究;分支6,流域生態水文規律及作用機理研究;分支7,水生態環境管理理論及技術研究;分支8,流域生態環境污染治理及修復研究;分支9,生態環境保護與修復研究;分支10,水利水電工程和生態水利研究;分支11,水生態文明城市和海綿城市研究;分支12,水資源管理理論及技術研究。

以沈陽主城區不同空間布局的448個小區的房價進行回歸分析。首先,進行了經典線性回歸模型(OLS)的估算,計算OLS結果如表1所示。

表4 1992—2017年國內水生態環境研究時段高頻主題詞

因子分析和聚類分析從微觀視角探究了主題詞之間的內在關聯程度,而多維尺度分析以向心度和密度為參數繪制的主題知識圖譜從宏觀角度探究了主題集群間的相似性[37],圖7中各主題詞(點)的相關位置及距離反映了該領域各主題的集群關系,主題詞間距離越近,關系越緊密,反之關系越疏遠。其中,Stress值是0.12394,Stress優劣尺度評價:12.4%≤15%,近似程度為滿意,值較小,表明觀察數據與分析結果擬合較好,說明模型擬合度較高,RSQ值為0.99118,接近于1,表示圖中各點構形距離與輸入實際距離匹配度較高,二者反映出各主題間的相互影響強度較高,聯系強度緊密。坐標橫軸為向心度,表示各主題詞間相互影響強度,縱軸為密度,表示水生態環境研究領域內部聯系強度,I象限內各主題詞在流域生態需水及生態水文研究方向上都有體現,流域生態環境、不同修復措施下的水環境效應機理等研究主題處于“次核心”地位,理論成果發展較成熟,且研究主題間存在較高的交叉度;Ⅱ象限內主題領域內部聯系緊密,各主題詞表現于整個水生態環境領域的“核心”地位,共同構成了水生態環境管理下的應用技術研究方向,水功能區劃、最嚴格水資源管理制度下的水資源論證技術、水利工程環境影響評價、水資源保護技術等研究主題間的關聯程度較高,理論及技術成果較為成熟;Ⅲ象限內主題領域結構松散,各主題詞定位于生態環境應用研究方向中,水生態系統保護與修復、水資源論證、水生態文明建設等研究主題關聯度較低,且發展不成熟,處于研究領域的“邊緣”地帶,表明上述研究具有較大的發展空間;Ⅳ象限內各主題詞聚類到流域生態環境改善研究方向,水土保持、面源污染治理等研究主題下的相關理論研究成果處于“核心”地位,但以此為基礎的工程實踐技術仍不成熟,需不斷創新。

圖6 主題詞聚類分析譜系圖

圖7 研究主題知識圖譜

3.3 基于關鍵詞共現聚類分析的研究熱點辨識經尋徑網絡(Pathfinder)算法修剪的水生態環境研究熱點知識圖譜保留了最重要的節點關聯,將致密冗余的原網絡簡化為表達清晰研究熱點聚類結構的最有效網絡,其中節點半徑、顏色深淺和連線距離、密度反映了關鍵詞的出現頻率、被引年份和關鍵詞的直接、間接聯系(圖8)。共現網絡存在428個節點,529條連線,密度為0.0058,說明網絡鏈接程度緊密,各主題詞間共現程度較高。Q值為0.8499,說明熱點研究聚類效果明顯,S值為0.6328,說明研究熱點的同質性較高,呈現較集中化的特點。圖8中明顯的關鍵節點為:水環境、海綿城市、生態補償、流域、水資源、生態環境等,即出現的高頻熱點詞;突變強度較大的關鍵詞有13個:生態補償(Burst=50.2362)、低影響開發(Burst=43.8269)、流域(Burst=24.944)、水生態文明(Burst=22.473)、年徑流總量控制率(Burst=18.4514)、濕地(Burst=18.3414)、生態補償機制(Burst=17.7084)、生態系統服務(Burst=16.0453)、生態需水(Burst=15.0045)、生態補償標準(Burst=14.433)、生態恢復(Burst=13.7246)、生態水文(Burst=13.3648)、流域生態補償(Burst=13.3148),這些關鍵詞出現頻次增長較快,且主要分布于2008—2017年,是該領域亟需解決也是學者關注的熱點問題。此外,海綿城市、低影響開發、雨洪管理、城市內澇及水生態文明是2013年后出現的新研究熱點。經“Circle Packing Of Clusters”方法生成13個子聚類,分別對應圖8中13個凝聚子群,凝聚子群在水生態環境領域中體現出一定的生命周期和多元化特征,依次為:(1)水環境知識群組(1992—2017年),在傳統水資源研究基礎上拓展,包括水質評價、生態需水等熱點;(2)水資源污染及治理知識群組(1996—2013年),為構建健康河流理論體系奠基,包括小流域、綜合治理等熱點;(3)生態系統及水土保持措施知識群組(1994—2016年),促進流域尺度下的水土資源開發研究,包括水土流失、水源地水質等熱點;(4)水資源污染治理知識群組(1996—2013年),是生態環境研究出現的萌芽,包括:岸邊污染帶、對策等熱點;(5)生態環境及生態經濟系統知識群組(1993—2013年),水生態環境研究為工程水利逐步定位,包括質量、可持續發展等熱點;(6)流域生態及生態需水知識群組(1997—2014年),研究成果在水資源和水工程規劃中發揮了關鍵性作用,包括水生態系統、河流生態等熱點;(7)生態補償及指標體系知識群組(1994—2012年),包括生態承載力、補償標準等熱點;(8)生態補償機制及生態修復知識群組(1997—2011年),水生態修復為水生態文明的發展提供了契機,包括土地利用、生態安全等熱點;(9)生態系統服務及生態足跡知識群組(1997—2012年),包括水生態足跡等熱點;(10)海綿城市知識群組(2014—2017年),其是城市水生態環境的范疇,包括低影響開發、年徑流總量控制率等熱點;(11)水生態文明知識群組(1998—2016年),為水生態文明試點建設提供了指導,包括指標評價體系等;(12)低影響開發知識群組(2014—2016年);包括城市內澇、雨水花園等;(13)生態水利工程知識群組(2005—2017年),流域生態環境改善及恢復下的理論及技術實踐,包括濕地、面源污染治理、流域綜合規劃等。由此看出,國內水生態環境領域具有較好的水環境保護、特定領域下的生態需水、面向生態環境的水生態保護與修復等理論及技術研究基礎,以滿足水資源管理和調配的生態環境為前提,發展流域生態環境下的計算及工程應用研究、水生態文明建設、海綿城市已成為目前研究熱點,因此圖譜呈現多中心交叉的枝狀分布特點。

通過“結構洞+中心性”分析體系,得到1992—2017年水生態環境領域內按時序凸顯的關鍵詞表(表5),圖8中,“水資源”節點q是“生態補償”節點i和“流域”節點 j的共同鄰接點,Pij是“生態補償”節點i的所有鄰接點中“流域”節點j所占的權重比例,Ci即為“生態補償”節點i的限制度指標;圖8中,“流域”節點 j和“水資源”節點k之間存在捷徑數 gjk,且兩者之間存在經過“水環境”節點i的捷徑數為為“水環境”節點i控制此兩節點的聯接能力,即為中介中心度指標。圖8中角標明顯的節點,對應表5內容,在水生態環境領域中,水環境、海綿城市、生態補償、水資源、流域、生態環境和水生態是學者關注的研究熱點的集中體現。

圖8 研究熱點知識圖譜

表5 1992—2017年國內水生態環境領域研究熱點關鍵詞(頻次≥100)

3.4 基于Kleinberg突變檢測算法的研究前沿分析通過Kleinberg突變檢測算法從標題和摘要中探測出按詞頻時間分布的詞頻和頻次變化率均高的名詞短語(Noun Phrases),將追蹤到的名詞短語根據主題進行歸納,得到反映研究前沿趨勢變化的信息熵圖(圖9),對應1999年至2010年上半年,突出顯示了連續和陡峭的熵值增加,不確定性的顯著增加是新興宏觀性質的體現,即水生態環境領域的研究重心發生變化,預示著新研究內容的注入。圖10是研究前沿的樣點分布趨勢圖,樣點位置顯示在XY平面中,每個樣點的感興趣屬性值通過Z軸豎線高度表示,利用全局多項式的內插方法擬合樣點趨勢面,探測縱向趨勢(X軸)和維度趨勢(Y軸)發現,樣點分布趨勢與研究前沿信息熵的變化趨勢相一致,樣點分布趨勢圖中的峰谷基本定格了前沿研究的具體類型,根據首次被引用的時間,2000年時區中的文獻最少,1999年、2001年時區次之,表明該領域處于低谷時期,其余時區是該領域發展的較繁榮時期。1992年、1993年時區與1994—1999年間各個時區中的節點的連線關系密集,表明1992年、1993年與1994—1999年間各個時間段的傳承關系較強,與此后各個時區的傳承關系較弱,2000—2017年間各個時區的傳承關系主要來源于1996年、1998年、1999年3個時區,其中1998年時區對各個時區的傳承關系最強,且影響至今,說明水生態環境研究前沿的時變特征。

圖9 研究前沿信息熵圖

圖10 研究前沿樣點分布趨勢圖

對生成時區視圖前的整體網絡結構進行社會網絡分析,自動聚類的網絡存在475個節點,1082條連線,密度為0.0096,將名詞短語作為網絡節點,名詞短語之間的共現關系作為節點連線,節點越大越接近中心地位,屬于前沿研究,統計具有中心性和突現度的名詞短語,如表6所示。

生成包含表6中名詞短語的研究前沿知識圖譜(圖11),反映前沿知識演進的時區視圖,以時區視圖的可視化方式描繪水生態環境研究在時間跨度上的過渡本質、演變趨勢和相互影響。參考圖9和圖10,水生態環境領域研究前沿顯著表現為3個研究階段。1992—1998年,初期研究主要體現為具體案例(飲水安全問題、西北地區生態需水研究等)和發展完善水資源、水工程的理論及技術實踐研究,表征該階段研究前沿的名詞短語包括:水環境、生態環境、水土流失、質量評價、水污染、水土保持、生態經濟系統等,中心性為0.27的“水環境”是初期各研究分支的根節點,“生態環境”、“水土保持”、“水土流失”、“生態服務”及水庫個案研究成為該領域早期受關注程度較高的前沿研究分支,呈現出較高的突現度。1999—2011年,該階段突現出較多的名詞短語,多個研究集群中呈現出中心性和突現度的集中分布,在1992—1998年研究基礎上,水生態環境領域衍生出多個新的前沿研究分支,表征該活躍階段研究前沿的名詞短語包括:生態需水、生態用水、生態恢復、生態水文過程、健康風險評價、生態系統健康、生態水文學等,其中面向具體流域的生態系統研究集群、以生態補償為核心的研究集群和面向生態環境問題的水生態保護與修復、生態系統服務研究集群拓展力度較大,表明該研究領域進入活躍期,各研究分支轉向應用研究,趨向具體化。2012—2017年,水生態環境領域前沿研究的瓶頸期,海綿城市、流域尺度下水土資源合理開發及水生態文明建設等經濟思想,生態水文學等新興學科的交叉引進,既注重坡面植被、河流水系、湖沼濕地、河口近岸海域等流域水循環耦合生態系統的生態水文規律基礎研究,也偏向于管理和改善水、流域生態環境的工程應用研究,表征研究前沿的名詞短語包括:水生態文明、海綿城市建設、風景園林、生態系統服務、生態環境需水量、景觀格局、生態健康、生態系統服務價值、評價指標體系、徑流總量控制(年徑流總量控制率)、水生態承載力、風景園林、生態安全等,水生態文明、低影響開發、海綿城市建設和面向最嚴格水資源管理的水資源論證技術具有較高的突現度和一定的中心性,成為當前和未來一段時間內的前沿研究分支。

表6 1992—2017年國內水生態環境領域研究前沿名詞短語

圖11 研究前沿知識圖譜

4 結論

本文以CNKI文獻檢索引擎為數據來源,通過構建水生態環境研究知識圖譜,進行行業知識挖掘。以CiteSpace、SPSS為支撐工具,從知識圖譜視角出發,采用定性分析和定量研究相結合的方法,對1992—2017年國內水生態環境主題文獻數據進行多方位分析。研究結果表明,國內水生態環境研究發展符合“Shneider四階段理論”描述,本文構建的“文獻量時序分析&學科分析(宏觀)→主題詞共詞矩陣分析(微觀、直觀)→關鍵詞共現聚類分析(復雜、整體)&典型聚類分析(局部)→名詞短語突變檢測分析(特殊)”信息分析方法是合理有效的。

本文以統計分析方式分析了國內水生態環境研究的發展現狀,以知識圖譜方式分析了國內水生態環境領域的研究主題、研究熱點和研究前沿,研究發現:

(1)國內水生態環境研究發展水平同國際間存在一定差距,發展效率較低,主要受國內水生態環境問題和國家關于水生態環境政策方針的影響,近十多年來,該領域學者對水生態環境的研究興趣增長較顯著,引發了較多新的研究創新點。

(2)國內水生態環境研究在多個領域內備受關注,且在環境科學與資源利用、生態、水利水電工程、城鄉規劃與市政中受關注程度較高,說明水生態環境研究呈現多研究目標、多研究層面、多研究學科交叉融合的復雜特征。

(3)研究主題演進路徑明確,分為三個階段:①1980年代初,開展針對飲水安全問題的水環境保護研究;②90年代末,開展面向水資源和水工程規劃的生態需水研究;③自2009年開始,開展促進生態水利發展的生態環境應用研究。各階段熱點主題豐富明確,發展較集中,研究主題緊跟與國內水生態環境相關的時政熱點問題,具有充足的政策導向性。

(4)研究熱點知識網絡結構聯系緊密,時間維度上具有豐富的進程特征,圖譜中各階段有明確突出的研究熱點,且集群化程度較高,說明水生態環境研究領域內有較好的研究氛圍。

(5)各時段研究前沿脈絡清晰,有較強的繼承關系且彼此聯系緊密,核心演變路徑體現為:“流域生態水文規律研究→水生態環境管理技術研究→流域生態環境改善、恢復研究”,以支撐流域水資源調配管理的生態環境需求為前提,促進生態水利、水生態文明建設、流域生態環境相關的計算及工程技術等研究,表示國內水生態環境研究從宏觀、共性的理論研究正轉向以此為基礎的區域、特性的工程技術應用研究。

目前,以科研論文為媒介的科學知識圖譜已成為研究領域中知識發現的重要方式,能夠對過去的事實型知識和過程型知識進行陳述,但由于缺少語義關系的解析和梳理,所以對文獻要素進行大規模實時關聯和特征分析的推理能力仍比較薄弱。下一步將以詞句、詞篇關系的數據挖掘方式探索水生態環境研究領域內的新知識,以提升水利信息化的專業性。

猜你喜歡
生態分析研究
FMS與YBT相關性的實證研究
“生態養生”娛晚年
保健醫苑(2021年7期)2021-08-13 08:48:02
遼代千人邑研究述論
隱蔽失效適航要求符合性驗證分析
住進呆萌生態房
學生天地(2020年36期)2020-06-09 03:12:30
生態之旅
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
電力系統及其自動化發展趨勢分析
主站蜘蛛池模板: 国产午夜福利片在线观看| 欧美在线综合视频| 欧美高清三区| 无码一区18禁| 国产18在线| 亚洲第一黄片大全| 国产经典免费播放视频| 亚洲国产天堂久久九九九| 国产在线一区二区视频| 777午夜精品电影免费看| 婷婷综合色| 亚洲AV无码精品无码久久蜜桃| 久久国产乱子| 亚洲成a人片77777在线播放| 91丝袜在线观看| 欧美视频在线不卡| 欧美精品高清| 亚洲人人视频| 国产精品人成在线播放| 亚洲免费播放| 国产美女自慰在线观看| 亚洲第一天堂无码专区| 欧美国产菊爆免费观看 | av天堂最新版在线| 欧美日韩中文国产| 国产毛片不卡| 国产精品一区二区不卡的视频| 国产小视频a在线观看| 青青草一区| 久久人午夜亚洲精品无码区| 无码福利视频| 40岁成熟女人牲交片免费| 波多野结衣一区二区三区AV| av一区二区三区在线观看| 欧美日韩国产在线观看一区二区三区| 另类专区亚洲| 日韩欧美国产综合| 99久久精彩视频| 国产乱人伦AV在线A| 亚洲欧美一区二区三区蜜芽| 色婷婷色丁香| 成人午夜免费视频| 91在线一9|永久视频在线| 婷婷综合亚洲| AV熟女乱| 天堂成人在线| 日韩a在线观看免费观看| 色老二精品视频在线观看| 狠狠v日韩v欧美v| 成人字幕网视频在线观看| 9啪在线视频| 不卡网亚洲无码| 人妻丰满熟妇啪啪| 中文无码精品a∨在线观看| 亚洲妓女综合网995久久| 国产丝袜丝视频在线观看| 国产麻豆aⅴ精品无码| 国产视频你懂得| 国产成人高清在线精品| 青青青伊人色综合久久| 国产91无码福利在线| 精品三级网站| 成人在线亚洲| 亚洲天堂网站在线| 色偷偷一区二区三区| 人人澡人人爽欧美一区| 无码网站免费观看| 国产成人无码Av在线播放无广告| 五月婷婷激情四射| 久久综合伊人 六十路| 国产精品55夜色66夜色| 国产一级在线播放| 国产高潮流白浆视频| 高清码无在线看| 日本在线亚洲| 狼友视频一区二区三区| 亚洲狼网站狼狼鲁亚洲下载| 伊人大杳蕉中文无码| 女人18一级毛片免费观看| 日本黄色不卡视频| 国产视频一区二区在线观看| 国产免费一级精品视频|