杜鳳青 程 凡 李 永
(1.國網(wǎng)上海市電力公司電力科學研究院,上海 200092;2.上海久隆企業(yè)管理咨詢有限公司,上海 200072)
放眼全球科技創(chuàng)新的發(fā)展,科研工作呈現(xiàn)出從單項技術創(chuàng)新向以產品和產業(yè)為中心的技術集群創(chuàng)新轉變的趨勢,不同技術緊密連接、學科領域交叉滲透。在能源電力領域,隨著全球能源互聯(lián)網(wǎng)理念的提出及發(fā)展,電力企業(yè)的業(yè)務活動和經(jīng)營模式呈現(xiàn)出前所未有的跨界特征,傳統(tǒng)電力產業(yè)鏈發(fā)-輸-配-售電的相關技術與大數(shù)據(jù)、云計算、信息通信、物聯(lián)網(wǎng)等新興技術不斷融合,并在廣度和深度上呈現(xiàn)出進一步增強的態(tài)勢。展望未來,電力企業(yè)科技創(chuàng)新所面向的技術范圍和類別將發(fā)生根本性變化,有效識別新興技術門類、形成適應能源互聯(lián)網(wǎng)的技術體系,是科技創(chuàng)新工作的基礎和前提。
目前,現(xiàn)有的能源電力技術體系框架存在技術領域覆蓋不全面、新興技術方向缺失等問題,已經(jīng)無法全面、科學展示能源互聯(lián)網(wǎng)的技術脈絡,不能滿足科技創(chuàng)新布局及項目管理的需要。
本文通過對學科演化及技術預見等先進理論和實踐的研究,基于當前能源互聯(lián)網(wǎng)技術領域識別及分類現(xiàn)狀,提出基于文獻計量法的能源互聯(lián)網(wǎng)技術領域分類方法,揭示能源互聯(lián)網(wǎng)技術結構,研究熱點和發(fā)展趨勢。
文獻計量法是以文獻體系和文獻計量特征為研究對象,采用數(shù)學、統(tǒng)計學等計量研究方法,通過對科學技術活動的代表文獻情報進行計量分析,研究其分布結構、數(shù)量關系、變化規(guī)律和定量管理,遴選前沿研究領域、研究項目和技術目標,進而探討科學技術結構、特征和規(guī)律的一門學科。本文采用文獻計量法中最為常用的作者共被引分析和共詞分析對文獻進行計量分析,以此來探討能源互聯(lián)網(wǎng)領域結構分布情況。
共被引分析由于高被引文獻的形成需要較長時間,而新興學科的研究往往人數(shù)眾多、作品比較分散、被引用情況不穩(wěn)定,因此,往往不能反映新文獻所代表的研究主題,從而更適合研究成熟學科的研究范式。共詞分析的研究對象是詞或詞組,通過分析詞與詞之間的親疏關系,推斷學科的研究熱點或研究范式,由于高頻詞往往反映的是熱點,所以更適合研究新學科的研究范式或成熟學科的研究熱點。
本研究所用數(shù)據(jù)來源于國網(wǎng)上海市電力公司科技創(chuàng)新智慧平臺,即中國知網(wǎng)(CNKI)中國學術期刊全文數(shù)據(jù)庫中與電力技術有關期刊,時間跨度為1912 年至2020 年。
作者共被引分析以文獻作者為基本單元,眾多學者按照被引證關系聚集成學科學術群體網(wǎng)絡,呈現(xiàn)出學科專業(yè)研究人員之間的聯(lián)系與結構特點,反映學科專業(yè)之間的聯(lián)系及其發(fā)展變化趨勢與規(guī)律。由于高被引文獻的形成需要較長的時間,因此,本文通過共被引分析研究的是能源互聯(lián)網(wǎng)相對成熟的技術領域[1]。
2.1.1 作者共被引頻次分析
首先,用BibExcel 軟件對數(shù)據(jù)進行被引頻次統(tǒng)計分析,篩選出電力技術領域被引頻次排名前100 位的學者,作為能源互聯(lián)網(wǎng)技術研究領域的代表人物。其次,對100位學者構建學者共被引頻次矩陣,用數(shù)字編號代替學者姓名,以方便數(shù)據(jù)獲取、分析。最后,將作者共被引頻次矩陣轉化為皮爾遜相關系數(shù)矩陣,并對其進行標準化處理,消除由學者被引頻次數(shù)量差距和文獻引用特性不同而造成的影響,使后續(xù)多元統(tǒng)計分析結果得到合理解釋。
2.1.2 因子分析
對皮爾遜相關系數(shù)矩陣進行主成分分析,原有的100 個變量,在第30 個主成分時累計貢獻率達到90.05%,即這30 個主成分能解釋原有變量90%的信息,具有一定的群體代表性,可以把這30 個主成分所代表的30 個學術群體作為能源互聯(lián)網(wǎng)技術研究歷程中最有影響力的主流學術群體。
2.1.3 聚類分析
上述分析是基于高被引頻次的計量分析,可能存在主成分劃分過細的問題,需要通過聚類分析進一步對學術群體進行分析和驗證。對皮爾遜相關系數(shù)矩陣進行系統(tǒng)自下而上的層次聚類分析,參照主成分分析得出的綜合因子數(shù)目進行聚類,使用Average-Linkage 聚類法獲得電力技術領域高被引頻次前100 位學者聚類樹狀圖。
2.1.4 結果分析
通過探究聚類樹狀圖1,可以將能源互聯(lián)網(wǎng)成熟的技術領域結構劃分為8 個研究領域,分別對應八大學術群體。

圖1 能源互聯(lián)網(wǎng)成熟技術八大研究領域及對應學術群體
由于能源互聯(lián)網(wǎng)技術領域學者的學術視野比較寬闊、研究領域比較寬泛,所以通過因子分析和聚類分析所劃分的學術群體會出現(xiàn)技術領域交叉的情況,因此,由此劃分的學術群體僅體現(xiàn)某領域學者間學術聯(lián)系密切程度,并不代表學者的研究僅限于此領域。
通過作者共被引分析研究了能源互聯(lián)網(wǎng)成熟技術領域結構,構建了能源互聯(lián)網(wǎng)技術領域基礎架構。下面利用共詞分析開展期刊高頻關鍵詞的共現(xiàn)分析,以此對共被引分析得出的技術領域分類進行驗證和補充,同時揭示能源互聯(lián)網(wǎng)技術的交叉領域、新興技術,追蹤研究熱點和趨勢[2]。
2.2.1 高頻關鍵詞選定
作為一篇文章核心內容的縮影,關鍵詞是作者學術思想與學術觀點的凝練體現(xiàn),可以代表該文章或作者的研究重點。本部分選擇2015—2020 年CNKI 數(shù)據(jù)庫SCI 和EI 期刊中與電力相關的文獻作為數(shù)據(jù)來源。經(jīng)過兩輪去除、合并、簡化處理,共得到13542 個關鍵詞。
受文章研究廣度限制,無法對全部樣本進行分析,需要選取一定范圍的高頻詞作為代表。為確保關鍵詞能代表研究熱點和趨勢,綜合考慮樣本大小、關鍵詞頻數(shù)總體變化情況及實際研究狀況,位于前166 位的關鍵詞(頻次≥10)詞頻數(shù)累計達到42%,可以認為其基本能夠表征能源互聯(lián)網(wǎng)技術領域的主要研究問題和研究熱點。
2.2.2 共詞聚類分析
應用BibExcel 軟件構建166 個高頻關鍵詞的共詞矩陣。對其進行系統(tǒng)自下而上的層次聚類分析,使用Average-Linkage 聚類法生成166 個關鍵詞的聚類樹狀圖,可以將近5 年能源互聯(lián)網(wǎng)技術領域結構劃分為40 個研究領域分支。剖析樹狀圖發(fā)現(xiàn),每個聚類中都包含了傳統(tǒng)統(tǒng)計學算法和現(xiàn)代人工智能算法,說明近5 年能源互聯(lián)網(wǎng)各個技術領域的研究都交叉融合了各類模型算法,如遺傳算法、有限元法、聚類分析、粒子群算法、潮流計算等,表明這是當前能源互聯(lián)網(wǎng)技術的研究熱點和趨勢。
為了更加清晰地透視能源互聯(lián)網(wǎng)核心技術的研究熱點和趨勢,將諸如主成分分析、神經(jīng)網(wǎng)絡、聚類分析、差分進化等算法剔除后,得到111 個高頻關鍵詞,再次構建共現(xiàn)矩陣、進行聚類分析。
2.2.3 結果分析
在能源互聯(lián)網(wǎng)技術領域,通過共詞分析得到4 個新技術領域及其研究熱點和趨勢,如圖2 所示。

圖2 能源互聯(lián)網(wǎng)新技術領域及其研究熱點和趨勢(基于共詞分析)
同時,對作者共被引分析得到的能源互聯(lián)網(wǎng)技術基本框架進行補充,豐富各個技術領域的子技術方向、研究熱點和趨勢如圖3 所示。

圖3 能源互聯(lián)網(wǎng)新技術領域及其研究熱點和趨勢(基于作者共被引分析)
本文提出了基于文獻計量法的能源互聯(lián)網(wǎng)技術領域分類方法,設計了能源互聯(lián)網(wǎng)技術分類模型。運用作者共被引分析、共詞分析構建了能源互聯(lián)網(wǎng)技術體系,梳理了能源互聯(lián)網(wǎng)技術12 大技術領域和若干技術方向,揭示了能源電力領域新興技術,追蹤了熱點技術方向和趨勢。
由于數(shù)據(jù)運算能力的限制,本文對能源互聯(lián)網(wǎng)技術領域的分類和能源互聯(lián)網(wǎng)前沿細分技術的挖掘仍存在不足,部分最前沿技術、新興研究領域可能未被發(fā)現(xiàn)。后續(xù),可針對未來技術的可能性、可行性、技術合作與競爭對手、未來技術優(yōu)先發(fā)展領域等進行全面判斷,為能源互聯(lián)網(wǎng)技術領域布局提供科學依據(jù)和參考。