■ 李 健 朱士超 張 文
1.北京工業大學經濟與管理學院北京現代制造業發展研究基地 北京 100124
2.北京工業大學區塊鏈研究中心 北京 100124
2008年,化名為“中本聰”(Satoshi Nakamoto)的學者在郵件組中發表了題為《Bitcoin:A peer-to-peer elec‐tronic cash system》的工作論文,提出了一種不依賴中心機構,完全通過點對點技術實現的電子現金系統,詳細的介紹了區塊鏈的共識機制、特點和技術組成。隨著比特幣價格不斷上升,區塊鏈也開始進入大眾視野。與業界相同,學術界對于區塊鏈的研究也是從比特幣開始的。學者們逐漸發現區塊鏈作為比特幣的底層技術,本質上是一個去中心化的數據庫,是分布式技術、點對點技術、非對稱加密以及共識機制等幾種技術的新型應用模式,具有去中心化、去信任化、時序數據、不可篡改等特點[1]。國內政府有關部門、企業對于區塊鏈技術也越來越重視,進一步刺激了國內學者、從業人員對于區塊鏈技術的研究和探索。2019年10月24日,中共中央政治局就區塊鏈技術發展現狀和趨勢進行第十八次集體學習。中共中央總書記習近平在主持學習時強調,區塊鏈技術的集成應用在新的技術革新和產業變革中起著重要作用。這意味著區塊鏈技術已經成為我國核心技術自主創新的重要突破口,成為亟需發展的戰略性技術。
在區塊鏈技術的發展進程中,與其他科學技術的結合是其真正落地應用的關鍵。通過與不同技術的結合,區塊鏈技術有潛力為社會生產關系帶來顛覆性的變化。物聯網、大數據、人工智能等技術的發展為區塊鏈技術的創新應用帶來了新的機遇。以區塊鏈、大數據以及物聯網的關系為例分析技術之間的融合性,物聯網和大數據分別可以作為區塊鏈的輸入和輸出端。區塊鏈本質上是一個分布式數據庫,物聯網技術可以為區塊鏈數據庫提供可靠的數據源,區塊鏈技術提供數據存儲的安全性和私密性,而大數據技術通過分析區塊鏈提供的高質量數據,指導社會生產實踐。三者各司其職,高效配合。
正是由于具有以上優勢,區塊鏈技術逐漸被應用至現代生活的各個領域,包括法律[2]、能源[3]、供應鏈[4][5][6]、金融[7]、溯源[8][9][10]、商業模式[11]等。區塊鏈技術相關研究為交叉學科,既包括對于區塊鏈技術本身的優化改進,又包括區塊鏈技術的應用研究,涉及信息科學、經濟與管理科學、法學等多個領域。多位學者對區塊技術的相關研究進行了綜述,其中袁勇和王飛躍[1]、韓秋明和王革[12]對區塊鏈技術的國內外發展和研究現狀進行了全面的綜述,Pournader 和Shi[13]、祝烈煌等[14]、斯明雪等[15]分別從運營管理、隱私保護以及安全性角度進行了區塊鏈相關應用綜述??紤]到現有綜述更多屬于定性研究,文獻挑選具有主觀性且文獻樣本量較小。為了更加準確的把握區塊鏈相關文獻的外部特征、知識結構以及研究現狀,厘清研究脈絡,為后續研究提供參考。本文通過CiteSpace 軟件,使用更加嚴謹的定量化和可視化方法,基于CNKI 和WOS 數據庫,對區塊鏈相關研究文獻進行計量分析。本文組織架構如下:首先介紹本文的數據來源和研究方法;然后從作者、機構的論文產量及相互之間的聯系角度闡述相關文獻的數據特征;進一步,通過共詞分析和關鍵詞聚類探索文獻的知識結構;最后對文章進行總結。
本文分別以CNKI 數據庫和WOS 數據庫為文獻來源,構建了國內國外兩個區塊鏈相關文獻數據集。具體的檢索方法為:
(1)以CNKI 為數據檢索源,在CNKI 平臺中使用高級檢索,令主題等于“區塊鏈”或“區塊鏈技術”,選擇“期刊類”文獻類型,來源類別選擇“CSSCI”和“CSCD”數據庫。在此檢索條件下,去重并篩去不規范數據,共得到有效期刊文獻945 篇,作為CNKI 數據源。檢索時間為2020年2月6日。
(2)以WOS 為數據檢索源,令主題等于“Block‐chain”,文獻類型為“Article”或“Review”,語種為“Eng‐lish”,時間跨度為“2008~2020”。在此條件下,去重并篩去不規范數據,共得到有效文獻1565 篇,作為WOS 數據源。
學者們常通過文獻綜述和文獻計量方法來探索某一領域或主題下的文獻外部特征和知識框架。[16]其中文獻計量法通常用來展示某一領域或主題的研究現狀,辨識領域內的重要期刊、學者和研究機構,追蹤發展動態。[17]CiteSpace 是一種信息可視化軟件,基于科學計量學、可視化數據,通過共現、共被引、耦合方法,以可視化圖譜的方式沿時間維度探索某一領域或主題下的發展脈絡、特點主題、突變詞以及發展趨勢。[18]本文借助CiteSpace(5.6.R5 版本)信息可視化軟件,使用文獻計量中的共現分析和聚類方法展開研究。
區塊鏈作為比特幣的底層技術,由中本聰(化名)在2008年提出。在區塊鏈提出的前幾年,并沒有引起學術界的廣泛關注。由區塊鏈相關研究文章數量年份分布圖(圖1)可知,截至檢索日,共有相關英文文獻1565 篇,中文文獻945 篇。2015年以前,有關區塊鏈技術的文獻的發文量僅有3 篇。2016年開始,區塊鏈相關的中英文文獻數量開始迅速增長,2016-2019年的中(英)文文獻發文量分別為33 篇(10 篇)、102 篇(52 篇)、275 篇(274篇)和414 篇(825 篇)。從2020年部分數據來看,區塊鏈相關文獻數量仍然處于較高水平。從增長速度來看,中英文文獻都保持較高的增長速度,英文文獻增速更快。區塊鏈相關文獻的發文量與政府部門的政策息息相關,這也符合產學研結合的技術創新體系。2016年起,國內外政府開始認識到區塊鏈技術的重要性,逐步頒布一系列政策,區塊鏈相關文獻的發文量也相應迅速增長。2019年10月24日,中央政治局就區塊鏈技術發展現狀和趨勢進行集體學習,強調區塊鏈技術的集成應用在新的技術革新和產業變革中起著重要作用。這意味著區塊鏈技術將成為我國核心技術創新的重要突破口,必然會推動學術界區塊鏈相關文獻發文量進一步增長。

圖1 2014~2020年區塊鏈相關文獻發文量分布
表1和表2分別為CNKI和WOS 兩個數據集中發文量較高的期刊及各自的發文量,前10種期刊的發文量占總發文量的比例分別為26.88%和43.19%。相比CNKI數據集,WOS數據集區塊鏈相關研究分布更為集中。從發表期刊所屬領域來看,學術界區塊鏈相關研究大部分集中于計算機科學、信息技術領域,其次為經濟與管理科學、法學、政務等領域。

表1 區塊鏈相關文獻發文量高載期刊分布(CNKI數據集)

表2 區塊鏈相關文獻發文量高載期刊分布(WOS數據集)
在同一主題中,半數的論文為一部分高產作者所撰,這是普萊斯定律的主要思想。學術界通常用普萊斯定律來確定某一領域或某一主題的核心作者,其公式為:

其中,m為核心作者最后一名的論文數量,nmax為該主題下核心作者第一名的論文數量。將論文數量大于m的作者成為該主題下的核心作者。在CNKI 數據集中,發文量最多的為王飛躍,數量為10 篇,由此得到m為2.4。即,發文量在2.4 篇以上的作者為該主題下的核心作者。核心作者群共包括107 位作者,共發表文章413 篇,占總文章數的42.4%,接近普萊斯定律規定的50%,說明區塊鏈相關文獻的核心作者群已經初步形成。
在WOS 數據集中,發文量最多的為KIMKWANG RAYMOND CHOO,數量為28 篇,由此得到m為3.96。即,發文量在3.96 篇以上的作者為該主題下的核心作者。核心作者群共包括156 位作者,共發表文章926 篇,占總文章數的59.2%,已經超過普萊斯定律規定的50%,說明區塊鏈相關文獻已經形成具有較大規模的核心作者群。
將兩組數據集導入CiteSpace軟件,進行作者合作網絡分析,參數設置為Time Slice=1,Selection Criteria=top 50。圖2~3分別顯示了兩個數據集中符合條件的作者以及他們之間的合作關系,其中節點大小表示該作者發文數量,節點間的連線粗細表示作者之間的合作次數。為了方便查看,圖譜中沒有顯示部分孤立節點。觀察圖譜可以發現,CNKI 數據集相比WOS 數據集,合作網絡更加稀疏,且以小規模網絡為主。而WOS 數據集中合作網絡更加密集,已經呈現出鏈式結構。通過作者合作網絡圖譜特征量(表3)可以看出,WOS 數據集相比CNKI數據集密度(Density)更大。因此可以得到結論:WOS數據集相比CNKI數據集,作者之間的合作更為緊密,研究團隊規模較大。而CNKI數據集中存在大量兩人或三人的小規模團隊,說明盡管學者間存在一定的交流合作,但研究團隊規模較小,團隊間有待于進一步聯系合作。

圖2 區塊鏈相關文獻核心作者及作者間合作關系圖譜(CNKI數據集)

表3 作者合作網絡圖譜特征量

圖3 區塊鏈相關文獻核心作者及作者間合作關系圖譜(WOS數據集)
從CNKI數據集高產作者信息(表4)來看,中文文獻中區塊鏈相關文獻發文量最高的作者是中國科學院自動化研究所的王飛躍,共發文10 篇。排在第二、三位的是中央財經大學的朱建明(9 篇)、中國科學院自動化研究所的袁勇(8 篇)。從引用量來看,位于前三位的分別是王飛躍、袁勇、于戈,分別為1547 次、1511 次、233 次。其中文章《區塊鏈技術發展現狀與展望》引用量達到1333 次,王飛躍、袁勇為該文章的聯合作者。通過以上分析可以看出在CNKI 數據集中,高產作者和高被引作者基本匹配。

表4 高產作者信息(CNKI數據集)
表5列出了WOS 數據集中的高產作者信息。在上榜的8 位作者中,2 位來自美國,2 位來自中國,挪威、卡塔爾、韓國、新加坡各一位。針對WOS 數據集,還做出了共被引網絡圖譜(圖4)。其中,文章《Blockchains and Smart Contracts for the Internet of Things》(Christidis 等,2016)被引用頻次為640 次,位于WOS 數據集高被引文章第一位。另外,高被引作者與高產作者鮮有重疊,存在高產作者和高被引作者失配的情況。

表5 高產作者信息(WOS數據集)

圖4 共被引網絡圖譜(WOS數據庫)
文獻計量中通常用關鍵詞共現(共詞分析)的方法來研究一個研究領域或主題的知識結構。關鍵詞共現的原理是統計一組關鍵詞在同一篇文章中同時出現的次數,從而反映關鍵詞之間的關系,進而分析每個關鍵詞代表的學科和主題的結構變化和發展趨勢。本研究通過對關鍵詞共現的結果進行可視化分析,并在此基礎上進行聚類分析,從而探索該領域的知識結構和發展趨勢。“區塊鏈(Blockchain)”為本文研究的主題詞,在學術文獻檢索時以“區塊鏈(Blockchain)”作為檢索詞,因此,“區塊鏈(Blockchain)”、“區塊鏈技術(Blockchain tech‐nology)”無法反映該研究領域內的研究趨勢,故在下文中不予分析。
利用CiteSpace 軟件對每年出現頻次最高的30 個關鍵詞進行共現分析,并對結果進行路徑查找(Pathfinder)和修剪切片網絡(Pruning sliced network)處理,得到兩個數據集中區塊鏈相關文獻關鍵詞共現網絡(圖5-6)。

圖5 區塊鏈相關文獻關鍵詞共現網絡(CNKI數據集)

圖6 區塊鏈相關文獻關鍵詞共現網絡(WOS數據集)
國內相關文獻關鍵詞共現網絡呈現以“智能合約”關鍵詞為核心的輻射結構,出現頻率較高的關鍵詞包括“智能合約”、“去中心化”、“比特幣”、“共識機制”、“數字貨幣”等。高頻關鍵詞如表6所示。進一步,利用CiteSpace 軟件的最大似然法(LLR 算法)對關鍵詞進行聚類,并使用關鍵詞對聚類進行命名,最終確定了7個聚類(圖7)。聚類圖譜模塊度(Modularity)為Q=0.6942,聚類內部指標值(Mean silhouette)為S=0.7109,說明聚類效果較好,各聚類群內相似度高,群間差異大。由聚類圖譜,7 個聚類主題分別智能合約、跨境電商、區塊鏈技術、財政金融、分布式賬本、金融科技、虛擬貨幣。這7個主題為CNKI 數據集區塊鏈相關文獻研究的主要內容,構成了區塊鏈技術相關文獻的知識結構。

圖7 區塊鏈相關文獻關鍵詞聚類圖譜(CNKI數據集)

表6 頻次前10位的關鍵詞(CNKI數據集)
國外相關文獻關鍵詞共現網絡呈現以“Internet of thing”、“Internet”、“Security”、“Smart contract”多個關鍵詞向四周發散的網絡結構,高頻關鍵詞如表7所示。進一步,利用CiteSpace軟件的最大似然法(LLR算法)對關鍵詞進行聚類,并使用關鍵詞對聚類進行命名,最終確定了8個聚類(圖8)。聚類圖譜模塊度(Modularity)為Q=0.5618,聚類內部指標值(Mean silhouette)為S=0.6436,說明聚類效果較好,各聚類群內相似度高,群間差異大。由聚類圖譜,8 個聚類主題分別Anti-quantum transaction authentication approach(非對稱交易驗證方法)、Robust fair payment(穩定的點對點支付)、Smart contract(智能合約)、Meat traceability(肉類溯源)、Research agenda(研究進程)、Ledger technologies(記賬技術)、Smart manu‐facturing system(智能制造體系)、Reputation-based sys‐tem(聲譽系統)。這8個主題為WOS數據集區塊鏈相關文獻研究的主要內容,構成了區塊鏈技術相關文獻的知識結構。

圖8 區塊鏈相關文獻關鍵詞聚類圖譜(WOS數據集)

表7 頻次前10位的關鍵詞(WOS數據集)
從聚類結果來看,區塊鏈的研究可以分為四類,與區塊鏈技術的發展進程高度相關,是區塊鏈1.0/2.0/3.0的體現。分別為區塊鏈技術的優化創新、數字貨幣相關研究(區塊鏈1.0)、區塊鏈金融與智能合約相關研究(區塊鏈2.0)、區塊鏈技術應用研究(區塊鏈3.0)。
區塊鏈技術的優化創新。學術界對于區塊鏈技術本身的研究主要集中在區塊鏈的網絡層、數據層、共識層以及控制層。其中,網絡層的研究集中在匿名分析、隱私保護和安全等幾個主題,數據層的研究集中在高效驗證和隱私保護,控制層的研究集中在可擴展性優化層面,共識層的研究則主要集中在共識機制的開發,除了傳統的共識機制,還產生了許多混合類的協議,包括PoX-BFT混合協議,PoX之間的混合協議。
數字貨幣相關研究。數字貨幣相關研究集中在對于數字加密貨幣以及ICO 這種集資方式的監管。數字貨幣存在監管漏洞,洗錢、毒品、恐怖主義等犯罪行為可能會通過數字貨幣逃避法律的追蹤。根據Foley 等[19]的研究,大約有23%的比特幣用戶與非法活動相關聯,數字貨幣為這些違法犯罪行為提供了溫床。因此許多研究聚焦于數字貨幣的監管方式,如運用監管沙盒、監管科技等。
區塊鏈金融與智能合約相關研究。國內區塊鏈在金融領域的應用場景主要包括銀行業、供應領金融、普惠金融、保險業、證券業等。去中心化、不可篡改性是區塊鏈應用于金融領域的主要依據。去中心化可以實現點對點交易,降低交易成本,而不可篡改性確保信息的真實性,為銀行與企業間、企業之間的貸款提供征信保障,從而降低了違約風險。關于智能合約的研究聚焦于其安全性、并發性、可擴展性以及可維護性,Ethereum 和Hyperledger是具有代表性的兩個智能合約項目。
區塊鏈的應用研究。目前區塊鏈技術的應用不止局限于數字貨幣和金融領域。區塊鏈與人工智能、云計算、大數據、物聯網等共同被應用于社會發展的各行各業,成為經濟發展的新動能,電子政務、版權保護、食品溯源、供應鏈管理、隱私保護等都是區塊鏈的典型應用場景。同時,這些技術的發展也為區塊鏈技術的發展起到促進作用。
本文采用文獻計量的方法,對CNKI/WOS 數據庫中有關區塊鏈技術的文獻外部特征、知識結構進行分析,得到以下結論:
(1)從外部特征來看:相關論文的發表數量迅速增長,并將會在2020年進一步爆發增長;區塊鏈相關文獻主要發表在計算機科學、信息技術、經濟與管理科學領域。
(2)從合作網絡來看:國外學者之間交流密切,合作較多,國內學者盡管存在一定的交流合作,但研究團隊規模較小,有待于進一步聯系,加強合作;國內高產作者和高被引作者基本匹配,國外高產作者和高被引作者失配。
(3)從科技發展角度:關鍵詞共現網絡圖譜中多次出現物聯網、大數據、云計算等關鍵詞。這些技術的發展推動了區塊鏈技術的科技創新和進步,多種技術的融合創新應用是今后科技發展的重要方向。
(4)從文獻知識結構來看:主要包括四類研究,與區塊鏈技術的發展進程高度相關,是區塊鏈1.0/2.0/3.0 的體現。分別為區塊鏈技術的優化創新;數字貨幣(區塊鏈1.0);區塊鏈金融與智能合約(區塊鏈2.0);區塊鏈的其他應用研究(區塊鏈3.0),包括電子政務、版權保護、食品溯源、供應鏈管理以及隱私保護等。
針對現有研究中存在的短板和不足,提出以下研究建議。
(1)區塊鏈技術短板的理論研究。區塊鏈技術自出現以來不斷改進和升級,但目前仍存在許多問題需要解決。首先,“不可能三角”問題。即區塊鏈的“去中心化”、“安全性”和“可擴展性”三種特性不可兼得。第二,原始數據的真實性問題。目前區塊鏈技術可以保證數據上鏈后不可篡改,但難以保證原始數據的真實性,是其落地應用的瓶頸之一。第三,區塊鏈的審計監管問題。公有鏈用戶匿名、信息不可篡改,難以追溯區塊鏈上的異常行為,包括欺詐、非法買賣、洗錢等。最后,區塊鏈相關標準的制定。區塊鏈標準的缺失會導致項目之間互聯互通受阻,商業布局被拖緩。以上問題需要科研人員進一步探索,尋找妥當的解決方法和技術方案。
(2)區塊鏈的應用研究。根據已有研究,區塊鏈技術已經應用于法律、能源、供應鏈、金融、溯源等多個領域,但目前研究不夠深入,未來可以在以下幾個方面進行擴展。第一,基于區塊鏈的商業模式在運營管理領域的研究,探索區塊鏈的應用為企業商業模式帶來哪些改變。第二,區塊鏈相關行業的實證分析。通過對應用區塊鏈技術的行業數據進行實證分析,判斷區塊鏈技術的應用條件和應用效果。第三,區塊鏈對行業網絡生態的影響分析。
綜上所述,區塊鏈作為一種具有巨大潛力的新興技術,已經成為學術界的研究熱點。未來將會出現更多的相關研究團隊和機構,研究內容也會向著區塊鏈3.0 方向發展,逐漸的將區塊鏈技術應用至更多的應用場景,為實現創新驅動發展戰略目標、建設世界科技創新強國助力。