劉承煥 馮文婕
(1.桂林電子科技大學 2.廣西南寧桂電研究院)
XBRL 被稱為可擴展的商業報告語言,是一種基于XML、開放式并且不限于特定操作平臺的國際標準,目前在金融、財務、信息技術領域都有深入研究。其原理主要為通過計算機技術將各類現代企業計算機語言信息平臺與其他各種相關商業數據、財務信息技術應用相結合,充分可靠地實現各類會計財務報告、內容與各相關領域商業報告數據信息及時、準確、高效化的融合,并可高效經濟化地實現相互數據存儲、處理和傳輸功能域的實時交流。XBRL 技術還可以根據現行財務會計信息的規范或披露規范標準規定的各種格式要求,將其所有的財務信息內容全部自動地分解成三種完全不同結構形式組成的結構化數據源文件(DataElement),并最終能實現根據各種最新的計算機語言規范標準。
本文主要采用南開大學計算機系美國德雷塞爾大學計算機及信息系統與技術情報學學院的陳超美等教授研究的信息可視化分析軟件CiteSpace,來輔助對基于XBRL 的研究報告主題內容進行文本語義信息挖掘和建模計算及文本信息的可視化研究結果分析。進行文獻的計量檢測及可靠性分析研究采用的最主要的文獻數據來源一般來自中國以及中知網等專業數據庫,收集到的文獻資料也主要是可以選擇從XBRL 的主題數據庫中進行全文的檢索,采集獲取到的文獻數據范圍,包括作者、篇名、關鍵詞、作者單位、文獻來源、刊發及截止發稿時間范圍等資料及文章摘要。檢索任務完成日期設定為2022 年3 月24 日,時間跨度是自2001 年底起到2021 年,檢索任務收集到的相關中文原始科技文獻總數約有1233 篇,將全部以Refworks格式文件導出。
CiteSpace 軟件對所研究領域文獻進行可視化分析。分析的理論基礎基于引文分析與共線分析的相互應用,其分析數據的功能包括但不限于作者、機構、國家地區的合作網絡分析;文獻術語、關鍵詞點、學科類別的網絡分析;作者共被引、文獻共被引、期刊共被引分析以及文獻耦合和共同分析。學術領域當下研究熱點和未來前沿可運用CiteSpace 軟件對文獻關鍵詞和突現詞匹配銜接進行可視化分析;對于深入挖掘學科領域的熱點文獻,可通過分析繪制聚類和時區圖譜得出結論,同時可以繪制出動態、分時、多元的科學熱點圖譜。
在CiteSpace 中可以被設置為TopN=50,TopN的%=10%,前后中這是三個時間段的c、cc、ccv的閾值分別為都是(2,2,20),(4,3,20),(4,3,20),時間跨度均為從2001—2021 年(TimeSlicing:From2001 年To2021 年底),時間切片周期為每間隔1 年一次(YearPerSlice1),利用CiteSpace 軟件對XBRL 主題數據庫和中國CNKI 全文數據庫中收錄的所有作者主題類型數據進行了聚類與分析,得到結果與在2001—2021 年期間所進行過的相關的課題相關研究第一或作者合作完成的核心網絡圖(圖1),節點數537 個(N=537),線數207條(E=207),密度為0.0014(Density=0.0014)。

圖1 2001—2021 年“XBRL”研究作者的核心網絡
根據圖1,利用CiteSpace 進行數據導出可以得到關于XBRL 研究相關性最強的順序表格。
由圖2 可知,國內關于XBRL 研究相關性最強的是張天西,其次是杜美杰,第三是吳忠生,其次還有李吉梅、毛元青等。聯系圖1 圖2 可以發現,關于“會計”與“高質量發展”研究的作者比較分散,頻數也較低,線條的數量較少,說明相互之間基本沒有聯系。

圖2 研究作者相關性數據導出
關鍵詞研究是根據一篇科研論文領域的主要核心概況,對研究論文關鍵詞進行的綜合性分析,可以用來對一篇文章主題框架進行綜合分析,也能深入分析歸納出未來該主題領域研究的關鍵詞主題內涵變化特點及其發展演進新路徑。本文主要對關鍵詞進行共歸線類和聚類兩類方法分析。
1.關鍵詞共線分析
在CiteSpace 中可以被設置為TopN=50,TopN的%=10%,前后中這是三個時間段的c、cc、ccv的閾值分別為都是(2,2,20),(4,3,20),(4,3,20),時間跨度都設置為2001—2021 年(TimeSlicing:From2001To2021 年),時間切片的周期通常為至少每間隔1 年一次(如主題YearPerSlice1),利用CiteSpace 軟件就可以實現對所有XBRL 主題數據和在CNKI 主題全文數據表庫中包含的其他所有的關鍵詞主題類型數據進行聚類分析,得到2001—2021 年進行相關研究主題的核心網絡圖(圖3),節點數589 個(N=589),線數1290 條(E=1290),密度為0.0074(Density=0.0074)。

圖3 關鍵詞共線知識圖譜
共線分析法是指利用一個相關文獻里集中多個相關詞匯短語或單個相關名詞短語之間的共線關系出現和頻率分布的變動等情況來綜合研究或確定它們與一個所選相關主題文獻集中所選要共同代表的主題詞的或者其他與各有關的主題詞語之間存在的某些相互關系。圖3 中所列出的關鍵詞的構成都采取了十字形節點標識,節點間距的越大即表明該組關鍵詞的出現頻率越高,研究結果的熱度效應也就會越強。選取排名在前10 名之內的10 個數據節點,主要選擇隨機排序出現過的10 個特征比較明顯的數據節點,依次排名后分別為XBRL、實例文檔、會計信息化、XBRL 財務報告、可擴展商業報告語言、網絡財務報告、信息披露、信息技術,以及財務報告、中國會計學會。節點層次數越多,中心度也越高,起到信息連接作用與網絡傳遞信息作用之間的節點關鍵詞數越多,在整個通信網絡內的通信媒介作用功能也應越強。為了方便快速準確顯示知識圖譜中的所有關鍵節點,列出了排名前20 位中的高頻檢索詞與高中心度關鍵詞,如表1 所示。

表1 高頻熱詞與高中心度關鍵詞列表(前20 位)
由表1 可以發現,在本文所被引用到的文本庫數據中,研究熱點主要都圍繞在XBRL、分類標準、財務報告、會計信息質量、審計、信息化、大企業數據采集等方面,關于研究中熱度相對較高的如XBRL、分類標準等、網絡財務報告這三個關鍵詞分別在2004 年、2003 年、2001 年首次顯現,此時期也是XBRL 剛提出的時間段,研究學者從那個階段開始就一直在對分類標準以及XBRL 在網絡財務報告的應用方面進行大量研究。排名前19 名的關鍵詞都在2010 年之前就開始顯現。2010 年以后對策、管理會計、云計算和大數據等關鍵詞開始逐步顯現,XBRL 的研究方向開始向這些關鍵詞傾斜。
2.關鍵詞聚類分
在建立了關鍵詞網絡共軛線知識圖譜體系框架的基礎上,運用了多MI(Multipleinstance)算法從多個關鍵詞網絡節點中分別隨機提取標簽以顯示網絡聚類命名,得到了一個關鍵詞網絡聚類網絡知識圖譜,如圖4 所示,在聚類網絡圖示模型中,聚類序號值越小,代表的網絡聚類輪廓值也越大,節點代表性越強,網絡密度值越大。
在數據庫中,關于對“XBRL”的研究選取出10 個聚類標簽:#0“XBRL”、#1“實例文檔”、#2“ 會計信息化”、#3“XBRL 財務報告”、#4“可擴展商業報告語言”#5“網絡財務報告”、#6“信息披露”、#7“信息技術”、#8“財務報告”和#9 中國會計學會,最終,各聚類中出現次數較多的關鍵詞如表2 所示。

表2 各聚類出現頻次較高的關鍵詞
3.關鍵詞時間軸與時區
利用CiteSpace 軟件對手機文庫進行關鍵詞共線,在關鍵詞貢獻基礎上進行形象化布局,在Visualizations 中選取時間軸(TimelineView)與時區(TimezoneView)可得到關鍵詞時間軸(圖5)與關鍵詞時區(圖6)。

圖5 關鍵詞時間軸

圖6 關鍵詞時區
根據圖5 關鍵詞時間軸與圖6 關鍵詞時區圖,可以清晰地看出2001—2021 年中每年的關鍵詞變化情況,以及在關鍵詞之間的聯系情況。在2001年處于起步階段,“會計數據”等關鍵詞是該年的核心研究主題。2002 年“網絡財務報告”“信息披露”“財務報告”這三個關鍵詞呈現出較強的中介中心性。2003 年的“分類標準”關鍵詞的顯現,呈現出更強的中介性。2004—2005 年出現了大量的中介中心性強的關鍵詞,如“xml”“可擴展商業報告”“信息化”“上市公司”“會計信息”等,都與此后的研究呈現較強的共線性。由圖6 關鍵時區可以看出,關于XBRL 的研究在2015 年之前研究關鍵詞的中心中介性更高,關鍵詞之間的共線性也比較高。在2016 年以后,關于XBRL 的研究的熱度出現一定下降,2016—2019 年間的關于XBRL的研究關鍵詞較少,且中介中心性也比較低,2018年處于熱度最低的狀態。2020 年開始,關于XBRL的研究出現了“區塊鏈”“人工智能”等新的關鍵詞,意味關于XBRL 的研究出現了新的方向。根據圖7關鍵詞突變圖,檢測出14 個關鍵詞突變量,可以看出,近些年的研究熱點集中在“大數據”“XBRL報告”“管理會計”“持續審計”這幾個關鍵詞。

圖7 關鍵詞突變圖
由此,若再分別將關鍵詞與共聚類線性知識圖譜(圖3)、高頻詞與頻率較高的中心頻次度的關鍵詞(表1)等、關鍵詞與共聚類知識圖譜(圖4)等、各中心共聚類下出現過的中心頻次度或較次高的中心次數的關鍵詞(表2)等、關鍵詞時間區軸(圖5)等與關鍵詞時區(圖6)等綜合到一起來做對比和分析,可以較清楚地看出,目前該細分學科領域關鍵詞研究主題演變的特點及沿關鍵詞方向演化發展的基本路徑:如高質量發展和管理會計及業財融合和會計改革與人才培養關鍵詞等研究的主題特點最為顯著和突出,且都呈現著相互或交叉關聯研究的主要動態發展演化過程和路徑。
通過統計分析XBRL 相關文章和引文的時間軸情況,發現其發表數量于2007 年開始大量增長。由于財務信息化、財務智能化、財務共享深入發展,掀起了以研究XBRL 為代表的信息披露浪潮。隨著大數據、人工智能、云計算、區塊鏈等新技術的迅速發展和廣泛應用,自2010 年開始,XBRL 領域研究熱度大增,研究內容豐富化。
通過對XBRL 文獻的知識結構進行分析,可以看出,近些年的研究熱點集中在“大數據”“XBRL報告”“管理會計”“持續審計”這幾個關鍵詞。對高頻關鍵詞點進行共現圖譜分析之后可以發現XBRL 研究熱點主要交叉于幾個方面:財務與審計轉型、集團財務共享中心、大數據管理會計與會計教育、智能財務、區塊鏈會計。
XBRL 研究熱點緊跟新興技術和經濟發展,有顯著的需求導向和科技賦能。通過動態演化分析XBRL 研究內容和關鍵詞熱點,隨著其不斷發展,研究主題表現出不斷融合交叉的趨勢,關鍵詞點聚性逐漸降低,但多角度化程度加深。