崔曉君
(中國信息通信研究院華東分院 上海市 200000)
大數據產業是新興產業,尚無明確的統計口徑,大數據產業統計工作更是沒有經驗可循[1]。為支撐大數據產業發展,探索建立一套科學高效的大數據產業統計系統尤為重要。本文著力于支撐政府決策,推動上海市大數據產業發展,創新性探索大數據產業統計制度方法,率先進行大數據產業統計系統的研究與設計,一方面提高產業主管部門統計工作工作效率,方便企業填報,另一方面獲得大數據產業基礎數據,為決策提供數據支撐[2]。
調查上海市大數據重點企業的發展規模、關鍵技術、收益和支出等內容,實現上海市大數據產業的數據采集、統計分析,支撐上海市大數據產業發展。
不同出發點對大數據產業范圍的界定結論有所不同[3],本次統計系統建設以工信部發布的《大數據產業發展規劃(2016-2020)》中對大數據產業的界定為基礎,同時結合上海市大數據產業的實際情況,采用重點調查的方式加以實施[4]。開展大數據企業分類模型研究(如圖1:大數據企業分類示意圖),通過企業國民經濟分類、專利、軟著、招聘信息、經營范圍、企業基本情況、工商數據等開展數據分析,形成大數據重點企業名錄庫,作為統計對象。
目前沒有專門的針對大數據產業的統計分類,而是包含在軟件與信息服務業中統計,本次系統設計需要首先進行大數據產業統計制度研究。
本次統計的目的是滿足政府宏觀管理決策的信息需求。統計指標體系的設計以此為基礎,通過全國各地發布相關大數據政策文件視角開展研究,梳理全國各地政府宏觀決策對大數據產業的主要信息需求。總結全國各地各項大數據政策指標,同時結合上海市對于大數據產業發展特定的信息需求指標,對于大數據產業整體發展的主要衡量指標主要包括大數據產業總產值、增加值、大數據核心企業數、經費投入、核心人才。
綜上,本次設計大數據產業統計指標共28 項,包括:
(1)期末資產負債(數據資產相關硬件原值、數據資產相關硬件凈值、數據資產相關軟件原值、數據資產相關軟件凈值);
(2)損益及分配(營業收入、其中:大數據業務收入、營業成本、營業利潤、所得稅費用、研發費用);
(3)人工成本及增值稅;
(4)從業人員(從業人員期末人數、從業人員平均人數);

圖1:大數據企業分類模型結構示意圖

圖2:上海市大數據產業統計工作流程圖

圖3:大數據產業統計系統功能模塊結構圖
(5)研究開發人員情況(研究開發人員合計,其中:碩士及以上人員,本科人員,專科及以下人員);
(6)研究開發產出及相關情況(當年專利申請數、其中:發明專利、期末有效發明專利數、發表科技論文、形成國家或行業標準);
(7)合同成交情況(大數據行業解決方案合同成交量、大數據行業解決方案合同成交額、大數據產品市場合同成交量、大數據產品市場合同成交額);
(8)其他(是否上市、是否為高新技術企業)。
系統設計的目標是設計并開發一套滿足上海市大數據產業統計需求的軟件系統,實現上海市大數據企事業(單位)的基本信息及主要財物指標數據的錄入、修改、查詢和匯總,通過軟件系統的設計,減輕企業和政府部門填報及統計工作量,提升工作效率。
此次通過統計系統,開展上海市大數據產業統計工作流程包括四個主要方面(如圖2 為上海市大數據產業統計工作流程圖),即上海市各區大數據重點企業名錄庫建設、各區開展大數據重點企業專項調查工作、各區統計數據的初審、匯總與上報、全市大數據統計數據的匯總與分析。
技術體系上選用J2EE 技術,采用Browser/WebServer/DataBase Server 三層結構進行應用系統的開發,B/S/D 三層結構實現數據與應用邏輯分離,簡化應用系統的分發、配置管理和版本管理工作。
各大數據企業通過系統完成填寫報送;各區縣用戶在系統內及時開展數據初審,并將初審結果在系統內完成提交,同時可進行本區填報數據的查詢、匯總、分析;市級用戶對報送信息進行復核,完成全市大專項統計調查的數據匯總和分析工作。
上海市大數據產業統計系統根據大數據產業統計特點(采用企業法進行統計/統計指標體系首次使用),同時滿足常規產業統計基本要求,功能設計包括數據采集/數據傳輸/綜合查詢與匯總/數據質量管理/數據備份與恢復/系統管理維護六大功能系統模塊(圖3 為大數據產業統計系統功能模塊結構圖)。
4.3.1 數據采集子系統
系統支持在線填報,提供表單式的填報界面。主要實現大數據企業基本信息及其主要財務指標數據、業務指標數據的錄入/修改和查詢等功能。
4.3.2 數據傳輸子系統
該系統主要完成數據的上報和接收,以實現數據的逐級匯總。其中數據上報操作主要用于將企業填報的數據導出,生成匯總數據,數據的導出分為批量導出和逐項導出。導出的數據可以保存為PFD、EXCEL 和文本等格式的文件。數據接收主要用于主管導入企業上報上來的數據,以實現系統數據的匯總功能。
4.3.3 綜合查詢與匯總子系統
該系統的功能是對匯總后的統計數據進行查詢、分析、匯總統計。系統支持全文檢索,可通過選定的組合條件來精確查詢和模糊查詢,并可對查詢結果進行二次漸進式查詢,逐步縮小查詢范圍。同時設計拖拽方式的可視化界面,實現數據的統計、匯總,針對數據指標展現與分析的要求,提供強大的圖形展現能力,除支持常規圖形,如:餅圖、柱狀圖、折線圖、散點圖、雷達圖、瀑布圖、玫瑰圖、氣泡圖、分區面積圖、堆積圖、卡特圖外,還支持三維圖、企業駕駛艙、交通燈、瀑布圖、工程進度圖、動態地圖(MAP),等特色圖形展現。同時支持將匯總統計的結果以文件或圖表等形式導出,以供使用。
4.3.4 數據質量管理子系統
為了確保高質量的統計數據,系統設計從采集、上報、審核、分析的各個環節入手,建立數據質量管理機制。首先對系統填報涉及的統計指標從名稱、統計口徑、計算方法進行規范,鼠標在指標上懸浮時,進行該項指標的解釋及計算方式介紹。對于上報數據系統自動按照設定的核查條件進行校驗,對填報空數據、異常值、失真值進行提醒,要求用戶修改或填寫備注說明情況;審核人員審核上報數據,對所有異常數據進行著重排查,核對異常數據的情況說明,發現問題及時通過電話聯系核實情況或退回并要求填報人員重新上報,確保數據的準確性、完整性。
4.3.5 數據備份與恢復子系統
該系統功能是完成統計數據的備份與恢復,以使系統的物理故障或其他不安全因素給系統帶來的損失降低到最低程度,保障數據的安全性。
4.3.6 系統管理維護子系統
該系統主要包括統計系統用戶管理、權限管理、系統日志管理等功能。用戶管理實現管理用戶和使用用戶的細度管理,包括對內提供系統權限配置功能,對外提供權限驗證接口。權限管理實現對系統、功能、菜單、頁面元素、數據等不同粒度的資源的授權。系統日志管理實現用戶操作跟蹤、功能使用跟蹤。
上海市大數據產業統計系統已經在上海市投入使用,2020年已完成上海市1000 余家大數據企業專項填報工作。目前系統運行良好,操作簡單、數據有效性檢查嚴格。該系統的建設和應用,一方面為我國探索大數據產業統計方法和途徑提供了有效嘗試。另一方面可滿足上海市大數據產業主管部門利用數據的需要。