曹 衛(wèi),鄧成生,楊 飛,陳 磊
(1. 鎮(zhèn)江市市場監(jiān)督管理局,江蘇 鎮(zhèn)江 212000;2. 鎮(zhèn)江市精神衛(wèi)生中心,江蘇 鎮(zhèn)江 212000)
2014年9月夏季達沃斯論壇上,李克強總理提出要在960萬平方千米土地上掀起“大眾創(chuàng)業(yè)”“草根創(chuàng)業(yè)”的新浪潮[1]。江蘇率先啟動了簡政放權(quán)、放寬準入和鼓勵創(chuàng)業(yè)創(chuàng)新等方案。尤其是全程電子化和全鏈通等不見面審批技術(shù)手段極大地鼓勵了創(chuàng)業(yè)熱潮,企業(yè)登記注冊蓬勃發(fā)展,注冊的企業(yè)數(shù)量大幅增加。愈加龐大的企業(yè)基數(shù)雖然反映了我國經(jīng)濟發(fā)展動力強勁,但同時也意味著不可忽視的風險隨之產(chǎn)生。江蘇作為全國經(jīng)濟體量舉足輕重的省級行政區(qū),而鎮(zhèn)江作為其中的地級市典型,其發(fā)掘出的數(shù)據(jù)資源極具參考價值。市場監(jiān)管局集中存儲了全市所有市場主體的相關(guān)登記數(shù)據(jù),并通過市場監(jiān)管(證照聯(lián)動)平臺歸集了其他相關(guān)企業(yè)監(jiān)管部門的行政許可、行政處罰和抽查檢查等數(shù)據(jù),和市信用辦、稅務(wù)等部門完成了數(shù)據(jù)對接,確保了企業(yè)海量數(shù)據(jù)的獲取和處理成為可能,從而便于監(jiān)管部門依據(jù)數(shù)據(jù)分析獲得真實的企業(yè)全貌,符合了全景多維大數(shù)據(jù)分析研判的基礎(chǔ)條件。
企業(yè)活躍度從企業(yè)運營狀況入手,考察企業(yè)是否具備正常運行的特征,是否在生產(chǎn)經(jīng)營活動中表現(xiàn)活躍,從而為預判和防范系統(tǒng)性經(jīng)濟風險奠定基礎(chǔ)。本研究將通過構(gòu)建基于大數(shù)據(jù)的企業(yè)活躍度評價體系,并利用鎮(zhèn)江市不同部門數(shù)據(jù)進行實證研究,驗證企業(yè)活躍度評價方法的科學性和有效性,為相關(guān)部門在市場監(jiān)管中進行政策制定提供決策支持工具。雖然企業(yè)活躍度被廣泛地運用于不同情境中刻畫被評價,但是企業(yè)活躍度這一概念目前在產(chǎn)業(yè)界與學術(shù)界仍尚未有明確的定義和統(tǒng)一的衡量指標[2]。筆者的思路在其他省市的先行研究基礎(chǔ)上從采集微觀數(shù)據(jù)開始,構(gòu)建評價指標體系,設(shè)計企業(yè)活躍度模型及活躍度評價標準,最后評估企業(yè)活躍度。當然,真實的企業(yè)活躍度涉及范圍過于寬泛,尤其是銀行交易流水的數(shù)據(jù)較難獲得,難以對企業(yè)經(jīng)營活動進行多維度全方位考察。因此,本文主要講述的是該研判的實現(xiàn)和應(yīng)用如何實現(xiàn),其初步研判所取得的數(shù)據(jù)僅限于賽思大數(shù)據(jù)平臺、鎮(zhèn)江市市場監(jiān)督管理局二版軟件數(shù)據(jù)庫系統(tǒng)、江蘇省市場監(jiān)管平臺、網(wǎng)監(jiān)系統(tǒng)以及信用辦等部門全部涉企數(shù)據(jù),力求在其中找到相應(yīng)的普適規(guī)律,根據(jù)規(guī)律梳理監(jiān)管工作中的思路和方法。
目前而言,企業(yè)活躍度沒有公認的統(tǒng)計方法。少有研究從管理理論的角度對企業(yè)活躍度的內(nèi)涵進行梳理與定義,有關(guān)研究仍待進一步完善。從理念角度而言,活躍程度是動態(tài)的,在企業(yè)之間是可量化對比的,因此活躍度的概念從大數(shù)據(jù)角度而言,在采集量足夠大的情況下,可以總結(jié)出相似的規(guī)律,因此主要根據(jù)現(xiàn)有資源對企業(yè)活躍度數(shù)據(jù)做了初步的梳理和權(quán)衡,這種梳理結(jié)果就是一種非靜態(tài)的、更新的企業(yè)活躍度評價體系。
根據(jù)數(shù)據(jù)取材范圍,企業(yè)數(shù)據(jù)取值主要來自工商登記數(shù)據(jù)、網(wǎng)站數(shù)據(jù)、銀行開戶數(shù)據(jù)、年報數(shù)據(jù)、稅務(wù)申報數(shù)據(jù)以及信用辦等其他各類涉企機關(guān)的處罰、檢查和行政許可數(shù)據(jù)。根據(jù)數(shù)據(jù)的有效率和時間的追溯程度,數(shù)據(jù)采集時間維度上以2011—2020年年底為界限,考慮到企業(yè)持有專利、商標對運營的長久影響程度以及業(yè)務(wù)沿革數(shù)據(jù)滯后性等情況,縱深向前推五年,向后推一年,采集范圍上分江蘇省全省和鎮(zhèn)江市,重點剖析鎮(zhèn)江市的企業(yè)情況,采集維度細化到每年的企業(yè)行業(yè)大類、產(chǎn)業(yè)大類、數(shù)據(jù)采集當年法人年齡段、企業(yè)存續(xù)期等數(shù)據(jù)。
數(shù)據(jù)記錄著發(fā)展,自2002年年初江蘇省工商局一版注冊登記軟件投入使用后,海量數(shù)據(jù)不斷產(chǎn)生,歷史數(shù)據(jù)蘊藏著巨大的價值,如何高效梳理數(shù)據(jù)碎片,進行更有效的數(shù)據(jù)挖掘,就需要在數(shù)據(jù)藍海中找到其關(guān)鍵信息。針對不同的企業(yè)規(guī)模,取值范圍也需要分別衡量,考慮到小微企業(yè)生存周期短,相關(guān)分析指標取前三年的數(shù)據(jù),大中企業(yè)存續(xù)時間長,取前五年為期,如大中企業(yè)2011年數(shù)據(jù)則取值范圍包含前五年情況。另外數(shù)據(jù)采集有其滯后性,2020年的數(shù)據(jù)需要到2021年年底采集,因為企業(yè)2020年的年報截至時間是2021年的6月30日,仍需考慮補報等情況,另外以遵循舊例原則以及可驗證原則,每年的統(tǒng)計報表時間為當年的12月25日,應(yīng)以該日期為界限,這樣按照年度可分別產(chǎn)生十條時間維度企業(yè)快照。對其他單位發(fā)函協(xié)助出具數(shù)據(jù)時,僅需要企業(yè)對應(yīng)活躍值的考核指標布爾值,不需要具體數(shù)值,這樣不僅可以防止數(shù)據(jù)的泄露,還能保護企業(yè)信息的隱私權(quán)。與外單位的數(shù)據(jù)溝通和交流時,部分單位不能提供精準的數(shù)據(jù)則需要運用復雜的EXCEL軟件運算法則或?qū)霐?shù)據(jù)庫用查詢函數(shù)計算出前后的關(guān)聯(lián),部分單位無法提供歷史數(shù)據(jù)的,需要協(xié)商溝通爭取盡最大可能完善企業(yè)運作場景。同時,與活躍度相關(guān)的數(shù)據(jù)應(yīng)該在相關(guān)機關(guān)內(nèi)部共享,將打破信息孤島的口號落實到行動,形成一種長期有效的更新維護和互聯(lián)共享機制。
企業(yè)活躍度可從企業(yè)開辦、生產(chǎn)、營銷等各個層面進行整理并統(tǒng)計出事項清單,該清單是一種可維護的動態(tài)清單,在面對不同的政策決策支撐需要則需及時調(diào)整清單項,廣義的活躍度考核指標初步定為三級N個指標,每個指標以最高10分,最低負10分的權(quán)重進行活躍度計算,總體上依據(jù)企業(yè)內(nèi)部成長、生命質(zhì)量以及存在狀態(tài)理論,即并非每一個清單事項在是和否的結(jié)果上分別進行賦分,如企業(yè)在本年度檢查次數(shù)超過一次且正常的為加分,未檢查的不減分。設(shè)定每個企業(yè)初始活躍值為100分,此處需要強調(diào)的是部分地方使用0分為初始設(shè)定分是不符合數(shù)學模型在實際社會中的應(yīng)用,因為即便是完整意義上的僵尸企業(yè)也應(yīng)該是0分,而不應(yīng)該出現(xiàn)負值。在初始分上進行加減分,最終得出每一個企業(yè)的總分,在賦值過程中需要討論賦值的非連續(xù)性,即出現(xiàn)警告閾值,如企業(yè)出現(xiàn)過量行為如一年內(nèi)三次處罰,即加大減分值,不同的行業(yè)檢查篩選需要進行不同的賦值,即該值隨著檢查項目和時間的變遷而變化,是一個動態(tài)賦值的過程。
企業(yè)的活躍度主要考核指標為企業(yè)年報涉經(jīng)營和行政許可存續(xù)數(shù)據(jù),較特殊的備案數(shù)據(jù)如:動產(chǎn)抵押、股權(quán)出質(zhì)等,登記機關(guān)之外的涉企監(jiān)管涉及金融、稅務(wù)、社保、進出口、電力、郵政、商務(wù)、專利等主管部門的數(shù)據(jù)。具體操作中是對考核項目進行細化,經(jīng)營類數(shù)據(jù)進行是否比上一年增長和是否為零進行劃分。對企業(yè)專利、商標、許可證等可以分為有無,并以時間為梯度進行分類統(tǒng)計。對數(shù)據(jù)質(zhì)量同樣進行考量,如企業(yè)聯(lián)系電話是否有效,該數(shù)據(jù)不僅要對位數(shù)進行校驗,還要和通信部門進行對接是否為空號,另有企業(yè)法人、股東、高管年齡是否正常,低于18歲和高于90歲都要進行相應(yīng)減分。時效方面則主要在稅務(wù)和銀行的開戶時間,對不同時間段仍未開戶進行分類統(tǒng)計。其余的進行有無類統(tǒng)計,如是否有負債、是否有凈利潤、是否有對外投資等。經(jīng)過初步統(tǒng)計,數(shù)據(jù)項超過百項,考核項目越多,則最終得出的分值就越能代表企業(yè)真實的活躍度和經(jīng)營實貌。同理,在取值和后續(xù)分析應(yīng)用的過程中,需要進行校驗賦值是否合理分析,形成有效的反饋修正機制。
在統(tǒng)計學領(lǐng)域,基層的數(shù)據(jù)質(zhì)量是基礎(chǔ)[3],在海量的大數(shù)據(jù)中如何對數(shù)據(jù)進行清洗合并和歸類是需要解決的技術(shù)手段。由于企業(yè)數(shù)量龐大,且統(tǒng)計時間跨度較長,龐大的數(shù)據(jù)在于每一個數(shù)據(jù)項都要進行對應(yīng)寫入運算,因此根據(jù)運算性能要求,應(yīng)該在服務(wù)器上操作,并注意每一步的備份,在建主表過程中,注意保留擴展字段,方便在有新的考核數(shù)據(jù)項出現(xiàn)時可以直接賦值寫入。
數(shù)據(jù)庫主要以活躍度總表為準,并自建索引主鍵,企業(yè)的ID和取值年份對應(yīng)一個活躍表主鍵值,列值命名規(guī)則使用通用易懂英文且包含權(quán)重值,并設(shè)置每一個字段的別名及注釋,在從各個機關(guān)的數(shù)據(jù)庫中導出的部分數(shù)據(jù)進行重新計算且只復制數(shù)值,用制表符分隔的文本進行按照名稱輸入導入,確定每一個數(shù)據(jù)域的對應(yīng)和數(shù)據(jù)類型,數(shù)據(jù)類型要注意寬度和類型盡量為數(shù)值型,必要時可使用字典進行關(guān)聯(lián)。導入遇到錯誤時選擇忽略并檢查錯誤數(shù)據(jù)原因并調(diào)整,每做一次操作備份一次表格,防止操作失誤,在賦值過程中,注意一些特定的數(shù)值比較,如從業(yè)人數(shù)于企業(yè)社保賬戶人數(shù)的對比,年份同比類使用雙表錯位相減。在統(tǒng)計年報是否及時以及上一年度擁有專利數(shù)等需要使用數(shù)據(jù)庫的內(nèi)部運算。
數(shù)據(jù)清洗過程中,可以倒逼數(shù)據(jù)質(zhì)量更正,由于歷史沿革等原因,一些可以修復的錯誤數(shù)據(jù)因為流程上的煩瑣而導致業(yè)務(wù)人員不愿意去觸碰,如企業(yè)股東或法人代表的身份證號碼錯誤,均可在與公安的數(shù)據(jù)對接上得到糾正,在糾正過程中,注意方式和方法,在錯誤數(shù)據(jù)進行羅列后,應(yīng)當由專業(yè)人員進行審核和審批,糾正過程中,一人操作,兩人實時監(jiān)督原則,將糾正內(nèi)容進行歸檔,操作員和監(jiān)督員對修改的數(shù)據(jù)質(zhì)量負同等責任。如果確實有部分數(shù)據(jù)無法更正,則在統(tǒng)計過程中剔除該記錄或者將該記錄值調(diào)整為平均數(shù),以減少對總值的干擾。
在賦值過程中還需要考慮因政策或軟件發(fā)布導致的數(shù)據(jù)差,如判斷2013年的年報是否及時,因為2013年之前是年檢,取消年檢改年報后基本是2014年下半年才進行年報,因此數(shù)據(jù)庫要對該年份做特定計算。2012年前的數(shù)據(jù)庫中是以分為單位,需要整理數(shù)據(jù)統(tǒng)一以萬元為單位,并注重各階段數(shù)據(jù)格式是否一致。最終形成一個統(tǒng)計表,即每個活躍值對應(yīng)的企業(yè)數(shù)量,從而形成一張橫坐標為活躍值,縱坐標為企業(yè)數(shù)量的直方圖,圖形的峰值函數(shù)類似一個倒V,該圖形有兩種情況,一種是符合正態(tài)分布,可以認為中位數(shù)左側(cè)為廣義的非活躍企業(yè)。另一種是不規(guī)則凸型曲線,可以認為左側(cè)Y/X值即斜率最高的地方出現(xiàn)了數(shù)量滑坡,左右側(cè)企業(yè)出現(xiàn)了明顯的數(shù)學差異,即該斜率左側(cè)為技術(shù)上的非活躍企業(yè)。總體而言這樣的分類方法并不準確,此算法過程重在可以得出任意指定百分比的非活躍企業(yè)名單。
在此基礎(chǔ)數(shù)據(jù)庫設(shè)定完成后,就可以進行簡單的低維度的展示,如各個區(qū)縣在不同領(lǐng)域的比值,不同企業(yè)類型的活躍度占比,大中小微企業(yè)在十年來生存周期的變化。同常住人口相比得出哪個區(qū)縣的從業(yè)人數(shù)密集度高。通過波士頓矩陣分析出哪些行業(yè)新設(shè)多、注銷少并結(jié)合從業(yè)人數(shù)找出各個區(qū)縣的特色產(chǎn)業(yè)。值得說明的是,各種維度的比較應(yīng)考慮更多的綜合因素,如對于區(qū)縣企業(yè)的活躍度比較,應(yīng)該考慮使用各種修正值,而非簡單的數(shù)據(jù)計算結(jié)果,需要對較多注冊地址一樣的企業(yè)進行再折算,對轄區(qū)內(nèi)遷入企業(yè)數(shù)量較多的以及企業(yè)總體平均存續(xù)期較長的應(yīng)該進行分段賦值加分。在架設(shè)體系的基礎(chǔ)上,如果有條件應(yīng)當記錄企業(yè)的地理位置信息,形成經(jīng)緯度系統(tǒng),此舉可以利用簇群分析醫(yī)院、銀行和政務(wù)中心等公共機構(gòu)對周邊環(huán)境的影響程度,即企業(yè)的空間聚集性和關(guān)聯(lián)性,分析特定行業(yè)如新城區(qū)和老城區(qū)批發(fā)零售業(yè)的變遷,通過線性回歸模型來找到產(chǎn)業(yè)空間的變化和影響因素。
2020年7月習近平總書記在企業(yè)家座談會上強調(diào)保市場主體就是保社會生產(chǎn)力,要保護和激發(fā)市場主體活力[4]。2021年12月李克強總理在中南海紫光閣提出要圍繞市場主體需求制定政策,且加大對實體經(jīng)濟特別是中小微企業(yè)的支持力度。對中央政策的解讀重點在于如何衡量企業(yè)現(xiàn)有活力和激發(fā)后的改變程度,以及在不搞大水漫溉的共識下,如何輔助真正需要幫助的企業(yè),并讓那些依靠補助政策漏洞的企業(yè)排除出市場之外,減少浪費與不公,這一些都需要數(shù)據(jù)來提供佐證,讓客觀事實來說話。
數(shù)據(jù)是沉睡的資源,也是客觀現(xiàn)實世界的映照,不同的視角會產(chǎn)生不同的圖景,這種數(shù)據(jù)的收集與展示可以揭示現(xiàn)實規(guī)律,為政府的監(jiān)管決策提供佐助,多單位縱深數(shù)據(jù)的基礎(chǔ)層面可以認為是簡單的二維對比,即使用皮爾遜相關(guān)系數(shù),如注冊資本和納稅總額的比較,根據(jù)變量的相關(guān)強度,可以分析出哪個區(qū)縣出現(xiàn)了較多的皮包公司不納稅或者注冊資本虛高的情況。用此方法可以在雙隨機中對該類企業(yè)進行定向抽查,增加抽查的有效性。在同民政局的數(shù)據(jù)聯(lián)動中,可以根據(jù)數(shù)據(jù)簇來確定家族企業(yè)經(jīng)營行為,尤其是對特定公務(wù)人員家屬經(jīng)商的檢查,也可以找出交易盈利型公司,一個家庭多個執(zhí)照和家庭開公司而單個成員冒領(lǐng)低保等現(xiàn)象。
用數(shù)據(jù)來管理,用數(shù)據(jù)來創(chuàng)新,在解決數(shù)據(jù)共享的問題后,科學建模就是其中的重點。數(shù)據(jù)建模可以挖掘深層次的社會成因,在建模過程中要關(guān)注各個特定時期理念創(chuàng)業(yè)激勵政策導向和軟件發(fā)布導致的數(shù)據(jù)偏差,如特定時間的因未年報導致大批量注吊銷和P2P、地條鋼特定行業(yè)企業(yè)的曇花一現(xiàn)。在各種屬性的同中存異計算中,根據(jù)對比差,也可以做出一些在哪個區(qū)域哪個行業(yè)仍可以追加投資的結(jié)論。在政策的數(shù)據(jù)取值上要避免進行非橫向比較的誤區(qū),不能簡單地以數(shù)據(jù)模型中地級市的各個行業(yè)活躍度來判斷哪個行業(yè)需要用政策激活,而是要將這個行業(yè)放到全省所有地級市的比較中,因為不同行業(yè)的情況不能進行簡單的對比,只有同類比較才有其社會意義。數(shù)據(jù)建模可以更深層次地根據(jù)企業(yè)的產(chǎn)業(yè)鏈特征對整個供應(yīng)鏈系統(tǒng),即上中下游企業(yè)進行高緯度分析,根據(jù)區(qū)位熵概念分析產(chǎn)業(yè)的集中程度,分析其優(yōu)劣,通過產(chǎn)業(yè)輻射理論,找到產(chǎn)業(yè)的主動脈戰(zhàn)略企業(yè),分析其產(chǎn)生的高輻射作用,從而做到協(xié)調(diào)區(qū)域發(fā)展,為每個地方找到適合自己的行業(yè)。
在經(jīng)濟政策的制訂上,決策者首先要看到以前的政策是否有效。從時間維度上,如鎮(zhèn)江市餐飲行業(yè)的分段式十年活躍度變化得出該行業(yè)的發(fā)展趨勢,推演下個年份的活躍度值,并且在綜合整改方案實施后和實際活躍度對比,可以量化整改方案的效果,讓數(shù)據(jù)建模真正地服務(wù)于高質(zhì)量發(fā)展。又如政府在下達提高女性就業(yè)率的文件是否有數(shù)據(jù)支撐,需要將鎮(zhèn)江的數(shù)據(jù)和其他城市作為參考,同時對比女性創(chuàng)業(yè)者和男性創(chuàng)業(yè)者的企業(yè)活躍度對比,確定女性創(chuàng)業(yè)者是否已經(jīng)在全省乃至華東地區(qū)排名前列,而不在于在本地區(qū)采用主觀認定比例的少或多。在企業(yè)家經(jīng)濟研討會議上,需要邀請的企業(yè)家更需要從數(shù)據(jù)中獲得,如部分行業(yè)企業(yè)生存周期短的問題,應(yīng)該根據(jù)實際情況篩選出創(chuàng)業(yè)在3~5年注銷的企業(yè)法人代表,獲得真實的創(chuàng)業(yè)者聲音,了解企業(yè)運作的困惑和阻礙,替他們排除創(chuàng)業(yè)障礙,解憂紓困,實現(xiàn)更良好的經(jīng)商環(huán)境。
更深入而言,企業(yè)的活躍度是企業(yè)乃至經(jīng)濟社會是否正常運作的關(guān)鍵因素。社會是一部精密的儀器,經(jīng)濟運行是一切社會關(guān)系的晴雨表,在雙減大背景下可以分析如教培類企業(yè)活躍度增加,經(jīng)濟發(fā)展和結(jié)婚率或出生率是正相關(guān)還是負相關(guān)。用數(shù)據(jù)去校驗人才引進和激勵政策所帶來的經(jīng)濟紅利和正向回饋,檢驗優(yōu)化企業(yè)開辦環(huán)境對企業(yè)活躍度的提升效果。在深度運用模式上,可以結(jié)合教育部和人社局數(shù)據(jù),檢查哪些企業(yè)出現(xiàn)了員工為注冊教師的集聚現(xiàn)象,是否存在“掛羊頭賣狗肉”的學科培訓行為,從社會實際的數(shù)據(jù)流量關(guān)聯(lián)上嗅探一切可能違反當前國策的暗流。
綜合而言,活躍度是一種動態(tài)的概念,不論是指標還是權(quán)重值乃至活躍度占比,都是一種動態(tài)行為。在常規(guī)的活躍度分析上,可以推廣到全省,可以清晰得出所有縣級市的哪類企業(yè)特征活躍度比例較高,另外綜合多個維度得出區(qū)域特色的較為權(quán)威評比結(jié)論,如哪個區(qū)縣萬人擁有非活躍企業(yè)數(shù)最多,哪個行業(yè)發(fā)展形勢較好,企業(yè)存續(xù)期最長的是哪個城市,什么時間段什么政策對企業(yè)的創(chuàng)業(yè)產(chǎn)生的影響程度如何。從經(jīng)濟角度而言,此活躍度分析技術(shù)以較小的代價獲得了對經(jīng)濟發(fā)展的有效診療,為決策層面提供了有效的政策取舍佐證,使得供需雙側(cè)結(jié)構(gòu)根據(jù)動態(tài)情況積極調(diào)整優(yōu)化。根據(jù)其他城市指標,對各行業(yè)設(shè)置合理活躍度預警值,數(shù)據(jù)庫自行定期檢查該類數(shù)據(jù),自動觸發(fā)提醒,及時向有關(guān)主管部門通告。
在活躍度數(shù)據(jù)的應(yīng)用上,可以就實際結(jié)果做相關(guān)治理,針對活躍度過高或過低,提前設(shè)置備用監(jiān)管方案,針對活躍度過高的行業(yè),加大招商引資和宣傳及市場準入力度,針對活躍度過低的行業(yè),應(yīng)當加大雙隨機檢查的抽查力度,對未經(jīng)營的皮包公司進行查無下落標注,按照監(jiān)管制度,及時進行批量吊銷,將僵尸企業(yè)排除出市場之外,讓企業(yè)更加有活力有質(zhì)量,讓鎮(zhèn)江乃至全省的經(jīng)濟更加健康繁榮。因此,對長期非活躍企業(yè)研判的探索與應(yīng)用可以探尋規(guī)律,把握經(jīng)濟脈搏,對深化供給側(cè)結(jié)構(gòu)性改革、激發(fā)市場內(nèi)部活力、指導經(jīng)濟社會持續(xù)健康發(fā)展具有非常重要的參考意義。