文/章立,唐余康,周萍,趙啟程,尹威
科技型中小企業是極具活力和潛力的創新主體,是強化企業創新主體地位的重要力量。江蘇省科技型中小企業面廣量大,但仍存在量多質不優,主動創新意識和創新能力總體偏弱的情況,研究構建科技型中小企業創新能力評價體系,挖掘出創新能力強、科技含量高的優質企業,有助于提高科技資源配置的精準度和有效性,對科技型中小企業培育具有十分重要作用。國內外學者從不同的視角對企業創新能力評價進行了大量的研究,本文在現有的科技型中小企業評價基礎上,以江蘇省2018-2022 年科技型中小企業評價入庫企業信息為樣本,通過人工智能算法研究構建企業創新能力評價指標體系。
科技型中小企業的發展狀況關系到整個地區經濟和產業發展,是國家創新能力的重要來源[1]。2017 年,為進一步推動大眾創業萬眾創新,加速科技成果產業化,加大對科技型中小企業的精準支持力度,壯大科技型中小企業群體,培育新的經濟增長點,科技部、財政部和國家稅務總局聯合印發《科技型中小企業評價辦法》,明確了科技型中小企業的標準。截至2022 年底,全國科技型中小企業評價入庫企業數量達到45.4 萬家,較2021 年增長38.4%。江蘇一直高度重視科技型中小企業創新發展,自科技型中小企業評價開展以來,多措并舉挖掘推動全省科技型中小企業“應評盡評”,在政府引導和支持下,2022 年江蘇省科技型中小企業評價入庫企業數達8.7 萬家,成為全國首個突破8 萬家的省份,近三年江蘇省入庫企業數連續位居全國第一。
通過對2018-2022 年江蘇省科技型中小企業評價入庫企業信息分析和日常走訪調研,發現部分科技型中小企業由于創新資源匱乏、開拓市場經驗不足等影響,存在研發投入不足、創新產出效率較低,科技成果轉化能力較弱等問題。如何進一步精準評價科技型中小企業創新能力,提高資源配置促進企業加速成長,對培育發展新動能、推動高質量發展顯得尤為重要。現有的企業創新能力評價指標體系多數采用主觀的打分法,結合機器學習的客觀評價體系正逐漸被主流領域所接受。
陳強遠(2020)利用機器學習算法對企業授權發明專利數據進行分析,結合語義引用測度了企業技術創新質量[2]。楊子暉等(2022)使用因子分析構建系統性風險指標,結合隨機森林模型進行預測,取得了更為有效的預測結果[3]。劉云菁等(2022)采用輕量梯度提升機算法對11 類財務指標進行分析,識別上市公司財務舞弊[4]。新興的機器學習算法是對傳統方法的補充與提升,同時也為本文的研究提供指引。
1、科技型中小企業評價填報信息
科技型中小企業評價入庫企業填報信息主要包括企業基本信息、研發費用、科技成果、直通車、財務信息以及人員信息,詳見表1。
2、新增信息
通過填報信息計算,可得到杠桿比率、資產收益率、毛利率以及科技人員在職率等相對指標信息,詳見表2。
3、創新能力指標體系構建
基于2018-2022 年江蘇省科技型中小企業評價入庫企業樣本信息,將企業評價分為五大維度,分別為研發投入強度、科技人員水平、科研能力、科技成果以及盈利能力。考慮企業信息絕對值可比性較差,本文除科技成果外,其他均轉化為相對值,且參考曹桃云和陳敏瓊(2021)的研究[5],采用隨機森林算法,通過指標篩選,最終確定創新能力指標體系,詳見表3。

表1 評價入庫企業填報信息

表2 新增相對信息及計算方法

表3 五大維度的創新能力指標體系構建

表4 研發投入強度指標聚類情況

表5 科技人員水平指標聚類情況
為驗證創新能力評價指標體系的有效性,參考張成崗和王明玉(2022)研究的方法[6],采用聚類分析將樣本分為兩組,特征相似的企業將被歸為同一組,并且兩組間的樣本有明顯的差異,進而區分出表現相對較好的樣本組以及相對不足的樣本組。具體的聚類過程如下:
①隨機選擇兩個聚類的中心位置C1 和C2(初始化)。
②循環執行兩個步驟直至收斂:一是將每個觀測值xi 重新分配到離它最近的聚類Ck(分配),二是更新每個聚類的中心位置
④由于聚類結果依賴于初始聚類中心位置,因此會嘗試不同的初始聚類中心位置(設置不同的隨機數種子),然后選擇最佳結果,最小化全樣本SSE,最終得到具有區分度的兩類樣本集合。
通過觀察不同年度中兩類樣本的占比可以初步驗證方法的有效性,分項驗證結果如下。
1、研發投入強度
研發投入強度分年份樣本的頻數與頻率如表4 所示,可以看出各年份之間的聚類結果相近,體現了結果的穩定性。


表6 科研能力指標聚類情況
研發投入強度聚類樣本分布如圖1 所示,杠桿比率對樣本研發投入強度的區分度較強,較少的樣本具有較高的杠桿比率,結合其它指標可以發現,樣本在不同年度中均可以分為比例穩定的兩個類別。
2、科技人員水平
科技人員水平分年份樣本的頻數與頻率如表5 所示,與研發投入強度相比,其分布稍有不同,但各年份之間的結果穩定性依然很強。
科技人員水平聚類樣本分布如圖2 所示,可以明顯看出指標對于企業的分類效果同樣是顯著的。職稱率對樣本科技人員水平的區分度較強,較少的樣本具有較高的職稱率,結合其它指標可以發現,樣本在不同年度中均可以分為比例穩定的兩個類別。
3、科研能力
科研能力分年份樣本的頻數與頻率如表6 所示,同樣可以看出各年份之間的聚類結果相近,穩定性較強。
科研能力聚類樣本分布如圖3 所示,首先對高新技術企業、省部級研發機構、科技獎勵、制定標準指標采用主成分分析法提取出主要因素,然后再使用聚類分析進行檢驗,樣本在不同年度中均可以分為比例穩定的兩個類別。
4、科技成果

科技成果分年份樣本的頻數與頻率如表7 所示,可以看出隨著年份的變化,科技成果不同類型的企業比例變化較大。
科技成果聚類樣本分布如圖4 所示,可以明顯看出指標對于企業的分類效果是顯著的,其中一類知識產權數量對樣本的區分度較強,并且隨著年份的不同,分化越大,體現出科技成果的重要性在不斷地提升。
5、盈利能力
盈利能力分年份樣本的頻數與頻率如表8 所示,同樣可以看出各年份之間的聚類結果相近,體現了結果的穩定性。
盈利能力水平聚類樣本分布如圖5 所示,毛利率對樣本盈利能力水平的區分度較強,較少的樣本具有較低的毛利率,結合其它指標可以發現,樣本在不同年度中均可以分為比例穩定的兩個類別。

表7 科技成果指標聚類情況

表8 盈利能力指標聚類情況

通過運用聚類分析算法從研發投入強度、科技人員水平、科研能力、科技成果以及盈利能力五個維度對企業進行評價,特征相似的企業將被歸為同一組,兩組間的樣本有明顯的差異,表明構建的科技型中小企業創新能力評價指標體系可以較好地對企業類型進行區分。政府部門、金融機構等可通過本文構建的創新能力評價指標體系,為企業成長特征進行“畫像”,研究分析營造企業創新環境的具體舉措和發展途徑,進一步精準匹配各類資源,推動形成良好的企業遞進發展生態。