999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數據要素、數據勞動與中國制造業增長

2024-05-26 01:21:50于柳箐
統計與決策 2024年9期
關鍵詞:效應

于柳箐,高 煜,b

(西北大學a.經濟管理學院;b.中國西部經濟發展研究中心,西安 710127)

0 引言

在加快建設“數字中國”和加快發展數字經濟的背景下,充分利用數據要素推動中國制造業增長以及數字化轉型升級對現代化產業體系的建立尤為重要。數據不僅是信息技術制造業等新興數字產業發展所必須依賴的要素,還在傳統制造業數字化轉型與變革過程中發揮著極其重要的作用。可以說,制造業變革或產業升級的路徑就是土地、勞動力、資本、知識、數據等生產要素主導地位變化的過程。從而,研究數據要素對制造業增長的影響對于正在邁向制造強國的中國而言具有重要意義。當前文獻著重考察了數據要素對制造業全要素生產率提升[1]、高質量發展[2]、綠色發展[3]等的影響,同時探究了企業增長和效率提升中數據要素與勞動力要素的結合效應[4,5]。然而,上述文獻雖然在理論上明確了數據要素投入效應的發揮需要結合勞動力要素,但未進一步指明是何種勞動產生作用,且缺少經驗證據。另外,在實證檢驗數據要素對制造業的影響時主要采用固定效應模型,雖然解決了部分不可觀測因素對數據要素投入效應估計一致性的混淆,但是由于僅控制了少數變量,因此依然可能存在遺漏變量偏差。

作為數字經濟時代具有關鍵作用的生產要素,數據要素與勞動力要素協同促進制造業增長的內在規律意義顯著。鑒于此,本文旨在研究數據要素如何協同勞動力要素促進制造業增長。本文基于2012—2019年中國省級面板數據,利用因果森林這一機器學習異質性因果推斷方法估計了數據要素影響制造業增長的效應,并進一步考察了數據要素投入效應在擁有不同數據勞動規模的地區制造業增長中是否存在異質性,以及如何呈現異質性。相比現有文獻,本文以數據挖掘機制為核心深入分析了數據勞動對數據要素促進制造業增長的調節機制;補充了數據勞動如何發揮調節作用的經驗證據;利用因果森林高維數據擬合和個體處理效應(Individual Treatment Effect,ITE)估計能力,在控制眾多投入要素變量的同時進行基于個體的非線性異質性因果推斷,不僅有效緩解了遺漏變量偏差問題,還使得考察數據勞動對數據要素促進制造業增長的非線性調節模式成為可能。

1 機制分析與研究假設

1.1 數據挖掘:數據要素促進制造業增長的核心機制

數據要素已經成為數字經濟時代企業生產、經營管理、研發創新、營銷等決策過程中的必要投入。但是原始數據的積累并不能自動轉化為用于生產的數據資本,與勞動力、資本等實物(有形)生產要素通過直接投入產生經濟物品不同,數據是虛擬(無形)的,無法依靠自身的消耗和形變創造價值,必須經過一定的轉換、分析、處理才能成為促進企業增長的要素投入[6]。作為投入要素的數據,其本質是以0-1(二進制)編碼的信息,具有非結構化和價值稀疏的特征,為了充分發揮數據價值,需要通過搜集、存儲、清洗等步驟將低價值的非結構化形態轉換為可供特定場景使用的高價值結構化形態,最后經過分析提取出有用的信息[5],這一過程即數據挖掘(Data Mining)。對產生于日常生產經營活動中數據資源①在產品生產、研發、銷售中,或在人力資源、財務管理等活動中產生的原始數據。的挖掘將助推制造業企業形成數據-信息驅動決策范式,有利于優化生產技術、激勵研發創新、提升管理能力等,進而實現制造業增長。

1.2 數據勞動:數據要素促進制造業增長的調節機制

數據要素的供給源于勞動創造,它不是原始的數據符號,而是經過挖掘后凝結了人類勞動的數據產品[7],形成數據要素的成本主要來自人力搜集、處理數據的成本[8]。換言之,涵蓋數據搜集、存儲、清洗與分析過程的數據挖掘的實現需要具備相關技能的勞動力全程參與,這反映了利用人力資本將數據“提純”的邏輯思想[6]。Abis 和Veldkamp(2021)[9]構建了包含數據要素的兩階段知識生產模型,并指出在將原始的非結構化數據轉換為結構化數據的過程中,需要數據管理人員的介入,隨后結構化數據集與從事數據分析的勞動力將一同作為知識生產中的要素。具體來看,實現數據挖掘的勞動(即數據勞動)包括對數據的搜集、管理和分析,相應地,從事數據勞動的人員包括進行數據搜集與記錄的數據搜集人員、進行數據清洗與存儲的數據管理人員和進行數據分析的數據分析人員。對數據的挖掘能夠促進制造業增長,而數據挖掘的實現又依賴于數據勞動。因此,在擁有不同數據勞動規模的地區,數據要素促進制造業增長的效應可能不同。數據勞動供給越充足的地區,數據挖掘的作用越能充分顯現,數據資源中的信息越能被充分提取,從而數據要素促進制造業增長的效應越明顯。據此,本文提出以下兩個待檢驗的假設:

假設1:數據要素投入可以促進中國制造業增長。

假設2:數據要素對制造業增長的促進效應受到數據勞動的調節,數據要素能更好地促進擁有更大數據勞動規模地區的制造業增長。

2 研究設計

2.1 因果森林方法概述

傳統回歸模型無法有效擬合高維數據,可能造成遺漏變量偏差,同時還缺乏有效的異質性處理效應估計方法。Wager 和Athey(2018)[10]對經典隨機森林(Random Forests)算法的節點分裂規則、數據擬合模式、處理效應估計等方面進行了改進,發展出因果森林(Causal Forests),不僅能用于高維數據因果推斷,還能進行個體異質性處理效應估計。在非混淆假設下,基于半參數部分線性模型利用殘差回歸的推斷,對于所有的x∈χ,結合隨機森林方法可以得到固定的條件平均處理效應(τ^):

其中,Wi代表處理變量,Yi代表因變量,e(x)=P[Wi|Xi=x] 是由隨機森林計算的傾向分數,m(x)=E[Yi|Xi=x]是由隨機森林計算的邊際結果(marginal outcomes),上標(-i) 表示執行隨機森林的袋外(out-of-bag)預測①對于每個訓練示例,所有在訓練期間沒有使用此示例的樹都被識別出來,然后僅使用這些樹對測試示例進行預測。。雖然式(1)對處理效應的估計是半參數有效的,但只能用于固定處理效應的估計,為此,Nie 和Wager(2021)[11]在式(1)的基礎上生成了一個“R-learner”目標函數(objective function),用于異質性處理效應的估計:

其中,Λn(τ(·))是正則化項,用于控制學習到的函數^(·)的復雜性。不同于經典隨機森林僅關注預測誤差是否因節點分裂而降低,因果森林通過最大化節點分裂后處理效應的組間差異反映異質性處理效應。因此,在給定Xi并最小化式(2)后,可為每個個體提供一個相應的條件平均處理效應估計^(Xi)。具體來看,因果森林通過隨機森林的袋外預測得到估計值^(·)和^(·),再利用式(3)可得到條件平均處理效應估計值:

其中,αi(x)為數據-自適應核(data-adaptive kernel),是利用隨機森林測量的第i個訓練示例與測試點x落入同一葉子的頻率。將隨機森林看作一種基于核的觀點使得用式(1)和式(2)進行處理效應估計成為可能。式(3)實際上使用羅賓遜變換進行了正交化處理[11],即首先訓練單獨的隨機森林和執行袋外預測計算傾向分數和邊際結果的估計值,然后計算殘差處理W-^(x)和殘差結果Y-(x),最后在這些殘差上訓練一個因果森林。正交化估計量從Wi中剔除了Xi的影響,相當于執行了工具變量法,因此正交化對于在觀測性研究中獲得準確的處理效應估計必不可少。

因果森林不僅能在具有非混淆性假設的潛在結果框架下得到一致的處理效應估計量,還能夠有效降低標準誤,提高估計準確性。更為重要的是,因果森林具備高維數據擬合和個體處理效應估計能力,彌補了傳統回歸模型的不足[10]。

2.2 變量設定

2.2.1 處理變量

本文所關注的是數據要素投入與制造業產出的關系,因此處理變量是數據要素投入規模。雖然現行的統計和國民經濟核算體系中仍然缺少有關數據要素規模、價值、存量等的記錄,但是可以借鑒以往評估無形資產價值的經典方法,比如市場法、收入法和成本法對數據要素價值展開測度[5]。然而由于當前數據要素交易頻率較低,且可參照的相關資產難以尋找,造成其未來收益、資產壽命、折舊率等難以準確衡量,使得市場法和收入法在數據要素價值測度實踐中無法實現[8],因此只有成本法是目前最具可行性的測度數據要素價值的方法,即通過投入在數據生產活動中的勞動力和資本成本間接反映數據要素價值。鑒于此,徐翔等(2024)[8]基于從事數據搜集、處理的就業人員工資與數據資本投資數據測度了歷年各省份的數據要素規模存量(datSca)。本文使用這一指標作為處理變量。

2.2.2 結果變量

本文的結果變量是制造業產出水平,采用主營業務收入(manIn)衡量。

2.2.3 調節變量

本文的調節變量是數據勞動規模。Nguyen和Paczos(2020)[12]指出,并非所有的行業都與數據生產活動相關,同時與數據生產相關的勞動力也不會將所有的工作時間都用于數據生產,因此各個行業或職業都存在一個“數據使用強度”。鑒于此,加拿大統計局對與數據生產相關的職業均分配了一個數據生產工作時間占全部工作時間的比例區間,隨后與各職業人數相乘估算了數據勞動規模。然而這一做法具有較強的主觀性,同時由于缺少中國省級層面的相關職業人員數據,因此本文以行業就業人員數據為基礎構造地區數據勞動規模指標(datLab)。具體地,借鑒許憲春等(2022)[5]提出的“供給法”,本文基于數據生產活動中的勞動力與其數據生產工作時間占比估算地區數據勞動規模:第一步,根據《國民經濟行業分類》(GB/T 4754-2017)選擇與數據生產活動相關的國民經濟二位數大類行業j,包括計算機、通信和其他電子設備制造業,儀器儀表制造業,軟件和信息技術服務業,互聯網和相關服務,電信、廣播電視和衛星傳輸服務①根據徐翔等(2024)[8]的計算,以上行業中數據生產活動占其總生產活動的比例均接近或超過50%。另外,根據《國民經濟行業分類》(GB/T 4754-2017),(63)電信、廣播電視和衛星傳輸服務,(64)互聯網和相關服務,(65)軟件和信息技術服務業是門類行業(I)信息傳輸、軟件和信息技術服務業下所包含的二位數大類行業。,以及為工業互聯網發展提供所需裝備的通用設備制造業和專用設備制造業[2]。第二步,使用徐翔等(2024)[8]計算的上述行業j的數據生產活動占其總生產活動的比例αj乘以行業j在i地區t年份的就業人數Lijt,得到行業j在各地區不同年份的數據勞動投入αjLijt。第三步,加總t年份i地區內所有行業j的數據勞動投入得到歷年各地區數據勞動規模指標,即datLabit=∑jαjLijt。

2.2.4 控制變量

由于因果森林具備高維數據擬合能力,因此可以通過控制更多的投入要素變量有效抑制潛在的混淆偏差,進而得到數據要素影響制造業增長的一致估計。本文在歐陽志剛和陳普(2020)[13]的研究基礎上增加了數據要素類別,同時在物質資本中增加了衡量網絡基礎設施和數據資本的指標,在人力資本中增加了衡量數據勞動的指標。最終構建了包含7 個投入要素類別、18個一級指標、30 個二級指標的投入要素指標體系(如表1所示)。

表1 投入要素指標體系與變量描述性統計

2.3 數據來源與說明

本文所用樣本為2012—2019 年中國31 個省份(不含港澳臺)的面板數據。投入要素變量數據主要來自中國研究數據服務平臺(CNRDS)以及歷年《中國統計年鑒》《中國科技統計年鑒》《中國勞動統計年鑒》《中國教育統計年鑒》《中國固定資產投資統計年鑒》等,制造業主營業務收入數據來自歷年《中國工業統計年鑒》。需要說明的是,由于新冠肺炎疫情的影響,中國制造業在2020 年后的發展遭受重大沖擊,可能波及數據要素對制造業增長的影響效應以及數據勞動的調節作用。與此同時,疫情期間大部分的經濟統計指標均出現異常變動,不僅會影響因果森林等機器學習模型的估計效果[14],還會影響數據要素規模存量指標測度的精確性。因此,為了確保實證結果的可信度,參照近期文獻的普遍做法[8,15],設定2019年為觀察末期。

3 實證結果與分析

3.1 數據要素對制造業增長的影響

利用因果森林估計數據要素影響中國制造業增長的效應。為了得到更為穩健的結論,本文對因果森林模型參數(即超參數)進行了不同設置,結果如表2 所示。其中,列(1)使用R 語言grf 程序包中casual_forest 函數的默認超參數;列(2)、列(3)將基礎決策樹的數量分別設置為1000和4000 棵;列(4)進行聚類分析,將處理效應的估計聚類到省份層面,以控制不可觀測的地區差異。不同省份具有不隨時間改變的文化、區位、自然條件等特征,傳統回歸模型通過“固定效應”或“隨機效應”模型來捕獲聚類效應,但是線性可加性假設限制了非線性聚類效應的估計。為解決這一問題,本文使用因果森林聚類分析方法,在模型訓練時所有的二次抽樣過程、節點分裂、森林預測等均在整個集群上進行操作,而不是單個觀測;列(5)使用交叉驗證調參,即利用機器學習交叉驗證法對因果森林超參數進行自動選擇①具體做法是通過訓練擁有不同超參數設置的因果森林,得到使式(2)“R-learner”目標函數袋外估計最小化時的超參數,并使用該超參數設置生成因果森林模型。;列(6)進行聚類分析的同時使用交叉驗證調參。

表2 數據要素影響制造業增長的效應估計

從表2可以看出,在基于不同超參數設置的因果森林模型中,datSca 系數均顯著為正,因此說明數據要素對中國制造業增長具有顯著的促進作用,假設1得到證實。需要說明的是,由于因果森林進行聚類分析以及使用交叉驗證調參時避免了不可觀測因素的干擾和人為主觀設定超參數的弊端,因此后文對數據勞動調節作用的考察以及穩健性檢驗均以列(6)為基準。

3.2 數據勞動的調節作用

3.2.1 異質性檢驗

據前文可知,因果森林通過式(2)在給定Xi時可以為每個個體提供一個相應的條件平均處理效應(CATE)估計τ^(Xi)。基于此,本文使用表2 列(6)計算得到各省份數據要素影響制造業增長效應的估計值,并使用核密度分布進行擬合。擬合圖(略)結果顯示,CATE估計值的分布并不集中,分散于0.1~0.55,這說明數據要素對制造業增長的促進效應在不同省份之間存在差異。

為確定樣本中是否存在異質性處理效應,本文使用最佳線性預測方法進行更正式的檢驗。將條件平均處理效應的袋外因果森林估計值劃分為兩個部分,分別為其中是袋外處理效應估計的平均值,隨后將對Ci和Di進行回歸,即設定如下回歸模型:。Di的系數β2可解釋為對處理效應異質性估計質量的度量,如果顯著為正,那么表明和τ(Xi)之間存在聯系,換言之,因果森林能夠發現數據中存在異質性處理效應的假設得到了支持。從表3可知,當進行聚類分析后,Di的系數β2顯著為正,說明數據要素影響制造業增長的效應的確存在地區差異,同時也體現了聚類分析的有效性。

表3 最佳線性預測檢驗結果

3.2.2 調節效應估計

為揭示數據要素影響制造業增長的效應是如何隨著數據勞動規模的變化而變化的,本文利用由表2 列(6)得到的各省份數據要素影響制造業增長效應的估計值(CATE)以及相應省份的數據勞動規模生成散點圖,并使用線性回歸法與局部多項式回歸法(LOESS)進行擬合,如圖1所示。直線擬合顯示,數據要素對制造業增長的促進效應隨著數據勞動規模的擴大而增強。這說明數據要素能更好地促進擁有更大數據勞動規模地區的制造業增長,假設2得證。

圖1 數據勞動對數據要素促進制造業增長效應的調節作用

進一步地,曲線擬合展現了數據勞動邊際處理效應(Marginal Treatment Effect,MTE)的變化,可以看到,數據勞動對數據要素促進制造業增長效應的調節呈現“倒U”型態勢,即隨著數據勞動規模的擴大,數據要素投入效應的增長幅度越來越小。這可能是因為,數據要素促進制造業增長效應的大小取決于從單位數據要素內挖掘的有用信息的多寡,而從單位數據要素內挖掘的有用信息的數量不僅取決于進行數據搜集、管理和分析的數據勞動人員數量,還依賴于他們所應用的數據抓取、編碼、整合以及機器學習等數據挖掘技術。因而在數據挖掘技術水平的約束下,隨著數據勞動規模的持續擴大,從單位數據要素內挖掘的有用信息的數量逐漸到達上限,進而新增數據勞動挖掘的有用信息的數量逐漸下降至零,從而導致新增數據勞動對數據要素投入效應的提升作用越來越小。

3.3 穩健性檢驗

(1)更換處理變量。為避免數據規模存量指標測度誤差對估計結果的影響,借鑒徐翔和趙墨非(2020)[6]在研究數據資本與經濟增長路徑時的做法,選取省際移動互聯網接入流量作為反映地區數據要素規模的指標,并將其轉換為制造業層面數據。

(2)小樣本調參。由于本文使用的是省級層面的數據,為避免基于小樣本進行因果森林估計時可能存在的偏差,采用兩種方案進一步優化超參數設置,以增強結果的穩健性。一是增加用于調參的樹的數量;二是增加基礎決策樹的數量以及誠實分割部分,同時禁止誠實樹剪枝。

(3)更換機器學習模型。為避免不同機器學習方法對因果森林估計的影響,分別使用廣義回歸森林和廣義提升森林模型計算得到傾向分數^(x)、邊際結果(x),隨后將其作為超參數傳遞至因果森林模型。

結果(略)顯示,在更換處理變量、使用適用于小樣本的超參數、更換計算傾向分數和邊際結果的機器學習模型后,因果森林模型對數據要素影響制造業增長效應的估計均顯著為正,同時數據勞動對數據要素促進制造業增長效應的調節模式也與前文一致,說明本文的結論穩健。

4 結論與啟示

本文主要研究了數據要素能否促進制造業增長以及數據勞動如何發揮調節作用的問題。以2012—2019年中國省級面板數據為研究樣本,使用因果森林方法展開異質性因果推斷,不僅估計了數據要素對制造業增長的影響效應,還考察了數據勞動對數據要素促進制造業增長效應的調節模式。據此,得到如下結論:第一,數據要素對中國制造業增長具有顯著的促進作用;第二,數據要素能更好地促進擁有更大數據勞動規模地區的制造業增長;第三,隨著數據勞動規模的持續擴大,數據要素投入效應的增長幅度越來越小。

由以上結論得出如下啟示:首先,政府需要通過加快數據開放、數據交易基礎設施建設、數據要素市場化改革等舉措,努力提高數據要素供給數量與質量,而制造業企業則需要重視數據要素在生產經營活動中的作用,加強數據要素投入,并積極融入制造業的數字化轉型升級;其次,政府需要加強數據搜集人員、數據管理人員、數據分析人員等數據勞動力的培育,而制造業企業則需要加快數據勞動人員的引進,充分發揮數據挖掘的作用,以提升數據要素對制造業增長的促進效應;最后,制造業企業在加強數據要素投入時,不僅應注意數據勞動人員數量的增加,還要關注數據勞動人員的數據搜集、管理、分析等技術應用能力的提高,以進一步激發數據挖掘的效用,充分挖掘數據資源中的有用信息,從而推動數據要素促進制造業增長效應的不斷提升。

猜你喜歡
效應
鈾對大型溞的急性毒性效應
懶馬效應
今日農業(2020年19期)2020-12-14 14:16:52
場景效應
雨一直下,“列車效應”在發威
科學大眾(2020年17期)2020-10-27 02:49:10
決不能讓傷害法官成破窗效應
紅土地(2018年11期)2018-12-19 05:10:56
死海效應
應變效應及其應用
福建醫改的示范效應
中國衛生(2016年4期)2016-11-12 13:24:14
福建醫改的示范效應
中國衛生(2014年4期)2014-12-06 05:57:14
偶像效應
主站蜘蛛池模板: 久久久国产精品免费视频| 18禁影院亚洲专区| 久久亚洲天堂| 找国产毛片看| 一级一毛片a级毛片| 蜜臀AVWWW国产天堂| 色综合国产| 精品国产网站| 国产内射在线观看| 全部免费特黄特色大片视频| 内射人妻无码色AV天堂| 国产精选自拍| 亚洲人成电影在线播放| 国产美女人喷水在线观看| 日韩视频免费| 一本大道东京热无码av| 亚洲欧美综合另类图片小说区| 美女潮喷出白浆在线观看视频| 日本道综合一本久久久88| 日韩在线欧美在线| 欧美日韩精品在线播放| 国产亚洲高清在线精品99| 亚洲国产日韩一区| 午夜限制老子影院888| 黄色福利在线| 国产超碰一区二区三区| 91福利一区二区三区| 久久中文字幕不卡一二区| 国产一区二区三区在线观看免费| 国产中文一区二区苍井空| 毛片基地视频| 亚洲欧美在线综合一区二区三区| 国产AV无码专区亚洲精品网站| 亚洲高清在线播放| 色爽网免费视频| 永久天堂网Av| 亚洲综合片| 久久久久无码精品国产免费| 精品少妇三级亚洲| 国产女人18水真多毛片18精品 | 国产精品19p| 丰满少妇αⅴ无码区| 欧美成人精品一级在线观看| 久久99国产综合精品1| 亚洲精品日产AⅤ| 国产一区二区三区免费观看| 亚洲色图在线观看| 精品人妻无码中字系列| 欧美a在线看| 久久综合丝袜长腿丝袜| 国产亚洲视频中文字幕视频| 一级看片免费视频| 亚洲福利视频一区二区| 国产精品久久久久鬼色| 在线观看热码亚洲av每日更新| 国产剧情一区二区| 一区二区在线视频免费观看| 成人国产一区二区三区| 91在线视频福利| 亚洲男人天堂网址| 99热国产这里只有精品无卡顿"| 浮力影院国产第一页| 国产不卡在线看| 亚洲国产日韩视频观看| 久久青草热| 国产亚洲精品91| 中国一级特黄视频| 91福利片| 色噜噜综合网| 亚洲AV无码久久精品色欲| 久久五月天国产自| 国产午夜小视频| 91小视频在线| 亚洲综合片| 91在线国内在线播放老师| 四虎精品国产永久在线观看| 亚洲一级毛片| 特级毛片8级毛片免费观看| 久久天天躁狠狠躁夜夜2020一| 亚洲欧美日韩成人在线| 99精品国产高清一区二区| 色婷婷狠狠干|