邵 全, 趙 奭, 劉 娜, 馮 凱
(1.北京建筑大學 經濟與管理工程學院,北京 100044; 2.上海電機學院 商學院,上海 200240; 3.上海隧道工程股份有限公司,上海 200032)
近年來,AI技術在工作環境中的介入給社會勞動關系帶來了正反兩方面的影響。一方面,企業應用AI技術進行勞動監控使得勞資雙方間信息的模糊性降低、信息環境更加完全,利于企業通過采集員工的工作數據從而改進工作流程、提高生產效率、降低員工的工作風險[1]。同時員工也因此而受益,員工通過AI技術實現工作數據化,利于員工提高自身人力資本水平,有效減少工作時間,創造更多收益。另一方面,工作場所應用AI技術的勞動監控也產生了負面作用,引發了工作倫理問題,影響了勞動關系。2018年TechNews披露了亞馬遜公司為一款AI腕帶申請了專利技術并要求員工佩戴,這個腕帶通過采集工人的工作數據,并能適時做出工作監視震動以促使工人提高生產效率[2],但這種數據的采集和工作方式也侵害了員工的隱私,遭到了員工的反對。隨著企業對于數據索求意愿不斷增強,企業、員工在博弈的過程中也意識到擁有數據權利是改善自身期望效用的有效策略,他們都在滿足心理預期最低保障的約束條件下尋求自身效用的最大化[3]。
為了構建和諧勞動關系,形成政府規制下的勞動監察權力制衡和利益均衡途徑,國內外學者對此方面展開了一系列研究。Lazear和Rosen建立了錦標賽理論提出如何形成代理人的有效激勵機制,從而降低委托人支付的勞動監控成本[4]。Solow[5]、Shapiro和Stiglitz[6]通過工資模型來解釋企業不能完全監控員工時,如何有效解決員工投機行為。Rubinstein[7]、Fama[8]、Weizmann[9]、Radner[10]設計聲譽模型和棘輪效應模型展開最優合同的研究中涉及勞動監控問題。Holmstrom[11]、Holmstrom和Milgrom[12]、Lazear[13]采用激勵機制證明了規避員工偷懶的有效方法。McAfee 和McMillan建立選擇模型分析團隊工作中的勞動監控問題[14]。Christiane Prange通過案例研究分析公司在數據創新管理中的合理利益分配途徑[15]。Baeten Xavier基于未來內生和外生因素的影響,構建了平衡的薪酬和福利計劃[16]。多數學者從契約理論、激勵理論等視角來研究和解決勞動關系風險問題,但少有學者從博弈合作聯盟的角度去研究博弈各方形成的一個工作聯盟,來解決企業和員工間形成的不完全信息合約機制所引發的潛在收益分配不公平和數據權利不對等問題。
本文關注勞動關系博弈局勢的理性參與人在何種行為策略下能形成政府協調下的勞動監控權力制衡,尋找到參與人的利益分配均衡途徑。第一部分基于博弈中的信號理論分析了信息不完全是勞動力市場產生不和諧勞動關系的根源。第二部分基于合作博弈理論深入探析了在AI時代,企業、員工、政府應如何理性地組建利益相關者的工作聯盟,如何對聯盟成員進行合理配置,構建了由政府、企業、員工三方構成的AI背景下工作聯盟,采用經典的Shapley Value方法對工作聯盟收益配置進行求解。第三部分引入一個算例,模擬計算了工作聯盟Shapley解,給出了AI時代,創建社會和諧勞動關系,實現聯盟的社會帕累托效率的相關策略建議。
在工作場所,勞資雙方的信息是不對稱的,員工會有偷懶、投機等行為,企業為了減少或最小化員工偷懶等行為所造成的收益損失,會進行必要的勞動監控,并為此支付一定的成本。企業與員工的這種博弈行為形成了一種不完全信息的信號博弈,員工和企業是信號博弈的兩個博弈方,分別為信號發出方和信號接收方,員工的類型是私人信息,他們向企業發送自己的信號,企業據此做出判斷并理性地選擇勞動監控的相關決策。同時,員工也會對企業的勞動監控決策進行判斷,理性地做出自己的最優反應策略。
(1)參與人集合I={1,2},1表示員工,2表示企業。
(2)員工的類型集Θ={s,w},s表示員工偷懶,并有投機行為,w表示員工努力工作,θi∈Θ(θ1=s,θ2=w)表示員工的私人信息,它是員工的類型,員工自己知道θi的取值,而企業僅知道θi的先驗概率分布,令p(θ1=s)=x,p(θ2=w)=1-x,x∈[0,1]。
(3)員工的信號集合M={m1,m2},m1表示員工按自己真實意愿行動,不刻意隱瞞自己的投機行為,受到監控被發現投機時不進行掩蓋,愿意與企業合作;m2表示員工不一定按自己的真實意愿行動,若θ1=s時,員工會蓄意隱瞞自己投機行為,從而使其投機行為很難被企業發現。若θ2=w,表示當員工真實意愿為與企業合作時,其必發送m2信號。
(4)企業的行動集A={a1,a2},a1表示企業監控意愿消極,監控效率很低,在這種情況下即使員工投機,企業也監控不到;a2表示企業付出很高的管理成本而積極監控,能高效檢查出員工投機行為。
(5)企業消極監控成本為c1,企業積極監控成本為c2,令c2>c1>0。
(6)員工生產率有高低之分,H表示員工投機時有高生產率,其概率為q;L表示員工投機時有低生產率,其概率為1-q;q∈[0,1]。
(7)員工產出價值為v,其中q×v表示高產出,(1-q)×v表示低產出;員工工資為ω,其中q×ω表示高工資,(1-q)×ω表示低工資;員工投機成本為g;員工投機收益為r;企業實施投機懲罰為f。
引進“自然”N,N首先選擇員工類型θi∈Θ,Θ={s,w}。因為企業與員工之間勞動契約關系已經成立,員工將根據自己的類型先選擇行動,員工選擇易被發現的投機行為或難以察覺的投機行為。企業后行動,企業觀測到員工發出的信號,企業使用貝葉斯法則參照員工的先驗概率p0=p(θi),得到其后驗概率p=p(θi|mi),然后決定監控的行動。如果檢查出員工投機但愿意與企業進行合作,則員工無法取得投機收益r,同時員工要擔負損失為投機支付的成本g,假設r>g>0,這樣員工有投機的個體理性;如果檢查出員工投機但其極力掩蓋,除了員工無法取得投機收益r,并且將被處于罰款f,f≥0。如果員工投機沒被發現,則員工投機獲得收益r-g>0。建立博弈樹如圖1。
博弈參與人的支付函數表示為Uij(mi,ak,θ,Vq),如表1所示,其中,θi={s,w};mi={m1,m2};ak={a1,a2},Va={(H,L)|P(H)=q,P(L)=1-q};i=1,2;j∈Z+。

圖1 勞動監控博弈模型

表1 博弈參與人支付函數表
員工向企業發送自己類型信號時有兩種策略,一種是不同類型的員工依據自己的類型向企業發送不同的信號,稱為分離策略。一種是不同類型的員工不管自己的類型如何都向企業發送相同的信號,稱為混同策略。針對員工的工作,企業有兩種監控行為。一種是高成本的勞動監控行為,一種是低成本的勞動監控行為。
1.3.1 員工的分離策略

當員工采取分離策略時,企業對員工做出后驗判斷概率為
p(s|m1)=1,p(s|m2)=0,p(w|m1)=0,p(w|m2)=1
企業根據對員工類型的后驗判斷p和員工發出的信號mi,企業選擇的行為必須滿足使得企業獲得期望支付最大,即a*(mi)是最大化問題:
命題1員工采用分離策略時,企業偏好消極監控策略,即(m1,m2)→(a1,a1)。
證明員工依據自己的類型發出兩種信號:m1,m2
(1)當mj=m1時,

=max(U2(m1,a1,s),U2(m1,a2,s))
=max(U21+U22,U23+U24)
=max(v-ω-2×c1,v-ω-2×c2)
=v-ω-2×c1
得出a*(m1)=a1。
(2)當mj=m2時,同理可解a*(m2)=a1。
命題2企業采用消極監控策略時,員工偏好發送信號m2,即(a1,a1)→(m2,m2)。
證明當給定企業采取消極監控策略時,即a*(m)=(a1,a1),員工選擇的策略必須使得員工期望支付最大,即m*(θi)是最大化問題
(1)當θ1=s時,

=max(U1(m1,a1,s),U1(m2,a1,s))
=max(U11+U12,U15+U16)
=max(ω-2×g,ω-2×g+2×r)
=ω-2×g+2×r
可得m*(s)=m2。
(2)當θ2=w時,同理可得m*(s) =m2
當員工采用分離策略,員工將根據自身類型發送不同信號,此時,企業可以通過觀察員工發出的信號對員工類型進行準確判斷,那么企業就會偏好采取消極的勞動監控行為,以降低支付的監控成本。當企業采取消極勞動監控時,員工的信號發送偏離了分離策略,沒有激勵相容性顯示出員工的真實類型。企業則不能通過信號對員工類型進行有效判斷,企業采取低成本的監控行為是無效率的。為了提高勞動監控效率,企業必須加強勞動監控力度,這必將消耗企業大量的監控成本。
1.3.2 員工的混同策略
命題3企業偏好的勞動監控策略將隨機化。同時,員工的相機勞動策略也將隨機化。
證明當員工采用混同策略,即員工不努力工作,被企業監控發現時,會刻意隱瞞自己的行為,從而使其投機行為不被企業發現;當員工努力工作時,會按真實意愿發送信號,與企業合作,即:

當員工采取混同策略組合向量,企業對員工做出后驗判斷概率為
p(s|m1)=1,p(s|m2)=x,p(w|m1)=0,p(w|m2)=1-x
企業根據對員工類型的后驗判斷p和員工發出的信號mj,選擇的行為必須滿足使得企業獲得期望支付最大,即a*(mj)是最大化問題:


解得①當θ1=s時,m*(s)=m2,②當θ2=w時,m*(w)=m2。


解得①當θ1=s時,m*(s)=m1,②當θ2=w時,m*(w) =m2。

信息不完全造成了勞資雙方的成本損失,不能實現勞動市場占優的整體理性投資行為。隨著人類社會進入AI時代,通過AI技術對工作數據的采集,這將大幅度降低工作環境的信息不完全性。但是,如果勞資雙方仍采取工業時代勞動監控中的非合作博弈行為,企業與員工間權力距離將導致員工處于更為惡劣的工作環境,雙方間的勞動關系矛盾根源也將從信息的不完全轉向信息權力的不對等。而解決這種問題的唯一途徑是強化和保障員工的數據權利和數據使用。因此,合理實現勞資雙方對于AI工作數據權益平衡,需要政府作為組織者、協調者、制約者的多重身份參與到博弈中去,這就需要采取激勵機制保證政府能公平、公開、公正地實現AI在勞動力市場中將民意化為國家意志,在勞資雙方間提供對稱的法律權利和義務關系[17]。本文構建政府、企業、員工三方共同參與的AI工作聯盟如圖2,通過在聯盟內部構建收益剩余的合理分配規則,讓聯盟成員達成帕累托改進,從而實現AI技術應用于工作環境中的社會總體優化。

圖2 AI工作聰明三方關系圖
員工、企業、政府作為理性參與人參與到一個勞動經濟博弈局勢中,他們彼此在可置信的約束下結成勞動合作聯盟。大聯盟內任何聯盟組合的收益用特征函數來描述如表2。

表2 各聯盟狀態下特征函數值
單一的員工、企業、政府無法建立符合邏輯的AI工作聯盟,v({1})=v({2})=v({3})=0。
沒有政府介入的、單純的企業與員工間建立的AI工作聯盟{1,2},因聯盟參與人的主體地位不同,企業處于強勢地位,員工處于弱勢地位,聯盟{1,2}的契約是不穩定的且具有弱約束力。原因在于員工受雇于企業,AI數據的透明度相對于員工更不完全,很多情況在員工簽署勞動契約合同時毫無防備地或迫于就業壓力地同意被隱含監視或采集員工個人數據,員工自然的弱勢群體身份在這個聯盟契約下,聯盟{1,2}會給企業帶來更多的收益,而且,這個聯盟收益很可能是源于員工利益的損失。企業依據其勞資關系中強勢地位,利用AI數據監控員工,侵犯員工個人隱私,壟斷性地攫取員工的潛在價值,企業分析某些崗位的數據后可以更加輕松地做出機器人替代員工或者將員工當作機器人一樣使用的決策。更有甚者,可以通過出賣員工工作行為、工作心理等數據牟利。因此,聯盟{1,2}的特征函數值a相對于其他聯盟的值最小,在整個社會環境中聯盟{1,2}最不穩定且無序。
聯盟{1,3}建立在政府和員工之間,將國家與公民聚集在一個開放的、有束縛力的AI數據的工作利益共同體中,宏觀的社會收益將優于松散的、無序的微觀企業與員工間的聯盟收益,但很大程度上取決于政府對微觀個體行為的監管力度。因政府的介入而使得聯盟建立基礎擁有政策性、法律性、公共管理的AI大數據工作聯盟使得員工作為公民參與性加強,不完全信息的環境相對改變,政府更有可能將公民的意愿變為國家決策。這個聯盟體現出對公民數據權利的尊重,降低了員工抗議的社會不滿意度。因此,聯盟{1,3}特征函數值b>a。
聯盟{2,3}的建立形成一種對員工最不利的獨裁性聯盟組合,數據開發的惰性存在于政府和企業自身,企業在經濟市場是強勢的,政府在公共管理是強勢的,無論在哪個方面,員工的AI工作數據權利鴻溝都是無法逾越的。AI數據紅利將極大推動政治學和企業經濟獲利的步伐,固然要犧牲在員工損失的基礎上,無論這個AI數據帶來的損失是精神上還是經濟上。員工在數字化生存的環境中擁有的抵抗力量是渺小的,壟斷資本和國家權力扭結在一起的聯盟力量是巨大的,因此,聯盟{2,3}特征函數值c>b。
政府、企業、員工進行有效相關策略協商,成立有置信威脅的AI工作三方聯盟。明確雙向AI工作數據賦權,這意味著強調參與人角色的主體間性而不是主體性,避免任何兩者關系的一元傾向。一方面,員工允許政府和企業采集、整理、分析其許可范圍內的數據,允許在法律約束下的商業轉讓途徑,但是收益要與員工共同分享,以使得員工能在一定范圍內被工作數據監視的環境中保持激勵,同時,AI數據的收益創造也使得政府和企業能提供更優質的數據服務。另一方面,政府和企業要允許員工擁有知道、使用、獲利的權益。員工可以共享、共用AI工作數據。聯盟將政府公共服務、企業數據優勢、員工數據生產技能有機地結合到一起,實現數字化時代中公私合作的要義。因此,聯盟{1,2,3}特征函數值d在所有可能的聯盟組合中取值最大。
政府、企業、員工三方參與的AI工作聯盟收益分配應建立在三個條件上,一是企業的積極投入和采取更加公平的數據權利分配。企業可以依靠自身資本的優勢,實現AI數據在工作場所的應用,在收益合理劃分與勞動關系間進行權衡,形成穩定的雇傭關系匹配,賦予員工個人數據權利,信任員工。二是員工提供有效的勞動服務數據。員工是AI工作聯盟創建數據不可或缺的主體,員工應在政府保障和工會支持下,信守職業操守,杜絕投機獲益的不道德行為。員工應樹立數據權利意識,出現矛盾應尋求有效、合法的保護途徑。三是政府的組織、協調、指導和監管。企業和員工聯盟關系的穩定性必須以政府作為第三方的介入才能得到有效保障,政府利用聯盟中的收益進行轉移支付,對企業和員工進行政策扶持及補貼。政府、企業、員工三方形成的勞動合作聯盟是一個伴隨可轉移效用的TU博弈。
命題4令(N,v)是一個勞動合作聯盟博弈。N={1,2,3},1表示員工;2表示企業;3表示政府。
設v({1,2,3})=d,v({1,2})=a,v({1,3})=b,v({2,3})=c,v({φ})=v({1})=v({2})=v({3})=0,則勞動合作聯盟博弈(N,v)是凸的,當且僅當d≥a+b,且d≥b+c,且d≥a+c。
證明(必要性) 不失一般性,取S={1},對S?T的所有T,有T={1,3},或T={1,2},或T={1,2,3},按以下三種情況討論:
①當T={1,3},則{i}=N/T={2},v(S∪{i})-v({i})=v({1,2})-v({1})=a
v(T∪{i})-v(T)=v({1,2,3})-v({1,3})=d-b
因為(N,v)是凸的,則d-b≥a,即d≥a+b
②當T={1,2},則{i}=N/T={3},同理可證d≥a+b。
③當T={1,2,3},則{i}=N/T=Φ,同理可證d,a,b為任意值。
綜上,S={1},有d≥a+b。
同理可證d≥b+c,d≥a+c。
所以,當勞動合作聯盟博弈(N,v)是凸的,則有d≥a+b,且d≥b+c,且d≥a+c。
證明(充分性) 若d≥a+b,則
v({1,2,3})≥v({1,2})+v({1,3})
v({1,2,3})-v({1,3})≥v({1,2})
v({1,3}∪{2})-v({1,2})≥v({1}∪{2})-v({1})
同理v({1,2}∪{3})-v({1,2})≥v({1}∪{3})-v({1})
若d≥b+c,同理可證v({1,3}∪{2})-v({1,3})≥v({3}∪{2})-v({3})
若d≥a+c,同理可證v({2,3}∪{1})-v({2,3})≥v({2}∪{1})-v({2})
綜上,當S?T?N,{i}=N/T時,有v(T∪{i})-v(T)≥v(S∪{i})-v(S),所以勞動合作聯盟博弈(N,v)是凸的。
任何凸博弈的核非空,而且Shapley Value屬于該博弈的核解,可以應用Shapley Value對聯盟收益進行配置。
根據以上分析能夠得出各聯盟收益排序如式d≥c≥b≥a,且d≥a+b,且d≥b+c,且d≥a+c。
在勞動力市場中政府也作為勞動力市場的制度制定者與勞資協調人參與其中。在AI背景下,員工、企業、政府三方參與人形成了勞動合作聯盟博弈,根據各聯盟收益排序,不失一般性,設a=5萬元;b=10萬元;c=20萬元;d=50萬元,利用Shapley Value的方法進行了求解,合作聯盟{1,2,3}各方收益如表3。

表3 合作博弈各方收益計算表 單位:萬元
根據表3得出的合作博弈各方收益計算結果,可以看出基于政府、企業、員工三方共同構成的AI工作聯盟,相比較博弈中任何兩兩參與人結合所組建的合作聯盟所獲得的各方自身收益都高,聯盟{1,2,3}是AI工作合作中最優化的聯盟選擇方式。
聯盟{1,2,3}下,員工收益為12.5萬元>聯盟{1,3}下,員工收益5萬。這表示沒有企業角色的介入,不論是政府還是員工都難以將AI數據潛在的收益實現最優化。政府和企業的聯盟更傾向于實現雙方在政治和公共管理中的數字化訴求。員工作為公民,政府需要其采用AI化的政治及管理參與,而員工需要通過政府實現自身作為公民的AI數據權益保障。員工相比政府在政治及公共管理領域中處于絕對弱勢角色,如果政府利用自身獨裁地位擁有失信尋租的激勵而謀求自身更大的收益,則員工所處的境地將更加惡化。而政府即使壟斷性地獲得了聯盟{1,3}下的全部收益也僅為10萬元<12.5萬元。針對AI工作聯盟本身的運行機制來說,政府需要依托企業本身完成AI化的市場資本投資,而員工則需要企業作為微觀平臺來成為實現自身更大的效用的途徑。
聯盟{1,2,3}下,員工收益為12.5萬元>聯盟{1,2}下,員工收益2.5萬元。這表示沒有政府角色介入,由企業和員工組建的聯盟使得員工自身獲益很小,這個聯盟也傾向于不穩定、無序的狀態,失去政府作為員工弱勢群體的支撐力量,按照Karl Marx勞動價值論中,員工被資本無情掠奪的自然悲劇屬性將使員工的收益存在極高的風險。除去貨幣收益分配不公之外,這又引發出一個違背人性工作道德倫理標準的問題,員工被企業時時刻刻、全方位監控,員工隱私被窺探,員工信息價值被盜取、轉賣獲利等。這正如Robert Dahl在《經濟民主》中的思想論述,企業擁有的強大所有權和控制力,將加劇員工在福利、技術、信息方面的不平等[18]。
聯盟{1,2,3}下,企業的收益為17.5萬元>聯盟{2,3}下,企業收益10萬元和聯盟{1,2}下,企業收益2.5萬元。企業與員工之間,一方面,企業需要借助自己的員工才能實現AI數據所帶來的收益;另一方,企業與員工在博弈結構里的地位極為不對等,企業總有榨取更多剩余分配的動機,而員工自我保護意識和自私性,自利性的根源使得勞資雙方在這場動態的持久勞動關系博弈中總要進行投機的試探。企業與政府之間,存在結合二元獨裁聯盟的意愿,二元指的是勞動力市場經濟和政治社會管理。聯盟{2,3}依靠強勢地位剝削全部員工的剩余價值進行聯盟內部的再分配,這將進一步加劇勞動關系風險。
聯盟{1,2,3}下,政府收益為20萬元,這個合作聯盟保證了政府在各種合作聯盟形式下總能取得最高收益,也是參與人中獲取的最高收益。這樣的收益分配將有激勵地、可持續地實現合作聯盟中政府作為博弈規則法定者、監控者、審判者的角色定位。這種收益激勵政府努力實現提升企業和員工在合作聯盟中的參與感和積極性,克服他們固有的帶有一定區隔的主體間性。通過對政府的激勵來實現一個能充分發揮企業數據技術、數據資本投入優勢,調動員工人力資本和數據締造優勢,采用政府組織、協調、引導、束縛的合作聯盟規則實現理性、均衡、有效的合作AI工作制度模式。政府的收益可以在周期性失業和產業政策扶持中,對企業與員工各參與方在不同時期的形勢變化中進行權衡并給予轉移支付的補助性政策,從而實現經濟社會的可持續發展。
本文采用不完全信息的勞動監控模型解釋了企業與員工之間的信息障礙。企業與員工的不完全信息工作環境,使雙方均有偏離均衡的動機,企業傾向利用資本優勢奪取員工的信息價值,而員工在被迫的數據監視工作環境中總有投機的抵抗利益驅使,博弈雙方始終處于一種長期非合作博弈關系,容易產生不和諧勞動關系。
基于合作博弈的思想,建立一種基于政府、企業、員工三方主體的相互制衡的合作聯盟博弈機制,有利于實現有序、公平的AI工作數據聯盟收益分配原則。在三方合作聯盟主體間,形成兩兩之間雙向數據權益賦權,通過透明化、匿名化、系統化的數據共享來達成利益相關者間的共識。任何兩兩主體間的合作聯盟都會因為主體地位不對等,利益分配不均衡,從而很難形成有序穩定的合作聯盟。由三方構成的大聯盟致力于增進政府、企業、員工之間的信任度與粘合度,在提高社會效率的前提下兼顧公平,從而形成背景下和諧的、穩定的、可持續的勞動關系。