999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數據工廠去代工化的戰略路徑
——以數據標注行業為例

2022-02-10 02:19:58范黎波于心悅
科技管理研究 2022年24期
關鍵詞:轉型企業

范黎波,于心悅

(對外經濟貿易大學,北京 100105)

1 研究背景

提起信息技術(IT)服務行業,就不得不提起20 世紀中國的一大遺憾。20 世紀80 年代,印度以國際化為主要發展方立足于國際市場,在全世界范圍整合資源和能力,推動其軟件與服務外包產業發展,并通過不懈的努力和先發優勢,在軟件服務的外包熱潮中取得了領先地位。2003—2005 年,印度服務外包出口分別為104 億美元、146 億美元和196億美元,而同期中國只有4.7 億美元、6.3 億美元和9.2億美元[1]。目前,印度已經在軟件接包、軟件服務代工領域取得了巨大成功,并成為了全球第二大軟件出口國。印度IT 服務行業的興起,離不開政府的大力支持及其國內軟件企業的特殊貢獻。早在1974年,塔塔咨詢服務公司就提供軟件外包業務,在歐美國家做得“風生水起”。塔塔咨詢服務的創始人將大量的海外訂單轉回國內交給各類中小企業完成,并在印度各大城市建立了10 多家軟件培訓中心,大量招募軟件人才進行培訓[2]。塔塔咨詢服務公司如今已成為印度最大的單一軟件服務出口商,同時也是亞洲最大的獨立軟件和服務業企業,是世界領先的軟件企業之一。中國與印度的不同路徑選擇使兩國軟件行業發展產生巨大差異。21 世紀初,印度主打軟件的設計并將其作為重點產業來發展,通過理解客戶的需求來生產定制化產品;而中國將軟件作為產品來發展,根據客戶已經做好的解決方案進行復制工作,同時將重點發展領域集中在了制造行業,忽略了IT 行業的未來前景。早期的路徑選擇使得中國在IT 行業與印度產生了較大的差距。

深度學習作為人工智能(AI)的重要技術之一,目前在圖像、語音、文本處理等領域獲得了顯著進展[3]。利用深度學習技能,機器人已經可以掌握圍棋算法并能夠戰勝圍棋界的世界冠軍。人工智能是依托于機器對環境的理解和判斷來實施相應的行動以獲得收益的計算機程序,然而,在此之前,計算機首先要獲得人類的理解和判斷能力。數據標注就是幫助計算機進行學習的過程,但計算機無法通過包含眾多內容且界限模糊的圖片進行學習,需要提前對圖片進行處理并標注,以使其了解應該識別圖片中的哪些特征。數據標注工作就為計算機的學習進行預先處理,通過對大量數據、圖片等進行標注,提高算法模型的有效性,最終使計算機完成深度學習。

隨著第三次人工智能熱潮席卷全球,大型科技公司、銀行和其他機構對數據的需求不斷增加,以實現利用人工智能來改善其產品和服務;同時,各行各業也通過對數據的挖掘提升對消費者的了解。數據營銷追求最大化利用已收集的數據,通過人工智能、大數據等技術高效挖掘消費者需求,并結合適當的廣告進行精準投放,以實現高轉化效果。在本次數據革命中,中國應吸取有關教訓,加強對數據領域的重視并開發出領先的數據分析、數據處理工具,擁有長線思維并取得市場領先地位[4]。

現有相關文獻主要研究了企業應該如何通過數據處理、數據分析進行轉型,但對數據加工企業缺少深入研究,因此,本研究聚焦于數據加工企業,并以數據標注行業為重點研究對象,歸納數據標注行業所面臨的市場現狀,揭示出在此過程中企業面臨的困境及其需要升級轉型的原因。選擇數據標注行業為重點研究對象的原因在于,一方面,數據標注是數據領域中的基礎工作,具備一定的普適性,同時也是全球利用數據進行智能革命最重要的工具,影響范圍廣泛;另一方面是因為數據標注行業相比于數據挖掘、數據采集、數據分析等其他數據領域起步較晚,市場尚存在眾多不確定性因素并具備一定的可塑性,研究數據標注行業是對中國經驗的總結與提煉,可以為世界其他國家與地區提供借鑒與參考。

2 代工企業研究分析

2.1 研究方法與數據來源

利用CiteSpace 軟件對代工企業相關研究進行了梳理與分析。首先以“代工企業”為關鍵詞在中國知網(CNKI)數據庫進行文獻搜索,檢索來源選擇CSSCI,得到2000 年至2021 年12 月的文章674 篇。由于在文獻中有可能存在對代工企業的叫法不一致,為了避免文獻的疏漏與缺失,在篩選文獻的過程中對“代加工”“original equipment manufacturer”等詞進行檢索,以確保文獻的完整性;同時,在Web of Science 上選擇核心數據庫進行檢索,以補充相關英文文獻。此外,為進一步保證文獻的準確與完整,通過EBSCO 等數據庫進行補充檢索有關研究。最后,通過對所檢索得到的文獻的相關性進行人工篩選與確定,將發表時間篩確定為2000—2022 年,最終得到英文文獻41 篇、中文文獻62 篇,即樣本文獻共103 篇。進一步對樣本文獻進行精讀,整理與分析針對代工企業的研究,以此構建研究框架與研究體系。

2.2 可視化分析

2.2.1 發文時段

如圖1 所示,最早出現的為英文文獻,時間為2004 年;中文文獻則最早出現在2006 年。英文文獻發表日期較為平均且發展相對緩慢;中文文獻在2011 年之前經歷了相對低緩的發展期,于2012 年達到了發表數量最大,并于2014 年之后進入了平穩期。總體來說,中文文獻雖發文時間較晚,但整體發文量更多。

圖1 樣本文獻發文時間分布

2.2.2 計量分析

為得到代工企業研究的重點范圍與研究方向,統計了英文組文獻聚類關鍵詞及聚類結果,如表1所示。其中,聚類關鍵詞包括渠道結構、知識、選擇、創新、不對稱的成本信息以及定價策略;聚類模塊值大于0.3,聚類平均輪廓值大于0.6,表明代工企業研究的關鍵詞網絡結構緊密、聚類結果顯著。從關鍵詞共現及聚類結果來看,國外有關于代工企業的研究多聚焦于代工企業的銷售渠道構建、知識獲取、合作對象選擇、創新、不對稱信息及定價策略等。由于各國技術、勞動力優勢各不相同,代工企業多位于亞洲地區,位于歐美國家較少,因此歐美學者對代工企業的研究相比于亞洲學者相對較少,且研究方向多集中于對代工企業較為系統的內部戰略管理研究。

表1 樣本英文文獻關鍵詞及聚類分析結果

從發表樣本文獻的期刊來看,首先,中文文獻發表期刊分布較為均勻,無明顯頭部期刊;其次,多數發表在影響因子較低期刊,表明研究質量有待進一步加強;最后,中文期刊數量明顯多于英文期刊數量,表明中文期刊對于代工企業的接納度、引領度以及對該領域的研究興趣均高于英文期刊。此外,從中文文獻對代工企業主要的研究方向可知(見表2),中國的有關研究多聚焦于代工企業的升級轉型,且研究方法多為探索性研究及案例研究,所選擇的代工企業主要分布在輕工紡織行業及重工制造行業。

表2 樣本中文文獻主要發表期刊和研究方向 單位:篇

表2(續)

總體來說,中文文獻從2010 年起多側重于研究代工企業的品牌升級與轉型以獲取生存及盈利空間,而英文文獻從渠道選擇、創新、定價策略等角度出發研究代工企業的發展方向,兩組文獻均缺乏對科技代工企業的系統性研究。其中僅有1 篇文獻“科技代工企業轉型升級的自我更新與資源整合——以S 集團為例”對科技代工企業的轉型升級進行了案例研究,并總結出對科技代工企業升級轉型的相關建議與作用機制。隨著數字化經濟的不斷發展,對科技代工企業的研究將成為未來新的研究熱點。

2.3 “代工企業”概念起源與產業結構改變

“代工”(OEM)概念最早在中國臺灣于20 世紀80 年代末提出。全球的半導體產業通過代工方式由最初的單一設計制造拆分為設計、制造、封裝與測試的四業分離,提高了半導體的制造與生產效率,由1993 年的770 億美元產值升至2008 年的2 650 億美元;而全球代工業也由1995 年的42.8 億美元提升至2007 年的221.0 億美元[5],并主要集中在中國、泰國、越南等東南亞地區。在參與全球化的過程中,中國根據自身的勞動力優勢和充足的自然資源,以承包的方式參與國際分工,并逐漸獲得技術溢出和資本積累。在參與國際分工初期,中國通過勞動力優勢在紡織、食品等勞動密集型產業中不斷獲得資本累積并穩步提高國內生產總值[6],同時通過代工出口方式取得了對外貿易的連續順差,逐步確立了中國在全球的經濟地位。然而,隨著國內原材料及勞動力成本的不斷上升,中國的代工利潤率呈不斷下降的趨勢[7]。此外,由于代工企業自身調節能力不足,無法應對突然改變的市場需求,造成了代工企業與其所處市場的隔閡與疏離[8]。代工企業由于本身的高替代性以及對委托方的高度依賴,導致其內部創新發展動力不足。因此,中國代工企業面臨著利潤空間被進一步壓縮及技術更新速度較慢的雙重壓力,亟須推動代工企業的升級轉型,擺脫處于價值鏈底端的被動地位。

2008 年的世界金融危機后,歐美市場的需求普遍降低,導致全球代工行業的訂單持續下降[9],同時部分代工企業由于高能耗、高污染而難以在中國繼續生存,許多委托方將機會看向了勞動力成本更低廉的東南亞國家,因訂單轉移、利潤空間不斷被壓縮,部分實體代工企業紛紛破產倒閉,此時,中國巨大的人工智能市場以及企業對數據的需求使得數據代工行業迅速崛起,并朝著專業化、細分化、場景化的方向發展。

3 數據工廠代工參與主體及其潛在問題與挑戰

3.1 數據工廠的參與主體

近年來,數據標注行業逐漸興起,根據2020 年iResearch 的統計資料,數據標注行業在中國的市場規模已超過36 億元,并預計將以21.8%的增長率持續增長,到2025 年,中國數據標注行業的市場規模有望突破100 億元[3]。即便如此,數據標注行業仍屬于新興產業,市場需求量較大、準入門檻偏低,目前屬于野蠻生長的狀態;且由于其屬于勞動密集型產業,受到人工成本上漲、同質化競爭等因素的影響,行業正面臨著巨大的挑戰。數據標注行業主要對接大量AI 實驗室以及初創型AI 公司,這類企業由于規模有限,在產品研發過程中面對成本方面和管理效率的挑戰。因此,對于初創型企業和研究實驗室來說,尋求數據標注企業為其提供處理后的數據進而進行機器學習,是其提高研發效率和節約成本的最佳方式。

數據標注行業目前主要有3 種市場結構。第一種是轉包結構,即數據供應商在接到客戶項目后將項目拆分并轉包給外部標注團隊執行。轉包模式可以利用擁有豐富流程管理經驗的中間商承擔溝通角色,并幫助解決數據標注中出現的問題,使數據質量相對穩定。第二種結構為眾包模式,即需求方直接在眾包平臺上發布任務,并由個人或標注團隊接單執行。眾包結構的好處是靈活性更強,可以雇傭大量兼職人員完成工作任務并且降低企業的運營成本;然而,其缺點也同樣顯著,即流動性更強的兼職人員無法保證數據的隱私性與安全性,他們的專業背景和工作能力也無法有統一的數據處理標準,分散的地理位置也降低了溝通效率,如果委托機構臨時需要修改或調整、核對標注任務,流動性較強的兼職人員則無法及時滿足需求。為了彌補眾包模式結構的缺陷,近年來許多眾包平臺開始制定相應的制度,例如對接收眾包任務的團隊和兼職人員進行考核,并采取末位淘汰制度以提升平臺整體的標注質量和競爭力。目前,中國以百度眾測、京東眾智為首的眾包平臺發展迅速。最后一種結構為自建團隊的模式,即數據供應商直接組建全職標注團隊,并在接受委托任務后派出合適的工作團隊和項目經理跟進執行。在自建團隊的模式中,數據標注的效率和質量都得到了保障,內部人員穩定,同時,自建團隊的數據服務商往往支持駐場、第三方部署等業務方案,極大地保證了數據的安全性;然而,自建團隊對數據服務商的資源、能力、規模以及現金流都有更高的要求,對比眾包模式和轉包模式價格更高。2021 年中國主要數據標注企業及眾包平臺排名如表3 所示。

表3 2021 年中國主要數據標注企業及眾包平臺排名

3.2 國外先進企業發展現狀

由于發達國家的勞務費用很高,很多科技企業依賴亞馬遜土耳其機器人(Amazon Mechanical Turk,MTurk)等眾包平臺來獲得標注后的數據。MTurk 是美國亞馬遜公司開發的數據標注眾包平臺,通過將需要處理的數據外包給以印度為主的東南亞國家來降低成本。然而,這樣的方式無法保證標注任務的準確性,也無法保證數據的安全性。近年來,美國也成立了很多數據標注企業,其中以Scale AI 發展得尤為迅猛。Scale AI 成立于2016 年,通過近6 年的發展已成為該行業中的龍頭企業,為客戶公司提供大量的數據標注服務。Scale AI 主要通過提高數據標注效率的方式搶占市場,其研發的軟件已經能夠通過算法自動甄別物體,并通過初始數據快速篩查出有效數據,提高了數據標注效率和準確性。Scale AI 強勁的市場表現使其市值在2016— 2021 年的5年時間中超過了73 億美元[10],并獲得了多家投資公司的投資意向。目前,這家年輕的公司已經與眾多科技公司達成合作,未來將繼續致力于為機器學習提供更高效率的數據標注服務。另外,澳大利亞人工智能巨頭澳鵬科技公司同樣發展強勁。該公司成立于1996 年,通過長期的發展,其客戶已遍布全球。澳鵬科技公司擁有專業的數據科學家團隊,通過AI算法輔助提高了標注的效率并降低成本。不僅如此,澳鵬科技公司在多年的發展中進行了大量的收購活動以擴大全球服務覆蓋的范圍和規模;同時,尤為重視公司運營的合規性,于2019 年發布眾包資源道德規范,并與世界經濟論壇等領先組織合作,致力于提高人們對數據標注工作的合規性與道德認識。

縱觀數據標注行業國外先進企業的發展軌跡,不難看出海外地區的數據標注領域趨向于更高的市場集中度,科技公司在尋求數據標注企業進行合作時,更傾向于尋找大型、綜合型服務商來為其提供高質量的數據服務;同時,海外的數據標注市場正在趨向成熟,類似澳鵬科技公司這樣的大規模企業正在逐漸收購中小型標注企業以提高自己的議價能力,并通過尋求投資等方式持續加大研發投入,以提高自身的技術能力和標注效率。

3.3 數據工廠發展的潛在問題

經過近些年來的發展,數據標注已經成為人工智能領域的勞動密集型產業,并處于人工智能高科技產業鏈的最低端,行業內的競爭比拼的是人力和價格。中國數據標注行業企業數量龐大,大多為中小型企業,因規模較小、資金有限等原因,只能依靠微薄的利潤獲取生路,缺乏擴大規模的能力;同時,眾多企業缺少相關的優秀人才對公司內部進行管理和創新。數據標注的準確性能夠為企業帶來競爭優勢,也決定了人工智能算法的有效性,因此,隨著數據標注行業的不斷成熟,未來發展趨勢將會是從量的層面轉而追求數據質量、安全性以及隱私性,這將給數據標注行業帶來前所未有的挑戰,作坊式企業將很難與自建團隊并具有一定規模的大企業競爭;同時,隨著技術發展,數據標注行業未來必定會由勞動密集型產業轉為技術密集型產業,當下大部分數據標注企業將會面臨市場的淘汰。因此,數據標注行業的轉型與升級具有重要意義。

3.3.1 技術無法滿足行業發展需求

近些年來,對深度學習、大數據和云計算等技術的研究逐漸興起,各種數據信息也以指數級的速度隨之增長,相關技術的多元化應用也基于大量數據進行研發并提高了多個行業的生產及運營效率。然而,大數據體量龐大、數據類型復雜的特征向數據標注行業提出了巨大的挑戰。另外,目前由于數據標注人員的專業背景較弱,無法滿足不同領域或某些專業性較高行業的數據標注需求。目前數據標注任務主要分為描點標注、區域標注、標框標注等幾類,不同的行業應用對數據標注的任務存在一定的差異性。人工智能技術的不斷成熟將使得一些行業對所用數據有更高的需求,然而,由于現有標注任務細化程度較低,很難達到相應的技術標準。例如,無人駕駛汽車是數據標注的一個典型應用行業,主要的標注任務為圖像標注中的指示牌標注和行人標注,其中指示牌標注用于識別交通規則,行人標注用于分析道路路況以保證安全駕駛,既不可以錯標也不可以漏標;然而隨著技術的進步,大家希望能夠進一步提升無人駕駛的安全性,不僅能夠識別出路況,還能夠依據前方車輛的行駛軌跡判斷出危險駕駛車輛并主動避開,為此,數據標注需要更加細化其標注內容,提高專業性,通過對算法模型進行補充和完善來滿足更高的應用需求。

3.3.2 效率較低且質量參差不齊

機器學習對數據的需求量巨大,然而目前大部分的數據標注任務仍然需要通過人工標注的方式來完成,即“有多少人工,就有多少智能”。目前的數據標注工作普遍是以委托方的需求為基礎,由數據標注團隊根據客戶的需求并借助其提供的工具或其他標注工具來完成畫框、標記等工作,但由于標注員能力的參差不齊及標注工具功能的不完善,數據服務供應商在標注效率上有所欠缺。據統計,在對數據精確度要求較高的數據標注工作中,一個圖像需要花費大約20 min,而完成整體數據集的標注工作則需要約53 000 h,低效的數據標注工作很難滿足人工智能對數據的需求[11]。不僅如此,數據標注工作的準確性也很容易受到影響。由于數據標注具有重復性、高強度以及目前質量審核流程不健全等特點,會導致標注任務的合格率低、標注不完整等問題,從而影響對數據后續應用的準確性。目前大多數眾包公司會采用人工標注和半人工標注兩種方案,因為標注人員由于缺乏專業知識使其難以應對于其而言完全陌生的專業標注任務。同時,對于數據標注工作的結果缺乏統一的判斷標準,使得部分標注人員通過投機的手段來獲得獎勵而不考慮數據標注的質量。近年來,盡管如百度眾測、京東眾智等企業已嘗試制定特殊的機制來提高標注質量,但是尚未系統地解決這個問題;同時,完全的人工標注方案需要標注人員進行高強度作業,極易出現疲勞標注、主觀標注等問題。在半人工標注中,不同的編碼技術及特征識別技術也會使得數據標注的結果產生誤差、差異化較大等問題。

3.3.3 工作方式缺乏安全性、合規性

在數據標注過程中涉及很多敏感的數據,比如人臉、語音等內容,因此數據安全成為了人工智能企業選擇數據標注服務商重點考慮的因素之一。然而,一些數據標注企業出于成本方面的考慮,也會將這些敏感的數據分發、轉包給其他服務商或者個人,導致數據泄露風險大幅提升。隨著經濟的發展和人們隱私意識的提高,大部分企業、政府等機構開始重視數據的安全性,但是仍然存在部分企業及組織為了降低其數據處理成本,將包含用戶私人社交內容的圖片及數據層層轉包給其他國家的標注團隊的現象。據路透社報道,美國聊天軟件臉書曾將部分數據標注工作轉包給了印度的威普羅公司(Wipro),威普羅公司的數據標注團隊有260 余人,對用戶的私人圖片及內容按照5 種類別進行標注[11]。臉書在數據安全方面的處理引起了大量用戶的擔憂和不滿。

此外,一些數據標注公司為規避風險出現數據處理違規行為。部分企業在數據處理過程中,將涉及公民隱私的數據拆成不同部分,每段均無法識別到個人,到了需求端再自行整合起來并形成對個人的完整數據。這類技術規避行為雖然在一定程度上保障了數據的安全性,但事實上仍然涉嫌泄露私人信息,并給企業帶來違規運營的風險。

3.3.4 代工成本日益上漲,已無法再享受勞動力紅利

隨著時代的進步與人們生活水平的提高,勞動密集型產業已逐漸與我國經濟社會發展形勢呈現出不匹配的現象。1982 年,中國勞動人口占總人口比重為58.8%,并在2010 年達到70.1%的峰值,勞動力一直處于充裕且溢出的狀態[12]。但在2010 年以后,由于計劃生育導致的出生率下降問題逐漸顯露,勞動人口無法得到有效補充。另一方面,中國現有的勞動力人口平均年齡逐漸提升,使得勞動力人口比重持續下降。上述情況將給中國的勞動密集型產業帶來負面影響:首先,勞動力人口供小于求,并由于養老負擔的加重導致勞動成本直線上升;其次,勞動力人口平均年齡不斷上升會顯著影響生產率。因此,勞動密集型產業轉型升級為技術密集型產業已是大勢所趨,中國企業必須大力開展技術升級、提升核心競爭力并維持經濟社會穩定發展[13]。而數據代加工屬于勞動密集型產業,通過大量的人工投入以獲得微薄的利潤,數據標注員每天需要重復地拉框、標點,將數據進行處理和標注來為AI 企業的算法提供大量的數據。因此,開發一款能夠實現自動化數據標注的工具既能夠解放人力,減少因勞動力成本上漲對企業造成的不利影響,又是行業發展的必然結果。

3.4 行業集中度上升將是未來趨勢,經營環境面臨挑戰

在有關微觀經濟學和產業組織理論的研究中,不同學者對市場結構如何影響企業的創新及生存能力持有不同的觀點。第一種觀點以熊彼特的創造性破壞理論為基礎,認為企業的創新及存續能力與行業的集中度有關;第二種觀點認為較高的行業集中度利于企業創新和可持續發展;第三種觀點則認為行業集中度、企業創新兩者之間存在一種倒“U”型關系,即企業的創新會隨著行業集中度的提高而提高,呈現正相關的促進作用,但隨著行業集中度提高到某個峰值之后,行業集中度將會對企業創新能力起到負相關的抑制作用[14]。無論是哪種觀點,都可以看到數據標注行業集中度上升將會是未來趨勢。原因在于,首先,行業集中度提高會使得行業內的企業規模擴大,易于積累資源和資本,從而促進創新技術的研發;其次,行業集中度較低會使得行業內的企業數量眾多,出現為了爭奪市場份額而無序競爭的現象,因此提高行業集中度能夠使行業競爭規范化、資源配置合理化[15],良好的行業秩序有利于創新行為出現,使得企業有更充足的資源進行研發活動。

目前,數據標注行業的集中度屬于適中狀態。這一方面是由于京東眾測、澳鵬科技公司等企業在行業發展初期便進入了市場,搶先積累了客戶資源;另一方面是目前大部分科技公司對數據的準確性要求尚不高、行業壁壘還不顯著,給資金與研發實力相對薄弱的中小企業留有一定的發展空間。然而,未來隨著上游科技企業技術的不斷成熟,數據標注行業將需要承擔內容更細化、專業性更強的標注任務,這就需要標注公司不斷開發專業化數據處理工具以滿足客戶需求并維持及擴大其市場份額。因此,充足的資金與研發能力在未來將成為數據標注行業的壁壘,一批中小型企業將面臨業務收縮,并購將成為行業內部趨勢,進而提升了行業集中度。

4 數據標注行業轉型升級相關理論與實踐

4.1 競爭優勢相關理論概述

在大數據經濟中,數據標注企業如何獲得競爭優勢成為了時代新課題。目前,主要有兩種主流觀點來概述企業如何獲得競爭優勢——關注企業自身資源能力的資源基礎觀和聚焦制度情形的制度理論。在資源基礎觀理論中,Penrose[16]34-35關注組織自身的成長并用創造性的視角將組織看作資源的集合體,提出組織對異質性資源的高效獲得和科學配置有助于提高自身績效,并進一步形成不同于其他企業的競爭優勢,從而保障自身的持續成長。資源基礎觀理論首次探究了資源異質性的領域,并確立了其對于形成組織競爭優勢的重要意義。Wernerfelt[17]基于Penrose[16]35提出的觀點,強調組織在制定戰略時會更多地關注其自身所擁有的資源,同時指出組織獲得高額利潤的重點在于其內部的異質性資源和對知識及能力的構建。這一“資源—知識—能力”的視角為后續的研究提供了更大的空間,并為組織內部資源的分配和發展戰略提供了參考。類似地,Barney[18]進一步提出對組織內部所擁有的資源、知識與能力的分析有助于組織作出戰略選擇。Barney等[19]認為,組織對資源的獲取依賴于其是否掌握了充分的信息,并指出組織獲得競爭優勢的關鍵在于其擁有的資源是否具備價值性、稀缺性、不可模仿性和不可替代性,因為這類資源既有助于決策者計劃和實行組織戰略,也有助于組織通過異質性資源、事先競爭現實等方式構建位置壁壘,以成為市場領先者并達成企業的戰略目標。

在有關制度理論的探究中,主要代表人物為側重經濟學領域的North[20]和側重社會學領域的Scott[21]460-484。在經濟學視角中,North[20]認為制度是維護社會秩序的規則,用來約束和管理組織間的人際關系。相似地,Scott[21]460-484強調制度為約束、禁止等行動提供了可依據的參考。Scott[21]460-484認為制度是一種長久的社會結構,并由象征性要素和資源組成。兩個以不同側重點為基礎的制度維度均強調了“合法性”在企業獲得競爭優勢中的重要性。“合法性”作為新興的學術概念,范圍不限于法律,還涵蓋商業倫理規則。某種意義上講,規則的疏密與企業可能面臨的未來風險成正比。企業合法性主要包括3 個維度,分別為規制合法性、規范合法性和認知合法性。其中,規制合法性主要指遵守國家、政府以及組織所指定的規章制度;規范合法性是以道德和社會共同價值觀為基礎;而認知合法性是指人們在認識并理解所在組織時的思考維度。具有合法性的組織遵從道德,原因在于合法性可以促進組織扮演必要的社會角色并承擔必要的道德義務。對于一個組織來說,建立完善的合規體系可以幫助其減少損失并實現長久的可持續發展。

4.2 企業升級轉型相關理論概述

全球價值鏈理論和微笑曲線理論都提出代加工行業的附加價值很低,具有極高的可替代性,處于價值鏈的底端部分[22];同時,大部分代工行業仍屬于勞動密集型產業,資源消耗較高而價值增值卻很低。隨著中國勞動力人口進入拐點,人口紅利逐漸消失,面臨人工成本上漲、勞動力人口不足等問題,許多歐美代工訂單向東南亞轉移。因此,中國的代工廠進行轉型與升級迫在眉睫。

Gereffi[23]認為企業轉型升級是一個必不可少的過程,在這個過程中,企業能夠完善自身能力、優化資源配置效率、拓寬經營市場,從而重新定位自身的業務內容。Humphrey 等[24]認為企業的轉型升級是從勞動密集型產業到資本或技術密集型產業進行轉變的重要過程。楊桂菊等[22]以價值鏈理論為基礎,通過對3 家中國本土企業進行研究,指出中國大部分代工企業在轉型升級過程中均不會摒棄原有的代加工業務,而會通過代加工的方式為自創品牌提供運營資金,最終實現轉型升級。汪建成等[25]通過對中國的格蘭仕企業的案例研究指出,格蘭仕的自主創新是通過技術引進的方式完成的,并總結了其技術能力構建路徑。也有其他研究對技術能力與品牌戰略兩方面在代工企業的轉型升級過程中起到的作用進行了探討。為了構建技術能力,代工企業可以通過在代工過程中得到的來自先進企業的技術溢出進行學習與吸收,并將其融入自身的生存運營中,最終實現轉型升級。如陶鋒等[26]注意到了代工企業在代工過程中得到的技術溢出和學習行為,發現學習傾向、廠商間信任等因素對代工企業的學習行為有顯著影響,并提出中國的代工企業應該遵循引進消化、吸收、再創新的學習模式。在品牌戰略方面,學術界擁有較為統一的觀點,即品牌戰略是代工企業轉型升級中所需要考慮的重要因素之一。如徐印州等[27]以中國家電行業為研究對象,指出代工企業轉型升級的關鍵性因素是良好的品牌意識。

4.3 相關研究述評

通過以上文獻回顧可以看出,首先,企業可以通過具備異質性資源并對其進行整合來獲得競爭優勢,并通過競爭優勢逐漸吸引客戶人群并占據主導地位,這也導致特殊的資源及技術成為企業爭相追捧的對象[28]。其次,企業在經營過程中必須考慮制度問題所帶來的合規性及合法性,一旦進入市場,企業既需要思考所生產產品或服務的規范性,又需要思考企業業務所帶來的社會價值[29]。現有相關文獻對數據標注企業的研究較少,主要集中在對數據標注技術的研究,較少考慮該行業的優勢來源及合規性,而數據標注行業的轉型與升級恰恰是其獲得競爭優勢及合規性的重要條件;在對代工企業轉型升級的研究中,對于制造業企業的研究占據了絕大部分,數據代工工廠因其興起時間較晚、與制造行業的代工工廠相比有一定的異質性,相關研究較少,尤其是對代工企業通過戰略及技術路徑完成轉型升級的過程與機制研究較少。代工行業屬于勞動密集型產業,缺少相關的知識與技術;在現實中,很多代工企業通過優秀的生產制造能力來獲得生存的必要砝碼并逐步完成企業的轉型升級。因此,本研究立足于已有相關研究成果,對數據代工工廠進行重點研究,并根據其與傳統代工工廠的相似性和異質性探索其轉型與升級路徑。

4.4 轉型升級實踐背景

推動數字化經濟加速發展、把握新機遇是中國《“十四五”數字經濟發展規劃》的重點內容。近年來,中國通過促進信息技術的發展與應用,極大地提高了生產效率,人們的生活方式也隨之發生了深刻的變革。截至2020 年4 月,中國數字經濟的核心產業已占國內生產總值的7.8%[30],為中國經濟發展提供了有力的保障。與此同時,中國在發展數據經濟中仍然面臨著一些困難和挑戰,主要表現為:第一,缺乏一定的技術創新能力,在個別關鍵領域中技術更新與改進速度較慢[31];第二,對數據資源的利用不夠充分,仍然存在較大的挖掘與利用空間;第三,對數字經濟的治理仍然需要進一步提高與完善。習近平總書記指出,數字經濟的發展速度與影響程度將成為改變國際市場競爭格局的重要力量[30]。因此,進一步推動數字經濟的發展及產業的轉型以加強對數字資源的利用,成為了中國未來發展的愿景。

國家《“十四五”數字經濟發展規劃》指出,中國到2025 年將全面邁向數字經濟的擴展期,并完成數字經濟核心產業比重達到國內生產總值10%的目標;同時,中國將持續推動產業數字化轉型,加快建設相關支撐服務體系以提高實體經濟的增長速度,到2035 年,將邁向數字經濟的繁榮成熟期,成為數據經濟發展的領導者。不難看出,數字經濟發展已成為中國乃至全球發展的重中之重,而數據工廠作為推動數字經濟發展的基礎保障,將會對中國未來的經濟發展起到重要的作用,因此,提高該行業的技術水平與生產效率會為中國推進數字化轉型與治理提供有力支撐。

5 數據標注行業轉型升級的路徑選擇

20 世紀90 年代初,華為技術有限公司(以下簡稱“華為”)與鴻海精密工業股份有限公司(以下簡稱“富士康”)幾乎同時在深圳創業,兩家企業的發展軌跡堪稱現代版的“牧羊人和砍柴人的故事”。由于中國的人口紅利,富士康在中國獲得了快速的發展,從沿海到內陸不斷投資建廠,并成為蘋果、三星等企業手機產品的最大供應商;然而,隨著中國勞動力成本的提升,富士康在中國的訂單慢慢縮減,業務也逐漸開始向東南亞地區轉移以尋求更低的人力資本。反觀華為,其通過薪酬、發展機會等吸引和激勵有知識的大學生,培養了一支知識型人才隊伍。截至2022 年4 月,富士康有120 萬名員工[32],未更早地從勞動密集型的代工廠升級為技術密集型企業,長期因“血汗工廠”污名纏身;而華為僅有19 萬名員工[33],走上了技術密集型發展之路,堅持“深淘灘、淺做堤”的互利共贏戰略。上述兩家企業不同的路徑選擇使得兩家企業人均產出懸殊。因此,基于傳統制造企業的發展歷程并結合高質量發展和更高水平開放經濟體的角度,本研究提出數據工廠從代加工轉型為原始設計制造商(ODM)/原始品牌制造商(OBM)的發展邏輯,并從技術和戰略兩個維度提出轉型升級路徑(見圖2)。

圖2 數據標注行業轉型升級路徑

5.1 技術路徑

5.1.1 細化數據標注任務,提升數據標注效率

通過近些年的發展,人工智能技術在不同領域均得到了廣泛應用,部分行業對數據標注的要求也逐漸提高,原有的標注方法難以滿足行業需求。以智能安防為例,更多的企業希望有關產品從原有的被動防御功能轉為具有主動警示的功效,由此,對數據標注任務的要求也不斷提高。例如,當一個面色緊張或手舉尖刀的人走進銀行時,安防系統應馬上啟動預警系統,通知工作人員以保護其他客戶的財產及人身安全。對數據標注任務的新需求將包括危險物品標注、表情標注、行為標注等。新的數據標注任務有利于進一步提高人工智能算法模型的準確性,幫助安防系統學習與識別異常行為,并提高該行業的人工智能應用程度。類似地,由于技術的發展,其他行業也將會對數據標注任務提出更細化的需求。因此,開發新的技術工具實現標注任務細化、進一步促進機器深度學習能力將成為未來數據標注的發展方向。同時,為了提升數據標注工作效率,數據標注企業應逐漸由現有的人工標注模式轉為“人工標注+智能輔助”,并最終實現“機器標注+人工輔助”的模式。通過智能模型對所需要標注的數據進行提前處理,然后用人工標注方法對數據進行校正與核驗,有利于降低勞動成本并提高標注效率。目前,一些數據標注企業已經嘗試開發相應的智能輔助工具。開發以人工標注為主、智能標注為輔的半自動化標注工具并逐步減少人工標注的比例,最終實現以機器標注為主、人工標注為輔的模式將會成為未來的發展趨勢,然而,截至2021 年6 月,中國數據標注企業的機器標注比例仍然只達到30%[11]。

5.1.2 制定行業規范,提升數據標注工作的質量、安全性和合規性

目前,數據標注行業各企業對圖像標注的要求與方法都各不相同,標注結果文件各異,嚴重影響數據的后續統一使用;同時,大部分公開數據集并非基于場景進行標注,會對后續的算法訓練造成一定的影響。因此,應對標注流程和標注結果形式進一步規范,以提升標注數據的通用性。近期,中國汽車工程學會已正式發布《智能網聯汽車場景數據圖像標注要求與方法》,旨在為行業提供場景數據圖像標注的基本規范,促進場景數據圖像標注的標準化,提升場景數據的通用性和易用性,推動汽車行業快速發展。數據標注中的其他場景數據也應該制定統一標準,以推動行業生態的合規性及通用性,進而滿足未來可能的跨界需求。

另外,數據標注企業可以通過數據分割、數據治理、數據安全傳輸和區塊鏈等技術來提高數據標注的安全性和隱私性。數據治理是通過對數據處理的整個流程進行識別、監控、分析等一系列管理活動來提高組織的管理水平,并確保數據在一個安全的環境下進行使用[34]。數據分割是通過將數據標注任務拆分為多個部分,并指派給相互陌生的團隊來保證數據的安全性[35],可以有效避免隱私數據被整體打包并泄露,對數據進行了多重保護。數據安全傳輸是指通過研發一個安全性較高的數據傳輸框架來對數據進行加密、壓縮的傳輸方式,有效避免傳輸過程中存在的被盜、暴露和復制等安全性問題[36]。運用區塊鏈技術可以通過采用強加密算法和分布式技術來提高數據安全性,通過采用區塊鏈技術,標注人員可以直接與需求企業進行對接,避免了數據標注任務的層層轉包,提高了數據的安全性,也能防止個人用戶批量搜集數據,最大限度地保障數據的安全。

5.2 戰略路徑

5.2.1 擴大企業規模

Fazzari 等[37]認為,資本市場的不完善會導致不同規模的企業在尋求外部資金時具有可獲得性差異和成本差異。由于成立時間較短、未有完善的管理能力以及資本實力,與大企業相比,小企業通常面臨較高的外部融資成本以及較大的內部資金壓力,因此,中小企業很難在市場集中度日益上升、競爭強度較大、對技術研發要求較高的行業中存活[38]。目前,處于尾部的中小型企業仍是市場中的主要供應力量,然而隨著未來數據處理體系逐漸成熟,客戶需求更加多元化,一批中小型廠商將會面臨業務收縮、研發能力無法滿足需求等情況;同時,由于數據標注企業所面臨的客戶數量較多,對數據處理的質量和要求具備一定的多樣性,中小企業難免會出現管理能力有限、對接能力不足等問題。因此,擴大企業規模將成為市場趨勢。頭部企業可以通過收購來豐富自主數據采集系統從而完成更具多樣性的任務,而中小型企業也需要通過兼并等方式提高自身競爭力,提高自己的議價能力,避免資金與研發實力成為企業發展的壁壘。目前,國內較為典型的數據標注企業并購事件為企業倍賽BasicFinder 收購北京欣博友數據科技有限公司以提升自身數據收集及處理能力。綜上,通過兼并與重組等方式擴大企業規模將是數據標注行業中企業未來存續并得以轉型升級的第一步。通過擴大規模,企業得以在行業中繼續生存,并為未來的技術創新積累資本實力。

5.2.2 開發自主品牌,成為原始品牌制造商

數據標注企業應積累創新研發能力和資本實力,通過投資等方式與上游企業進行合作。借鑒Beverelli等[39]的研究思路,數據標注企業憑借自身的數據處理能力與實力,拓寬經營市場,向價值鏈上游行業進行擴張。數據標注企業將不僅僅以代加工為主,而是依靠自身優勢與其他上游公司進行合作,建立自主品牌,由此為企業帶來更大的優勢。第一個優勢是企業通過與上游企業合作,正式進入人工智能價值鏈上游領域,而不再僅僅是做基礎性、技術含量較低的工作[40]。通過建立自有品牌,企業將能夠徹底地完成產業升級與轉型[41]。第二個優勢是通過自立自主品牌,企業將能夠提升自身的知名度及聲譽,為自己原有的數據標注代加工行業提升市場認可度、競爭力和議價能力。通過提高數據處理能力與其他企業進行合作并建立自主品牌的方式,提高數據處理能力與數據處理質量,以吸引更多的潛在客戶。在此基礎上,企業需要具有充足的資金與研發能力加快數據標注智能化,成為行業領先者并帶動該行業走向智能化的轉型升級,進而降低人工成本、提升工作效率[42]。數據標注的智能化也意味著該行業不再是勞動密集型產業,由此避免中國數據標注企業與東南亞等人工成本更低的地區進行價格競爭,實現行業發展由量轉向質的轉型革命。

5.3 培養企業創新能力并持續提高研發投入

企業家自身的創新意識培養有利于塑造其機會感知能力。強化創新意識可以有效促進數據代加工工廠發掘潛在機會、實現轉型升級。貫徹創新理念對數據代加工工廠整合有限資源、實施戰略性創業行為具有極強的促進作用。對于一家企業的轉型工作來說,至關重要的就是要推動其發展方向向著技術創新型進行轉變,并且形成創新發展的內在動力,逐漸形成技術創新的核心競爭力,進而能夠幫助企業從容應對運營中的各種障礙[43]。具體來說,企業進行技術創新可以通過以下過程:首先,通過整合與配置所擁有的資源提高原始創新能力。企業的原始創新能力能夠幫助其不斷進行創新,形成競爭優勢,并在行業中處于領先地位[44]。其次,企業在此基礎上不斷學習國外的先進技術,并根據所學習內容找到適用于自身發展創新的關鍵,完成將先進經驗用于自身的知識轉化,并結合自身實際進行再次創新。

中國正處在由經濟增長到經濟高質量發展的關鍵時期,在全球發展的浪潮中保持領先地位的關鍵不僅在于經濟發展的速度和規模,還在于經濟發展的質量和技術研發能力。而研發投入被視為創新能力的關鍵因素,在推動中國經濟發展的道路上發揮了重要的作用。為保證企業的長遠發展,數據代工工廠應持續加大研發投入,加快數據標注智能化以成為行業領先者,并帶動該行業走向智能化的轉型升級,降低人工成本、提升工作效率;通過先進技術的研發,有利于提升數據標注企業在市場占據的份額,吸引大量投資者對企業進行資金支持,助力中國數據標注企業進軍國際市場。

6 結論與討論

本研究分析了數據標注行業如何基于目前存在的問題與挑戰進行轉型升級的技術與戰略路徑,展現了數據標注行業轉型升級的過程、邏輯與實施細節。研究發現,目前我國數據標注行業面臨的主要問題包括:第一,數據標注需要更加細化標注內容以提高專業性,而行業技術尚無法滿足行業發展需求;第二,人工標注方式使得標注效率較低且質量無法保證;第三,尚未有統一的行業規范,部分數據標注企業存在安全及合規風險;第四,由于勞動力人口比重持續下降而代工成本日益上漲,行業的利潤空間正在逐漸被壓縮。同時,隨著數據標注任務所需要的專業性不斷提升,充足的資金要求與研發能力將會提高該行業的進入壁壘,而行業集中度將會不斷提高,部分數據標注企業將會面臨經營挑戰。對此,從技術與戰略兩方面為數據標注行業提出轉型升級的路徑選擇。從技術路徑出發,數據標注企業應通過開發新的技術工具、促進機器深度學習能力提高以實現標注任務細化、提升數據標注效率的目標;從戰略路徑出發,數據標注企業首先應擴大規模以保證自身生存并為未來的技術創新積累資本實力,其次通過建立自主品牌提高市場認可度以吸引更多的潛在客戶,最后持續培養創新能力并提高研發投入以形成核心競爭力,實現由量轉向質的轉型革命。

目前,百度公司已在山西轉型綜合改革示范區建立了山西數據標注基地,為產業鏈各環節提供數據保障并支持山西人工智能產業發展,截至2022 年1 月,該示范區AI 訓練師作業人員已達到4 300 余人[45],成為國內擁有從業人員最多和產值規模最大的單體數據標注產業基地;另外,新疆皮山縣也已建立數字經濟產業園,并擁有上千名員工[45]。然而,目前從事簡單、機械、重復勞動的人工數據標注崗位很有可能會被未來的機器標注所替代,因此,對數據標注行業的探索與研究將有助該行業對新技術的研發,并為大量員工提供學習的機會以提升其自身素質、避免被時代淘汰。數據標注行業的轉型與升級有助于中國行業內企業保持國際領先地位,并保證這些產業園的持續發展;同時,數據標注行業的代工性質及所從事工作的機械性與重復性在數據領域的眾多工作中具有典型性與普適性,因此,對數據領域中的其他行業的轉型升級也可提供一定的啟示借鑒。人工智能技術的進一步成熟和大規模應用必將對大量工作崗位形成替代,甚至包括當前一些薪資待遇較好的崗位,如數據分析師、數據挖掘等,因此,能否通過產業升級、提高知識含量來提高生產率和附加值決定著中國未來的經濟發展前景,對其他行業的企業也有著重大意義[46]。

隨著人工智能的進步與數字經濟的快速發展,數據標注等行業在經濟社會中的影響力越來越大,并逐漸成為了熱門行業,數據代加工工廠由注重量轉向注重質、由勞動密集型產業轉向技術密集型產業,有利于行業內企業形成核心競爭優勢,是擴展其價值鏈活動范圍的重要途徑。只有通過累積資本與不斷創新,真正實現轉型升級,才能保證企業不會因缺乏先進的技術以及嚴峻的經濟環境所淘汰,維持自身的長期健康發展。

猜你喜歡
轉型企業
企業
當代水產(2022年8期)2022-09-20 06:44:30
企業
當代水產(2022年6期)2022-06-29 01:11:44
企業
當代水產(2022年5期)2022-06-05 07:55:06
企業
當代水產(2022年3期)2022-04-26 14:27:04
企業
當代水產(2022年2期)2022-04-26 14:25:10
“反季”的冬棗——轉季的背后是轉型
當代陜西(2021年17期)2021-11-06 03:21:30
敢為人先的企業——超惠投不動產
云南畫報(2020年9期)2020-10-27 02:03:26
安凱轉型生意經
汽車觀察(2018年10期)2018-11-06 07:05:30
聚焦轉型發展 實現“四個轉變”
人大建設(2018年5期)2018-08-16 07:09:06
轉型
童話世界(2018年13期)2018-05-10 10:29:31
主站蜘蛛池模板: 亚洲性影院| 日本人妻一区二区三区不卡影院| 一级毛片免费观看久| 九九久久99精品| www.狠狠| 欲色天天综合网| 精品国产免费人成在线观看| 91国内在线视频| 色精品视频| 国产免费久久精品99re不卡| 一本视频精品中文字幕| 无码高潮喷水在线观看| 国产视频一区二区在线观看| 香蕉视频在线观看www| 日本草草视频在线观看| 欧美激情伊人| 亚洲精品制服丝袜二区| 中文字幕啪啪| 久久精品最新免费国产成人| 999精品色在线观看| 91精品国产情侣高潮露脸| 美女视频黄频a免费高清不卡| 亚洲男人的天堂在线观看| 精品国产免费观看| 91色在线观看| 欧美精品啪啪| 国产免费精彩视频| 永久免费无码成人网站| 99国产精品一区二区| 久久夜夜视频| 亚洲国产精品一区二区第一页免 | 亚洲欧美另类视频| 日韩欧美国产综合| 青草视频网站在线观看| 精品国产毛片| 国产在线欧美| 日本尹人综合香蕉在线观看| 日韩福利视频导航| 99热这里只有成人精品国产| 欧美天堂久久| 亚洲免费人成影院| 一级毛片免费播放视频| 日韩精品视频久久| 日本人又色又爽的视频| 成年看免费观看视频拍拍| 91成人免费观看在线观看| 色婷婷狠狠干| 青青草a国产免费观看| 麻豆精品视频在线原创| 无码粉嫩虎白一线天在线观看| 精品少妇人妻av无码久久| 国产高颜值露脸在线观看| 日韩不卡高清视频| 国产成人啪视频一区二区三区| 国产精品xxx| 丝袜美女被出水视频一区| 中文字幕无码av专区久久| 国产人妖视频一区在线观看| 色婷婷电影网| 91久草视频| 中国成人在线视频| 99国产精品一区二区| 四虎免费视频网站| 无码一区中文字幕| 国产第一福利影院| 国产资源免费观看| 伊人久久大香线蕉aⅴ色| 欧洲欧美人成免费全部视频| 91国内视频在线观看| 色综合久久无码网| 天天综合色天天综合网| 国产精品99久久久| 日本中文字幕久久网站| 狠狠做深爱婷婷综合一区| 久久国产热| hezyo加勒比一区二区三区| 国产日本一线在线观看免费| 国产拍在线| 国产午夜一级毛片| 久久无码av一区二区三区| 国产综合色在线视频播放线视| 国产视频一二三区|