□華 雷

區塊鏈最早是在2008 年,由中本聰在《比特幣:一種點對點的電子現金系統》一文中提出。他指出,區塊鏈是用于記錄比特幣交易賬目歷史的底層技術。隨后,鑒于區塊鏈技術具有廣闊的應用前景,許多國家開始進行區塊鏈的研究和應用。我國區塊鏈技術的相關研究起步較晚,但近年來受到中央和各界的廣泛關注。2016 年12 月,區塊鏈技術首次被寫入《“十三五”國家信息化規劃》,其中明確提出要加強區塊鏈等技術的創新、試驗和應用。近幾年,中共中央和國務院又先后出臺十余次文件,關注區塊鏈技術和其他新興技術的融合,支持區塊鏈技術和產業的發展,體現中央對于區塊鏈技術的重視程度。
1.比特幣是區塊鏈技術的第一個成功應用。傳統金融體系的交易記錄都被保存在銀行中心的數據庫中,而區塊鏈則是比特幣的賬本,任何時刻產生的比特幣的所有權以及交易記錄,都記錄在區塊鏈賬本中。交易過程中會向全網發送一份賬單,其他用戶會對其校驗,一旦通過驗證,交易行為就成功了。第一個校驗出這筆交易是否有效的用戶,會被獎勵一筆比特幣。
2.浙江省區塊鏈電子票據平臺——全國首個區塊鏈電子票據平臺。該平臺由浙江省財政廳發起,聯合省大數據局、省衛健委、省醫保局,應用支付寶的螞蟻區塊鏈技術共同推進。支付寶自主研發的螞蟻區塊鏈技術,在區塊鏈電子票據從生成、傳送、儲存到使用的全程中都蓋上“戳”,全程可溯源、不可篡改,保證了票據的真實性。
3.區塊鏈技術的未來展望。區塊鏈技術的20 種應用場景:支付和現金交易、銀行業、游戲、物聯網、供應鏈金融、版權保護、汽車業、物流鏈、跨境支付、實體資產、醫療、社交、云計算、共享經濟、慈善、文件存儲、大數據、禮品卡和會員項目、體育、政務。
勞動力調查始于1996 年,2004年國務院印發《國務院辦公廳關于建立勞動力調查制度的通知》,正式建立勞動力調查制度。2009 年開始31個大城市月度勞動力調查。大城市月度勞動力調查,采用分層、二階段、概率與規模成比例的抽樣方法。第一級抽村級單位,第二級在抽中的村級單位中抽取住戶組。2013 年新增34 個 大 城市。2017 年1 月 國 務 院印發《十三五促進就業規劃》,2015 年7月,鋪開到全國所有地級市,調查隊開始介入。2018 年7 月,調查隊全面接手月度勞動力調查。
現行的“一套表”統計是基于中心式互聯網的統計模式。即計算機和互聯網革命所帶來的,形成以互聯網統計為新的核心,以開放政府大數據(OGD)為新的依托(中心)平臺架構模式。
調查員攜帶PAD 進行入戶調查,確保數據生產全過程電子化、透明化、可追溯。各級統計調查機構組織管理和審核驗收,規范數據的采集、上報、編碼、審核、驗收流程,實現數據生產過程的標準化、規范化。
一是勞動力調查和各種人口和就業調查制度銜接不暢。各種人口和就業相關調查調查制度是逐漸并入政府統計的,調查之間缺乏整體規劃設計,人口和就業類調查中的各項調查制度各成一體,銜接不暢。
二是統計標準不統一。雖然對于勞動力調查的絕大部分指標,國家統計局都出臺了相應的指標解釋,但某些重要的指標解釋在不同的調查項目中并不一樣,比如,調查戶中“總人口數”這一指標在住戶調查中是指居住在同一個住宅內,與本住戶分享生活開支或收入的所有人員;而在勞動力調查中則認為只要居住在這所住宅內就需要接受調查。同一指標的解釋不相同導致的是統計口徑的不一致。
三是統計資源利用率較低。人口和就業類調查的其中幾種就可以共用一套抽樣框,調查人員和設施,但勞動力調查和住戶調查卻各自編制抽樣框,制定不同的指標解釋。全國月度勞動力調查和住戶調查在抽樣框、指標設計上具有高度的相似性,但兩種調查抽取的村級樣本和住戶組不同,指標雖相近但解釋不同,工作的組織和實施也并未合二為一。
四是每月上門調查投入成本較高。目前由調查員手持電子終端(PAD)入戶,錄入后將數據直接報送到國家統計局聯網直報平臺。相比于問卷調查,它節省了問卷印刷費與問卷錄入成本,但是每月調查員入戶必將投入大量的人力與物力,此外由于工作繁忙等原因,不可避免地會存在難以見到被訪者,這將導致人力成本與交通成本高企。
月度勞動力調查是為及時、準確地反映我國城鄉勞動力資源、就業和失業人口的總量、結構和分布情況,為政府準確判斷就業形勢,制定和調整就業政策,改善宏觀調控,加強就業服務提供依據。
“就業鏈”統計是指圍繞月度勞動力調查的各項有關事務。基于區塊鏈的“就業鏈”統計系統(以下簡稱系統)是指依附于“就業鏈”實際運動環境中,能夠通過智能合約實現“就業鏈”上統計信息的收集整理、匯總、分析、監測的智能化。“就業鏈”可以將人口就業和失業相關信息鏈串聯起來,包括人口基本信息、就業和失業信息、社保繳納情況、收入消費情況、家庭戶能源消耗情況等,其中社保繳納情況、收入消費情況、家庭戶能源消耗情況,它可以佐證住戶的就業和失業情況。
“就業鏈”生態體系參與主體主要有五大類:
1.“就業鏈”直接參與者主體是各個公民,他們既是“就業鏈”統計信息的生成者,也是需求者。這些主體之間的經濟信息和其他信息,按照事先達成共識的有關統計分類、標準和編碼,經過統計處理后,打包為區塊并記錄在系統中,并以分布式方式存儲,形成“就業鏈”統計信息,分布式存儲方式保證了信息無法被篡改。
2.金融機構在“就業鏈”區塊記錄系統中,公民會產生許多依附“就業鏈”的消費和需求,在金融機構(包括支付寶)介入下,這些信息同樣在經過統計處理后通過區塊鏈記錄在系統中,形成資金流統計信息,這些信息能進一步佐證公民就業情況。
3.政府部門既包括統計部門,也包括社保、稅務等有關職能部門。盡管這些部門與企業、金融機構是平等參與“就業鏈”的共建共享,但可以充分發揮專業和職能特長,優化和提升系統功能,政府部門可以根據實際需要,通過智能合約技術將統計任務直接寫入區塊鏈代碼,開展信息統計匯總和分析,動態監測“就業鏈”,形成“就業鏈”宏觀統計信息,相關部門利用它進行信息追溯。
4.區塊鏈機構從專業分工發展趨勢來看,基于區塊鏈的“就業鏈”統計系統中關于區塊鏈可能需要專門的機構提供技術支持、物理設施、系統建設和日常維護。區塊鏈機構不是中心化,而是去中心化。
從區塊鏈的發展趨勢看,架構有兩種基本方式:第一種稱之為“+區塊鏈”,原有架構保持基本不變,僅僅是在原有架構中嵌入獨立的區塊鏈層級或者在幾個層級中嵌入相應的區塊鏈模塊,這種處理方式的優點就是轉換成本低,但是發揮區塊鏈的作用有限。第二種稱之為“區塊鏈+”,著眼于最大程度地發揮區塊鏈的優勢和特點,基于區塊鏈重建新的架構,將區塊鏈的各種功能根據其特征分別嵌入到新架構的不同層級之中。這種方式的缺點在于花費的成本較高、時間較長,而且架構的難度也較大。本文著重探討和研究“+區塊鏈”模式下勞動力調查的應用。
(1)“勞動力調查+區塊鏈”的模式
該模式推行相對簡單,其數據保護子系統的應用層包括RESTful 接口和區塊鏈數據管理平臺兩部分,RESTful 接口有嚴格的時間戳、隨機數和數字簽名的檢查,僅適用于統計管理子系統后臺代碼進行調用,不能直觀對就業信息進行查詢和展示。區塊鏈數據管理平臺則以網站的形式提供了就業的查詢、統計功能和RESTful 接口相關參數的管理功能。區塊鏈數據管理平臺包括用戶注冊登錄、用戶中心、數據統計、數據查詢、開發文檔等多個模塊。其中用戶中心可以查看個人信息,查看和修改RESTful 通信過程中的公私鑰信息。數據統計模塊展示了最后添加、更新和驗證的就業信息,以及就業的總數量、就業的每日和每月趨勢等內容。數據查詢模塊提供了就業查詢功能,可通過關鍵字對數據和附件屬性進行查找。
(2)“勞動力調查+區塊鏈”數據來源
①區塊鏈數據與傳統勞動力調查數據的融合。從數據處理方法上講,前述的信息融合理論是適用的。雖然區塊鏈數據包含巨大信息量、具有成本和時效性優勢,但其存在諸多現階段不易處理的數據質量問題,使得大眾對其不能“盡信”。為此,利用區塊鏈技術輔助實現、提升傳統勞動力調查水平,是現階段區塊鏈數據統計生產的可行路徑。具體來說,假設統計生產試圖對某參數μ 進行估計。對于以上步驟需要說明的是:第一,參數μ 可以針對離散變量,如關于某個突發事件看法的概率;也可以針對連續變量,如價格。第二,Dw 表示各異源數據Dw(w=1,…,n)的整合結果,可以通過前述信息融合方法(如數據加權法)獲得;也可以在算得P(Dw|μ)的基礎上,按照貝葉斯公式加工形成P(μ|Dw)。第三,若采用共軛先驗的方式,上述推斷過程將大大簡化,并具備良好的實時在線處理性能。第四,μ 可以采用最大化后驗概率(MAP)的優化準則進行估計,也可以采用全概率和貝葉斯方式預測獲得。
以上是將區塊鏈數據和統計調查數據進行融合生產的基本思路,利用了區塊鏈數據的時效性和低成本特點,也利用了統計調查的數據質量可控性,使得統計產品的數據質量在兩種數據之間進行折衷。統計生產可依據準確性、成本和時效性的不同要求,使用兩種數據的融合比例和方式。當然,具體的整合方式方法還因問題而異,需要作進一步的實踐探索,在探索過程中,逐漸明確數據質量問題,以加快區塊鏈數據統計生產的探索進程,形成相對標準的做法。
②區塊鏈數據來源方式。區塊鏈數據一般可分為以下幾類:一是對外開放的數據平臺,比如支付寶。二是專業數據平臺,如國家經濟信息中心、中國知網等。三是部門專業數據平臺,比如各大行政職能部門的專業數據庫,這類數據庫是不對外開放的。統計部門可以通過《統計法》規定,要求其提供所需的電子形式數據。四是互聯網上雜亂無序的數據,其數據質量很低,建議暫時不用,因為其數據質量低,數據處理非常困難,技術要求和投入成本都比較高。
(3)“勞動力調查+區塊鏈”的指標模板整合
①整合勞動力調查指標體系。一份完整的指標設計需參考國際勞工組織的勞動力市場主要指標和國際就業失業統計經驗,并結合我國實際和政策需要。
②整合現行人口調查相關指標。為了解決現行人口和就業類調查之間不能有效銜接、調查成本過高、資源不能有效整合、統計標準不統一等問題,需要根據現行的人口和就業類調查的相關指標、調查頻次、調查方式等進行重新整合。
穩步推進區塊鏈技術在勞動力調查上的應用實現路徑。以浙江省為例,若想發揮區塊鏈技術在勞動力調查上的作用,實現路徑可從三個層面推進:地市級試點、省內范圍推廣、全國范圍推廣。
1.建立區塊鏈調查因子庫。梳理現有月度勞動力調查指標,按照勞動力調查項目住戶信息、個人基本信息、工作信息和無工作信息4 個部分,嚴格按照指標體系建立對應的調查因子庫,方便后續審核對接。
2.探索建立浙江版的“勞動力調查+區塊鏈”系統。構建浙江省人口管理大數據分析平臺。如對接各有關行政部門,部門數據通過規范流程進入聯盟鏈,借助“支付寶”平臺,開放API 接口,打通人力社保、用電用氣等數據流,與支付寶的螞蟻區塊鏈技術共同推進。在對住戶的調查補貼上,通過嘗試使用“勞動兌換幣”,每位接受勞動力調查的住戶可以在支付寶上領取“勞動兌換幣”,一方面是對住戶接受調查的獎勵,另一方面為了確保接受調查的是否本人,形成正向激勵循環。
同時,向國家局申請打通相關數據接口。橫向打通的數據鏈,包括人口普查與住戶抽樣調查、企業調查、行政記錄等。
建立系統后,調查員每月手持PDA 上門調查,住戶的部分數據可通過區塊鏈技術先驗獲得,缺失指標再詢問住戶,經確認無誤后再上報,可減少工作量。
3.從省內向全國推廣。形成以勞動力調查為核心的人口住戶類區塊鏈調查體系,整合人口、住戶類調查項目。就業是民生之本,收入是民生之基,建立以勞動力調查為核心的人口住戶類調查體系既可行,又必要。勞動力調查作為全國最重要的抽樣調查之一,其豐富的資源如抽樣框、調查流程、調查人員、計算機設備等可以為其他住戶調查的開展提供便利,可以降低其調查成本,提高精度。
本文通過對區塊鏈技術在勞動力調查上的應用的探析,從技術角度為“勞動力調查+區塊鏈”系統的開發提供新的解決思路,最大化利用各類資源,在需要的時候,進行快速擴展,提升勞動力調查的效率和安全性。但是,研究設想要落地還存在不少難點問題,一是行政部門數據相互打通還存在不少壁壘,需要多方協調統籌推進。二是區塊鏈的應用是一項系統化的工程,想要自下而上推動有一定難度,而且需要的人力、物力、財力較多。三是需要強化數據保護,監督各行業數據傳遞過程中是否存在違規行為,對私人數據要嚴加監管。四是區塊鏈技術是一項新興事物,對統計部門的系統架構能力以及專業素養都提出了更高的要求。此外,由于研究水平和資料有限,研究工作仍有待提升完善。