

摘要:“十四五”海關(guān)發(fā)展規(guī)劃是海關(guān)未來五年發(fā)展的戰(zhàn)略規(guī)劃,通觀全文,全領(lǐng)域覆蓋、全鏈條監(jiān)管、全面提升智能化是高質(zhì)量發(fā)展的新要求。以發(fā)展規(guī)劃為綱,結(jié)合作業(yè)中心在加貿(mào)領(lǐng)域的企業(yè)畫像探索,筆者提出企業(yè)畫像的智能路徑研究,即構(gòu)建以“大數(shù)據(jù)+知識圖譜”為基礎(chǔ)的“數(shù)據(jù)+知識”中臺,以雙中臺為基礎(chǔ)構(gòu)建企業(yè)數(shù)字孿生模式,打通從數(shù)據(jù)到知識再到智慧的通道。在新發(fā)展階段,以新發(fā)展理念,展現(xiàn)海關(guān)改革強(qiáng)關(guān)、科技興關(guān)的責(zé)任與擔(dān)當(dāng)。
關(guān)鍵詞:智能化 雙中臺 數(shù)字孿生 企業(yè)畫像
一、以發(fā)展規(guī)劃為綱,全面提升智能化
“十四五”海關(guān)發(fā)展規(guī)劃是海關(guān)未來五年發(fā)展的戰(zhàn)略規(guī)劃,是我們未來的行動綱領(lǐng),通觀全篇,高質(zhì)量監(jiān)管與服務(wù)離不開科技引領(lǐng)與支撐,未來的五年,將是海關(guān)全面提升智能化水平的五年,是全面促進(jìn)業(yè)務(wù)科技融合的五年,是全面踐行改革強(qiáng)關(guān)、科技興關(guān)的五年。在新發(fā)展階段,以新發(fā)展理念,進(jìn)一步服務(wù)經(jīng)濟(jì)發(fā)展總體格局,充分展現(xiàn)海關(guān)新的使命擔(dān)當(dāng)。在這一總體框架設(shè)計下,以“三智”核心精神為引領(lǐng),在加工貿(mào)易領(lǐng)域加快創(chuàng)新實踐,進(jìn)一步深化專業(yè)化審核等特色工作,進(jìn)一步提升作業(yè)中心對關(guān)區(qū)加貿(mào)企業(yè)智能監(jiān)管與服務(wù)水平,通過構(gòu)建以“數(shù)據(jù)+知識”雙中臺引擎,對關(guān)區(qū)加工貿(mào)易企業(yè)進(jìn)行畫像,對未來進(jìn)行展望,通過推進(jìn)建設(shè)企業(yè)數(shù)字孿生全面提升加工貿(mào)易領(lǐng)域的智能化水平。
(一)迎接業(yè)務(wù)規(guī)范化挑戰(zhàn),構(gòu)建加貿(mào)業(yè)務(wù)指標(biāo)體系。
根據(jù)規(guī)劃(二十七)完善海關(guān)技術(shù)規(guī)范和業(yè)務(wù)規(guī)范體系。
在未來五年內(nèi)建立全國海關(guān)統(tǒng)一的業(yè)務(wù)指標(biāo)體系,完善統(tǒng)一的數(shù)據(jù)規(guī)范體系,優(yōu)化支撐性業(yè)務(wù)規(guī)范,遵循國家和國際有關(guān)標(biāo)準(zhǔn)規(guī)范,構(gòu)建適用于全鏈條監(jiān)管的統(tǒng)一技術(shù)規(guī)范,提升信息數(shù)據(jù)交換水平等要求。
筆者認(rèn)為,全面智能化的基礎(chǔ)必定是業(yè)務(wù)指標(biāo)規(guī)范統(tǒng)一,業(yè)務(wù)指標(biāo)規(guī)范統(tǒng)一需要各業(yè)務(wù)部門在統(tǒng)一目標(biāo)下、統(tǒng)一領(lǐng)導(dǎo)下,齊心協(xié)力才有可能構(gòu)建成功。作業(yè)中心通過在加工貿(mào)易領(lǐng)域進(jìn)行企業(yè)畫像,以多種途徑收集和分析企業(yè)基本資料、運(yùn)行管理、關(guān)聯(lián)關(guān)系、監(jiān)管評價等信息,開發(fā)數(shù)據(jù)集成功能,按一定的分析框架形成統(tǒng)一的指標(biāo)體系,通過對風(fēng)險模型建設(shè)及調(diào)優(yōu)做到對企業(yè)的精準(zhǔn)監(jiān)管與服務(wù),達(dá)到“業(yè)務(wù)指標(biāo)系統(tǒng)化、風(fēng)險分析模型化”。
(二)迎接業(yè)務(wù)智能化挑戰(zhàn),構(gòu)建加貿(mào)業(yè)務(wù)智能體系。
規(guī)劃中17次出現(xiàn)“信息化”、30次出現(xiàn)“大數(shù)據(jù)”、51次出現(xiàn)“智能”,可見,全面提升智能水平是海關(guān)各業(yè)務(wù)領(lǐng)域根本需求,是探索全業(yè)務(wù)領(lǐng)域高質(zhì)量發(fā)展、全鏈條智能監(jiān)管的根本途徑;同時根據(jù)規(guī)劃(三十四)增強(qiáng)海關(guān)信息化支撐能力、(三十五)深化海關(guān)大數(shù)據(jù)應(yīng)用,完善信息化基礎(chǔ)、構(gòu)建從數(shù)據(jù)到知識再到智慧的通道都是實現(xiàn)業(yè)務(wù)智能化的挑戰(zhàn)。
作業(yè)中心以線上大數(shù)據(jù)畫像、線下專業(yè)化審核構(gòu)建閉環(huán),做到對關(guān)區(qū)加工貿(mào)易企業(yè)、行業(yè)格局發(fā)展心中有素,進(jìn)一步提升業(yè)務(wù)監(jiān)管智能化水平,進(jìn)一步提升監(jiān)管效能、嚴(yán)守風(fēng)險防控底線,從而更好地加強(qiáng)對企業(yè)的服務(wù)支持與風(fēng)險防控,為在下一階段全面提升智能化打好基礎(chǔ),達(dá)到“業(yè)務(wù)監(jiān)管智能化、風(fēng)險判別精準(zhǔn)化”。
(三)迎接人才培養(yǎng)挑戰(zhàn),構(gòu)建加貿(mào)綜合人才培養(yǎng)體系。
根據(jù)規(guī)劃(四十五)加強(qiáng)人才隊伍建設(shè)中大力實施人才強(qiáng)關(guān),以優(yōu)化人才結(jié)構(gòu)為重點(diǎn),強(qiáng)化人才在科技創(chuàng)新中的主體地位,持續(xù)優(yōu)化人才發(fā)展環(huán)境和成長路徑,可見,人才培養(yǎng)是我們干事創(chuàng)業(yè)的基礎(chǔ),全面提升業(yè)務(wù)智能化,一定要培養(yǎng)業(yè)務(wù)科技一體化人才。
作業(yè)中心通過業(yè)務(wù)與科技相融合的企業(yè)畫像,通過專業(yè)化審核、結(jié)合數(shù)據(jù)分析,我們?yōu)橄乱浑A段創(chuàng)新改革工作打好專業(yè)化、綜合化的人才堅實基礎(chǔ),為隊伍發(fā)展培養(yǎng)科技業(yè)務(wù)融合的綜合性人才,達(dá)到“創(chuàng)新工作常態(tài)化、人才培養(yǎng)綜合化”。
二、以雙中臺為引擎,塑造智慧新平臺
“十四五”規(guī)劃(三十五)深化海關(guān)大數(shù)據(jù)應(yīng)用中提到“完善大數(shù)據(jù)基礎(chǔ)設(shè)施,匯聚多形態(tài)數(shù)據(jù)資源,形成海關(guān)大數(shù)據(jù)湖,為海關(guān)數(shù)據(jù)治理提供基礎(chǔ)支撐。構(gòu)筑集專家經(jīng)驗與業(yè)務(wù)知識為一體的知識計算新引擎,建設(shè)海關(guān)特色知識圖譜,打通從數(shù)據(jù)到知識再到智慧的能力提升通道。”這將進(jìn)一步推動“大數(shù)據(jù)+知識圖譜”在海關(guān)中的理論及應(yīng)用探索,筆者認(rèn)為基于這一理念建設(shè)“數(shù)據(jù)+知識”雙中臺,能夠進(jìn)一步提升海關(guān)大數(shù)據(jù)治理能力,為全面提升智能化打下平臺基礎(chǔ)。
(一)從數(shù)字化到智能化,重塑信息化格局
海關(guān)歷來重視信息化建設(shè),從H883、H2000到H2010再到H2018、金關(guān)二期建設(shè),積累了大量信息化建設(shè)經(jīng)驗,但是傳統(tǒng)的信息化系統(tǒng)多以流程和管控作為任務(wù)目標(biāo),缺少智能化的技術(shù)手段,無法有效處理和應(yīng)對信息與知識的爆發(fā),主要體現(xiàn)在①對一線執(zhí)法的智慧決策及輔助仍顯不足,海關(guān)在北京、上海、廣東等地建設(shè)了多個大數(shù)據(jù)中心,目前來看,中心的計算能力仍無法被充分使用,還不能夠在全業(yè)務(wù)領(lǐng)域形成智能決策方案,業(yè)務(wù)一線得到智能決策支持仍不足;②數(shù)據(jù)形態(tài)越來越復(fù)雜,金關(guān)二期在全國各地海關(guān)建設(shè)了各級監(jiān)控指揮中心,收集了大量的音視頻數(shù)據(jù),多形態(tài)的數(shù)據(jù)越來越復(fù)雜,傳統(tǒng)的數(shù)據(jù)處理方式已經(jīng)無法滿足需求,急需借助智能化技術(shù)和應(yīng)用的幫助;③全鏈條的數(shù)據(jù)聯(lián)通仍顯不足,人機(jī)智慧交互仍顯不夠,在海關(guān)各系統(tǒng)之間業(yè)務(wù)鏈條、數(shù)據(jù)鏈條還不夠通暢,在業(yè)務(wù)人員與業(yè)務(wù)系統(tǒng)交互方面,系統(tǒng)仍然顯得不夠“聰明”,業(yè)務(wù)專家知識無法有效地被系統(tǒng)理解利用,數(shù)據(jù)與業(yè)務(wù)場景結(jié)合不夠緊密,上述因素都阻礙著海關(guān)監(jiān)管與服務(wù)的高水平發(fā)展,都需要通過進(jìn)一步提升智能化水平來解決,最終打通從數(shù)據(jù)到知識再到智慧通道。
中臺的作用在于打通固有多業(yè)務(wù)系統(tǒng)之間的數(shù)據(jù)壁壘,融合各個不同業(yè)務(wù)系統(tǒng)間所產(chǎn)生的數(shù)據(jù),通過數(shù)字化驅(qū)動支撐前端業(yè)務(wù)的快速變化,從而產(chǎn)生更大的價值。隨著數(shù)據(jù)中臺之后,以知識圖譜、人工智能技術(shù)為代表的知識中臺作為新經(jīng)濟(jì)形態(tài)下的智能化方案,將持續(xù)從技術(shù)、行業(yè)應(yīng)用、生態(tài)合作的角度進(jìn)行提升,更好地賦能和提升海關(guān)創(chuàng)新能力和治理水平。技術(shù)方面,知識中臺的數(shù)據(jù)處理能力將由結(jié)構(gòu)類、文檔類數(shù)據(jù),拓展至圖片、音頻、視頻在內(nèi)的多模態(tài)數(shù)據(jù);通過圖譜技術(shù),知識中臺將提升復(fù)雜知識表示和快速構(gòu)建技術(shù),提升數(shù)據(jù)知識化的效率。應(yīng)用方面,知識中臺將由搜索、問答、推薦,升級至輔助決策、預(yù)測、推理等各類業(yè)務(wù)場景的知識深度應(yīng)用,滿足海關(guān)各業(yè)務(wù)領(lǐng)域自動化定制需求,提升各業(yè)務(wù)領(lǐng)域智能化水平。
同時,筆者認(rèn)為知識中臺可以理清海關(guān)全業(yè)務(wù)領(lǐng)域邏輯,用機(jī)器可以理解的方式將知識組織起來,從而建立符合總體需求的智能化應(yīng)用,全面提升智能化水平,重塑信息化發(fā)展格局。推動作用體現(xiàn)在①為各業(yè)務(wù)領(lǐng)域快速提供定制類智能化服務(wù),助力業(yè)務(wù)智能化水平提升。從“十四五”規(guī)劃整體來看,各業(yè)務(wù)領(lǐng)域都有對智能化的要求,構(gòu)建統(tǒng)一的知識中臺,將共性的智能化分析以服務(wù)形式提供,能夠以較低的成本,自動化提供定制服務(wù),滿足更多業(yè)務(wù)領(lǐng)域內(nèi)需求,助力監(jiān)管與服務(wù);②各業(yè)務(wù)領(lǐng)域利用和反饋中臺,使中臺能夠提供更具業(yè)務(wù)價值的洞察,有效支撐各級業(yè)務(wù)人員決策,降低執(zhí)法風(fēng)險,提升服務(wù)效率,使得人民滿意,踐行“人民海關(guān)為人民”;③在知識中臺的智能技術(shù)支撐下,各業(yè)務(wù)領(lǐng)域能夠積極推動業(yè)務(wù)模式創(chuàng)新,及時得到改革效果反饋,進(jìn)一步推動改革強(qiáng)關(guān),知識中臺建設(shè)將成為推動創(chuàng)新成功、人民滿意的核心驅(qū)動力。
(二)從數(shù)據(jù)中臺到知識中臺,打通數(shù)據(jù)到知識再到智慧通道。
1、知識中臺架構(gòu)體系。
數(shù)據(jù)中臺理解為數(shù)據(jù)大腦,這個數(shù)據(jù)大腦主要是用技術(shù)鏈接計算平臺的數(shù)據(jù)處理能力,來負(fù)責(zé)對數(shù)據(jù)進(jìn)行收集、分析、下發(fā)、整理等一系列的工作。因此,數(shù)據(jù)中臺不但要將很復(fù)雜的大數(shù)據(jù)處理技術(shù)封裝起來,形成計算平臺;同時進(jìn)入數(shù)據(jù)中臺的數(shù)據(jù)都需按照規(guī)范的建模方法論將數(shù)據(jù)形成主題域模型、形成標(biāo)簽?zāi)P突蛘咚惴P停@類數(shù)據(jù)模型就是數(shù)據(jù)中臺的核心。
知識中臺在架構(gòu)中處于承上啟下地位,包括三個層面:基礎(chǔ)技術(shù)、核心功能、產(chǎn)品矩陣。其中,基礎(chǔ)技術(shù)層提供以人工智能為核心的技術(shù)支持,主要包括知識圖譜、自然語言處理、多模態(tài)數(shù)據(jù)(結(jié)構(gòu)化數(shù)據(jù)、音視頻等非結(jié)構(gòu)化數(shù)據(jù))的綜合處理及分析;核心功能層涵蓋知識生產(chǎn)、知識組織、知識應(yīng)用的全流程;產(chǎn)品矩陣層封裝了平臺、應(yīng)用、行業(yè)解決方案多層級產(chǎn)品,為各行業(yè)、各類場景提供全方位服務(wù)。面向智能化升級需求,知識中臺可以提供靈活、多樣的服務(wù)方式,包括標(biāo)準(zhǔn)化產(chǎn)品服務(wù)、組件化服務(wù)能力輸出、集成解決方案構(gòu)建,和定制服務(wù)的設(shè)計與實施。
2、引入知識中臺解決傳統(tǒng)企業(yè)畫像工程實踐三大問題。
(1)數(shù)據(jù)問題——數(shù)據(jù)治理的問題。
從加工貿(mào)易領(lǐng)域企業(yè)畫像工程實踐分析,所需信息包括行業(yè)地位、生產(chǎn)經(jīng)營、商品信息、加貿(mào)業(yè)務(wù)、監(jiān)管記錄、風(fēng)險行為六個維度,①行業(yè)地位,產(chǎn)業(yè)鏈情況、是否為上市公司、當(dāng)前海關(guān)認(rèn)證等級、企業(yè)信用情況、企業(yè)投資額、企業(yè)進(jìn)出口金額企業(yè)人數(shù)等;②生產(chǎn)經(jīng)營,逾期手冊企業(yè)、剩余料件比例、結(jié)轉(zhuǎn)比例、內(nèi)銷比例、有進(jìn)口無出口、首辦企業(yè)、半年未進(jìn)出口企業(yè)、進(jìn)出口倒掛等;③商品信息,企業(yè)主要進(jìn)出口商品,企業(yè)生產(chǎn)工藝,企業(yè)單耗分析,有無超配額、禁止類、固廢、風(fēng)險類等商品信息等;④加貿(mào)業(yè)務(wù),加工貿(mào)易增幅、加工貿(mào)易降幅、手賬冊辦理有無違規(guī)情況等;⑤監(jiān)管記錄,企業(yè)稽核查記錄,涉案情況,第三方盤庫等信息;⑥風(fēng)險記錄,對企業(yè)風(fēng)險行為進(jìn)行記錄,及企業(yè)司法訴訟、行政處罰、政策法規(guī)、監(jiān)管問詢等等。
以上這些數(shù)據(jù)基本來源于海關(guān)業(yè)務(wù)數(shù)據(jù)、外部工商數(shù)據(jù)、行業(yè)數(shù)據(jù)、政府公開數(shù)據(jù)以及其他來源數(shù)據(jù),可以說是真正的多源異構(gòu),如何將這些信息有效的關(guān)聯(lián)起來本身是一項非常有挑戰(zhàn)的工作,急需數(shù)據(jù)標(biāo)準(zhǔn)、業(yè)務(wù)標(biāo)準(zhǔn)的統(tǒng)一,工程落地難!
(2)業(yè)務(wù)問題——知識轉(zhuǎn)化與沉淀的問題
傳統(tǒng)企業(yè)畫像有待解決的業(yè)務(wù)問題主要體現(xiàn)在大數(shù)據(jù)與業(yè)務(wù)監(jiān)管分析之間的鴻溝。以企業(yè)供應(yīng)鏈分析為例,我們可以從海關(guān)業(yè)務(wù)數(shù)據(jù)中獲取到部分供應(yīng)鏈上下游數(shù)據(jù),經(jīng)過加工處理,形成供應(yīng)鏈圖譜。但業(yè)務(wù)領(lǐng)域?qū)σ怨?yīng)鏈為單元的監(jiān)管顯然有更明確要求和目標(biāo),簡單的供應(yīng)鏈路無法滿足業(yè)務(wù)監(jiān)管的要求,我們需要按照業(yè)務(wù)場景來定制處理。這就帶來了企業(yè)畫像的一個業(yè)務(wù)難題,就是什么樣的標(biāo)簽和關(guān)聯(lián)分析是符合以供應(yīng)鏈為單元這種業(yè)務(wù)場景需求的?這不僅僅是大數(shù)據(jù)處理的問題,也涉及到大量的業(yè)務(wù)領(lǐng)域?qū)I(yè)知識,所以,企業(yè)畫像是很有必要引入專家經(jīng)驗、人機(jī)協(xié)同,專家如何將業(yè)務(wù)知識落地沉淀到畫像系統(tǒng),都是畫像系統(tǒng)要解決的問題。
(3)技術(shù)問題——算法模型的天花板
企業(yè)畫像因為沒有更全面的外部數(shù)據(jù)及企業(yè)財務(wù)、管理行為數(shù)據(jù)的支撐,所以畫像標(biāo)簽面臨不完整、不準(zhǔn)確的問題。標(biāo)簽不完整是源于很多我們目前數(shù)據(jù)來源還是非常有限,那么我們定義的畫像各種數(shù)據(jù)維度缺乏數(shù)據(jù)支撐,傳統(tǒng)打標(biāo)平臺無法解決這塊信息的補(bǔ)全。標(biāo)簽的不準(zhǔn)確表現(xiàn)為缺乏背景知識的語義理解不準(zhǔn)確,舉個例子,如果某篇資訊通篇在提光纜、通信設(shè)備、基站以及車聯(lián)網(wǎng)相關(guān)的話題,那么我們在給與上述實體標(biāo)簽基礎(chǔ)上,最應(yīng)該打上還有個“5G“標(biāo)簽,即便文章中并未提到5g,但事實上,文章內(nèi)容是對5g產(chǎn)業(yè)鏈的一個綜合性描述,而系統(tǒng)如何知道5g跟那些關(guān)鍵詞的對應(yīng)關(guān)系的呢?這就需要賦予系統(tǒng)一個5g產(chǎn)業(yè)鏈的背景知識。很顯然,單純的機(jī)器學(xué)習(xí)模型哪怕是預(yù)測模型也是解決不了這類標(biāo)簽準(zhǔn)確性問題的。
對于一份數(shù)據(jù)稀疏的大數(shù)據(jù),用傳統(tǒng)機(jī)器學(xué)習(xí)方法打標(biāo),很快還會遇到一個算法的天花板。工程界算法和調(diào)參基本處在同一個起跑線,語料是決定算法結(jié)果質(zhì)量的關(guān)鍵,企業(yè)畫像數(shù)據(jù)過于稀疏、數(shù)據(jù)價值密度低,使得從顯性數(shù)據(jù)里獲取的語料非常有限,但我們知道在顯性數(shù)據(jù)背后還有很多隱性數(shù)據(jù)關(guān)聯(lián),類似實控人這類標(biāo)簽業(yè)務(wù),就是有效關(guān)聯(lián)帶來的成果。問題就是,如何發(fā)現(xiàn)這些隱性關(guān)聯(lián),以及這些關(guān)聯(lián)后的新知識。
(4)引入知識圖譜技術(shù),解決三類難題。
通過引入知識圖譜技術(shù),需要在工程實踐中做出思維方式的3大改變。①基于過程的分析轉(zhuǎn)向基于領(lǐng)域的分析,這主要應(yīng)對的是業(yè)務(wù)問題;②基于顯性實體關(guān)系轉(zhuǎn)向隱性關(guān)聯(lián)關(guān)系的發(fā)現(xiàn),這點(diǎn)主要應(yīng)對的是數(shù)據(jù)問題;③基于實體關(guān)系數(shù)據(jù)的模型走向基于語義的模型,這點(diǎn)應(yīng)對的是算法模型的天花板問題。
為了解決前述分析的企業(yè)畫像系統(tǒng)的各種問題,我們需要引入新的“領(lǐng)域驅(qū)動”模式。領(lǐng)域分析主要在實體之間建立語義連接。我們看個具體的例子,在過程驅(qū)動中,可以將企業(yè)在產(chǎn)業(yè)中的信息用ER關(guān)系進(jìn)行表達(dá),于是會形成企業(yè)信息表、企業(yè)關(guān)聯(lián)行業(yè)表、企業(yè)主營產(chǎn)品表,如果有新的數(shù)據(jù)源,比如企業(yè)供應(yīng)關(guān)系,就需要增加一張表解決問題。這樣一個ER關(guān)系如果轉(zhuǎn)化成領(lǐng)域圖,就是一個產(chǎn)業(yè)鏈知識圖譜,這張圖里有企業(yè)、行業(yè)、主營產(chǎn)品、供應(yīng)關(guān)系、上下游等數(shù)據(jù)結(jié)構(gòu),所有數(shù)據(jù)表達(dá)采用統(tǒng)一的模式圖”三元組“,形成的就是產(chǎn)業(yè)鏈知識圖譜。面向過程的ER圖的使用,需要人來找數(shù)據(jù)用數(shù)據(jù),而面向領(lǐng)域的產(chǎn)業(yè)鏈知識圖譜,既可以作為行業(yè)分析人員的背景知識,更重要的是,基于三元組的語義網(wǎng)絡(luò)的數(shù)據(jù)組織形式,是可以讓計算機(jī)理解產(chǎn)業(yè)鏈數(shù)據(jù),進(jìn)而可以產(chǎn)生機(jī)器認(rèn)知的某種能力,諸如知識推理、知識補(bǔ)全等等,這不是面向過程的數(shù)據(jù)組織方式可以提供的能力。
我們將畫像業(yè)務(wù)從基于過程的分析轉(zhuǎn)變?yōu)轭I(lǐng)域分析后,需要借助知識圖譜做工程落地,有了知識圖譜,我們就可以利用知識推理、挖掘、發(fā)現(xiàn)、關(guān)聯(lián),從顯性ER關(guān)系獲取更多的隱性數(shù)據(jù)關(guān)聯(lián)。也可以將專家邏輯跟AI邏輯做統(tǒng)一整合。進(jìn)而,企業(yè)畫像系統(tǒng)依賴的機(jī)器學(xué)習(xí)標(biāo)簽、預(yù)測標(biāo)簽,可以從基于ER數(shù)據(jù)的模型,走向基于語義的模型。ER模型走向語義模型我們可以有幾條路徑去驅(qū)動:1)特征支持,圖譜的schema是特征的源,相對于實體屬性關(guān)系網(wǎng)絡(luò)特征應(yīng)該是區(qū)分度最好的特征來源之一;2)語料樣本數(shù)據(jù)支持,圖譜的三元組數(shù)據(jù)是一個個事實,隱性關(guān)聯(lián)的知識也是這樣的一個個事實,從而對于標(biāo)簽理解或者機(jī)器學(xué)習(xí)標(biāo)簽可以提供語料或者樣本數(shù)據(jù);3)圖分析的一整套方法可以補(bǔ)充進(jìn)機(jī)器學(xué)習(xí)標(biāo)簽?zāi)P屠铮S富算法空間。4)基于知識圖譜的表示學(xué)習(xí)可以和深度學(xué)習(xí)結(jié)合,完成更加有挑戰(zhàn)的標(biāo)簽數(shù)據(jù)的建設(shè)。
(5)構(gòu)建“數(shù)據(jù)中臺+知識中臺”雙中臺驅(qū)動。
引入知識中臺,建立“數(shù)據(jù)中臺+知識中臺”雙中臺驅(qū)動。體現(xiàn)在①從數(shù)據(jù)到信息再到知識最后到智能,數(shù)據(jù)中臺主要定位在從數(shù)據(jù)到信息這個環(huán)節(jié),知識中臺定位在從信息到知識這個環(huán)節(jié);②知識中臺是知識相關(guān)、事實相關(guān)、關(guān)系相關(guān)的信息的再組織,它無法取代數(shù)據(jù)中臺對應(yīng)的數(shù)據(jù)中心,大多數(shù)情況下,數(shù)據(jù)中臺和知識中臺是共生的,他們合在一起是更加廣義的數(shù)據(jù)中臺。數(shù)據(jù)中臺為知識中臺提供大數(shù)據(jù)支撐,知識中臺為數(shù)據(jù)中臺賦能AI認(rèn)知能力;③畫像系統(tǒng)以及其他業(yè)務(wù)系統(tǒng)按需從數(shù)據(jù)中臺、知識中臺或者原始數(shù)據(jù)中獲取數(shù)據(jù),他們不是多選一,而是多方協(xié)作。
三、以數(shù)字孿生為基,構(gòu)建智能新模式。
“十四五”規(guī)劃(三十五)深化海關(guān)大數(shù)據(jù)應(yīng)用中提到“探索構(gòu)建與業(yè)務(wù)實體運(yùn)行良性互動的數(shù)字鏡像,以大數(shù)據(jù)驅(qū)動風(fēng)險防控、通關(guān)監(jiān)管、稅收征管、檢驗檢疫等海關(guān)主要業(yè)務(wù)運(yùn)行”,這將推動數(shù)字孿生在海關(guān)中的應(yīng)用探索,筆者認(rèn)為基于“數(shù)據(jù)+知識”雙中臺實現(xiàn)數(shù)字孿生,能夠進(jìn)一步推進(jìn)該智能新模式落地。
(一)以數(shù)字孿生為基礎(chǔ),構(gòu)建業(yè)務(wù)實體數(shù)字鏡像。
1、數(shù)字孿生是實體的鏡中世界。
數(shù)字孿生是以數(shù)字化方式創(chuàng)建物理實體的虛擬實體,借助歷史數(shù)據(jù)、實時數(shù)據(jù)以及算法模型等,模擬、驗證、預(yù)測、控制物理實體全生命周期過程的技術(shù)手段,基于這一原理,在虛擬世界可以實現(xiàn)實體世界難以做到的操作,核心在試錯、評估,所以在國家的十四五規(guī)劃中,構(gòu)建數(shù)字孿生城市對于城市治理有著巨大的提升作用,同理,構(gòu)建企業(yè)、海關(guān)特殊區(qū)域等一系列的數(shù)字孿生,對于提升海關(guān)全業(yè)務(wù)領(lǐng)域智能化都有巨大的作用。
數(shù)字孿生模型基于多維度、實時大數(shù)據(jù),具有如下六個特征:①互操作性,數(shù)字孿生中的物理對象和數(shù)字空間能夠雙向映射、動態(tài)交互和實時連接,具備以多樣的數(shù)字模型映射物理實體的能力;②可擴(kuò)展性,數(shù)字孿生具備集成、添加和替換數(shù)字模型的能力,能夠針對多尺度、多物理、多層級的模型內(nèi)容進(jìn)行擴(kuò)展;③實時性,數(shù)字孿生要求數(shù)字化,即以一種計算機(jī)可識別和處理的方式管理數(shù)據(jù)以對隨時間軸變化的物理實體進(jìn)行表征。表征的對象包括外觀、狀態(tài)、屬性、內(nèi)在機(jī)理,形成物理實體實時狀態(tài)的數(shù)字虛體映射;④保真性,數(shù)字孿生的保真性指描述數(shù)字虛體模型和物理實體的接近性。要求虛體和實體不僅要保持幾何結(jié)構(gòu)的高度仿真,在狀態(tài)、相態(tài)和時態(tài)上也要仿真;⑤閉環(huán)性,數(shù)字孿生中的數(shù)字虛體,用于描述物理實體的可視化模型和內(nèi)在機(jī)理,以便于對物理實體的狀態(tài)數(shù)據(jù)進(jìn)行監(jiān)視、分析推理、優(yōu)化工藝參數(shù)和運(yùn)行參數(shù),實現(xiàn)決策功能,即賦予數(shù)字虛體和物理實體一個大腦。因此數(shù)字孿生具有閉環(huán)性。
2、數(shù)字孿生是虛實映射的復(fù)雜架構(gòu)。
如下圖,是基于雙中臺構(gòu)建的數(shù)字孿生架構(gòu)圖,雙中臺負(fù)責(zé)基礎(chǔ)支撐,上有數(shù)據(jù)建模與仿真分析層、共性應(yīng)用層、行業(yè)應(yīng)用層。
數(shù)字孿生是虛實映射的復(fù)雜架構(gòu),虛擬實體的生命周期包括起始、設(shè)計和開發(fā)、驗證與確認(rèn)、部署、操作與監(jiān)控、重新評估和退役,物理實體的生命周期包括驗證與確認(rèn)、部署、操作與監(jiān)控、重新評估和回收利用。值得指出的是,一是虛擬實體在全生命周期過程中與物理實體的相互作用是持續(xù)的,在虛擬實體與物理實體共存的階段,兩者應(yīng)保持相互關(guān)聯(lián)并相互作用。二是虛擬實體區(qū)別于物理實體的生命周期過程中,存在迭代的過程。虛擬實體在驗證與確認(rèn)、部署、操作與監(jiān)控、重新評估等環(huán)節(jié)發(fā)生的變化,可以迭代反饋至設(shè)計和開發(fā)環(huán)節(jié)。
(二)從企業(yè)畫像到數(shù)字孿生,構(gòu)建智能監(jiān)管新模式。
1、構(gòu)建線上線下閉環(huán),推動企業(yè)畫像建設(shè)。
從加工貿(mào)易領(lǐng)域企業(yè)畫像工程實踐分析,所需信息包括行業(yè)地位、生產(chǎn)經(jīng)營、商品信息、加貿(mào)業(yè)務(wù)、監(jiān)管記錄、風(fēng)險行為六個維度,作業(yè)中心通過線下線下構(gòu)建業(yè)務(wù)閉環(huán),推進(jìn)企業(yè)畫像。
線上,通過構(gòu)建企業(yè)調(diào)研及行為管理工具、商品及單耗管理工具、政策分析及檢索工具、指標(biāo)及標(biāo)簽建模工具、智能畫像可視化工具、數(shù)據(jù)分析及調(diào)度工具這六個工具,對關(guān)區(qū)加工貿(mào)易企業(yè)進(jìn)行畫像,實現(xiàn)如下主要目標(biāo)①業(yè)務(wù)指標(biāo)系統(tǒng)化,業(yè)務(wù)指標(biāo)體系建設(shè)是一個動態(tài)過程,按照監(jiān)管作業(yè)的需要不斷調(diào)整,從六個維度提取風(fēng)險指標(biāo)。通過對這些指標(biāo)的分析計算構(gòu)成評分模型,實現(xiàn)對企業(yè)精準(zhǔn)畫像,輔助全過程監(jiān)管和服務(wù);②行業(yè)沙盤數(shù)字化,通過可視化技術(shù),構(gòu)建加貿(mào)業(yè)務(wù)總覽、行業(yè)總覽、企業(yè)畫像、企業(yè)集團(tuán)畫像、供應(yīng)鏈畫像、無感監(jiān)管畫像等系列數(shù)字沙盤;③企業(yè)信息可視化,從行業(yè)地位、生產(chǎn)經(jīng)營、商品管理、加貿(mào)業(yè)務(wù)、監(jiān)管記錄、風(fēng)險行為六個維度形成企業(yè)信息雷達(dá)圖,可視化展現(xiàn)企業(yè)狀況;④企業(yè)關(guān)系圖譜化,以Neo4J圖數(shù)據(jù)為知識圖譜存儲平臺,構(gòu)建如下關(guān)系圖譜:企業(yè)集團(tuán)關(guān)系、深加工結(jié)轉(zhuǎn)、外發(fā)加工、供應(yīng)鏈關(guān)系等,提升風(fēng)險判別智能化水平。
線下,推動專業(yè)化審核,從行業(yè)中選取典型企業(yè),從企業(yè)六個維度對企業(yè)進(jìn)行調(diào)研,搭建企業(yè)智能知識庫,編寫調(diào)研報告書,結(jié)合線上分析對企業(yè)整體進(jìn)行再分析、再提煉。
2、實現(xiàn)全要素數(shù)字化,推動企業(yè)數(shù)字孿生建設(shè)。
傳統(tǒng)企業(yè)畫像是站在海關(guān)監(jiān)管角度上,以部分?jǐn)?shù)據(jù)對企業(yè)畫像,往往并不是企業(yè)全貌,數(shù)字孿生則是以企業(yè)為主體,對企業(yè)的全要素數(shù)字化,各監(jiān)管部門從不同角度進(jìn)行監(jiān)管。從社會治理整體來看,這也是監(jiān)管的大趨勢。現(xiàn)階段,企業(yè)數(shù)字孿生仍面臨技術(shù)和非技術(shù)兩大瓶頸難以突破,技術(shù)瓶頸是指當(dāng)前基于云計算和互聯(lián)網(wǎng)的聚合式的模式創(chuàng)新比較成功,而基于物聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能、區(qū)塊鏈、量子通信等技術(shù)的原始創(chuàng)新則極度缺乏,未出現(xiàn)殺手級應(yīng)用,各功能模塊有機(jī)融合的架構(gòu)未能實現(xiàn),造成創(chuàng)新只停留在表面,企業(yè)運(yùn)行和治理的水平有量的提升,但沒有質(zhì)的改變。非技術(shù)瓶頸,則表現(xiàn)在企業(yè)數(shù)字孿生整體建設(shè)是一個龐大的社會性工程,不是一個單位或部門能完成的,所需資金龐大,政府和市場邊界不好劃分,工程周期長投入大充滿變數(shù),企業(yè)盈利和資本回報前景模糊,觀望躑躅之下,推進(jìn)效果可想而知。此外,彰顯智慧所必須的資源共享與業(yè)務(wù)協(xié)同機(jī)制也一直沒有建立起來,信息打通仍困難,協(xié)同共治難實現(xiàn)。兩大瓶頸懸而未決將導(dǎo)致推進(jìn)企業(yè)數(shù)字孿生建設(shè)困難,現(xiàn)有的建設(shè)發(fā)展模式亟待突破。
企業(yè)數(shù)字孿生建設(shè)通過對物理世界的企業(yè)運(yùn)行管理的所有要素數(shù)字化,在網(wǎng)絡(luò)空間再造一個與之對應(yīng)的“虛擬世界”,形成物理維度上的實體世界和信息維度上的數(shù)字世界同生共存、虛實交融的格局。物理世界的動態(tài),通過多種手段采集數(shù)據(jù),精準(zhǔn)、實時地反饋到數(shù)字世界。數(shù)字化、網(wǎng)絡(luò)化實現(xiàn)由實入虛,智能化實現(xiàn)由虛入實,通過虛實互動,持續(xù)迭代,實現(xiàn)物理世界的最佳有序運(yùn)行。因為數(shù)字孿生是企業(yè)真實情況的全反應(yīng),各個監(jiān)管部門能迅速提升監(jiān)管與服務(wù),實現(xiàn)治理智能化;同時,通過對虛擬世界的“假設(shè)”分析和虛擬規(guī)劃,把握企業(yè)運(yùn)行脈搏,提升風(fēng)險管理水平,評估改革效果;在改革實施前就能了解企業(yè)特性、評估實施影響,避免浪費(fèi)時間與資金,防止在驗證階段重新進(jìn)行設(shè)計,以更少的成本、更快的速度實施改革,體現(xiàn)出海關(guān)十四五規(guī)劃中業(yè)務(wù)實體數(shù)字鏡像的巨大社會治理作用。
作者簡介:金劍鋒 蘇州海關(guān)駐相城辦事處 一級主辦、副科長。