白旭飛 線江南 單強 孫圓
(國網冀北物資公司 北京市 100071)
2018年以來,國網公司開啟現代智慧供應鏈建設,構建“五E一中心”供應鏈平臺,全面支撐智能采購、數字物流、全景質控三大業務鏈,內外高效協同,智慧運營調配,實現傳統業務的數字化轉型。在大信用和大數據時代,如何加強大數據在環境信用評價領域的應用[1]成為新的著重點。當前對供應商產品服務水平、質量水平、軟硬件綜合實力等方面缺少科學劃分和客觀量化的手段,亟待加強電力物資供應商信息采集與管理、能力及風險智能化評估,利用人工智能技術建立供應商全息畫像體系。借助新技術,引入智能算法實現個性化、專業化生產,實現精準化管控成為大勢所趨[2]。
如圖1所示,知識圖譜構建與智能應用項目總體架構包括數據采集、數據處理、圖譜構建、應用管理和保密安全五個部分,基于供應商多維數據進行統一的數據建模、分析和數據訪問和應用,實現電網現代智慧供應鏈管理的智能化、可視化[4]。
2.1.1 數據采集
包括業務中環節中的供應商內部信息,與供應商輿情、企業關系、征信等供應商的外部信息組成的供應商全量信息采集。
2.1.2 數據處理將集成進來的企業各個系統中的數據進行清洗、標注得到結構化數據、非結構化數據以及半結構化數據。
2.1.3 圖譜構建
(1)梳理物資供應相關數據,完成基本知識圖譜構建;
(2)確定畫像指標/標簽,基于知識圖譜進行畫像;
(3)基于業務規則和目標,設計知識圖譜推理方法,圖譜推理自動/調度完成,指導業務應用。
2.1.4 應用管理對軟件的性能、可靠性、魯棒性、擴展性、維護性、易用性、系統災備設計等一系列要求進行專項設計,提高系統應用能力。
2.1.5 保密安全
遵循“分區分域、安全接入、動態感知、全面防護”的安全策略,根據業務系統的不斷完善加強對網站的防護,最大限度的保障國家電網公司圖像智能分析應用的安全、可靠和穩定運行。實現企業內部的高效協同與精細化管理[3]。
如圖2所示,本項目需要采集的數據信息主要包含業務系統內的供應商相關數據和第三方提供的供應商數據(天眼查、企查查等)數據、文檔表格等外部數據。導入、導出數據支持批量操作,可同時錄入大量數據(最高單次10 萬條數據)。

圖1

圖2
(1)業務系統數據,指在供應鏈管理過程中通過業務系統產生的各類業務數據(簡稱內部數據)。
(2)第三方提供的供應商數據,指通過第三方機構采集的供應商數據,包括工商信息、稅務信息、股權結構、注冊信息、資產負債率、司法信息等。
(3)文檔圖譜數據,指在業務管理過程中產生的相關文本、圖片表格(如合同掃描件)等資料,其中包含供應商相關信息。
做到以下要求:
數據源為負責數據實時采集和數據離線導入,通過采集工具和接口服務集成來自底層數據設備、業務系統、文本資料等多元化異構系統的數據,為項目系統提供統一的數據入口。
數據存儲與知識存儲層將處理過后的數據進行統一存儲,了滿足供應商畫像相關數據的存儲與計算需求,采用數據存儲相關技術,根據數據的規模和存儲方式,分為Hadoop 文件存儲、Hbase 列式存儲、Oracle、MySQL 關系型存儲以及Neo4j 圖數據庫存儲;在圖計算技術中,采用Python iGraph、Spark GraphX、Neo4j GDS 等圖計算引擎,數據檢索方面,采用Neo4j 內置的Cypher 以及關系型數據庫的SQL。

圖3:技術架構圖

圖4
數據與知識處理層將集成進來的企業各個系統中的數據進行清洗、標注得到結構化數據、非結構化數據以及半結構化數據。半結構化數據通過包裝器(Wrapper),非結構化數據通過實體命名識別(NER)、關系/屬性抽取等NLP 方法轉化為結構化數據,再將所有結構化數據按照預先建模的知識模型進行映射。將生成的知識經過實體對齊、更新、加工等環節轉化為成熟知識。

圖5
知識處理和知識計算層通過NLP 技術、圖計算、知識表示學習等手段,將非線性世界中的知識信息結構化,以便機器計算、存儲和查詢。
智能應用層主要是根據不同需求,充分應用已有的數據及知識,為提供便捷、易用的客戶端接入方式,為用戶直觀的展示數據,并支持用戶對數據進行業務分析、應用。
技術架構圖如圖3所示。
2.3.1 數據源
數據源基于數據中臺及相關系統構建,對外提供統一服務和支撐。
2.3.2 基礎資源層
基礎資源層主要包括計算資源、存儲資源、網絡資源、負載均衡資源等,采用統一的云平臺提供服務,優先項目單位現有設備利舊。
2.3.3 存儲層
提供結構化數據、非結構化數據、半結構化數據的存儲及服務,可以按需供應服務及橫向擴展,主要技術涉及國網自主關系數據庫、圖數據庫、分布式文件系統等。
2.3.4 系統功能層
知識圖譜實現,采用知識圖譜技術,實現制度標準數據的實體識別、句子切分、事件單元抽取、事件關聯管理等;還包括圖計算、機器學習、算法模型訓練、語音分析、NLP,提升制度標準知識圖譜標注準確性、智能性。算法引擎,搭建語音識別、圖像OCR 識別等基礎算法引擎,為服務與應用提供支撐。
2.3.5 服務層
構建智能搜索、多輪問答、關聯事件分析、語義分析、NLP 等算法引擎,支撐智能應用的實現,并提供統一的API 調用,為業務應用提供支撐。同時提供服務治理框架、分布式消息隊列、實時服務監控等能力。
2.3.6 界面展示層提供WEB、手機APP 兩種界面展示方式,技術包含HTML、CSS、HTML5、JS 等。
2.3.7 應用層
應用層主要包括管理各環節的業務處理能力,形成物資知識庫、智能搜索、智能問答等基礎應用和供應鏈全過程貫通、供應商全方位評價、質量全環節監管、風險全方位管控、成本全流程核算等專業應用。
2.3.8 內外網隔離裝置
處理內外網的隔離交互,實現內外網穿透、業務連接管理服務、運行日志采集服務等。
2.3.9 平臺支撐層
平臺支撐層包括開發平臺和安全管理兩部分。開發平臺包括UAP、APM、BPM 等開發套件及框架、功能組件等。安全管理包括安全控件、安全證書、DDOS 防護等。
應用架構如圖4所示。為提高系統的易用性,滿足頁面布局合理,通用操作規范,出錯處理、反饋與提示人性化等要求,可以從以下的方面來提升:
(1)在設計上借鑒采用具有良好用戶體驗的界面布局;
(2)對于復雜的用戶交互,采用界面工作流(或界面向導)的方式實現;
(3)對于程序錯誤和異常信息,提供用戶易于理解的響應;
(4)對于填充控件類長時間的任務,采用使用異步技術實現;
(5)提供有效的在線幫助和詳盡的用戶使用手冊;
(6)提高響應時間,單條響應不超過3 秒鐘;
(7)系統支持Windows7 及以上(含Windows10)版本的操作系統,用戶前端針對IE 瀏覽器、谷歌瀏覽器、360 瀏覽器開發多個版本。
安全架構如圖5所示,遵循“分區分域、安全接入、動態感知、全面防護”的安全策略,根據業務系統的不斷完善加強對網站的防護,最大限度的保障國家電網公司圖像智能分析應用的安全、可靠和穩定運行。
防護標準:
(1)國際標準和國家標準:包括 ISO、ITU 等國際標準,國家原信產部相關標準,國家公安部相關標準,以及電信行業相關標準等。
(2)機構標準和策略:包括本機構發展戰略相關的安全維護和發展策略,以及機構內部制定的相關安全標準。
(3)安全規定、流程和操作手冊:用于指導安全建設和安全運維的相關流程和規定,以及指導具體運維的操作手冊。
(4)其它安全資料:包括用戶安全服務協議、培訓資料等。
加強安全策略體系的管理,確保機密信息不泄漏,落實相關策略,并加強對策略執行情況的監督。
防護目標:
(1)保障圖像智能分析應用安全可靠運行。
(2)保障圖像智能分析應用邊界和網絡傳輸通道安全。
(3)保障圖像智能分析應用用戶身份真實可信,防止惡意用戶、非授權用戶訪問。
安全架構的各區邏輯如下:
(1)外部網絡,提供第三方服務器服務訪問網絡環境。
(2)互聯網接入區,部署數據采集服務器,互聯網外網數據首先歸集到外部數據前置庫中,通過數據的一致性比對,數據匹配加工之后,再進入內網進行管理。
(3)代理區,部署訪問代理JMS 中間件,確保數據流單向訪問。
(4)應用訪問支撐區,屬于信息內網,負責數據導入業務,通過外網數據接入流程完成數據存儲。
(5)電力內網區,屬于信息內網,部署應用業務庫、圖數據庫。
基于知識圖譜的供應商畫像將通過深挖數據價值,強化運營分析決策,提升資源優化配置,完善風險監控預警,深化數據資產應用,增強應急調配指揮五大功能領域,持續優化,規范運營管理,成為提質增效的重要抓手。