鄒山花
ZOU Shan-hua1,2
(1.東南大學 軟件學院,蘇州 215123;2.江南大學 太湖學院,無錫 214000)
面對激烈的市場競爭,企業紛紛采用ERP(Enterprise Resource Planning)管理系統來提高自身的競爭力和整個供應鏈上的管理水平,但是ERP應用的效果取決于供應鏈上各個環節的集成的有效性,這種有效性使供應鏈過程保持同步、應用之間能夠互操作。這種有效性取決于供應鏈中流動的數據。數據不能流暢的流動,整個系統就不能運轉,所以數據的質量是供應鏈安全、有效的保證。
典型的劣質的數據是隨心所欲的使用詞匯,這些詞匯將造成一物可由多個詞匯描述,或者一個詞匯代表多物的現象。這種不一致性使得數據流動的過程中產生阻力,輕則使業務流程減速,重則會造成極大的問題,尤其是在各類賬目的統計中。
為了保證企業數據的質量,優化主數據是關鍵。主數據是企業中用來描述企業自身的、獨立的、基礎的實體;主數據通常存儲在數據庫中,在事物處理中通過標識符被引用[1,2]。例如,零件號是制造商給零件指定的標識符,同時,零件號也標識了這個零件的主數據。一個數據是否是主數據由企業決定,也就是說一個數據在A企業是主數據,可能在B企業就不是主數據[2]。規范和優化主數據可以降低運行的費用、降低簽訂合同的費用、改進價格,增加物流中數據交換的柔性。
ISO 22745 國際標準給出了表示、處理和交換主數據的描述技術[2]。它提供了工具使得企業能夠保證輸入和輸出的主數據足夠優質,改進內部數據的質量;在整個供應鏈上進行富有語義的、數據粒度級的信息交換,實現直接、正確、有效的協同。
ISO 22745 的核心是開放的技術字典(the Open Technical Dictionary ,OTD),它是一組詞條的集合,每一個詞條描述一個概念/元數據,包含概念/元數據的標識符、術語和定義文本、注釋、樣例、圖像、超鏈接到源標準。一個概念可以與任何數目的術語、定義、縮略語和圖像關聯。一個概念可以與同一個語言中的幾個術語關聯。這些術語都是同義詞。這些元數據用來描述企業中統稱為物件(item)的主數據(個人、組織、位置、商品,服務,規則章程[2]),提供統一的、與語言無關的對主數據編碼的方法。
OTD的概念跨越整個供應鏈,從供應商->客戶->材料->存儲->服務;概念包含整個數據生命周期,從設計(CAD/CAM/CAE/PDM)->設備->制造/生產;概念包括整個ERP的主數據。概念的類型包括:類、特征、描述、測量單位、測量的限定符、特征值、貨幣值和語言。
類是一組具有相同特性的實體的集合。例如,‘服裝’、‘計算機’、‘車床’。通常,類中包含概化、泛化的關系,構成類的層次結構。但是OTD不包含類的層次結構,它是一個扁平的概念集。這是因為OTD中的類可以來源于多個數據源(供應商)抽取的類,其中每一個類可以鏈接到一個或者更多的外部的類層次(它們可能屬于不同的鄰域、學科)。例如,眼鏡可以屬于不同的類:

圖1 OTD中一個類可以屬于不同的外部類
可以是醫療類的泛化,也可以是安全裝備類的泛化。如圖1所示。數據源越多,合并這些層次結構成為一個的可能就越小、越困難。
特征指物件的屬性,例如:螺紋級別、直徑、材質,強度等。測量單位包括測量單位的國際系統和英制系統。測量的約束,如:極小值、極大值、正常值。特征類型指物件特征的類型,可以是枚舉類型, 例如,一周中的日子有(Monday, Tuesday, ...)七天,螺紋的方向有("right hand" or "left hand")兩種,材料有(steel,aluminum, ...)等多種,這些特征值注冊在OTD中作為概念,給定標識符。貨幣的名稱,例如,美元、歐元等,也給定OTD 標識符。語言標識符是指對不同的語言給定標識符,以便對與語言相關的術語、縮略語和定義進行語義識別。例如,US說"elevator"而UK 說 "lift",US說"truck"而UK說"lorry"。這些差別出現在很多語言里。為了使得OTD能夠處理這樣的語言變化,ISO 22745 指定了語言標識符。表1給出了一個螺栓[3]相關的概念的標識符。

表1 概念的標識符的樣例
可以根據OTD術語的來源把OTD 分成兩組:
1)內容創建OTD:OTD中的術語是由 ‘數據維護組織’(Dictionary Maintenance Organization,DMO)標準化的,OTD是該術語的源。
2)內容收集OTD:OTD中的術語是OTD之外標準化的術語信息的復制。任何人都可以請求把已經標準化了的術語添加到OTD中。OTD中的每個術語項都有鏈接指向源文件。用戶可以跟隨鏈接獲取更多的信息。如圖2所示。

圖2 OTD 中術語項都有鏈接指向源文件
ISO 8000-110定義了“主數據是企業中的數據,它們用來描述那些企業自身的、獨立的、基礎的實體,而且在執行事務處理時會用到它們”[2]。任何一條主數據記錄描述的都是“物件”(item),它可以是各種現實中具體的物體(如,某車輛,標識號為"XYZ66089"),也可以是同樣物體的集合(如,東芝 Portege 3300 M909—現實世界中有很多這樣的電腦)。主數據記錄主要包含一個或多個特征值。每個特征值表示描述物件的一個特性。例如,“特征項—值”為“螺紋直徑—1.0英寸”、“材料—鋁”和“直徑—1.5厘米”等。ISO 22745表示主數據的原則是“語義編碼”(Semantic Coding),也就是用機器可讀的標識符代替人可讀的文本。
主數據中類的標識符是一個指針,指向OTD中的概念;主數據中的特征、測量單位、測量的限定、控制值等的標識符是指針,指向OTD中的概念。例如,某螺栓的參數[3]如表2所示。

表2 “螺栓”的信息
OTD 為主數據的編碼提供了支持,如圖3所示。
用OTD編碼后,“螺栓”的主數據如表3所示。
采用機器可讀的標識符的好處是:

圖3 OTD支持主數據編碼

表3 “螺栓”的主數據
1)使得主數據的語言中性,主數據可以解碼(譯碼)成任何OTD支持的語言;
2)使得編碼唯一,降低了單一物件可能的冗余的主數據。
標識模式[2](Identification Schema)如下:

其中,
1)RAI,注冊權威標識符 Registration Authority Identifier
2)ICD,國際碼標志符International Code Designator
3)OI,組織標識符Organization Identifier
4)DI,數據標識符 Data Identifier
5)CSI,碼空間標識符Code Space Identifier
6)CC,概念碼 Concept code
7)VI,版本標識符Version Identifier
ISO 22745為了支持對主數據的編碼,還提供了一個標識指南IG(Identification Guide)eOTD-i-xml(參考ISO 22745-35)[2]。IG是基于OTD中的概念、提供給買家用來描述主數據的一個母模板、一組基本規則。按照IG來描述物件,可以提高數據質量,減少所需的時間。
提高數據質量首先著眼于提高ERP中主數據的質量,尤其是那些用于多個應用軟件組件/單元之間需要交換的數據。以供應鏈中最常用的商品為例,
1)首先是能夠唯一確定商品的代號,包括:
(1)有效的商品的標識符(零件號)和供應商的標識符(名稱, 地址, 電話,e-mail等);
(2)物件的類型,必須指明:
(3)唯一的、典型的、有設計控制的,或擔保的物件;
(4)競爭的,來自某制造商的物件可能從多個廠家獲取;
(5)可替代的,多個制造商可生產相同的物件(相同的適合度、形狀和功能);
2)其次是為競爭的物件確定物件標識符,為可替代的物件確定適合性、形狀和功能。多個競爭供應商可能成組地存在于物件的一條記錄中,而多個可替代供應商也可能成組地存在于物件的一條記錄中。那么在構建訂購單時就要對他們進行分離,給出優先次序,以便從網絡上自動的搜索;
3)然后是確定其他所需要的特征業務數據。尤其是在網絡自動搜索競爭供應商或可替代供應商時,需要動態添加的一些特征補充信息。

圖4 構建主數據
基于IG構建主數據時,必須參考OTD,其關系如圖4所示。圖中
(1)構建主數據的用戶向OTD請求相關的概念信息:給定一個標識符,從OTD中提取關于該物體(對象)的信息,或者給定一個搜索的模板(特征值),在OTD中尋找與該模板匹配的對象;
(2)OTD 返回信息,或者源信息地址;
(3)調用源數據;
(4)獲得源數據;
供應鏈中信息的搜索過程如圖5所示。

圖5 訂購的搜索過程
首先,購買者或用戶作為數據的請求者定義它們對數據的需求:物件的名稱(例如,球狀軸承,環狀軸承)、可能的供應商、特征值(例如,內徑、外徑、寬度、行數、速率等)表述成eOTD-i-xml(參考ISO 22745-30)[2]形式;
其次,購買者或用戶作為數據請求者創建一個請求,發送給數據提供者的供應商或制造商,請他們按照標識了零件號的物件驗證特征數據,或者按照指定的特征值提供零件號。這個請求寫成eOTD-q-xml(參考ISO 22745-35)[2]文件;
然后,供應商或制造商作為數據提供者向數據請求者(購買者或用戶)應答。應答文件為eOTD-r-xml(參考ISO 22745-40)[2]格式。如果供應商或制造商作為數據提供者不具有所請求的數據,那么他們以同樣的數據格式、按照競爭者供應商或可替代供應商的優先次序通過供應鏈發送請求。
數據質量是保持供應商和制造商長期關系的重要因素,ISO 22745及其核心的OTD和標準的特征數據交換的格式是提高數據質量的基礎性使能工具,它可以滿足工業界的需求,在整個供應鏈上進行數據粒度級的信息交換,實現直接、正確、有效的協同。
[1] Salomon de Jager,Ph.D.Solving Data Quality Problems Using Data Standards Oct-De2007 http://findarticles.com/p/articles/mi_qa3766/is_200710/ai_n27997243
[2] Gerald Radack, Ph.D ISO 22745:The Standard for Master Data 28 Nov,2009.http://findarticles.com/p/articles/mi_qa3766/is_200710/ai_n27997247/.
[3] Donald Hillman A Global Standard Descriptive Language for Cataloging--Implementing the NCS/eOTD http://www.eccma.org.