陳俊宇, 田 凌
(清華大學 a. 機械工程系; b. 精密超精密制造裝備及控制北京市重點實驗室,北京 100084)
大型船舶一般以三級中間產品分級建造,規模由小到大分為零件級、組立級和分段級.其中,分段在船廠的生產設計和生產管理中居于核心地位.分段在建造中需要經歷5種工藝(即組裝、預舾裝、沖砂打磨、涂漆和預總組)以及在工藝之間的堆場周轉,場地之間的分段轉運通過專用平板車完成.分段轉運保障了分段在各個工藝之間的有序流動,但消耗了大量成本.以國內某水平領先的船廠(以下稱為S船廠)為例,年均分段轉運3.7萬次,相關一線員工(平板車司機、起重工和叉車工)42~45人,每次轉運平均需要3.3人次、耗時40 min,物流部門每日兩班倒以滿足船廠轉運需求,年均消耗成本 2 200 萬元,約占船廠年凈利潤的1/10.
大量分段轉運不是分段建造所必需的,即為非生產性轉運,包括兩類.第一類非生產性轉運是由于分段堆場擁擠,分段之間互相阻擋所造成的額外轉運,特征為轉運的起止分段狀態均為堆場周轉.堆場相關轉運中第一類非生產性轉運的比率,即第一類非生產性轉運率[1-7]是常用的評價指標,已有研究顯示其集中在10%~30%,可以通過評估這一指標來監測船廠的第一類非生產性轉運.第二類非生產性轉運是由于派工調度不合理、場地沉降、工裝設備故障等原因,工藝出現返工所造成的額外轉運,特征在于轉運終點的分段狀態為已經歷過的工藝,可以通過評估單位時間內各項工藝的返工數和開工數之比,即返工開工比來監測船廠的第二類非生產性轉運.除這兩類轉運之外,其余轉運均為生產性轉運.
合理的生產計劃和堆場調度是減少兩類非生產性轉運的關鍵.然而,由于生產和轉運現場的干擾因素多,一線班組在執行中具有一定決策權,所以分段轉運的計劃和執行之間存在較大區別.船廠管理者需要監測實際轉運過程,特別是監測兩類非生產性轉運,進而實現衡量轉運計劃執行情況,為后續的優化提供數據支持.在分段轉運過程監測領域,韓國團隊[8-11]利用全球定位系統(Global Positioning System,GPS)、射頻識別設備(Radio Frequency IDentification,RFID)、慣性測量單元(Inertial Measurement Unit,IMU)、無線局域網(Wi-Fi)等技術實時顯示分段位置,為船廠提供了分段位置數據的實時監測手段.我國船廠也跟進了這一領域,張恒等[12]研究了船體分段外場物流實時綜合監測系統方案,包括船廠的場地編碼體系和基于GPS/RFID組合的分段、平板運輸車的定位方案等技術,可以自動化獲取分段的時空數據.在空間充裕的船廠中,場地一般用途專一,可以直接通過時空數據反映分段的實時狀態.然而S船廠生產任務多、場地緊張,存在一場多用的現象,即部分場地對應了多種分段狀態,在應用分段轉運過程監測技術時,分段的時空數據可以給出分段在建造過程中經歷的場地序列,但是無法直接轉換為分段狀態序列,因此難以實現兩類非生產性轉運的監測.
本文針對S船廠在分段轉運監測中存在難以獲取分段狀態的問題,通過研究分段轉運過程中分段狀態的特征,提出了基于隱馬爾可夫模型(Hidden Markov Model,HMM)的分段狀態識別方法,并應用于船廠分段時空數據,實現了船廠的兩類非生產性轉運的監測,驗證了本文方法的有效性.
分析船廠分段轉運中分段狀態的規律,是選取合適的推理方法,實現分段狀態識別的基礎.首先經由領域專家構造標注數據集,在此基礎上分析了分段狀態間時序關系和分段狀態的耗時特征,為分段狀態識別奠定了基礎.
分段狀態會因為分段轉運而發生變化,針對船廠的分段轉運過程已有一定研究.Lee等[13]為了描述典型的分段轉運過程,與韓國大宇船廠合作,基于某一條船190個分段的轉運日志數據,采用事件日志驅動的過程挖掘方法[14-16],通過挖掘頻繁起止分段狀態對,描述了“標準型”“簡單型”“翻轉型”和“外協型”4種典型的分段轉運過程,并指出由于標準型分段轉運過程中只在預舾裝和沖砂打磨兩個工藝前有堆場周轉,是韓國大宇船廠的生產瓶頸.這一研究說明現代船廠中分段狀態的變化具有穩定的時序特征,然而該研究使用的分段轉運數據樣本量較小,且不同船廠的典型分段轉運過程不同,其給出的典型分段轉運過程不能直接用于本文.陳好楠等[17]研究了國內某船廠的分段轉運數據,這一數據給出了轉運的日期和起止場地,不包含分段狀態.研究人員通過現場調研獲得了兩條船480個分段相關轉運的起止狀態,利用層次聚類算法,給出了典型的11種分段轉運過程.這一研究面臨的困境與本文相似,即分段轉運數據中缺乏分段狀態.雖然其通過現場調研方式人工標注了分段狀態,但是這種方式能處理的數據量少,難以對全船廠所有分段的狀態進行監測,分析結果也僅能用于描述單船的分段轉運情況,無法反應船廠各個工藝的整體情況,無法對分段轉運過程的影響因素進行監測和分析.
S船廠雖然存在一場多用的現象,但是分段轉運并不是隨意的,轉運的起止場地和分段狀態受到多種因素的影響,包括船廠內部的物流慣例、分段規格、場地的設備能源條件、調度人員掌握的信息和權限范圍等.例如,有的沖砂場地多用于曲面分段,而有的沖砂場地多用于平面分段;雙層底分段由于規模較大,往往在噴漆后安排在特定的周轉堆場;有的工藝場地可以支持完工后的檢驗工作,之后分段直接進入下一工藝,不需要轉運到堆場進行檢驗.這樣的規則數量極多且難以窮盡,將其枚舉并顯式表達的成本很高.然而,熟悉這些規則的領域專家可以在參考船廠的歷史生產計劃的基礎上,通過分析單個分段所經歷的場地序列,就較為準確地推理出對應的分段狀態序列.
為了研究S船廠分段轉運中分段狀態的變化規律,獲得可以像專家一樣從場地序列推理分段狀態序列的推理模型,邀請船廠物流部門的班組長,為某船234個分段的時空數據標注了分段狀態,構造了標注數據集,其形式如表1所示.表中前4列為分段時空數據原有數據,后2列為人工標注數據,從中可以看出分段101的轉運軌跡,經歷了“G場—I場—D場—……—K場—C場”的場地序列,以及“組裝—堆場周轉—預舾裝—……—堆場周轉—預總組”的分段狀態序列.標注數據集覆蓋了 2 990 次轉運,有3 224 個分段狀態,其中234個分段狀態為分段開始第一次轉運前的組裝,234個分段狀態為分段完成最后一次轉運后的預總組,因此,這468個分段狀態的耗時無法計算;而其余分段狀態可以通過各自的起止時間計算耗時.

表1 標注數據集Tab.1 Labeled dataset
抽取出標注數據集中75%的分段(176個)相關的數據作為訓練集,用于后續分段轉運過程的分析和分段狀態識別方法的研究;剩余25%的分段(58個)相關的數據作為測試集,用于驗證相關結論.
分段狀態之間通過分段轉運發生時序上的轉化,本文采用有向圖描述不同分段狀態之間的時序關系,如圖1所示.節點為分段狀態,其中矩形節點為堆場周轉,橢圓節點為5種工藝;有向邊為分段狀態之間的轉化(即分段轉運),有向邊的寬度和數字表示對應轉運在訓練集中的頻次,圖中只繪制了頻次超過10次的轉運.由于S船廠中5種工藝都與堆場周轉有關,如果將堆場周轉視為一個節點,則有向圖中會出現以堆場周轉為中心的布局,難以直觀表達不同工藝之間的時序關系,所以在構建有向圖時,按緊隨的工藝區分了堆場周轉.

圖1 分段狀態間時序關系Fig.1 Time sequential relationships between state of blocks
由圖可見,S船廠中分段經歷的工藝順序一般為組裝、預舾裝、沖砂打磨、噴漆和預總組,有部分分段跳過了預舾裝,工藝之間大多數情況下有堆場周轉,也存在直接轉運的情況,這種不確定的時序關系表明前序的分段狀態會影響但不能直接決定未來的分段狀態;由于分段組裝之后才會進行第一次轉運,完成預總組之后分段建造就結束,不再進行轉運,所以以組裝為起點的轉運遠多于以組裝為終點的轉運,以預總組為起點的轉運遠少于以預總組為終點的轉運;堆場周轉節點上存在自環有向邊,例如有406次轉運的起止分段狀態均為沖砂打磨前周轉,說明存在大量第一類非生產性轉運;工藝節點上存在環形子圖,例如“組裝-組裝”,“預舾裝-預舾裝前周轉-預舾裝”,說明存在某一分段不止一次經歷同一工藝,即第二類非生產性轉運.
根據S船廠的生產特點,可知分段在加工中,可能會多次經歷某一工藝,然而其中一般只有一次為實質性加工,其余為修補返工.實質性加工和非實質性加工本質上是不同的,在研究其耗時特征時應予以區分.因此,規定每個分段經歷的預舾裝、沖砂打磨和噴漆中停留時間最長的一次視為實質加工,其余為非實質加工;分段第一次轉運前的組裝為實質組裝,后續出現的組裝為非實質組裝;分段最后一次轉運后的預總組為實質預總組,之前出現的預總組為非實質預總組.統計不同分段狀態的耗時情況(不包括實質組裝和實質預總組,這二者的耗時無法計算)如圖2所示.將耗時(t′)分為短期(t′≤3 d)、中期(3 d

圖2 各種分段狀態的耗時Fig.2 Durations of state of blocks
對分段轉運過程中分段狀態間時序關系和耗時特征進行分析,可知一方面分段狀態受到前序分段狀態影響,可以采用時間概率推理模型實現未知分段狀態的推理;另一方面分段狀態的耗時可能有助于識別分段狀態的具體類型,不僅應該考慮直觀上最明顯的位置變量(即場地),也可以嘗試考慮耗時特征.在此基礎上,簡述所使用的時序概率推理工具HMM,提出分段狀態識別方法并應用于測試集,驗證了本文方法的準確性.
常用的時間概率推理方法包括動態貝葉斯網絡、卡爾曼濾波器以及HMM,后二者是動態貝葉斯網絡的特例.三者都是通過將問題模型化,求解可觀測部分在特定取值下不可觀測部分為各個取值的條件概率,主要區別在于解決的問題類型不同.如果變量是小規模離散的,可用HMM解決;如果變量是連續的,可用卡爾曼濾波器解決;如果變量的數量較多,則動態貝葉斯網絡更為高效[18].HMM作為離散隨機變量時間序列的推理工具,提供了一種自然且高度穩健的概率推理方法,可以給出給定觀察變量序列下狀態變量的后驗分布,適用于本文要解決的問題類型;其所遵循的假設具有直觀的合理性,因此本文嘗試使用HMM作為時間序列概率推理工具.Baum等[19]提出了用于推理和學習的HMM;Viterbi[20]提出了Viterbi算法,用于在HMM的基礎上計算最可能狀態變量序列.Rabiner[21]提供了關于HMM的詳細教程.HMM可以形式化定義為一個5元組,表示為
λ=〈Xt,Ot,P(Xt|Xt-1),P(Ot|Xt),P(X0)〉
(1)
5元組各個元素的含義如下.
(1)Xt和Ot.將問題域離散化,并看作是一系列時間片,每個時間片都包含了一組離散隨機變量,其中一部分是不可觀察的,將所有不可觀察變量合成為一個隨機變量,稱為狀態變量,用Xt表示t時刻的狀態變量,Xt取值范圍為{1, 2, …,n}.另一部分是可觀察的,將所有可觀察變量合成為一個隨機變量,稱為觀察變量,用Ot表示t時刻的觀察變量,Ot取值范圍為{1, 2, …,m}.
當某待定數量xt或ot以獨立的形式出現在概率P后的括號中時,是一種縮寫形式,代表了對應的隨機變量等于相關值這一事件的概率,例如P(xt) =P(Xt=xt),P(ot) =P(Ot=ot).
(2)P(Xt|Xt-1)和P(Ot|Xt).Xt滿足兩個假設:一是馬爾可夫假設,即當前狀態只受前一個狀態影響,不受更前的狀態影響,即有
P(Xt|X0,X1,X2, …,Xt-1) =
P(Xt|Xt-1)
(2)
式中:P(Xt|Xt-1)用于描述狀態演變的規律,稱為轉移模型,為一個n×n的矩陣T,其元素為
Tij=P(Xt=j|Xt-1=i)
(3)
二是穩態過程假設,即P(Xt|Xt-1)不隨t變化.
Ot滿足傳感器馬爾可夫假設,即觀察變量值由當前狀態變量值直接決定,即有
P(Ot|X0,X1, …,Xt,O0,O1, …,Ot-1) =
P(Ot|Xt)
(4)
式中:P(Ot|Xt)用于描述觀察過程,稱為觀察模型,為一個m×n的矩陣O,其元素為
O[k,i] =P(Ot=k|Xt=i)
(5)
(3)P(X0).P(X0)為Xt的先驗概率分布.
HMM是動態貝葉斯網絡的特例,使用動態貝葉斯網絡表示HMM,如圖3所示.

圖3 使用動態貝葉斯網絡表示隱馬爾可夫模型Fig.3 Hidden Markov models in form of dynamic Bayesian networks
為了實現分段狀態識別,需要定義HMM中的Xt和Ot,再利用訓練集學習HMM的轉移模型、觀察模型和先驗概率分布,獲得完整的HMM;在此基礎上,利用Viterbi算法,實現分段狀態序列的推理.
(1) 設置狀態變量Xt和觀察變量Ot.Xt和Ot的設置可以影響推理的準確度,其實質是對分段狀態和觀察到的情況進行離散化.根據圖1,分段狀態中堆場周轉可以根據緊隨的工藝分為組裝前周轉、預舾裝前周轉、沖砂打磨前周轉、噴漆前周轉和預總組前周轉;根據1.3節的討論,可以在設置觀察變量時,既包含場地信息,也包含耗時信息.在訓練集規模有限的前提下,為了準確獲取HMM參數,狀態變量和觀察變量的取值多樣性是有限的.因此,本文給出了4種Xt和Ot的設置方案.
方案1不區分堆場周轉和耗時.不區分堆場周轉,狀態變量Xt有6個取值,代表5種工藝和堆場周轉,n=6;不考慮觀察變量Ot耗時,有42個取值,代表S船廠的42個場地,m=42.
方案2區分堆場周轉,不區分耗時.按緊隨的工藝區分堆場周轉,狀態變量Xt有10個取值,代表5種工藝和5種堆場周轉,n=10;觀察變量Ot設置方法同方案1,m=42.
方案3不區分堆場周轉,區分耗時.狀態變量Xt設置方法同方案1,n=6;觀察變量Ot中融合42個場地和3種耗時(短期、中期或長期).為了形式的一致性,規定某分段的第一個和最后一個分段狀態的耗時為中期,共有42×3=126個取值,即m=126.
方案4區分堆場周轉和耗時.狀態變量Xt設置方法同方案2,n=10;觀察變量Ot設置方法同方案3,m=126.
使用上標s標識方案1~4獲得的HMMs及其相關變量,如下式所示.
λs=
s=1, 2, 3, 4
(6)
(2) 學習HMM參數.無監督的方法(例如Baum-Welch法[22])學習復雜HMM參數需要超大規模的數據集,不適合S船廠的具體數據條件,因此本文采用有監督的方法學習HMM的參數,步驟如下.
步驟1計算轉移模型P(Xt|Xt-1).通過頻率估計概率,統計訓練集中,狀態變量由時刻t-1時的Xt-1=i,變為在時刻t下Xt=j的頻數aij,則轉移模型的元素表示為
(7)
步驟2計算觀察模型P(Ot|Xt).通過頻率估計概率,統計訓練集中,時刻t時狀態變量為Xt=i,同時觀察變量Ot=k的頻數bik,則觀察模型的元素表示為
(8)
步驟3按均勻分布設置P(X0).由于HMM的魯棒性,先驗概率分布P(X0)對于推理結果的影響不大,所以可以直接規定這一分布為均勻分布.
步驟4修正轉移模型.分段建造的一般過程是組裝-預舾裝-沖砂打磨-噴漆-預總組,但是一些加工需要返工,因此各個工藝之間都存在互相之間轉移的可能,應該為轉移模型中相對應的元素設置一個不為0的小正數作為其最小值;又因為在正常的加工中工藝環節隔得越遠,二者之間越不可能返工,所以這個小正數可以隨著工藝隔得越遠而越小.
步驟5修正觀察模型.一個場地能完成的工藝是有限的,觀察模型描述了場地與分段狀態之間的對應關系,如果統計表明某個場地未曾存在過某項工藝,就說明對應的元素值確實為0;如果統計表明某個場地未曾存在過某項周轉,并不能說明該場地不可能承擔該項周轉任務,相應的元素最小值應設置一個不為零的小正數;多個場地屬于室內車間,空間狹窄,限制較多,并不會承擔分段的周轉任務,這種事件在目前的訓練集中沒有發生過,可以認定這些場地內并不會發生周轉,因此將觀察模型中相應的元素設置為0.
(3) 分段狀態序列推理.單獨計算每個時刻各個狀態的濾波或平滑的后驗概率,并不能得出最優的狀態序列推理,因此必須考慮所有時間片的聯合概率.Viterbi算法[20]解決了這一問題,通過記錄到達當前狀態的有最大后驗概率的前端狀態序列,利用到達Xt+1的各個取值最可能的狀態序列與到達Xt的各個取值最可能的狀態序列之間的遞歸關系,求得有最大聯合概率的狀態及其所對應的前端狀態序列為

P(Xt+1|xt)P(ot+1|Xt+1)=
(9)
式中:o1:t為o1,o2, …,ot的簡寫;P(x1, …,xt,Xt+1,o1: t+1)為一個n元向量,其第i個元素的值為P(x1, …,xt,Xt+1=i,o1: t+1).
表2和表3分別展示了HMM1的轉移模型和部分觀察模型,用以舉例說明基于Viterbi算法的分段狀態識別方法.依據HMM1進行某一分段的最可能分段狀態序列推理,其觀察變量序列的值(o1,o2,o3)是已知的,具體為(1, 13, 9),即(A場,G場,I場).

表2 HMM1的轉移模型Tab.2 Transition model of HMM1

表3 HMM1的部分觀察模型Tab.3 Part of observation model of HMM1
因為o1=1,根據聯合概率分布的鏈式規則,以及貝葉斯網絡中所有節點條件都獨立于父節點以外的其他節點, 所以有
P(X1,o1)=P(o1|X1)P(X1)=


(10)
若觀察到的場地序列到此為止,則由式(9)可知,最可能的分段狀態序列為X1=3,即預舾裝,其與觀察序列同時發生的聯合概率為0.040;此外,還有可能是X1=1,即堆場周轉,聯合概率為0.021,或者X1=2,即組裝,聯合概率為0.028.其他分段狀態的概率較低.
因為o2=13,所以有
(11)
其中第3行的的因子〈0.021 0.028 0.040 0.0 0.0 0.0〉對應了x1=1, 2, 3, 4, 5, 6時P(o1|x1)P(x1)的值,已經在式(10)中求出;第4行第1個元素代表X2=1時對應的最可能的分段狀態序列的聯合概率,為了求得最可能的前序分段狀態,需要以x1為自變量求這一元素的最大值,通過遍歷可知x1=2時這一元素取得最大值,0.028為P(o1|x1)P(x1)在x1=2時的取值,0.54為P(X2|x1)在x1=2,X2=1時的取值;類似地,第4行其余5個元素分別代表代表X2=2, 3, 4, 5, 6時對應的最可能的分段狀態序列的概率.
若觀察到的場地序列到此為止,則由式(11)可知,最有可能的分段狀態序列為X1=2,X2=1,其與觀察序列同時發生的聯合概率為0.001 361.另一個可能的分段狀態序列是X1=2,X2=2,對應的聯合概率為 0.000 481 6;其他序列的聯合概率均較低.
因為o3=9,所以有


(12)
式中:第3行的因子0.000 1×〈13.61 4.816 0.0 0.0 0.0 0.0〉對應了x2=1, 2, 3, 4, 5, 6時P(o1|x1)P(x1)P(o2|x2)P(x2|x1)的值,這一值已經在式(11)中求出.
因為觀察到的場地序列到此為止,所以由式(12)可知,最可能的分段狀態序列為X1=2,X2=1,X3=1,即(組裝,堆場周轉,堆場周轉),其與觀察序列同時發生的聯合概率為 0.000 022 05.另一個可能的分段狀態序列為X1=2,X2=2,X3=2,即[組裝,組裝,組裝],聯合概率為 0.000 018 64;其他序列的聯合概率較低.
以上這一計算實例如圖4所示,其中,箭線表示分段狀態在相鄰時刻間轉化的所有類型,這是一個全連接;實箭線表示當前觀察變量條件下最可能的分段狀態轉化類型,其起點分段狀態是終點分段狀態的最佳前序分段狀態;在完成最后一個時間的分段狀態推理后,由于X3=1對應了最大的聯合概率,因此可以認為堆場周轉為t=3時的分段狀態,通過實箭線反推出整個分段狀態序列,在圖中將這一序列對應的箭線和分段狀態標紅.這樣就基于Viterbi算法實現了分段狀態識別.

圖4 利用HMM1和Viterbi算法推理某個分段的分段狀態Fig.4 Reasoning of states of a block using HMM1 and Viterbi algorithm
將2.2節中獲得的4個HMM應用于測試集,推理分段狀態序列,并驗證其準確率和兩類非生產性轉運數量,結果如表4和表5所示.由于堆場周轉的具體類型不影響轉運性質的判斷,所以基于HMM2和HMM4獲得的分段狀態推理結果還需要一步后處理, 即將目前按緊隨的工藝分類的堆場周轉退化為堆場周轉大類,再計算狀態識別準確率.

表4 4個HMM推理的分段狀態結果Tab.4 Results of states of blocks predicted by 4 HMMs

表5 4個HMM推理的兩類非生產性轉運數Tab.5 Results of 2 types of unproductive transfers predicted by 4 HMMs
可以看出:首先,在測試集上,4個HMM均有較高的分段狀態識別準確率,這說明了將HMM應用在分段狀態識別問題上是有效的,分段轉運過程很大程度上滿足HMM的3個先驗假設,即馬爾可夫假設,穩態過程假設和傳感器馬爾可夫假設.然后,HMM4在分段狀態序列推理時具有最高的準確率,HMM2略微次之,HMM3再次,HMM1的效果最差.因此按緊隨的工藝區分堆場周轉、區分分段狀態的耗時均有助于提高識別的準確率,HMM4效果更明顯.最后,HMM2獲得的第一類非生產性轉運數量最準確,HMM1次之;HMM4推理的第二類非生產性轉運數量較準確,HMM2次之.因此,HMM2在分段狀態推理、第一類非生產性轉運推理和第二類非生產性轉運的推理上都有較好的應用效果.
為了驗證本文方法的準確率,選用典型的機器學習算法——支持向量機(Support Vector Machine, SVM)作為對照.應用方案1~4提供的狀態變量Xt和觀察變量Ot,并規定t<1時,有Xt= 0,Ot= 0.以某個分段狀態Xt的前2個分段狀態Xt-2,Xt-1以及最近的3個觀察變量Ot-2,Ot-1,Ot為輸入特征,以Xt為輸出值,以訓練集學習每個方案對應的SVM分類器,記為SVMs,s=1, 2, 3, 4.使用測試集對4個支持向量機分類器進行準確率測試,與基于HMM的方法的分段狀態識別準確率比較,結果如圖5所示.由圖可見,與基于SVM的分段狀態識別方法相比,本文提出的基于HMM的識別方法在分段狀態識別的準確率和魯棒性上有明顯優勢.

圖5 HMM與SVM方法的分段狀態識別準確率對比Fig.5 Comparison of recognition accuracy of HMMs and SVMs
訓練集和測試集來源于船廠實際的分段時空數據,現有的4個HMM在測試集上的準確率均較高,船廠的分段生產規律是長期較為穩定的.實驗表明HMM2在識別兩類非生產性轉運上的表現良好,又因為HMM方法本身具有的魯棒性,綜合考慮,本文可采用HMM2作為分段轉運監測使用的推理模型.
上文提出了基于分段時空數據的分段狀態識別方法,并在測試集上驗證了其準確率.接下來,通過將這一方法應用到船廠實際的分段時空數據上,實現兩類非生產性轉運的監測,根據監測結果為優化船廠分段轉運過程提出初步建議,驗證本文方法的有效性.
以S船廠23個月的分段時空數據為樣本,這一數據集的形式如表6所示,包括船號、分段號、轉運日期、起點場地和終點場地;從表中可以大致看出303號船的134號分段、317號船的810號分段以及446號船的685號分段所經歷的分段位置變化過程.這一數據集涵蓋 9 984 個分段的 70 420 次轉運對應的起點和終點場地.逐月轉運次數如圖6所示.

圖6 S船廠逐月分段轉運次數Fig.6 Monthly block transfers in S shipyard

表6 S船廠部分分段時空數據樣本Tab.6 Samples of time-site data of blocks in S shipyard
將HMM2應用在船廠分段時空數據上進行分段狀態識別,并逐月監測兩類非生產性轉運.對第一類非生產性轉運情況進行逐月監測,計算第一類非生產性轉運率,結果如圖7所示.在23個月的觀察期內,船廠中與堆場周轉相關的轉運中,第一類非生產性轉運率平均值為62.5%,最高達到72%,這一比率在次年有所下降,但始終保持在52%以上,遠高于現有研究給出的10%~30%的理論值,亟待通過優化船廠堆場調度策略、降低堆場負載率、降低分段在堆場的平均周轉期、放松分段進出場時間約束等手段,減少第一類非生產性轉運.

圖7 第一類非生產性轉運逐月情況監測Fig.7 Monthly monitoring results of Type I unproductive transfers
對第二類非生產性轉運情況進行逐月監測,并計算各個工藝的開工數(ns)、返工數(nr)和返工開工比(r),結果如圖8所示.在觀察期內,組裝的返工數和返工開工比一直處于高位,且返工開工比在次年的1月和2月間突然升高,這種異常情況被監測到后,可以提示管理者及時加強組裝后的驗收環節,提高組裝場地的調度水平,避免在組裝上產生過多的返工,減少第二類非生產性轉運.

圖8 第二類非生產性轉運逐月情況監測Fig.8 Monthly monitoring results of Type II unproductive transfers
針對S船廠中現有監測技術難以從分段時空數據中獲取分段狀態且難以監測兩類非生產性轉運的問題,本文在領域專家對船廠的部分分段時空數據進行分段狀態標注的基礎上,研究了轉運過程中分段狀態的時序關系和耗時特征.進而選用HMM作為時序概率推理工具,建立了4個HMM并使用有監督的方法學習其參數,通過Viterbi算法實現了分段狀態識別,以區分堆場周轉和耗時為特點的HMM4在測試集上準確率最高,達到了93.5%;以區分堆場周轉、不區分耗時為特點的HMM2在分段狀態識別和兩類非生產性轉運監測上都有較好的表現.將HMM2應用于船廠分段時空數據,識別了分段狀態,實現了船廠兩類非生產性轉運的監測,監測結果顯示目前船廠分段堆場中第一類非生產性轉運率過高,組裝的返工開工比較高并在個別月份突增,需要針對性優化.