控制圖經濟設計的隨機梯度優化方法

2022-06-27 10:31:31張公伯彭一杰楊書淮

預測 2022年3期

張公伯彭一杰楊書淮

摘要：控制圖作為一種實施統計過程控制的工具，在現代制造業的質量管理中具有廣泛應用。控制圖的經濟設計可以提高過程控制效率，降低過程控制成本。本文提出一種基于隨機梯度估計的控制圖經濟設計優化方法，首先應用廣義似然比法估計平均運行成本的梯度，并分別結合逐步增加仿真樣本量和隨機化仿真樣本量的隨機近似方法得到控制圖的最優控制上界。最后，重點展開介紹了本文提出的控制圖經濟設計方法在休哈特控制圖和指數加權移動平均控制圖中的應用。

關鍵詞：控制圖;隨機梯度估計;廣義似然比法;隨機近似

中圖分類號：F273.2文獻標識碼：A文章編號：2097-0145（2022）03-0045-08doi：10.11847/fj.41.3.45

Stochastic Gradient Method for Economic Design of Control Charts

ZHANG Gong-bo1， PENG Yi-jie1， YANG Shu-huai2

（1.Guanghua School of Management， Peking University， Beijing 100871， China; 2.College of Engineering， Peking University， Beijing 100871， China）

Abstract：As a tool for statistical process control， control chart has been widely used in quality management in modern manufacturing. The economic design of a control chart can improve the efficiency and lower the cost of process control. This paper proposes a gradient-based simulation optimization method for economic design of control charts. In the first part， the generalized likelihood ratio method is used to obtain the gradient estimate of the average running cost. Then two stochastic approximation methods with increasing sample size in iterations and randomized sample size are utilized respectively to obtain the optimal upper control limit. In the end， the paper applies the proposed method to Shewhart and exponentially weighted moving average control charts.

Key words：control chart; stochastic gradient estimation; generalized likelihood ratio method; stochastic approximation

1 引言

當今世界正高速邁入以數字化、智能化為特點的新階段，人們對產品和服務質量的重視程度不斷提高。統計過程控制作為一種應用統計方法對生產和服務過程進行評估和監控，從而保證產品和服務符合規定要求的質量管理技術，已廣泛應用于制造業和服務業。控制圖是一種實施統計過程控制的工具，它是基于系統運行中測定的關鍵特性值，通過繪制相應的系統特性值統計圖，并根據假設檢驗原理判斷系統是否處于控制狀態的統計圖形方法。控制圖的概念最早由休哈特[1]提出，在統計過程控制領域中備受學界和業界關注。近年來，控制圖廣泛應用于集成電路制造[2]、醫學與流行病學[3]、畜牧業養殖管理[4]、鐵路接觸網檢測[5]和臨床化學質量控制[6]等領域。

系統平均運行長度（Average Run Length， ARL）是普遍使用的控制圖統計性評價指標，它是系統偏移或宣告失控前所需要的平均觀測周期數。蒙特卡洛仿真、積分方程和馬爾可夫鏈方法可以估計控制圖的平均運行長度[7]。對控制圖進行優化設計和敏感性分析是統計質量控制中具有挑戰性的問題。受生產人員、機械設備、生產環境和原材料等因素的影響，生產過程會突發故障處于失控狀態，將影響制造產品的質量，導致產品異常損耗及故障維修成本。控制圖的參數設計往往會影響樣本的抽樣和檢測、生產過程異常排查及維修等控制措施的成本。在控制圖統計性質的基礎上，需要考慮控制圖的經濟設計，在提高控制圖監控效率的同時，降低監控過程產生的成本，維持生產過程處于受控狀態，減少制造階段因產品異常帶來的損失，提升控制圖的經濟效益。Lorenzen和Vance[8]提出了一種靜態控制圖經濟設計的成本函數模型。有關可變抽樣區間和可變樣本容量的動態控制圖經濟設計的研究，可參考文獻[9～11]。這些研究往往通過馬爾科夫鏈方法估計控制圖的平均運行長度，采用遺傳算法等啟發式算法優化成本目標函數求解最優設計參數。

控制圖的優化問題屬于復雜隨機系統優化問題，其目標函數的解析表達通常未知且含有大量系統設計變量。蒙特卡洛仿真得到的系統樣本表現可以估計目標函數。梯度包含了目標函數隨參數變化的信息，在迭代搜索優化算法和敏感性分析中有著重要的應用。通過蒙特卡洛仿真估計的隨機系統中目標函數關于參數的梯度稱為隨機梯度估計。常用的無偏隨機梯度估計方法有無窮小擾動分析法[12]，似然比法[13]和弱導數法[14]。無窮小擾動分析法無法解決樣本表現不連續的問題，而似然比法和弱導數法無法解決樣本表現帶有結構參數（出現在樣本路徑與系統表現度量的函數關系中的參數）的問題。控制圖的控制邊界屬于結構參數，且蒙特卡洛仿真得到的系統樣本表現關于控制邊界不連續，無法保障常用的隨機梯度估計方法的無偏性。Peng等[15，16]提出的廣義似然比法為無偏隨機梯度估計，該方法既適用于帶有結構參數和不連續的樣本表現的問題，同時具有無偏性和單樣本軌道性。A67D4071-5767-49FE-868D-67CB7CFF2701

采用隨機梯度估計方法優化設計控制圖的現有研究具有局限性。Lele[17]采用有限差分法分別估計指數加權移動平均和貝葉斯控制圖的梯度，但有限差分法得到的梯度是有偏的，且需要選取攝動值的大小，在處理高維參數向量時需要很大的計算量。Fu等[18，19]采用平滑擾動分析法得到指數加權移動平均控制圖的無偏梯度估計和控制圖經濟設計的最優控制邊界，但平滑擾動分析法需要解析地計算一個條件期望，在實際應用中需要視控制圖的設定而選取適當的條件。Peng等[15，16]采用廣義似然比法得到指數加權移動平均控制圖的無偏梯度估計，但沒有考慮控制圖的經濟設計問題。本文提出一種考慮過程平均運行長度和控制成本的控制圖經濟性評價指標，并提出一種基于隨機梯度估計的控制圖經濟設計方法。本文首先采用廣義似然比法估計控制圖平均運行成本的梯度，解決了常用的隨機梯度估計方法不適用及需要取條件期望的問題，提供了成本目標函數隨控制圖設計參數變化的梯度信息，豐富了對控制圖進行經濟優化設計的方法。進而考慮服從正態分布和均勻分布的質量特性值，通過逐步增加仿真樣本量和隨機化仿真樣本量的隨機近似方法得到控制圖經濟設計的最優控制邊界，同時討論了兩種隨機近似方法的理論性質。并以休哈特（Shewart）和指數加權移動平均（Exponential Weighted Moving Average， EWMA）控制圖的應用為例，說明提出方法的有效性。

2 問題構建

考慮包含單個可測的系統過程變量的控制圖，其中系統過程變量具有穩定的受控狀態和不穩定的失控狀態。系統失控時間τ不可觀測，其累積分布函數為F0。控制圖的采樣間隔時間為Δ。在每個采樣點，可以觀測到系統的檢驗統計量：Y1=X1;Yi=（Xi，Yi-1;θ），i>1，其中θ∈Θ為控制圖設計參數，Xi為第i個仿真輸出的質量特性值，是與系統參數無關的馬爾可夫鏈的轉移函數。系統處于穩定的受控狀態時，Xi的累積分布函數為F1;系統處于不穩定的失控狀態時，Xi的累積分布函數為F2。

例1 休哈特控制圖：Yi=Xi，i1。

例2 指數加權移動平均控制圖：Y1=X1;Yi=αXi+（1-α）Yi-1，i2，0<α1。

令θ1，i和θ2，i分別為第i個檢驗統計量的控制下界和控制上界。控制圖的設計參數為控制界限：θ=θ1，i或θ=θ2，i。當檢驗統計量Yi偏移至控制界限之外時，判定系統處于不穩定的失控狀態。判定系統處于失控狀態的時間為：

N=min{i：Yi[θ1，i，θ2，i]}，即檢驗統計量Yi不在控制界限內的停時，是一個離散型隨機變量。控制圖的平均運行長度是判定系統處于失控狀態的時間的期望，即

ARL（θ）=E[N]

=∑∞n=1nPr（N=n）=∑∞n=1nE[1（N=n）]（1）

其中1（·）為示性函數，Pr（·）為括號中事件發生的概率。ARL（θ）作為控制圖的一種統計性評價指標，沒有考慮成本等經濟因素。如下提出一種考慮系統在失控狀態下的產品損耗及判定系統處于失控狀態時的維修成本的控制圖經濟性評價指標。假設系統處于不穩定的失控狀態時，由于制造流程出現異常，生產產品的質量無法得到保障，每單位時間支付損耗成本c;當判定系統處于失控狀態時，需一次性支付系統維修成本C。當系統完成維修時，系統會恢復正常運行狀態，因此，該過程可以視為一個再生過程。每進行一次循環，該過程的成本期望值為：cE[（N-「τ/Δ）+]+C，其中「x為向上取整函數;若x0，（x）+=x，反之，（x）+=0。單位時間內的平均運行成本可以表示為

C（θ）=cE[（N-「τ/Δ）+]+CE[N]

C（θ）是一種控制圖的經濟性評價指標。可以觀察到，增大控制圖的控制上界與控制下界之間的距離會導致判定系統處于失控狀態的頻率降低，從而減少一次性維修成本;但同時會增加系統處于不穩定的失控狀態的時間，導致更大的單位時間產品異常成本。因此，優化設計最優的控制界限可以實現產品損耗成本與系統維修成本的平衡。在給定產品損耗成本c、系統維修成本C的條件下，通過優化設計控制圖的控制界限θ，達到極小化單位時間的平均運行成本C（θ）的目標，即θ*=arg minθC（θ）。隨機近似方法是一種基于梯度的參數優化方法，適用于優化求解高維參數。本文采用隨機近似方法搜尋控制圖的最優控制界限θ*。參數的第k次迭代可以表示為：

θ（k+1）=θ（k）+αkC^k（θ（k）），其中αk為第k次迭代的步長，C^k（θ（k））為C（θ）/θ|θ=θ（k）的估計量

C（θ）θ=cE[（N-「τ/Δ）+]θE[N]-（cE[（N-「τ/Δ）+]+C）E[N]θ（E[N]）2

注意到C（θ）/θ的計算中包含E[N]/θ和E[（N-「τ/Δ）+]/θ。記E[N]/θ=E[G1（θ）]，E[（N-「τ/Δ）+]/θ=E[G2（θ）]。由于通過仿真得到的N關于控制圖的控制界限θ不連續，無窮小擾動分析法、似然比法和弱導數法均不適用。本文采用的廣義似然比估計法可以在仿真N的同時，分別得到隨機梯度的單樣本無偏估計量G1（θ）和G2（θ）。將仿真得到的估計量代入C（θ）/θ中，得到梯度估計C^k（·）

C^k（θ）=c∑ki=1G2，i∑ki=1ni-（c∑ki=1（ni-「τ/Δ）++kC）∑ki=1G1，i（∑ki=1ni）2

C^k（·）是由若干估計量構成的非線性函數，通常不是C（θ）/θ的無偏梯度估計量。梯度估計

C^k（·）與真實梯度C（θ）/θ之間的偏差可以通過增加仿真樣本數量的方法進行消除，即滿足漸近無偏性：limk→∞ E[C^k（θ）]=C（θ）/θ。

3 基于廣義似然比法的無偏梯度估計

本節給出當仿真輸出的質量特性值Xi分別服從正態分布和均勻分布時，采用廣義似然比法得到的E[N]/θ和E[（N-「τ/Δ）+]/θ的單樣本無偏梯度估計量。A67D4071-5767-49FE-868D-67CB7CFF2701

3.1 質量特性值服從正態分布的廣義似然比估計量

假設質量特性值Xi處于穩定的受控狀態時，服從均值μ1，方差σ21的正態分布;質量特性值Xi處于不穩定的失控狀態時，服從均值μ2，方差σ22的正態分布。（1）式中的N可以改寫為

N=min{i：Yi[θ1，θ2]}

=min{i：gi（X1，…，Xi;θ）[0，1]}

其中gi（X1，…，Xi;θ）=（Yi-θ1）/（θ2-θ1），i1。則1（N=n）=（∏n-1i=11（0gi（X1，…，Xi;θ）1））×（1-1（0gn（X1，…，Xn;θ）1）），∏0i=11。取條件于τ/Δ=z，Xi的條件概率密度為：

fi（xi|z）=1（i

記Jg（x（n）;θ）g（x（n）;θ）為g（g1（x1;θ），g2（x1，x2;θ），…，gn（x1，x2，…，xn;θ））′的雅克比矩陣。如果Jg（x（n）;θ）是可逆矩陣且g（x（n）;θ）二階連續可微，采用廣義似然比法得到

E[N]θ=∑∞n=1nE[1（N=n）]θ=∑∞n=1nE[1（N=n）w（X（n）;θ）]

其中w（X（n）;θ）=lnf（x（n）;θ）/θ+d（x（n）;θ）。d（x（n）;θ）=∑ni=1（J-1g（x（n）;θ）xiJg（x（n）;θ）J-1g（x（n）;θ）ei）′θg（x（n）;θ）-tr（J-1g（x（n）;θ）θJg（x（n）;θ））-（θg（x（n）;θ））′J-1g（x（n）;θ）x（n）ln f（x（n）;θ）。

qJg表示對Jg矩陣中與q有關的元素求導數，ei為第i個元素為1的單位向量，tr表示矩陣的跡。

x（n）ln f（x（n）;θ）=（ln f（x（n）;θ）/x1，…，ln f（x（n）;θ）/xn）′

=-（xi-μ1σ211（i

采用廣義似然比法分別得到E[N]/θ和E[（N-「τ/Δ）+]/θ的單樣本無偏梯度估計量為：Gnormal1（θ）=N×w（X（n）;θ），Gnormal2（θ）=（N-「τ/Δ）+×w（X（n）;θ）。

例3 考慮常數的控制圖界限，即：θ1，i=θ1，θ2，i=θ2。在給定控制圖的控制下界θ1的條件下，優化設計控制圖的控制上界θ=θ2。當仿真輸出的質量特性值Xi服從正態分布時，對于指數加權移動平均控制圖，

w（X（n）;θ）=Nθ2-θ1-（θg（x（n）;θ））′J-1g（x（n）;θ）x（n）ln f（n）（x（n）;z）|n=N，x（n）=X（n），其中θg（x（n）;θ）=-1θ2-θ1（g1（x1;θ），g2（x1，x2;θ），…，gn（x1，x2，…，xn;θ））′，

Jg=1θ2-θ1×11-α… （1-α）n-2（1-α）n-1

0α…α（1-α）n-3α（1-α）n-2

00… αα（1-α）

00… 0αn×n

當α=1時，Jg為單位矩陣，可以相應地得到休哈特控制圖的單樣本無偏梯度估計量。

3.2 質量特性值由均勻分布驅動的廣義似然比估計量

均勻分布隨機數可以產生服從任意分布的隨機數，考慮由均勻分布驅動的質量特性值具有更廣泛的應用場景。假設質量特性值Xi處于穩定的受控狀態時的累積分布函數為F1（·）;質量特性值Xi處于不穩定的失控狀態時的累積分布函數為F2（·）。仿真輸出的質量特性值由獨立同分布的服從均勻分布U（0，1）的隨機變量構成的向量U（n）=（U1，U2，…，Un）驅動。（1）式中的N可以改寫為：N=min{i：Yi[θ1，θ2]}=min{i：Zi[0，1]}，其中Zi=（Yi-θ1）/（θ2-θ1），i1。{Yi，i1}是一條馬爾科夫鏈，則{Zi，i1}也是一條馬爾可夫鏈：Z1=h1（U1;θ），Zi=（Zi-1，hi（Ui;θ））。（1）式中：1（N=n）=（∏n-1i=11（0Zi1））×（1-1（0Zn1）），∏0i=11。記Jh=Th為h（h1（u;θ），…，hn（u;θ））′的雅克比矩陣。如果Jh是可逆矩陣且h二階連續可微，采用廣義似然比法得到

E[N]θ=∑∞n=1nE[1（N=n）]θ

=∑∞n=1n∑ni=1E[（∏n-1j=11（0Z+ij1））×（1-1（0Z+in1））×ri（1-;θ）]-

∑∞n=1n∑ni=1E[（∏n-1j=11（0Z-ij1））×（1-1（0Z-in1））×ri（0+;θ）]+

∑∞n=1nE[（∏n-1i=11（0Zi1））×

（1-1（0Zn1））×dn（U（n）;θ）]

其中{Z+ij，j1}和{Z-ij，j1}是分別由U（n）i（U1，…，

1-第i個元素，

…，Un）和U（n）i（U1，…，0-第i個元素，…，Un）通過{Zi，i1}相應生成的馬爾可夫鏈。ri（u;θ）=（J-1h（u;θ）θh（u;θ））′ei，i=1，…，n。dn（u;θ）=∑ni=1ei′J-1h（u;θ）（uiJh（u;θ））J-1h（u;θ）θh（u;θ）-tr（J-1h（u;θ）θJh（u;θ））。qJh表示對矩陣Jh中與q有關的相應元素求導數，x-和x+分別為x的左極限和右極限。A67D4071-5767-49FE-868D-67CB7CFF2701

對任意函數h～（·），記h～（x-）limx→x-h～（x），h～（x+）limx→x+h～（x）。

結合文獻[20]的隨機化方法，令N′1為概率質量函數f～的離散隨機變量，得到

E[N]/θ的單樣本無偏梯度估計量為

Guniform1（θ）=N′×（SN′（U（N′））+DN′（U（N′）））/f～（N′）

E[（N-「τ/Δ）+]/θ的單樣本無偏梯度估計量為

Guniform2（θ）=（N′-「τ/Δ）+×（SN′（U（N′））+

DN′（U（N′）））/f～（N′）

其中Dn（U（n））=（∏n-1i=11（0Zi1））×

（1-1（0Zn1））×dn（U（n）;θ）

Sn（U（n））=∑ni=1（∏n-1j=11（0Z+ij1））×

（1-1（0Z+in1））×ri（1-;θ）-

∑ni=1（∏n-1j=11（0Z-ij1））×

（1-1（0Z-in1））×ri（0+;θ）

例4 考慮例3中的控制圖優化設計問題。當仿真輸出的質量特性值Xi的分布由均勻分布驅動時，對于指數加權移動平均控制圖，馬爾可夫鏈{Zi，i1}可以表示為：Z0=0，Zi=（1-α）Zi-1+hi（Ui;θ），i1。其中hi（Ui;θ）=αθ2-θ1[1（i<τ/Δ）F-11（Ui）+1（iτ/Δ）×F-12（Ui）-θ1]。進而得到

ri（u;θ）=-1θ2-θ1[1（i<τ/Δ）F-11（ui）f1（F-11（ui））+1（iτ/Δ）F-12（ui）f2（F-12（ui））-θ1]

dn（u;θ）=1θ2-θ1∑ni=1[1（i<τ/Δ）F-11（ui）f1（F-11（ui））+

1（iτ/Δ）F-12（ui）f2（F-12（ui））+1]

當α=1時，Zi=hi（Ui;θ），i1，可以相應地得到休哈特控制圖的梯度估計量。

4 基于隨機近似方法的最優控制上界求解

本節通過隨機近似方法求解控制圖經濟設計的最優控制上界，在消除梯度估計量與真實梯度之間的偏差的同時，達到極小化控制圖的單位時間內的平均運行成本的目標。考慮逐步增加仿真樣本量和隨機化仿真樣本量的兩種隨機近似方法，并討論相應的理論性質。

4.1 逐步增加仿真樣本數量

該方法在參數優化迭代時，使用逐步增加仿真樣本數量的方法計算C^k（θ）。為了證明逐步增加仿真樣本數量的隨機近似方法的全局最優性，提出如下假設：①C（θ）是θ∈R的嚴格凹函數;②C^k（θ）的二階矩一致有界，即：supk∈NE[supθ∈RC^2k（θ）]<∞;且C^k（θ）是漸近無偏的，即：limk→∞E[C^k（θ）]=C（θ）/θ+limk→∞ Γk（θ）=C（θ）/θ，其中Γk（θ）為殘差項;③步長序列與偏差序列滿足：∑∞k=1αk=∞，∑∞k=1α2k<∞，∑∞k=1αkβk<∞和βk=supθ∈R|Γk（θ）|。

定理1 如果條件①～③成立，則limk→∞θ（k）=θ*，a.s.，其中a.s.表示幾乎處處。

證明令Πk（θ（k）-θ*）2，則E[Πk+1|θ（k），…，θ（1）]=Πk+2αkζk+α2kE[C^2（θ（k））]=Πk+2αk（ζ+k+ζ-k）+α2kE[C^2（θ（k））|θ（k））]，其中ζk（C（θ）/（θ|θ=θ（k）+Γk（θ（k）））（θ（k）-θ*），ζ+k12（ζk+|ζk|），ζ-k12（ζk-|ζk|）。令{kt}是滿足ζ+kt≠0的子序列，則

|C（θ）θ|θ=θ（kt）<|Γkt（θ（kt））|

由條件①和③

limt→∞（θ（kt）-θ*）=0， limk→∞∑∞t=kαtζ+t=0

令ΠkΠk+2∑∞t=kαtζ+t+∑∞t=kα2tE[C^2（θ（t））|θ（k），…，θ（1）]0，{Πk}是正的上鞅，因為E[Πk+1|θ（k），…，θ（1）]=Πk+2αkζ-kΠk。由條件②和③

limk→∞∑∞t=kα2tE[C^2（θ（t））|θ（k），…，θ（1）]=0

根據鞅收斂定理[21]，存在隨機變量Π，使得

limk→∞Πk=limk→∞Πk=Π， a.s.

注意到

E[Πk]=E[Π1]+2E[∑kt=1αtζt]+∑kt=1α2tE[C^2（θ（t））]

由條件①，對任意δ>0，存在ε>0，使得

sup|θ-θ*|>δ|C（θ）/θ|>ε

若Pr（Π=0）≠1，則

∑∞k=1αkζk=∑∞k=1αt（C（θ）/θ|θ=θ（k）+Γk（θ（k）））（θ（k）-θ*）=-∞以正的概率成立，這與E[Πk]0和∑∞k=1α2kE[C^2（θ（k））]<∞的結論矛盾。因此，Pr（Π=0）=1。綜上所述，定理的結論成立。證畢。

4.2 隨機化仿真樣本數量

該方法在參數優化迭代時，使用隨機化仿真樣本數量的方法計算C^k（θ）。具體地，令C^k（θ）∑kt=1Δt（θ），其中Δt（θ）C^t（θ）-C^t-1（θ），C^00。定義C（θ）∑t=1Δt（θ）/Pr（t），其中是與{C^k（θ）}獨立的離散隨機變量。根據文獻[20]的定理1，C（θ）是C（θ）/θ的無偏梯度估計量，該證明可由limk→∞ E[C^k（θ）]=C（θ）/θ，∑∞t=1E[|Δt（θ）|]<∞，和下述結論得到：如果∑∞t=1E[|C^t-1（θ）-C（θ）/θ|2]/Pr（t）<∞，則C（θ）∈L2，E[C（θ）]=C（θ）/θ，其中L2為平方可積的隨機變量的希爾伯特空間。隨機化仿真樣本數量的方法可能會導致較大的方差[22]，因此需要推導樣本數量的最優隨機分布。C（θ）的方差可以表示為A67D4071-5767-49FE-868D-67CB7CFF2701

E[C2（θ）]=∑∞t=1vt（θ）/Pr（t）

其中vt（θ）E[|C^t-1（θ）-C（θ）/θ|2]-E[|C^t（θ）-C（θ）/θ|2]。令P（N）為支撐集N的分布族，考慮如下有約束的優化問題

infPr∈P（N）：E[]=T{∑∞t=1vt（θ）/Pr（t）}

（2）

優化問題（2）本質上是一個最優控制問題，該問題的最優解即為最優隨機分布。

定理2 如果vt（θ）0，vt（θ）vt+1（θ），優化問題（2）的解為

Pr*（t）=1，1t

（T+1-t*）vt/2/∑∞t=t*vt，tt*

其中t*min{t∈N：T+1-t∑∞l=tvl/vt}。

證明考慮如下離散時間的最優控制問題

inf{μ（t）∈（0，1）：t∈N}{∑∞t=1vt/μ（t）}

s.t. （t+1）-（t）=μ（t）， t∈N

（1）=0， limt→∞（t）=T（3）

建立漢密爾頓函數：H（（t），μ（t），y（t+1），t）vt/μ（t）+y（t+1）μ（t），其中（t）為狀態變量，μ（t）為控制變量。對于t∈N，最優控制μ*（n）滿足極大值原理，其中最優條件：μ*（t）=infμ∈[0，1）H（（t），μ（t），y（t+1），t），伴隨方程：y（t+1）-y（t）=-Hz（（t），μ（t），y（t+1），t）=0。

根據伴隨方程，存在v∈R，y*（t）=v，t∈N。對于t0，雖然控制變量μ*（t）=1滿足最優條件，但不滿足最優控制問題（3）中的約束。因此，v∈R+，且μ*（t）=1，0t

若v1v，則t*=1，limt→∞ *（t）=∑∞t=1vt/v=T，即v=（∑∞t=1vt）2/T2，μ*（t）=Tvt/∑∞l=0vl。

若v1>v，則t*>1，limt→∞ *（t）=t*-1+∑∞t=t*vt/v=T，即v=（∑∞t=t*vt/（T+1-t*））2。因此，t*=min{t∈N：T+1-t∑∞l=tvl/vt}。相似地，可以證明t*>1當且僅當v1>（∑∞l=1vl）2/T2。如果vt非負且非增，則最優控制μ*（t）非增，且limt→∞ μ*（t）=0。因此，Pr*（t）=μ*（t）。證畢。

5 數值實驗

本節通過數值實驗介紹本文提出的控制圖經濟設計方法在休哈特和指數加權移動平均控制圖中的應用。為了方便進行數值實驗，考慮常數的控制圖界限，即：θ1，i=θ1，θ2，i=θ2。在給定控制圖的控制下界θ1的條件下，優化設計控制圖的控制上界θ=θ2。數值實驗在搭載英特爾酷睿i5-11300H處理器的Windows系統計算機上通過Matlab R2021a軟件進行測算。

5.1 質量特性值服從正態分布

假設質量特性值Xi處于穩定的受控狀態時，服從均值為1，方差為1的正態分布;質量特性值Xi處于不穩定的失控狀態時，服從均值為2，方差為4的正態分布。設定系統失控時間τ服從均值為20的指數分布，采樣間隔時間Δ=1，控制圖的控制下界θ1=-1。令損耗成本c=1，系統維修成本C=3。控制圖的初始控制上界θ2=1。設定隨機近似方法迭代步長αk=1/k。設定逐步增加仿真樣本量的隨機近似方法中，第k次迭代使用1000+k個仿真樣本;隨機化仿真樣本量的隨機近似方法中，第k次迭代使用的仿真樣本數量服從成功概率為10-4的幾何分布。對于休哈特控制圖，兩種隨機近似方法分別迭代K=104和K=5×103次。對于不同參數設定的指數加權移動平均控制圖：α=0.2，0.4，0.6，0.8，兩種隨機近似方法分別迭代K=2×103和K=103次。表1展示了兩種隨機近似方法迭代估計的最優參數值θ（K）和分別通過108次獨立仿真實驗估計的初始平均運行成本C（θ（0））和最優平均運行成本C（θ（K））。圖1展示了對于α=0.2的指數加權移動平均控制圖，兩種隨機近似方法迭代得到的樣本軌道。

從表1中可以觀察到，兩種隨機近似方法得到相近的最優控制上界的估計值。通過對控制圖的控制上界進行優化設計，過程的平均運行成本有顯著的下降。雖然逐步增加仿真樣本量的隨機近似方法消耗了更多的迭代次數，但隨機化仿真樣本量的隨機近似方法在每步迭代時隨機消耗均值為104個仿真樣本，導致運算時間更長。例如，在不同參數設定的指數加權移動平均控制圖中，雖然逐步增加仿真樣本量的隨機近似方法的迭代次數是隨機化仿真樣本量的隨機近似方法的迭代次數的2倍，但后者的平均運算時間約為前者的3.5倍（前者：約638.47秒;后者：約2220.00秒）。

（a）逐步增加仿真樣本量（b）隨機化仿真樣本量圖1 α=0.2的指數加權移動平均控制圖控制上界θ2的樣本軌道

5.2 質量特性值由均勻分布驅動

假設質量特性值Xi處于穩定的受控狀態時，服從[-1，1]區間上的均勻分布，即Xi=2Ui-1;質量特性值Xi處于不穩定的失控狀態時，服從[1，2]區間上的均勻分布，即Xi=Ui+1。此時，F-11（Ui）=2Ui-1，F-12（Ui）=Ui+1。相應地，

ri（u;θ）=-1θ2-θ1[1（i<τ/Δ）（ui-12）+

1（iτ/Δ）（ui+1）-θ1]

dn（u;θ）=1θ2-θ1∑ni=1[1（i<τ/Δ）（4ui-2）+1（iτ/Δ）（ui+1）+1]

設定系統失控時間τ服從均值為5的指數分布，其余系統參數設置與5.1節的實驗相同。隨機化方法中的離散隨機變量N′服從成功概率為0.1的幾何分布。設定隨機近似方法迭代步長αk=1/k。設定逐步增加仿真樣本量的隨機近似方法中，第k次迭代使用1000+k個仿真樣本;隨機化仿真樣本量的隨機近似方法中，第k次迭代使用的仿真樣本數量服從成功概率為10-5的幾何分布。對于休哈特控制圖和不同參數設定的指數加權移動平均控制圖：α=0.1，0.3，0.5，0.7，兩種隨機近似方法分別迭代K=5×104次和K=104次。表2展示了兩種隨機近似方法迭代估計的最優參數值和分別通過108次獨立仿真實驗估計的初始平均運行成本C（θ（0））和最優平均運行成本C（θ（K））。圖2展示了對于休哈特控制圖，兩種隨機近似方法迭代得到的樣本軌道。A67D4071-5767-49FE-868D-67CB7CFF2701

從表2中可以觀察到與表1相同的結論，即：兩種隨機近似方法得到相近的最優控制上界的估計值、過程的平均運行成本有顯著的下降。隨機化仿真樣本量的隨機近似方法在每步迭代時隨機消耗均值為105個仿真樣本，導致運算時間更長。在不同參數設定的指數加權移動平均控制圖中，雖然逐步增加仿真樣本量的隨機近似方法的迭代次數是隨機化仿真樣本量的隨機近似方法的迭代次數的5倍，但后者的平均運算時間約為前者的1.2倍（前者：約2.09×104秒;后者：約2.59×104秒）。

6 結論與啟示

本文基于隨機梯度估計方法提出一種控制圖的經濟設計方法。管理者期望在制造生產流程運作的同時實現控制圖界限優化的經濟設計目標。控制圖的經濟性評價指標同時考慮系統失控后的損耗成本和系統判定失控后的維修成本。由于控制圖邊界屬于結構參數且關于控制圖的系統表現不連續，本文采用隨機梯度估計方法中的廣義似然比法估計控制圖的經濟性評價指標關于控制圖界限的梯度。結合逐步增加仿真樣本量和隨機化仿真樣本量的隨機近似方法優化控制圖界限，并討論了隨機近似方法的理論性質。特別地，本文考慮對控制圖控制上界的優化，給出了當質量特性值服從正態分布和其分布由均勻分布驅動時的梯度估計量。在數值實驗中，介紹了本文提出的控制圖經濟設計方法在休哈特控制圖和指數加權移動平均控制圖中的應用，表明了方法的有效性。研究成果為控制圖的經濟優化設計提供了一種新的求解思路。未來的研究可以考慮更多影響系統運行成本的因素。采用強化學習方法對控制圖進行經濟優化設計也是可以進一步研究的方向。

參考文獻：

[1]Shewhart W A. Economic control of quality of manufactured product[M]. Macmillan And Co Ltd， London， 1931.

[2]Hsieh K L， Tong L I， Wang M C. The application of control chart for defects and defect clustering in IC manufacturing based on fuzzy theory[J]. Expert Systems with Applications， 2007， 32（3）： 765-776.

[3]Sego L H. Applications of control charts in medicine and epidemiology[M]. Virginia： Virginia Polytechnic Institute and State University， 2006.

[4]Stewart B， James R， Knowlton K， et al.. An example of application of process control charts to feed management on dairy farms[J]. The Professional Animal Scientist， 2011， 27（6）： 571-573.

[5]程宏波，王佳鑫，劉杰，等.基于改進多元統計控制圖的接觸網狀態綜合評價方法[J].鐵道科學與工程學報，2021，18（11）：3048-3056.

[6]Westgard J O， Barry P L， Hunt M R， et al.. A multi-rule shewhart chart for quality control in clinical chemistry[J]. Clin Chem， 1981， 27（3）： 493-501.

[7]Huang W， Shu L， Jiang W. A gradient approach to efficient design and analysis of multivariate EWMA control charts[J]. Journal of Statistical Computation and Simulation， 2018， 88（14）： 2707-2725.

[8]Lorenzen T J， Vance L C. The economic design of control charts： a unified approach[J]. Technometrics， 1986， 28（1）： 3-10.

[9]Bai D S， Lee K T. An economic design of variable sampling interval X control charts[J]. International Journal of Production Economics， 1998， 54（1）： 57-64.

[10]Chen Y K. Economic design of X control charts for non-normal data using variable sampling policy[J]. International Journal of Production Economics， 2004， 92（1）： 61-74.

[11]Naderkhani F， Makis V. Economic design of multivariate Bayesian control chart with two sampling intervals[J]. International Journal of Production Economics， 2016， 174： 29-42.

[12]Ho Y C， Cao X R. Perturbation analysis of discrete-event dynamic systems[M]. Boston： Kluwer Academic Publisher， 1991.A67D4071-5767-49FE-868D-67CB7CFF2701

[13]Rubinstein R Y. The score function approach for sensitivity analysis of computer simulation models[J]. Mathematics and Computers in Simulation， 1986， 28（5）： 351-379.

[14]Pflug G C. Sampling derivatives of probabilities[J]. Computing， 1989， 42（4）： 315-328.

[15]Peng Y J， Fu M C， Hu J Q， et al.. A new unbiased stochastic derivative estimator for discontinuous sample performances with structural parameters[J]. Operations Research， 2018， 66（2）： 487-499.

[16]Peng Y J， Fu M C， Hu J Q， et al.. Generalized likelihood ratio method for stochastic models with uniform random numbers as inputs[J/OL]. Submitted to Operations Research. Preprint in https：//hal.inria.fr/hal02652068/document， 2020.

[17]Lele S. Steady state analysis of three process monitoring procedures in quality control[D]. Michigan： University of Michigan， 1996.

[18]Fu M C， Hu J Q. Efficient design and sensitivity analysis of control charts using monte carlo simulation[J]. Management Science， 1999， 45（3）： 395-413.

[19]Fu M C， Lele S， Vossen T W. Conditional monte carlo gradient estimation in economic design of control limits[J]. Production and Operations Management， 2009， 18（1）： 60-77.

[20]Rhee C H， Glynn P W. Unbiased estimation with square root convergence for SDE models[J]. Operations Research， 2015， 63（5）： 1026-1043.

[21]Karatzas I， Shreve S. Brownian motion and stochastic calculus[M]. Germaoy： Springer Science & Business Media， 2012.

[22]Cui Z， Fu M C， Peng Y， et al.. Optimal unbiased estimation for expected cumulative discounted cost[J]. European Journal of Operational Research， 2020， 286（2）： 604-618.A67D4071-5767-49FE-868D-67CB7CFF2701

預測2022年3期

預測的其它文章: 科技大數據多元價值鏈模型與價值評估方法; 基于小樣本數據增強的科技文檔不平衡分類研究; 面向科技大數據的科研團隊精準立體畫像生成方法; 基于智能情報挖掘的技術甄別發展現狀及趨勢預測研究; 中國空間站工程技術與管理創新; 考慮多價值鏈協同的電力設備制造企業經營風險預測研究