尹濤 戴昭穎 閆冬 付建新



摘要
公司信息化系統從建設、實施、到穩定運行已經持續近十年的時間,隨著二期項目的實施、新的產品產線不斷擴充,業務量和數據量與建設期相比,都達到了成倍級別地增長,導致系統的響應時間變長,用戶汁系統體驗變差。目前主要是通過硬件擴容、參數調優等一系列定性方法對信息化系統進行優化,不僅投入大量人力物力財力,而且不能從根本上采用定量的方法進行持續優化改善。本文通過采用六西格瑪管理的方法,選取ERP系統為典型示例,對該系統的響應速度進行定量地分析,通過定量的分析方法對影響因子進行改善,從而對指標進行提高,達到定量分析提高信息化系統響應速度的效果。
【關鍵詞】六西格瑪 ERP系統 定量分析 關鍵因子
公司從2008年ERP系統正式上線以來,已經穩定運行將近十年時間。隨著產線增多,業務數據量成倍增加,目前系統數據量約為2.8TB,數據月增長量約為60GB,ERP系統性能較差,后臺執行程序時需要遍歷海量數據,導致查詢報表、接口運行速度緩慢,系統響應時間變長,且對后期新應用會產生影響;系統安全性較弱,數據庫備份、恢復時間長,未來升級停機時間較長,是長期安全隱患;系統運維成本高,包括硬件擴容成本和維護成本都迅速增加。在這種形勢下,我們采用一些措施來提升ERP系統總體性能:提高系統可用性,軟件升級,數據庫重組,數據備份或恢復等系統管理工作可以在較短時間內完成,收益明顯,還可以從增加硬盤、CPU、存儲等投入提高系統性能,但是這些方法只是定性地提高系統響應時間,不能從根本上改善系統的性能,而且會增加大量的硬件投入成本和運維成本。
數據庫的大小很大程度影響著數據庫對于會話的響應時間,通過縮小數據庫加快訪問業務數據的速度。通過使用六西格瑪管理的方法,按月增長量對數據庫的增長空間影響進行相關性分析,將月增長量按照人、機、料、法、環,充分運用頭腦風暴去尋找影響因子,按照影響程度和大小進行權重打分,綜合比較選出最關鍵的影響因子,然后逐個對關鍵因子和指標按照數據類型進行單因子方差、假設檢驗、回歸分析找出函數關系,逐個對因子進行分析和控制,最后達到定量對指標持續有效地改善控制。
1 六西格瑪實施方法
1.1 實施方式
六西格瑪是一種流程改善管理,把質量整合到日常活動中,測量缺陷和變異,用一種持續改進以滿足客戶需求的方法,用一種固有化的流程,包括定義流程/問題、測量流程/問題、分析流程/問題、改善流程/問題、控制流程/問題,而最終的成效定義的指標Y由輸入的關鍵因子X決定,尋找一種對應的函數關系,就可以準確地改善和控制Y:
Y=f(X1,X2,X3,...,Xk)
通過找出的這種函數關系,將生產過程中的實際問題,通過統計學知識轉化為統計問題,將統計學的解決方案轉化成實際的解決方案,即每百萬個出錯機會中有3.4個錯誤,或者合格率為99.9999%,就是達到了六西格瑪的水平。六西格瑪項目啟動過程中,要將項目背景,選題理由,客戶需求分析確定下來,通過輸入輸出流程圖、價值流圖分析宏觀流程,選擇關鍵流程,確定項目范圍。將改善ERP系統響應時間作為六西格瑪方法的目標,而數據庫的響應時間與數據月增長量是線性相關的關系,因此將主要的指標定義為每月增長數據量的縮減率,作為判斷ERP系統運行時間的標準,計算公式如下:
月增長數據量縮減率=縮減數據量/數據增長量*100%
指標的基線、目標和極限的設定標準為,基線為歷史3~6個月穩定數據的平均水平,標桿的設定為行業最高水平、歷史最佳水平和設備的極限。單位缺陷數DPU=全部缺陷數/單位數,百萬機會的缺陷數DPMO=所有缺陷的總數/(單位數*缺陷機會數)*1000000,每百萬機會的缺陷能力指標,主要用于衡量流程的西格瑪水平。
1.2 實施步驟
1.2.1 定義階段
采用條形圖和單值控制圖查看公司ERP系統一年內的平均運行時間,得出事務碼平均響應時間為51.15,超過10S說明系統響應速度緩慢。分析公司ERP系統架構可以看出,說明用戶在前臺執行事務碼,后臺整個架構反映過程,主要分為數據庫順序讀取,CPU計算,網絡交互反應,系統日志切換,其中CPU計算、網絡交互反應、系統日志切換與硬件升級有關,只能對問題進行定性改善,不能做定量分析,不用于六西格瑪的改善分析。因此,分析系統響應速度轉換為分析系統數據量增長情況。如表1所示。
因為數據庫增長量與系統響應速度有相關關系,隨著數據量的增加,系統響應時間不斷增加。根據調用頻次將ERP系統數據增長量分為三部分,調用頻次在100次以上的為調用頻繁數據量,調用頻次在4-100次為正常調用數據量,調用頻次在4次以下為沉寂數據量。按照每年數據增長縮減率的平均水平將基線設定為8.1%。目標設定項目實施完成后提高到37.7%,極限目標按照歷史最高水平設定為40.3%。選取ERP系統中的典型事務碼ZSR016的運行時間作為比較標準。
1.2.2 測量階段
首先從ERP系統后臺監控說明,當前生產系統使用的數據空間與系統在高峰期用戶等待系統響應時間成正比。整個數據管理流程,從用戶需求提報,到數據管理方案設計,再到測試系統歸檔、生產系統歸檔及日常數據增長情況的監控,在這些流程中通過人、機、料、法、環因素找出影響因子,通過因果矩陣、魚骨圖等六西格瑪常用的工具,最終確定六個關鍵因子,分別為用戶對系統性能需求、大數據表增長量、業務數據條目數、數據對象范圍、程序邏輯與算法、清理歷史數據。通過失效模式分析,清理歷史數據作為短期執行可以出現明顯效果的改善因子,因此作為快贏的主要措施,快贏階段結束后,值提升到12.5%,輔助指標響應時間降低一半以上。
1.2.3 分析改善階段
對各個關鍵因子和指標進行量化分析,將不可量化的因子采用召集用戶部門,調研反饋搜集問題點等方式改善。對于可量化的因子,根據離散還是連續的情況采取假設檢驗、單因子方差、回歸分析等六西格瑪定量分析方法。
在用戶對系統性能需求的因子分析過程中,通過搜集各業務部門反饋問題點,整理為四個方面:
(1)業務用戶進行系統變更需求時,職責不明確,造成管理混亂;
(2)用戶數據表查詢效率低,很多數據量是不經常被調用的;
(3)沒有一個明確的細化的用戶數據管理需求提報模板;
(4)規范用戶在系統中的操作,避免產生不必要的負荷。
將這四個問題點展開分析,主數據管理通過查詢頻次、分模塊、分供應商分析,系統變更管理通過職責分工、技術審批、技術實現分析,需求提報規范通過范圍選擇、業務影響、優先順序三方面分析,系統管理辦法通過停機安排、備份時間和恢復時間分析,根據對問題點的分析,提出信息化系統變更管理辦法和主數據維護管理辦法,用戶分模塊需求提報模板,ERP系統管理辦法,將系統維護規范化、合理化、標準化。
在改善大數據表增長量的過程中,由于大數據表增長量是可量化的連續數據,因此需要采用六西格瑪中的假設檢驗分析。假設檢驗是先對總體參數提出一個假設值,然后利用樣本信息推斷這一假設是否成立,假設檢驗是利用小概率事件原理,進行反向推斷,檢驗問題實際就是判斷樣本是來源于哪個總體,由物理問題轉換為數學問題建立一對相對立的假設,可以用樣本均值估計總體均值,因此要研究樣本均值的分布,根據中心極限定理,可以得出總體的方差和均值。
假設檢驗需要建立原假設HO和備擇假設H1,假設的對象是總體參數,不是樣本統計量,選擇檢驗統計量,給出拒絕域的形式,給出顯著性水平a,確定臨界值C,給出拒絕域W,計算置信區間及P值。原假設一定是不需證明的,正常的情況,通常取原假設為等于;備擇假設是我們需要作出判斷的情況。要作出判斷的對象是總體參數,而不是樣本統計量,用樣本統計量對總體參數進行估計,將樣本空間劃分為兩個區域,樣本數據落入拒絕域,就拒絕原假設,落入非拒絕域,就無法拒絕原假設,拒絕是有說服力的,不能拒絕是沒有說服力的。
見表2,由于大數據表增長量與月數據量增長的縮減率都是連續型數據,因此根據假設檢驗采取回歸分析。通過事務碼DB02提取出大于1G的數據表清單,查看月增長情況,將大數據表增長量與縮減率進行回歸分析,如圖1所示P值小于0.05,并且殘差穩定且正態,說明縮減率與大數據表增長量有顯著的相關關系。并且由擬合線圖可以看出縮減率與大數據表增長量呈負相關,從而通過降低大數據表增長量而提高縮減率。通過帕累托圖二八原則,挑選出數據量增長明顯的5個大數據表,用于后續的分析改善。提高縮減率的改善措施為數據避免和數據刪除,將5個大數據表進行相應業務歸類,在系統中進行后臺配置關閉和刪除處理。根據數據增長量進行控制,減少系統維護的壓力和成本。
在改善業務數據條目數的過程中,查看上半年接口報錯的日常監控日志,由于接口日志報錯和用戶業務數據操作錯誤,導致業務系統條目數成倍增長。正常的業務條目數不能避免,但是用戶執行一次誤操作,會產生三條以上的業務條目數和錯誤日志。將業務數據條目數與縮減率進行相關和回歸分析,并且做擬合線圖,得出P<0.05,縮減率與數據條目數負相關,殘差穩定且正態。
提高縮減率,需要降低業務數據條目數。降低業務條目數有三種途徑,進行創建控制、及時關閉訂單、控制訂單數量,核心問題為規范用戶操作。分模塊制定8份業務用戶操作手冊,指導用戶正常操作,避免產生無效的條目數,從而提高縮減率。在確定數據對象范圍過程中,ERP系統有2萬多張數據表,按數據表進行管理時,會造成數據管理流程混亂,并且要從官方數據對象中篩選相應業務的數據對象。按照公司己有的業務模塊,結合數據表相關性分析,根據業務完整性和先后性對數據對象進行分類和排序。通過DB15和TAANA兩個事務碼操作,找出數據表與數據對象一一對應關系,最終選出20個合理的數據對象,大大提高管理效率,提高數據縮減率。在優化程序邏輯與算法中,因為ERP系統原有程序存在運行緩慢,運行結果錯誤,測試不充分等問題,影響系統的性能和縮減率,這些都與程序的邏輯和算法有關。因此要優化算法、制定標準。程序算法要滿足兩個邏輯,一個是對數據的清理邏輯,另一個是清理數據后的查詢邏輯。需要搜集用戶需求和業務規則,考慮程序讀取性能優化,進行增強程序處理。制定詳細的程序刪除和增強數據的邏輯清單,并且根據當月的實際業務制定開發清單,保證數據的完整性。通過增加改善程序的措施后,不僅提高數據縮減率,同時優化系統的性能。
1.2.4 控制階段
按照分析改善階段的措施,對5個關鍵因子進行持續改善和控制,制定控制計劃,包含控制點,控制方法,控制頻率和反應計劃。實施控制計劃后,項目指標月數據量的縮減率達到極限目標40.7%,事務碼執行時間降低到10.5S,說明系統響應時間在項目實施完成后的6個月進行了持續改進控制。
1.3 實施效果
通過對5個關鍵因子的改善措施實施,相應的跟蹤指標進行統計,Y的指標從12.5%提升到38.1%,完成目標設定。輔助指標事務碼執行時間,從75.3S降低到15.2S.隨著ERP系統業務產線的不斷增加,系統數據增長幅度很大,每年要投入大量成本用于服務器內存和存儲資源的擴充,以及每兩年進行的ERP系統的升級,包括硬件配置和系統版本的升級。通過采用六西格瑪的管理方法不僅提升ERP系統的響應速度,而且取得的財務收益包括擴充空間收益和避免升級收益達到了將近100萬元,同時也減少了人力的投入,為公司用六西格瑪管理的方法提高信息化系統有效結合起來提供了有力的支撐。
2 結論
本項目通過使用六西格瑪方法的定義、測量、分析改善、控制五個階段的分析工具,如頭腦風暴、因果矩陣、潛在失效模式分析、單值控制圖、假設檢驗、回歸分析等定量改善工具,通過客觀數據的方法定量地改善ERP系統的響應時間,不僅減少人力維護成本和硬件投入成本,還可以從根本上解決ERP系統響應時間長,數據增長量過快的問題,通過六西格瑪方法在ERP系統中的成功應用,為公司信息化系統定量分析墊定了理論基礎,將六西格瑪方法更好地應用到信息化系統的優化改善中。
參考文獻
[1]中國質量協會組織編寫,何楨主編.六西格瑪管理(第三版)[M].北京:中國人民大學出版社,2014.
[2]吳嘉晟,鄭大興編著,制造業六西格瑪應用手冊[M].北京:中國人民大學出版社,2008.
[3]馬逢時等編著.六西格瑪管理統計指南一Minitab使用指導(第二版)[M].北京:中國人民大學出版社,2013.