方慕賢 吳聲援
(寶山鋼鐵股份有限公司設備部 上海)
隨著企業生產規模及管理業務的拓展,相應的設備管理信息系統用戶需求及應用數據都會逐日增加,信息化管理系統運行一定時間后通常都會面臨“減少系統冗余數據,提高程序執行效率”這類具有普遍性的實際問題。以下通過寶鋼總部設備管理信息系統應用完善的案例,簡要介紹設備管理信息系統應用完善的基本方法和成功的經驗。
寶鋼設備維修綜合管理信息系統(以下簡稱設備管理信息系統)包括設備基準信息(EN)管理、固定資產(EF)管理、點檢(EC)管理、運行狀態(EG)管理、檢修(EM)管理、備件請購(ES)管理、備件修復(ER)管理、維修材料(ET)管理、維修成本(EC)及合同(EW)管理等主要應用子系統。初期規劃設計的設備維修業務管理范圍和系統應用功能于2001年全部研發完成,投入運行。隨著設備管理業務應用需求的拓展和系統中歷史數據不斷積累,系統主機負荷上升速度很快,尤其是2003年下半年,工作時段系統主機CPU平均工作負荷實際上達到了運行上限的設定值。每逢月初和月底負荷高峰時,線上應用交易執行處理時間及等待周期變長,批次作業幾乎無法執行,影響到用戶的正常使用,面臨需要再次擴容或者升級改造的系統風險。
根據對設備管理信息系統投運初期應用情況綜合分析發現,由于部分業務流程基于原有的(手工)管理基本思路及用戶作業習慣進行系統應用設計,未能有效發揮系統管理的效能,需要進行相應的完善優化。例如:設備維修協力合同管理業務結算流程實現跨部門、跨專業的整合,維修成本預算與消耗實際差異控制流程及檢修項目計劃、委托工令單信息的查詢和打印流程等。
為了保證信息化系統有限資源的充分利用和高效運行,保證系統歷史數據的完整和可追溯性,圍繞設備信息系統“瘦身”(減少冗余數據,提高程序效率)的技術研究顯得十分必要。從2003年6月起,寶鋼設備部牽頭與寶信軟件公司再度合作,開始設備信息系統“瘦身”項目的研究與開發。于2003年12月完成了系統負荷與關鍵應用功能效率的監測與分析;2004年1月完成系統改善方案的基本設計;同年7月完成各應用子系統業務流程的完善及應用功能的優化;8月完成優化后系統性能的測試和試運行檢驗;9月開始對優化后系統應用操作的合理性、科學性、靈活性及安全性等方面進行了全面的應用考核。
(1)研究分析設備管理信息系統各類信息交易占用系統資源的情況。開發跟蹤監測(JCL)和輔助分析統計(REXX)程序,對每天產生的幾百兆系統數據進行跟蹤統計,尋找影響系統效率的關鍵環節。通過對各子系統交易占用系統主機CPU的時間和對影響較大的線上交易進行重點分析,發現主機CPU開銷在訪問數據庫(DB2)上約占了90%的時間,由此明確了優化方向重點是在應用程序訪問數據庫(DB2)的效率上。
(2)分析各類在線操作交易占用系統資源的情況,找出對系統CPU產生較大影響的線上交易。利用CANDLE DB2工具和開發的REXX程序,對各子系統交易占用CPU資源的數據進行統計分析,查找了占用系統資源較多子系統。如:維修材料(ET)子系統占33%左右,備件(ES)子系統占17%左右,合同(EW)子系統占14%左右,點檢(EC)子系統占13%左右,確定優先對這些子系統應用交易進行重點的跟蹤分析。
(3)找出了對CPU產生較大影響的線上交易應用效率欠佳的程序(SQL)語句進行優化。通過重點分析發現:有的單筆交易占用CPU的時間就超過幾十秒鐘(如EW82、EW83、ER83等),有的交易單筆雖然占用CPU的時間<1s,但是由于使用頻次較大,累計占用時間很長(如:ET02、ET4A、ET4D、ES36、ES4D、EC65 等)。針對不同SQL語句訪問數據庫(DB2)的效率(COST開銷),找出效率低(COST大)的SQL語句,進行優化處理(如:對應用子系統程序PACKAGE作REBIND或找到匹配INDEX最佳的SQL語句等)。
(4)分析程序訪問DB2時使用INDEX(索引)的情況,優化數據庫訪問策略。例如:分析應用程序中PF7(向上翻頁)、PF8(向下翻頁)鍵的系統資源開銷情況時,選用的相關數據庫表(如:DTEMMF、DTEMC0),在開發環境放大選用的數據庫表數據存儲空間,將運行環境的數據導入開發環境相應的庫表中,通過對應的交易界面(如:EM24)進行PF7、PF8翻頁查詢測試,收集分析交易時的CPU開銷數據。然后,創建INDEX EM.DIEMMF06后重復上述同樣的測試進行對比分析,得出PF7翻頁時若沒有INDEX,則系統開銷將增加20%左右,以此作為應用程序中是否開放翻頁功能或者是否需要建立新的INDEX的參考依據。
(5)定期進行數據歸檔,控制在線運行的系統數據量。根據對系統實際累積數據量進行統計發現:每月系統數據記錄增長量都在百萬條以上,而且有相當數量的應用數據一年后在線調用和訪問的頻次極少,長期在線保存勢必影響系統的運行效率。因此,分析研究對在線數據進行歸檔處理的系統解決方案,開發對歸檔后歷史數據的查詢、調用應用功能,既提高了系統在線資源的利用率和運行效率,又滿足用戶對歸檔數據查詢和調用的基本需求,系統響應時間有了較明顯的改善。截至 2004年11月設備管理信息系統共歸檔了20 377 249條記錄數據,有效減少了冗余的在線數據。
(6)重點分析、研究有關應用業務流程,優化整合設備管理信息化系統業務流程。完善相應的數據處理流程及應用程序(如:ER、EW等),去除了一些不必要的模糊查詢應用功能(如:ET02、ET4A、ET4D、ES36、EC65 等),對多條件的查詢,必須輸入縮小系統數據搜索范圍的基本查詢指定條件,確保設備信息系統的高效、安全、順暢。
(7)研究各種交易使用頻度及用戶的使用習慣,規范應用操作的方法。如:分析備件子系統中用戶領用申請查詢的操作使用習慣,限制了查詢的范圍,讓用戶輸入某些數據項的前幾位或全部,增加了錯誤操作的提示信息;并且加強對用戶的操作培訓,幫助用戶改進不良的操作習慣,減少了無謂的操作,規范系統應用,提高應用訪問數據庫的性能。
(8)限制或優化部分報表查詢及打印的應用。如:對ES4A(用于已發料清單查詢打印)之交易限定發料日期及庫區為必須輸入的數據項;對ES4D(用于查詢打印已消耗清單)之交易限制發料日期的查詢范圍≤3個月,制單人或備件管理號至少輸入一項,而且制單人崗位號前三位不得為空;對ES4C(用于查詢打印待消耗清單)之交易限制發料日期必須輸入,制單人或備件管理號至少輸入一項,且制單人崗位號前三位不得為空。
(9)在系統應用分析的基礎上,對部分占用CPU時間較長的重點交易處理程序邏輯進行了集中優化工作。例如:①用戶使用材料代碼查詢功能(ETOU02)的應用次數十分頻繁,平均每天達3萬多筆(每日最高達4.8萬余筆)。對該交易進行跟蹤分析發現對數據庫操作時,應用程序先用子查詢查出一結果集,再在結果集中進行查詢,走不到主關鍵字cldm的索引。優化后取消了子查詢方式,直接走cldm索引,提高了性能,每筆交易平均處理時間從以前的0.28s減少到0.007s;②當用戶通過驗收單(ETOU25)功能查詢未開票的材料驗收數據時需要查詢驗收明細數據庫,數據量較大,運行時間較長。改進后,根據用戶是否查詢未開票信息作為判定條件,將原來的查詢數據處理流程拆成兩個分支,當用戶查未開票驗收信息時,仍然走原來的處理方法;③當用戶查所有驗收信息時,改查驗收主數據庫,可以通過程序索引大大加快系統響應速度;原材料領用申請查詢(ETOU4A)程序需要通過兩個索引,分別為CLDM+LYSQH和LYSQH,大量時間花在對LYSQH的排序上,而CLDM+LYSQH的索引對本程序是沒有實際意義的。更改查詢程序邏輯后,只走LYSQH一個索引,節省了大量的排序等待時間,每筆交易平均CPU時間從0.35s下降到0.01s。
隨著寶鋼股份公司生產規模和產線的擴充,2004年寶鋼設備信息系統的應用范圍較2003年有了較大的擴展,例如,寶鋼三號彩涂板等三期后項目的相繼投產、十五規劃項目(寬厚板連鑄、厚板廠軋機、4BF)生產準備以及收并整合冷軋薄板廠(原宜昌薄板公司)、用戶協作單位管理子系統(HC)應用功能的增加等,2004年(尤其是下半年)設備信息系統占用主機CPU的負荷率按理應較2003年同期有顯著的上升,但是由于采取了“瘦身”措施,2004年9月以后系統CPU負荷率不升反降,達到了在同等業務范圍條件下(與2003年底同口徑比較)控制設備信息系統占用主機CPU的負荷率月平均下降4.48個百分點的預期研發目標。
由于設備管理水平的提升只有更好,沒有最好。因此,設備管理信息系統應用完善是一項必須長期持續堅持的工作,只有開始,沒有結束。通過對設備管理信息系統的優化,培養和造就一批具有現代化管理理念、掌握持續完善方法的系統應用維護人員,方能確保系統長期穩定運行,有效發揮系統的作用和效能。