編者按本文編譯自2018年10月的《麥肯錫季刊》。作者史蒂夫·布拉德伯里(Steve Bradbury)、布萊恩·卡皮索(Brian Carpizo)、馬特·甘澤爾(Matt Gentzel)、德魯·霍拉(Drew Horah)和喬爾·蒂伯特(Joel Thibert)均為麥肯錫公司的顧問。本文認為,數字化可以提高可靠性,降低成本。公司應該加大數字化維護方面的投入。
我們是否正進入智能機器的世界,在這個世界里,機器可以在出故障前自行向操作人員發出警報?先進的預測性維護(PdM)通過大量的傳感器集成和機器學習技術來得到實現,被廣泛視為第四次工業革命帶來的進步。這自然具有相當大的吸引力,鼓勵資產密集型的公司對數字化維護和可靠性加以投資。
但在我們看來,如果將先進的預測性維護視為應對維護和可靠性挑戰的靈丹妙藥,有可能會被證明是一種短視。一方面是因為當今先進的預測性維護事實上只適用于部分情況,另一方面也在于對某種方式的過度倚重會導致公司無法獲得數字化維護和可靠性提升后的潛在利益。
這些潛在利益的意義相當重大。我們對重工業向數字化維護和可靠性的轉變進行了觀察,發現公司可以將其資產可用性提高5%到15%,并且將維護成本降低18%至25%。

為什么先進的預測性維護被視為工業4.0的殺手級應用呢?原因不難理解。該方法綜合了推動工業數字化新浪潮的眾多科技技術,例如聯網傳感器、大數據、先進的分析方法和機器學習等。以前所未有的方式對成百上千的變量進行分析,識別其中復雜的模式,讓操作人員可以基于數據對故障出現的原因有更深入的了解,這是一種非常強大的技巧。它給人們帶來了非常實在的好處,即機器不會出故障。這令人感到誘惑。
但事實上,在現實世界里,對這些先進的預測性維護技術的經濟性使用并不是那么廣泛。如果機器容易出現大家熟悉的少量故障模式,通常通過更為簡單的方式就可以發現潛在問題,例如根據設定的臨界值去監測某零部件的溫度或振動,或者是不間斷地嚴格采用基于數據的可靠性分析技術去查找失效模式的根本原因。而且,如果某機器出現成百上千種故障的話(一些故障是相當罕見的),那么建立大量高質量的模型來預測故障也是不切實際的。
考慮到開發準確的機器學習模型所需的專業技術和所投入的精力,基于模型的預測性維護就成了一種解決特定高價值問題的突破性方法,而不是用于所有維護工作。如果故障模式有完整的記錄,并且相關的停工影響較大,那么這種方法就可以發揮較大的作用,例如針對大型生產線上的核心機器。在大規模地應用到大量相同的資產上時,這種方法也能發揮大作用。這些資產有足夠長的可靠性歷史,可以分攤開發和管理成本,例如海上風力發電廠或鐵路機車車隊。設備制造商要從戰略角度出發,為終端使用者大規模地推動預測模型的開發和部署。但這些工作目前尚未能大范圍地開展。
預測性維護的使用范圍相對較小,這是否意味著維護和可靠性工作在一定程度上不用去追趕數字化的潮流?當然不是。事實上,我們建議公司不要只盯著某一類數字化工具,而是要考慮數字化和先進的分析技術能如何改變整個維護和可靠性系統。這也意味著從端到端去尋找利用數據的機會,并且遵循以用戶為本的設計原則來對流程進行數字化。要想取得可持續的影響,就必須綜合各種新數字化工具,改變資產戰略,改善可靠性實踐方法。
可靠性和維護工作由兩部分組成,一是程序,二是執行。程序是指資產戰略和維護計劃。執行則是去識別有哪些工作,確定工作的輕重緩急,對工作進行計劃安排,并且實施這些工作。數字化可靠性和維護(DRM)則同時包括了這些元素,并且擁有一系列使能元素來輔助這些工作的開展,其中包括公司管理其資產、數據和人員所需的基礎設施、流程和工具,以改善資產的可靠性和維護(參見圖1)。

圖1 數字化可靠性和維護的綜合框架
我們從基礎講起,從下往上來討論這些使能元素。最重要的一點在于,數字化的流程都是由數據來推動的。也正是出于這個原因,對于數字化可靠性和維護而言,最基本的使能元素就是強大的數據支柱。多數組織已經建立了系統來記錄同維護和可靠性相關的數據,但糟糕的管理可能會破壞此類系統的有效性。例如,同樣的資產或問題可能在不同的系統里有不同的描述,從而加大了整合的難度。公司可能使用任意格式的文字字段來記錄問題或維護工作,這也導致自動化的搜索或數據分析難度加大。或者說關鍵數據可能無法獲取,被藏在了數據表或紙質記錄中。
要解決這些問題,通常不在于對新技術進行投資,而取決于采用更為嚴格的標準來對資產進行標識和對數據進行記錄。自然語言處理這類人工智能技術可以幫助組織改變混亂的歷史數據,采用更適合于自動分析的形式。
同樣,數據存儲和網絡帶寬的成本驟降,也意味著現在從機器控制系統和外部傳感器處收集數據流的難度更小,成本也更低。這類數據可以被用于狀態監測、診斷和故障模式分析。不管是使用傳統的方法還是運用先進分析學與機器學習,這些數據都同樣有用。
在擁有了數據之后,公司必須有途徑來訪問這些數據。對于多數組織而言,他們必須采取新的舉措。合并數據服務層,即“數據湖”可以從多個系統和數據源收集數據,然后建立單一的事實源,填補系統之間的信息鴻溝,為資產的健康情況提供全面的信息。數據湖是數據基礎設施中至關重要的組成部分,擁有多種用途。它為數字化績效管理、描述性分析和管理儀表盤提供基礎,同時作為新維護和可靠性應用中不可分割的一層,為先進分析模型提供必要的數據。
對數字化可靠性和維護而言,接下來重要的使能元素就是可靠性工程分析的數字化工具。通過故障樹分析、因果分析或失效模式和影響分析(FMEA)等方法從根源上來解決問題,這是組織維護和可靠性戰略中最基本的內容。不過,這些工作現在通常是人工進行的,而且它們的結果很少被集中記錄。將可靠性工程工具整合到組織的數字化可靠性和維護架構中,能確保分析的統一性和系統性,加快和簡化輸入數據的獲取,并且獲得分析結果以備未來使用。
建立一個數字化平臺,用以提供數字化可靠性和維護使用的所有工具,并作為數據源,這項工作具有挑戰性。但如果能在數字化可靠性和維護項目的初期就建立正確合適的平臺,就能創造長久的效益。一家油氣公司準備在既有平臺上打造維護解決方案。但在描繪出自身數字化維護的宏大愿景時,公司領導人發現,這套系統的技術能力達不到要求。因為對公司的長期維護愿景而言,工具之間的無縫對接是至關重要的。為此公司選擇將所有的維護解決方案整合到一個全新的平臺。盡管從短期而言,這意味著推倒重來,但數字化可靠性和維護的功能可以隨著公司的需求和數字化能力的發展而進行擴充,避免了只是暫時發揮積極的作用,卻很快落后于競爭和技術能力發展的尷尬。
截至目前,我們的討論集中在應用數字技術來加速、推動和改善現有的可靠性工程實踐工作。數字化也為可靠性工程團隊提供了種類繁多的新工具和新方法。正如此前所說的,使用機器學習技術來監測資產狀態已經得到大量的關注,盡管其成本和復雜性最終可能會限制其應用。
不過,并非所有狀態監測技術都需要精心設計的算法或復雜的模型。數據驅動的條件監測方法使用簡單的詢問功能。該方法會定期進行查詢,或者是實時查詢機器和外部傳感器生產的時間序列數據。如果超出了臨界狀態,這些系統會通過數字可靠性工程工作流程來啟動調查或糾正措施,或者是直接實施維護。
上文介紹的使能技術形成了數字化可靠性和維護的基礎,但并沒有能真正地改善資產的可靠性或維護效果。那些改善來自于組織如何使用其數字化數據來優化維護工作,即調整計劃,合理化計劃,優化資源分配。
數字化的績效管理系統是有效的數字化可靠性和維護項目的核心所在。該系統涉及使用描述性分析和數據可視化來實時了解資產的健康程度和可靠性。數字化績效管理可以自動生成和展示關鍵指標和定性信息,公司可以在其可靠性項目中使用這些指標和信息,例如設備綜合效率(OEE)數據或損耗原因。這類自動化是令人驚奇的、強有力的改善工具,能將資產維護人員從數據收集和分析這類耗時且易錯的工作中解放出來。而且它能夠支持快速的趨勢識別、基于事實的決策制定、即時的干預,以及設備投資、流程和政策的改變。
有時候,公司已經擁有管理維護績效所需的大部分數字基礎設施。例如,一家礦業公司正準備建立一套系統來跟蹤移動設備的維護。公司列出了新系統的要求,并且發現公司當前計算機化的維護管理系統中已經擁有所需的功能。相關的模塊已經在公司內進行過試用,但從未規模化。
可靠性工程活動的周期和效果通常會因為信息缺失或者運營與可靠性/維護團隊之間的失調而受到影響。通過跟蹤可靠性工程職能執行的每個工作單元的整個生命周期,數字化可靠性工程工作流系統可以填補這些鴻溝。這些系統至少能記錄引發可靠性工程團隊調查的事件細節、相應的行動,以及這些行動的結果。

新的數字化工具也可以提高成本收益分析和決策的速度,并且標準化這些活動。例如,數字化資產管理工具能夠幫助可靠性團隊在單個資產或整批資產的生命周期內計劃和管理維修或替換。同樣,新的數字化工具可以為以可靠性為中心的維護提供支持,幫助維護團隊針對每種資產選擇正確的維護戰略(例如故障后維護、有計劃的預防性維護或基于資產狀態的維護等)。
新的數字化工具也改變了公司對維護和可靠性活動的計劃和管理方式。數字化的工作管理包括流程數字化和數據推動的分析,以提高維護工作的效率和效力。這些工具包括自動化計劃算法、數字化計劃環境,以及用于現場數據輸入和數據檢索的平板或可穿戴設備。
多數工業企業已經在有意和無意間踏上了數字化可靠性和維護的旅程。他們通過企業資源規劃或資產管理系統來記錄自己的工作,他們的眾多資產開始生成和收集數據,雖然這些數據相當分散,甚少得到使用。
這些默認的自動化方法現在并不能充分發揮其潛在的影響力。我們在今年年初對一些資產維護經理進行了調查。僅僅只有50%的被調查者表示,他們當前的信息和運營技術(IT/OT)架構足以為他們的維護和可靠性流程提供支持。對于維護工人是否擁有積極的用戶體驗,做肯定回答的維護經理不到20%。
對多數組織而言,至關重要的一步是在其數字化維護和可靠性戰略中采用前置的、全面的、經過深思熟慮的方法。這要求他們對當前的維護和可靠性實踐工作進行詳細的評估,分析數據采集改進所提高的直觀性、先進分析所帶來的洞察力,以及新的數字化維護執行系統所提高的控制力在哪里能產生影響。關鍵在于從端對端來全面了解潛在的應用方法,并且思考新工具、新技術和新方法如何得到整合和聯合。
同任何大型變革一樣,為了向數字化可靠性和維護的新世界邁進,公司必須敢想敢干,找到系統化的轉變方法,并且擁有長遠的目光。