編者按
《從加速數字化轉型,到建設質量強國》一文為宗福季教授2022年5月至7月發表于香港科大內地辦“教授專欄”上的文章。經作者授權,本刊分三期刊載。本期刊載該文第一部分。
宗福季:現任香港科技大學講座教授,香港科技大學(廣州)信息樞紐署理院長、國際質量科學院(I A Q)院士、美國統計學會(A S A)會士、美國工業工程師學會(IISE)會士、美國質量學會(A S Q)會士、國際統計協會(ISI)當選會員、香港工程師學會(HKIE)會士,主要研究方向為:工業大數據,包括運用統計學習、機器學習、異常檢測等方法研究涉及傳統制造、新型制造、物聯網、公共服務、金融等領域的工業大數據,在質量分析、統計過程控制、監控和診斷領域有卓越成就。
進入工業4.0時代以后,數字化轉型成為經濟發展的普遍趨勢,而質量4.0更是其中的關注焦點。工業大數據是數字化轉型的重要載體,更是質量4.0的核心,其在質量創新中的重要性日益顯著。無論是行業還是個人發展,都將面臨數字化轉型下工業大數據的應用所帶來的重要機遇和挑戰。工業大數據在質量4.0中的機遇,具體表現在通過采集數據、分析數據并建立模型進行質量控制與質量提升。同時,工業大數據在質量4.0的應用中也面臨數據完整性、數據質量、數據場景、領域知識、數據隱私、樣本稀缺等方面的諸多挑戰。此外,質量4.0的思想及技術更可被應用拓展到社會的各個方面,以期助力建設質量強國。
2020年新冠疫情的爆發,極大地加速了數字化轉型的趨勢。數字化轉型發生在工業4.0的框架下,工業4.0又被稱之為第四次工業革命。第一次工業革命是由瓦特發明蒸汽機所導致的工業化,第二次工業革命是在電氣革命背景下引發的大規模生產,第三次工業革命是由于電腦與控制器的介入所產生的自動化。而現在,盡管各國都對第四次工業革命有不同的解讀與偏向,但是其中心思想就是數字化轉型,即利用物聯信息系統將生產中的供應、生產、銷售信息數據化、智能化,最后達到快速、有效、個性化的產品供應。
圍繞工業4.0時代背景,我將闡明工業大數據在質量創新中的應用,以及工業大數據在質量創新應用中面臨的機遇、挑戰,并闡述其在不同領域的拓展性應用,以期為落實質量強國帶來一些啟發及探討。
大約10年前,我被選為國際質量科學院(IAQ)院士。IAQ是質量領域最負盛名的全球性組織,由全球質量相關領域的思想領袖組成。IAQ僅選出來自25個國家的一百多位院士(每個地區都有限制名額)。IAQ的智庫近幾十年來協助解決了許多與質量相關的重要問題(如同聯合國智庫和ISO智庫所發揮的作用)。最近,我受邀加入華生博士(Dr. Greg Watson)領頭新建的“質量4.0”智庫(天津大學何楨教授也是成員之一)。
質量4.0的概念和命名,起源于2010年德國政府首次將工業4.0戰略計劃作為行動計劃的延伸。該術語于2017年首次使用,用于表明質量思維的新紀元。這是數字化和大數據對工業和社會質量實踐的顛覆性影響的結果。根據美國質量學會(ASQ)的說法,“質量4.0”是指在工業4.0背景下,質量和組織卓越發展的未來。質量專業人員可以將經過驗證的質量學科應用于新的數字化和顛覆性技術方面,在他們的組織中發揮重要作用。在創建這個術語之前,質量的概念并沒有根據其自身領域的重大事件的進展劃分為不同的時代,但將質量技術發展并行于工業的發展,這應該是合理的。
在質量4.0的顛覆性時代,這個IAQ智庫旨在尋求對數字技術的方法、應用和對質量方法、工具和實踐的影響,以及對從事質量行業的專家的影響有清晰的理解,并為將來質量4.0的應用,發展相對應的專業能力。在數字化轉型背景下,質量4.0的發展中,工業大數據無疑是其中的核心。
大數據有三個原始特性:高容量(High-Volume),指的是數據量;高速度(High-Velocity),指的是收集、獲取、生成、處理數據的速度;多種類(High-Variety),指的是不同的數據類型,如音頻、視頻、圖像數據(主要是非結構化數據)。
質量4.0對于企業的競爭力至關重要。不過,是不是只要有了更先進的機器設備去收集大數據,或通過自我研發跨越了以往存在的一些技術門檻,質量創新就能提升到更高水平呢?事實上,并不是軟硬件完全到位就可以解決問題。如果那樣的話,很多問題就不是問題了。接下來結合幾個具體實例進行說明。
實例A: 航空產業產品質量預測與控制
某航空航天公司生產的一個重要產品是IMU(飛機慣性導航系統)。飛機慣性導航系統就像陀螺儀一樣可以控制方向,是一種非常強調精密性的儀器。航空業的公司規模往往非常大,軟件硬件也非常齊備,擁有非常好的數據收集系統與傳感器系統,可以獲得大量的有效實時數據。在制造飛機慣性導航系統時存在許多不同的工序,我們在每個工序中都放置一些傳感器。布置傳感器的原因:一方面傳感器是先進科技的結晶,可以對數據進行準確和高效的收集,從而對工序進行實時監控;另一方面傳感器的價格低廉。然而,即便我們獲得了海量的實時數據,并且擁有良好的信息系統,產品的質量檢測最終還是要仰仗人工檢驗。對于飛機慣性導航系統而言,共有(x,y,z)三個維度,且每個維度擁有3個指標。我們需要對該產品共計9個指標進行測量,若有一個指標不符合要求則該產品不符合質量要求。
對于這個案例而言,雖然我們獲得了大量工業數據,最終產品質量檢測還是依靠人工方式進行,而不是根據獲得的海量數據預測獲得。此外,當產品質量發生問題時,我們也沒有辦法根據數據進行診斷或者問題追蹤,仍依賴人為判斷。
實例B:半導體產業產品質量預測與控制
半導體行業是一個非常追求精密化的行業。他們對數據的應用在所有行業中處于領先地位,在其他行業進行大數據分析之前半導體行業就已經在進行數據收集了。半導體行業中的玻璃面板成膜(PVD)過程包含很多工序,并且數據收集非常完備,有海量的實時數據。可是與案例A很像,我們無法通過數據,預測產品質量是否過關,最終還是需要進行人工檢測。我們通常通過測量一整塊鍍膜玻璃上17個點的厚度,并計算他們的均值和方差,以此檢驗產品質量是否過關。
玻璃面板成膜過程中的眾多工序中,我們目前采集的數據僅包括其中的3個工序。然而,僅僅是這3個工序就已經有65個參數,并且目前還沒有辦法識別出這65個參數里哪些是重要參數。對于玻璃面板成膜過程整體而言,工序越多,數據就越復雜,參數就越多,而哪些參數對最后的產品質量有決定性影響是很難識別的。因此,該過程很難根據參數數據來對產品質量進行預測。此外,當產品質量出了問題,該如何進行調控提升、應該調整哪些參數、如何追蹤是哪個環節出了問題等都非常重要,但我們目前沒有辦法解決它們。
介紹這個案例是想說明,盡管現在工業數據收集環節已經完善,仍然無法實現自動化的產品質量預測與監控。
實例 C:服裝產業產品質量預測與控制
某制衣公司在制衣業中排名很靠前,他們購買了ERP系統與RFID系統,具備完善的信息系統和數據采集系統。可是他們仍然遇到了挑戰:該公司主要客戶是快時尚人群,喜歡根據時尚潮流快速替換他們的產品款式。這對客戶方而言是有益的,他們可以很快地替換服裝款式并且可以將價格成本壓得很低,但是對于生產方來說有很大壓力。大家可能認為他們可以根據大數據信息系統迅速提出工時工序報價,但實際情況是目前他們對于工時工序報價仍然無法根據數據進行預測建模,因此提供工時工序報價時最終還是依靠人為判斷與經驗。
雖然該公司的數據收集系統非常完善,但由于服裝款式非常多,其中還包含許多零部件的生產,整體工序非常復雜。而工序數據不僅僅是連續型數據,還包含非常多的定性數據,造成數據維度非常高。雖然擁有海量數據,但是在維度非常高的情況下,模型很容易擬合失敗。另外,在數據采集環節涉及到大量人工干預,比如用人工填表等方式收集數據,這導致獲得的數據精準度不高。因此,雖然該公司數據量非常大,最終做決策時還是仰仗人的參與。
目前,我們推崇大數據與數據科學,這股潮流會讓我們產生一些幻覺,比如一些公司覺得自己規模不是很大,也沒有充足的資金,沒有辦法構建良好的信息系統與數據采集系統等,因此無法在大數據浪潮中獲益。


通過以上三個例子我們發現,無論是人工參與較多的服裝行業,還是較為智能化的半導體業,就算公司資金非常充足、信息系統與數據采集系統非常完善,可以通過各種方式獲得海量實時數據,但這些數據并不能幫助他們解決實際問題。他們沒有辦法做到產品質量管理的自動化,產品質量檢測問題仍然大量依賴人工方式。
這些例子告訴我們:大數據確實很重要,但只有大數據依然不能解決問題;大數據并非質量創新的充要條件。如何根據在生產過程中獲得的大數據,對工序進行優化或預測產品質量仍是質量創新亟待解決的問題。
想要解決質量創新問題,需要依照一些步驟與方法,其中很多步驟或方法目前已經較為成熟,比如六西格瑪、工藝流程圖等。這些方法在實際應用中仍然十分有效。因此,我們在數字化轉型過程中并不能摒棄它們。然而,這些傳統方法也有許多不足之處。
首先,傳統方法使用的數據是基于采樣得到的,它們只代表部分產品信息,反映局部生產過程。在看不到的地方,我們往往是用人為經驗進行填補。其次,缺少統一的數據信息平臺,質量數據難以共享與追蹤。如果數據是一座“孤島”的話,往往會孤掌難鳴,效果有限。數據真正強大的地方在于將它們聯系起來。第三,工具自動化程度偏低,依賴人員大量參與和主觀判斷。

進入工業4.0時代并展望質量4.0,首先,由于現代傳感器行業的發展,我們可以獲得更多更實時的數據,可以看到更多更全面的信息。其次,我們擁有了更多數據平臺,可以把孤立的數據聯系起來。第三,伴隨著統計及機器學習方法的發展,盡管仍然需要人的參與,我們還是可以做到一些工具的自動化與智能化。
過去,我們把數據當成金礦,所以盡量存起來,以備后用。但現在發現,數據不是湖或者海的靜態概念,而是數據流,是河流的概念。它有速度的,所以不要打算存起來;它是實時流動、動態的,所以質量4.0的重點是思考如何利用數字化轉型,實時分析工業大數據、實時反饋,以達到智能決策及管控的目的。