編者按
本文譯自俄羅斯《標準與質量》2020年第10期,作者阿列克薩特勒·切薩里寧是俄羅斯科技大學計算機和信息安全部主任、技術科學副博士,謝勒蓋伊·格羅特崽斯金是俄羅斯科技大學管理信息技術部教授、技術科學博士。
20世紀初,愛因斯坦提出了相對論,海森堡和薛定諤闡述了量子力學的基本原理,發現微觀世界適用概率定律。非平衡熱力學的創始人之一普利高津和他的學生們成功地改變人們對世界的決定性看法:在這個世界里,對系統狀況的了解可以明確地描述未來。很明顯,不確定性不僅存在于現有知識體系和不完善工具里,還存在于世界模型本身。
威爾斯在100年前寫道:“總有一天,統計思維對公民而言與讀和寫一樣重要。”很難說是什么原因賦予這位著名的英國科幻作家這種想法,但現實生活證實了他的觀點:現在人們普遍意識到,缺乏統計思維與教育不足或者說普遍認知不足有關。
然而,統計結果有時會被明顯懷疑。互聯網上充斥著關于統計數據的嘲弄,比如19世紀英國政治家季思拉埃利的言論“謊言,無恥的謊言,統計”,就遠不只是對它本身的輕視了。通常情況下,我們會提到“醫院的平均溫度”,但對統計而言實際上并沒有這種東西。
在日常生活中,我們會不知不覺地從統計學角度思考問題,尤其發生過程參數的自然離散現象時。例如,我們帶著一定的時間余量去上班,以防萬一我們遲到。很明顯,出行越重要,遲到的代價也就越大,也就意味著我們越要有更多的時間余量。
回顧一下。統計思維緣起于一個實際的任務,以解決1923年著名電話發明家貝爾實驗室設計的產品缺陷問題,當時問題擺在休哈特面前。在實驗過程中,休哈特確立了世界多變性的根本作用,并提出了一種減少其對決策影響的方法。統計思維的出現,為現代質量管理系統理論創造了先決條件。
休哈特提出了統計過程管理的理念,并奠定了統計質量控制的基礎。為了確定當前的狀態,他創建了帶有邊界的控制圖。在邊界里,表示應該控制在該參數值狀態下的過程;超越邊界,則意味著由于特殊原因,這個過程變得無法控制,需要識別和消除特殊原因。
現在人們普遍認為,質量管理體系的基礎是休哈特-戴明循環,每個階段都應當采用統計思維的原則。
統計思維是基于多變性理論,從而決定是否干預,以及如果有必要,決定由誰和什么時候來干預的一種方法。俄羅斯學者阿特列勒和施貝勒對統計思維的起源和變異理論的基礎進行了研究,提出一個更普遍和簡潔的定義:“統計思維是在一個飽受易變性之害的世界里做出系統性決策的能力。”
隨著工業4.0的到來,統計思維變得前所未有的熱門。不同來源和時間、不同的真實程度的信息,意味著不同的真實,因而必須分析大量的不同種類的數據集(大數據)。在不斷成長、快速變化的信息體量和速度面前,世界上幾乎沒有任何分析者能夠勝任。數字化時代現代企業日常處理的數據總量早已超過十億字節,而且還在不斷增加。在人工智能方法基礎上建立的新技術,已經開始幫助分析師們。若干已經被證實有用的工具,可以用來實現統計思維。
今天我們碰到的問題,是如何正確使用現代方法和算法。因為所應用數據的多樣性、矛盾性、成熟度、真實性和相關性,這有時非常困難。在這種情況下,最重要的任務是將數據通過“工程”形式轉化為實現算法所需要的類型,使其能夠最大限度地利用有用信息并消除無用數據。
確定人工智能的方法和算法頗難,同樣困難的還有培訓,以及怎么選擇啟發式、確定系數、教學模式等。有時模型的學習過程就像一個復雜的實驗。然而,數據處理、算法選擇和模型構建還只是工作的一部分。模型需要根據不斷出現的新的要求、數據、獲得條件等具體情況,不斷調適、加以控制。此外,分析師還必須掌握在哪里使用某種模型、怎樣實施某一方法或算法、什么方式能達到最大效用、所使用模型的可靠性如何等。
概括起來說,今天我們已必須具備智能思維,也允許使用大量數據構建復雜的預測模型。這就是在管理現代系統方面獲得重大優勢的方法。
當涉及到不同的數字系統時,通常會出現一個薄弱環節,也是系統中最需要關注的部分,那就是人。但自動化使得許多科學技術領域能夠消除這一個薄弱環節。
人工智能的應用使數字生產系統更加靈活和高效。值得注意的是,現有的人工智能基本上在更高水平上解決了同樣的自動化問題。這種人工智能被認為是“弱”的,在,而一個被認為“強”的人工智能可以建成有創造力的全新事物。但這是對未來的展望,我們必須認識到,在目前,創造力尚是人類的特權。
在第四次工業革命中,質量的提高或減少與眾所皆知的人為因素密不可分。有兩種方法可以解決這一問題:要么用通用機器人取代一個人,這個理想在不確定的遙遠未來;要么現在就以智能思維訓練一個人。
當然,實現第二個選項非常困難,因為人工智能的方法包含了來自不同知識領域的元素,比如概率和數理統計理論、算法和編程、信息學和模擬等。
根據我們的研究,列出了數字化生產管理中應該使用的7種基本人工智能方法。
·模糊邏輯;
·機器學習(包括神經網絡);
·大數據分析;
·博弈論;
·模擬(數字模擬、多代理模擬);
·進化算法;
·專家系統和決策支持系統。
智能思維應該在需要的地方被使用,尤其是面對困難挑戰可以帶來重大優勢的地方。一般來說,這些任務與大數據處理直接相關。大數據的概念具有各種屬性,如Visualizat(可視化)、Variability(變化性)、Viability(可行性)、Veracity(真實性)、Velocity(速度)、Variety(類型)、Volume(體量)、Value(價值),這些都需要運用智能思維去解讀。
人工智能的標準任務是基于大數據的智能系統去解決各種預測問題,即使智商(IQ)最高的人也無法承擔。因為人不能像電腦那樣處理信息,也不能像現代計算機那樣分離處理過程。因此,顯而易見的解決辦法是,將處理大數據的智能思維過程轉移到現代計算設備上。在這種情況下,需要“人”能夠開發和編程必要的算法,并控制機器學習的質量和信息的真實性。可以把基于大數據創建人工智能系統的過程分為下列幾個階段。
·確定可以通過人工智能有效解決的問題及其范圍;
·識別出待解決問題所必需的數據和屬性,對它進行預處理;
·建立一個合適的人工智能算法來有效解決這個問題;
·確定如何將擬議中的人工智能嵌入到目標系統中。
因此,人類在創造復雜技術系統智能思維的任務是:在人工智能幫助下,合理解決對事物領域和問題定義的系統分析,以及為達此目的來使用/構造有效的人工智能算法。
技術發展的緊迫挑戰是建立具有大批、多種、完整和協同作用的網絡物理系統。它只能通過人工智能處理大數據的有效算法來解決,這需要人類的智能思維。
從長遠來看,人工智能的作用將會增加,因此智能思維的發展是現代工程師和管理者的首要任務。隨著時間的推移,智能思維將變得和如今的統計思維一樣平凡。
讓我們試著給人工智能一個先驗定義:這是一種采取基于人工智能方法的系統決策能力。
也許,我們的表達會被指責為某種程度上的“歪曲”,對此我們不作爭論。但為了明確“統計思維”理念的清晰理解,曾經需要幾乎一個世紀的時間。在21世紀,“年被壓縮成時刻,世紀被壓縮成時刻”,因此更精確的表達可能會更快呈現。
用一句頗具誘惑力的話來結束這篇文章:“總有一天,智能思維將成為與人們的讀和寫一樣的必需品。”