?
AlphaGo和大公司的優勢沒落
編者按
最近,谷歌人工智能機器圍棋AlphaGo(“阿法狗”)戰勝了圍棋冠軍李世石,引起轟動,成為媒體熱點。那么“阿法狗”的勝利會給大公司帶來哪些影響?霍華德?余教授在2016年3月的《哈佛商業評論》上發表文章,簡要介紹了人工智能機器學習的過去、現在和未來,分析了它們對大公司的影響。霍華德?余博士現任瑞士國際管理發展學院(IMD)商學院的戰略管理和創新教授。
2016年3月,谷歌公司的谷歌人工智能機器圍棋(AlphaGo)擊敗世界圍棋冠軍李世石,人工智能機器學習又往前邁出一大步。圍棋是一種古老的中國棋盤游戲,其歷史可以追溯到近3000年前。圍棋使用的是方形格狀棋盤,棋盤上有縱橫各19條直線,對弈雙方要力爭占據更多的地盤。西方的國際象棋可進行近40個回合,而圍棋有據可查最多的高達200多個回合,可能的結果達到了駭人的10761種,遠遠超過了整個可觀測宇宙中的原子總數量。人們此前曾經認為至少還需要10年的時間,人工智能機器才能在圍棋對弈中戰勝人類。
最值得一提的就是,AlphaGo是一臺可以每日改進自身表現的機器,無需人類程序員直接的監管。這就像是飛機無需工程師的幫助卻可以飛得越來越快。這怎么可能呢?
結構化數據。人工智能機器學習首次出現時,被用于預測我們將如何點擊鼠標、購買東西、撒謊和死亡。人工智能機器改進了公司發送電子郵件、打電話、提供折扣、推薦產品、推送廣告、檢查缺陷和批準貸款等的方式。在人工智能機器學習的外殼之下,是統計數據挖掘,即發現此前未知的模式,推薦實時行動。這種方法的缺陷在于它依賴一定的背景。正是因為這個原因,多數算法都是為了單一的目的而設計,例如深藍(Deep Blue)。深藍打敗了前國際象棋超級大師加里?卡斯帕羅夫,但除此之外別無它用。對于這些第一代的人工智能機器而言,要實現學習,只能通過計算機科學家和統計學家的不斷干涉。數據必須貼上標簽,而且也必須設定目標。同樣的程序設計不能被用于解決其他問題,而且算法也沒法懂得使用人類自然語言所表述的非結構化數據。
自然語言。2011年2月,在綜藝節目《危險邊緣》(Jeopardy!)中,IBM的人工智能沃森(Watson)擊敗了該節目的前冠軍肯?詹寧斯和布拉德?魯特爾。人們開始清楚地看到,人工智能機器學習可以突破單一思維,處理非結構化的模糊數據。除了要掌握各種主題的事實知識之外,《危險邊緣》的參賽者還必須能夠懂得諷刺、謎語、俚語、隱喻、玩笑、雙關語和其他復雜的語言文字。意思取決于前文、主題,也取決于討論的方式。在為期兩天的《危險邊緣》聯賽中,IBM的沃森總共獲得了77147美元獎金,是其人類對手的3倍有多。排名第二的詹寧斯后來說:“20世紀時,工廠的工人們被新裝配線上的機器人所取代。同樣,布拉德和我是第一批知識產業工人,我們因為第一代的‘思考’機器而失業了。”
目前,IBM沃森并沒有取代專家們,而是提高了他們的工作能力。例如,專家們只需要通過一款iPad應用,使用簡單直白的英語描述病人的癥狀,該算法就可以為腫瘤學家提供研究和臨床方面的建議。盡管IBM沃森并不依靠被編碼的規則,但它必需有領域專家們的密切干涉,為它提供數據,評估它的表現。在沃森為腫瘤學家提供服務之前,它被人工輸入了25000份測試用例場景、1500份實際用例場景、60.5萬份醫學證明,以及200萬頁的文字。護士們花了14700個小時的時間一絲不茍地對該算法進行培訓。所有這些都需要花費時間、金錢和精力。
深度學習。在AlphaGo與人類對決之前,谷歌研究人員一直在開發它來玩視頻游戲,其中包括《太空侵略者》(Space Invaders)、《突圍》(Breakout)和《Pong》。根據程序設計,AlphaGo會力爭高分,并且通過每天與自己玩數百萬次游戲,來不斷改善自己的系統。該算法能夠通過反復試驗來掌握每種游戲,最初是隨機按下不同的按鈕,之后會根據學習制訂出合適的戰略,并且不犯錯誤地加以執行。AlphaGo能實現這點,原因在于它基于一種深度神經系統,即模仿人類大腦神經元的一個硬件和軟件網絡。這并不是一種新概念。計算機科學家們已經討論這個問題20余年。隨著計算力的發展,深度學習變成可能,而AlphaGo也是率先實現了這種驚人的直覺思維模擬。
AlphaGo證明,無需人類專家和程序員過多監督且可以自行學習的人工智能機器的崛起是不可避免的。正如IBM沃森所顯示的那樣,人工智能機器將從各種各樣的來源吸收大量各種形式的信息和數據,不管這些信息和數據是否結構化。執行成本將會不斷下降。組織內部和外部的業務往來的協調速度將會提高,而且在這個過程中,組織摩擦會得到消除,市場協作得到加強。
基于這些原因,那些因為垂直整合而擁有傳統優勢的大公司將會成為首批被淘汰者。“一站式購物”和“供應鏈優化”這些傳統觀念將會變得陳腐,眾多行業里規模較小的從業者或新從業者相比之下能更輕松地實現這些。
讓我們以電子數據交換(Electronic Data Interchange,EDI)和其他大型跨組織系統為例。這些系統讓供應商、顧客和物流專家可以進行實時溝通。思愛普公司(SAP)和甲骨文公司(Oracle)所生產的系統都非常笨拙、成本高昂、使用難度大,而且難以進行整合。在歷史上,只有沃爾瑪和百思買這類大型企業才有足夠的規模和討價還價的能力,能夠迫使他們的供應商采用這些系統。在建設好后,這些系統仍然需要一群專家來不斷進行監測、改進、向管理層提出行動建議,并且在組織內逐層推廣該系統。
相比之下,開發AlphaGo的團隊人數不到50人。該程序本身相對屬于輕量級的,在建立后并不需要太多人類干預,而且可以廣泛運用到不同的問題領域。
不難想象,自我學習的算法在協調經濟交易方面將會發揮更大的作用。AlphaGo只是讓我們看到了在不久的未來有哪些會變成可能。即時調整、自動優化,以及持續改進,這些都由無人監管的算法自行安靜地進行管理,因而生產設施的冗余和供應鏈中的浪費不會再讓人們為之頭疼。沒有了垂直整合的壓力,而且組織協調所需的資源也大幅減少,那么規模較小的從業者就能夠全心全意去提供一流的服務,當特定的需求出現時實時提供極具針對性的定制解決方案。
大型非科技公司即將面臨的問題有:
(1)當規模不再重要時,自身組織的核心競爭力是什么?
(2)我的組織內有多少管理能力是用于負責市場協調的?
(3)如果新的競爭對手也復制了這些能力,用機器計算來取代人類專家,那么我的成本結構和他們相比存在什么優勢或劣勢?
(4)進一步來說,如果產品發布去中央化,我們能增加什么新的服務或產品?
(5)我是否可以與新的從業者合作,重組我當前的能力來進入新市場?
最令人興奮的是,未來AlphaGo這類能夠自我學習的機器人,將嵌入全球經濟的命脈。當不斷自我學習的算法將關系松散的公司、非政府組織和政府機構聯系在一起,它們也許能夠帶來新的生態系統,解決最具難度的社會問題,例如能源、交通運輸、醫療衛生和教育。這些領域目前因為錯綜復雜和市場四分五裂而表現不佳。
(粟志敏 編譯)