沈建苗
機器學習、尤其是深度學習這一主題是許多科技刊物競相報道的最熱門話題之一。這個領域值得重點關注和報道有充足的理由。
機器學習/深度學習的范圍和影響已在眾多學科的無數應用領域一再得到了體驗和證明。廣告、自動駕駛車輛、聊天機器人、網絡安全、無人機、電子商務、金融技術、工業機械、醫療保健、市場營銷、機器人和搜索引擎,這些只是受到機器學習/深度學習重大影響的幾個關鍵領域而已。
機器學習/深度學習的好處不再只有買得起高端裝備的少數精英群體才能享用。產品推薦工具和價位合理的聊天機器人在普通群體中流行起來,這點不可否認。明眼人都看得出來,機器學習/深度學習在一大批新的未開拓領域還有待發揮所長。
開發和部署機器學習/深度學習管道的成本在迅速下降。連最懷疑這種技術的人士只要分析一下其用途,也極有可能找到價值所在。
據機器學習/深度學習界的幾位名人聲稱,深層神經網絡“效果異常好”,盡管他們并不確信個中原委,但他們堅信機器學習/深度學習的應用前景不可限量。
深度學習領域在迅速演變,而且是在許多維度上演變。許多新的技術、架構和算法層出不窮,各自具有獨特的價值。然而,我認為三個主要的宏觀趨勢未來幾年會在機器學習領域真正改變游戲規則。
機器學習/深度學習領域第一個、也是最重要的宏觀趨勢是,監督學習模式逐漸向非監督學習模式轉變。
原來實施的機器學習/深度學習絕大多數是監督式學習系統。換句話說,只有對被大量標記的訓練數據加以訓練,它們才有用。雖然監督式學習系統為我們提供了很好的服務,但收集和標記龐大數據集費時又費錢,還很容易出錯。數據集規模變大后,這些挑戰變得極其棘手。另一方面,非監督學習系統具有巨大的優勢,因為它們不需要龐大的訓練數據集,可以邊訓練邊學習。這可以解釋為什么機器學習方面的許多高級研究與非監督學習有關。
此外,機器學習/深度學習應用的第二個應用趨勢是在生成式對抗網絡(GAN)方面。
生成式對抗網絡(GAN)是什么?它在整個機器學習領域有著怎樣的地位?GAN其實不是一種新的模型類別,它只是一種極其巧妙、高效的訓練生成式模型的方法。它的優點是減少了對龐大訓練數據集的需要。
GAN通常使用充當對手的兩個神經網絡來構造。一個生成酷似有效樣本的假樣本,另一個網絡(判別器網絡)不斷接收生成器網絡發來的偶爾混有假樣本的訓練樣本,并負責將兩種樣本區別開來。這個迭代過程的最終結果是,整個模型經受了更完備的訓練,其優點在于,在外部干預最少的情況下進行改進。
第三個機器學習/深度學習應用趨勢是強化學習領域。機器學習原則上是通過實驗和探索來學習。這有別于監督學習模式,因為后者依賴已知良好的訓練數據,而強化學習(Reinforcement Learning)最初對“世界如何運轉”幾乎一無所知。強化學習基于三個基本要素,即“狀態”(States)、“動作”(Actions)和“獎勵”(Rewards)。
舉例子有助于我們了解它們的重要性。不妨假設一家網上運動衫商戶使用強化學習來說服訪客購買其產品。不妨在這種上下文中探究狀態、行動和獎勵的意義。可能是這種情況:一個潛在的加拿大訪客花兩分鐘來比較一件運動衫的各種顏色,并閱讀了該產品的兩則評論。另一方面,動作是指商戶為說服潛在顧客實際購買而采取的動作(比如提供即時折扣,或名人穿著類似運動衫的照片)。在某個狀態下運用動作導致轉換到一個新狀態。每次轉換之后,基于成交概率的增加(或減小),獎勵(或懲罰)強化學習。這里的關鍵是,應用強化學習的設備最初可能一無所知,但隨著時間的推移,它們學會選擇在特定的狀態(人口特征、環境和消費偏好)下效果最好的策略(動作序列)。
強化學習非常重要,這有兩個原因。它們在諸如機器人、廣告和游戲之類的應用領域中具有顯著效果。更重要的是,強化學習高度模仿人類大腦從嬰兒到成年的演變。這種飛躍讓機器智能向接近人類智能更邁出了一步,讓機器能夠將感覺和直覺等軟技能運用到學習上。