郭若宇 廣州外國語學校
1997年5月3日國際象棋世界冠軍卡斯帕羅夫與IBM超級電腦“深藍”展開首次“人機大戰”,以一勝二負三和的戰績敗北。2016年、2017年人工智能圍棋程序“AlphaGo”先后兩次戰勝圍棋屆頂尖高手韓國的李世石與中國的柯潔對戰。由于計算機超強的運算能力是人類無法企及的,從這個意義上來說,“AlphaGo”的勝利是計算能力和算法的勝利。就像代表人類出戰的中國圍棋職業九段棋手柯潔以0:3完敗于“AlphaGo”之后感慨的“人類是會犯錯的,而機器不會犯錯”。
隨著現代科技日新月異的快速發展,智能手機、智能穿戴設備等智能數碼產品已經成為我們生活中的重要組成部分,而且由于性能的不斷提升使得產品的更新換代速度越來越快,性價比也越來越高,這一切都可歸因于20多年來以機器學習為核心的人工智能技術的飛躍式發展。
“AlphaGo”的出現讓“人工智能(Artificial Intelligence)”和“機器學習(Machine Learning)”前所未有地為大眾所熟知。在多數人看來,二者之間可以劃等號,都指可以代替人類工作的先進生產力,事實并非如此。人工智能指的是以人工方式制造具有或類似“人類智能”的機器,而機器學習指的是使電腦或其它數碼產品在人工編程之外自主運作的能力,它是人工智能的核心,是使計算機或其它數碼產品實現“像人類一樣思考、判斷并解決問題”的能力的途徑,其應用遍及人工智能的各個領域:數據挖掘、計算機視覺、自然語言處理、生物特征識別、搜索引擎、醫學診斷、檢測信用卡欺詐、證券市場分析、DNA測序、語音和手寫識別、戰略游戲和機器人運用等,體現在普通人生活中的就是數碼產品上層出不窮的App應用,讓我們的生活越來越便捷和舒適。
由于訓練方法和應用領域的不同,機器學習主要分為監督學習、半監督學習、無監督學習和強化學習等四種類型。機器學習必須是建立在海量數據的基礎之上,
(1)監督學習(Supervised Learning)
監督學習又被稱為“有老師的學習”,所謂的老師就是事物特征對應的標簽,比如水果的顏色、形狀、味道和香氣等。監督學習的過程為先通過已知的訓練樣本(如已知輸入和對應的輸出)來訓練,從而得到一個最優模型,再將這個模型應用在新的數據上,映射為輸出結果。再經過這樣的過程后,模型就有了預知能力。比如小朋友第一次看見蘋果和桔子兩種水果,老師告訴他(她)哪種是蘋果,哪種是桔子,并且從形狀、顏色、味道和香氣等方面加以解釋,下一次小朋友再看見這兩種水果后就能進行準確的分辨,這是監督學習。當在人工智能中,監督學習主要被應用于快速高效地教受AI 現有的知識。例如多次打敗圍棋世界冠軍的“AlphaGo”, 就是利用監督學習來“記憶理解”上千萬盤的人類對弈棋譜,通過人類輸入的“現成的”信息來進行學習的。
(2)無監督學習(Unsupervised Learning)
無監督學習被稱為“沒有老師的學習”,和監督學習相比,是沒有“老師指導”的訓練過程,而是直接拿數據進行建模分析,意味著這些都是要通過機器自行學習后探索事物間的關系或規律。還是以第一次看見蘋果和桔子兩種水果的小朋友為例,這一次沒人告訴他(她)哪個是蘋果哪個是桔子,但小朋友根據他們的形狀、顏色、味道和香氣等特征的不同鑒別出這是兩種不同的水果,并對特征歸類,這是無監督學習。在人類探索認識世界的過程中經常會用到無監督學習,這是人類文明發展進步的重要力量。無監督學習說起來比監督學習更難一點,因為這個過程非常像老師沒講知識點就給我們一堆沒有答案的習題,然后讓我們自己做,看我們能不能從中學到什么。和監督學習相比,無監督學習相當于在黑暗中摸索,存在耗時長以及學習效果不佳的問題。
(3)半監督學習(Semi-Supervised Learning)
目前海量存在的網頁分類、文本分類、基因序列比對、蛋白質功能預測、語音識別和計算機視覺等數據大部分屬于無標簽數據,只有極少一部分數據通過特殊設備或經過昂貴且用時非常長的實驗過程獲得標簽,這種大量無標簽數據和少量標簽數據共存的情況催生了半監督學習,即將大量的無類標簽的樣例加入到有限的有類標簽的樣本中一起訓練來進行學習,期望能對學習性能起到改進的作用。對于半監督學習,其訓練數據的一部分是有標簽的,另一部分沒有標簽,而沒標簽數據的數量常常極大于有標簽數據數量(這也是符合現實情況的),通過一些有標簽數據的局部特征,以及更多沒標簽數據的整體分布,就可以得到可以接受甚至是非常好的分類結果。在AI咨詢公司Joostware工作Delip Rao構建了一個使用半監督學習的解決方案,每個類中只需使用30個標簽,就可以達到與使用監督學習訓練的模型相同的準確度,而在這個監督學習模型中,每個類中需要1360個左右的標簽。因此,這個半監督學習方案使得他們的客戶能夠非常快地將其預測功能從20個類別擴展到110個類別。半監督學習避免了數據和資源的浪費,同時解決了監督學習的模型泛化能力不強和無監督學習的模型不精確等問題.
(4)強化學習(Reinforcement Learning)
強化學習是指機器自身收集環境中的相關信息作出判斷,并綜合成自己的“經驗”。它有點像平時老師讓我們用學到的知識去解決某些答案并不確定的復雜問題,例如我們在學習數學的過程中,老師分別講解了三角、圓、矩形等多個單元的知識點后,將相關的知識點揉在一起出一個綜合題來考察我們解決問題的能力。再以海洋館常見的海豚跳圈表演為例,假設海豚在平時的訓練中已經掌握了跳一個圈的能力(順利完成動作會得到食物獎賞),現在訓練師想讓它完成更復雜的動作,比如增加呼啦圈的數量、改變呼啦圈的位置等,并且每次完成一個既定目標就可以獲得相應的食物獎賞,而且獎賞的豐富程度與動作的復雜程度相匹配,這樣經過多次“訓練-失敗-沒獎賞”、“訓練-成功-獎賞”的“強化學習” 之后,海豚就可以自如地進行表演了。AlphaGo 利用監督學習參照人類的走法大致學會了預測下一步,但是缺乏實戰經驗,于是計算機科學家讓兩個非監督學習下建立的AlphaGo 互相下棋并不斷調整,保留勝方的模式和參數,經過3000 萬盤強化訓練后,AlphaGo 便通過“左右互搏”提高了“實戰能力”。強化學習這一方法背后的數學原理,與監督/ 非監督學習略有差異。監督/非監督學習更多地應用了統計學,而強化學習更多地結合了離散數學、隨機過程這些數學方法。
機器學習是基于海量的有標簽或無標簽的數據的,不管是什么領域,只要呈現充足的數據并經過適當的訓練就可以自動識別里面的規律,進行分類、預測等。比如我們在網絡購物時就會發現,購物網站會根據我們之前的購物行為大致判斷出我們的購物喜好,從而自動推薦一些我們喜歡的商品供我們參考,由此可見,隨著我們購物次數的增加,在網上積累的相關數據就越多,個人的購物特征就會越來越清晰。與此同時,對大量消費者的購物特征數據加以集中和強化學習,就又可以增強機器判斷的本領,比如性別、年齡、收入水平和家庭結構等對購物行為的影響,進而給購物網站的經營者帶來更多更有用的信息,提高網站的盈利能力。這就是機器學習的本質。
機器學習的發展與云計算的普及幾乎同步,其原因在于云應用程序、平臺和基礎設施的無縫集成將信息孤島打破,把各個組織及其網絡的數據都吸引進來,為機器學習所用。機器學習所基于的算法需要盡可能多的、來自不同領域的數據。聚集的數據量越多,它就會變得越聰明,其決策潛能也就越大。機器學習的基礎是數據的掌握和應用。如果擁有更多的數據并且有更強的數據處理和分析的能力,機器學習的效果就更好,甚至可以超出人類的水平,甲骨文公司提出自治的云平臺的概念,這個概念就像無人駕駛汽車一樣,將一些局部的應用結合成為一個整體,成為一個基于機器學習的無人干預的云平臺。
Strategy Analytics近期發布的研究報告指出,全球今年銷售的智能手機每三臺就有一臺使用基于人工智能(AI)的虛擬助手,而且基于設備的機器學習功能會大大提高智能手機AI的運行速度。機器學習技術已經被應用到智能手機的各類應用中。最為著名的是智能手機上的“Siri”和Cortana(微軟小娜)等虛擬手機助手,可以幫助你管理日程,設置鬧鐘、打電話、發信息、打開應用、搜索、導航、翻譯,并回答你的任何問題。還能根據你的喜好,主動推送專屬于你的定制信息。此外還有許多新穎的智能App被不斷研發出來,如飲食助手APP“Bitesnap”,可以通過拍照識別飯菜并計算它的熱量營養,協助用戶進行熱量攝入控制,更有效地執行用戶的膳食計劃。當你碰到喜歡的東西,但不知道產品的商業信息時,一款名為“拍立淘”的軟件可以大顯身手,通過這個應用對感興趣的物品進行拍照,我們很快便會在阿里系的購物網站上獲得該物品的信息,目前拍立淘的適用商品基本覆蓋了消費者的所有需求,包括男女裝、鞋包、配飾到瓶飲、日用品、化妝品等等。訊飛輸入法APP是一款可以識別方言的語音輸入法,不僅支持粵語、英語、普通話識別,還支持客家話、四川話、河南話、東北話、天津話、湖南(長沙)話、山東(濟南)話、湖北(武漢)話、安徽(合肥)話、江西(南昌)話、閩南語、陜西(西安)話、江蘇(南京)話、山西(太原)話、上海話等方言識別,具有強大的語音識別效果,語音識別率超過95%。形色APP是一款識別花卉、分享附近花卉的APP應用。可以一秒就能識別植物,支持識別4千種植物,準確率高達82%,可以在1~5秒內給出花名,App內部也有識花大師幫忙鑒定植物,地圖上更有特色植物景點攻略。綜上,上述智能App的開發和應用就是源于大數據的機器學習的結果。2018年3月6日下午,芯片廠商ARM在北京舉辦發布會上公布了4款新GPU,分別為Mali-G52、Mali-G32、Mali-D51和Mali-V52,在最重要的機器學習能力上,Mali-G52是上一代產品的3.6倍,這意味著絕大多數智能設備在未來都能擁有機器學習能力。
現代社會文明的快速發展,使得人們追求“健康生活”的愿望日益強烈,人們比以往更加關注自己的身體健康,在這種背景之下,以實時監測血液、心臟及運動能耗等生理指標的智能穿戴產品應運而生,如智能手環、智能手表、智能眼鏡等,我們的體力活動、位置以及身體生理數據等每一點變化都成為了可被記錄和分析的數據。基于加速度探測技術的智能可穿戴設備,通過加速度傳感器探測人體身體活動的加速度,再依靠一系列算法估算人體體力活動的能量消耗,為我們的健康飲食和運動方式提供大量的數字化信息。2017年11月美國斯坦福醫院就宣布和蘋果合作,通過iWatch對心率的監測探索是否能對房顫等心臟病進行預警。蘋果公司通過軟件采集人體生理數據,基于機器學習算法對光電反射傳感器采集的心率大數據,針對于該用戶進行自適應的個性化心律曲線分析,并針對該用戶建立相匹配的心律狀況評價函數,實時分析出用戶心律狀況,區分心臟節律與其他雜音,從而發現心律異常等問題并將信息發送到蘋果手機上并進行心律異常狀況預測和預警。微軟公司也在2017年Build大會上則展示了一款可以識別帕金森患者顫抖頻率的手環,并通過同樣頻率的顫抖幫助帕金森患者寫字。通過不斷地進行多種形式的機器學習,智能穿戴設備有望給我們的生活帶來不斷的驚喜。以睡眠為例,手環對體征的監測完全可以被融入到物聯網的大話題下,手環把監測到的數據和歷史數據進行對比和分析,得出“用戶最近的睡眠質量差”的判斷,可以直接推薦用戶購買褪黑素等保健產品以及針對性的生活方式方面的個性化建議。比如智能球拍在進行大量的“機器學習”鍛煉后,就可以記錄用戶手臂的運動軌跡并進行分析,通過震動的方式矯正用戶運動姿勢。
機器學習是一個活躍且充滿生命力的研究領域,同時也是一個困難和爭議較多的研究領域。從目前研究趨勢看,機器學習今后主要的研究方向如下:
人類和機器誰是未來世界的主宰一直存在大量爭論,機器是人類發明的,但其初衷是希望幫助人類更好地發展,目前在很多問題的處理上還存在諸多不足,因此需要進一步借鑒人類學習機制,拓展現有的機器學習思路。
從目前機器學習的4種主要方式來看,均各有其長處和不足,有必要通過新的方法和手段進一步完善現有的學習方式。即如何通過更少的數據(標簽數據或非標簽數據),建立更有效的數學模型,進行更準確的結果判斷或解決方案。
進一步拓展機器學習研究的領域及深度,開發出更多、更好的智能App應用。