陳俊宇 重慶育才中學
人工智能現狀調查
陳俊宇 重慶育才中學
近些年,人工智能在高度發達的電子技術支持下,以極其迅猛的速度發展起來,甚至很多人工智能產品已經投入應用,走進人們的生活。本文簡單分析了人工智能的發展現狀和現在常用的機器學習算法,并簡單地探討了一下人工智能現如今的發展難點,讓大家對人工智能有一個基礎的了解。
人工智能 現狀 發展
近年來,人工智能學術研究方面最大的成果非深度學習莫屬。深度學習[2]最初由加拿大多倫多大學Hinton教授和他的學生Salakhutdinov于2006年在發表于頂尖學術刊物《Science》上的一篇論文中提出。Hinton在2012年ImageNet圖像分類競賽中利用深度學習技術取得重大突破,識別準確率超出第二名10%以上。深度學習源于人工神經網絡的研究,作為機器學習研究的一個重要分支,其主要目的在于建立、模擬人腦機制來進行數據的分析與解釋。
Hinton教授和他的兩個研究生AlexKrizhevsky和IlyaSutskever于2012年底成立了一個名叫“深度神經網絡研究”(DNNresearch)的公司,3個月后就被谷歌以500萬美元收購。Hinton從此一半時間留在多倫多大學,另外一半時間在硅谷。兩位研究生則成為谷歌的全職雇員。原來在紐約大學教書的YannLecun,2013年底被臉書(Facebook)聘請為人工智能研究院的總管。曾在斯坦福大學和谷歌工作的吳恩達,2012年創立了網上教育公司Coursera,2014年5月被百度聘任為首席科學家負責百度大腦的計劃。2015年,谷歌公布開源機器學習平臺TensorFlow;FaceBook打造其專屬機器學習平臺FBLearnerFlow,大幅提高員工效率;2015年5月,特斯拉創立開源人工智能系統OpenAI。其他工業巨頭也紛紛斥巨資推動人工智能的發展,例如IBM的沃森系統、百度大腦計劃、微軟的同聲翻譯等等。2016年的IBM正在率先推動全球人工智能的第一次商業化浪潮與核心業務轉型。目前,深度學習的研究熱點正在迅速轉向基于深度卷積神經網絡的物體檢測與定位/分割能力,其突破將推動人工智能的實際應用與產業發展。
它是人工智能的核心,是使計算機具有智能的根本途徑,其應用遍及人工智能的各個領域,它主要使用歸納、綜合而不是演繹。
而機器人的學習算法又可以分為監督學習和非監督學習:
在監督式學習下,輸入數據被稱為“訓練數據”,每組訓練數據有一個明確的標識或結果,如對防垃圾郵件系統中“垃圾郵件”“非垃圾郵件”,對手寫數字識別中的“1”,“2”,“3”,“4”等。在建立預測模型的時候,監督式學習建立一個學習過程,將預測結果與“訓練數據”的實際結果進行比較,不斷的調整預測模型,直到模型的預測結果達到一個預期的準確率。監督式學習的常見應用場景如分類問題和回歸問題。常見算法有邏輯回歸(Logistic Regression)和反向傳遞神經網絡(Back Propagation Neural Network)常見的監督學習算法包括回歸分析和統計分類。
非監督學習又稱歸納性學習(clustering)利用K均值聚類(Kmeans),建立中心(centriole),通過循環和遞減運算(iteration&descent)來減小誤差,達到分類的目的。常見算法包括Apriori算法以及k-Means算法。
機器學習的問題主要包括如下4個方面:
(1)理解并且模擬人類的學習過程;
(2)針對計算機系統和人類用戶之間的自然語言接口的研究;
(3)針對不完全的信息進行推理的能力,即自動規劃問題;
(4)構造可發現新事物的程序.
下面介紹兩個目前非常火的兩個算法
(1)人工神經網絡
人工神經網絡算法模擬生物神經網絡,是一類模式匹配算法。通常用于解決分類和回歸問題。人工神經網絡是機器學習的一個龐大的分支,有幾百種不同的算法。(其中深度學習就是其中的一類算法,我們會單獨討論),重要的人工神經網絡算法包括:感知器神經網絡(Perceptron Neural Network),反向傳遞(Back Propagation),Hopfield網絡,自組織映射(Self-Organizing Map,SOM)。學習矢量量化(Learning Vector Quantization,LVQ)
(2)深度學習
深度學習算法是對人工神經網絡的發展。在近期贏得了很多關注,特別是百度也開始發力深度學習后,更是在國內引起了很多關注。在計算能力變得日益廉價的今天,深度學習試圖建立大得多也復雜得多的神經網絡。很多深度學習的算法是半監督式學習算法,用來處理存在少量未標識數據的大數據集。常見的深度學習算法包括:受限波爾茲曼機(Restricted Boltzmann Machine,RBN),Deep Belief Networks(DBN),卷積網絡(Convolutional Network),堆棧式自動編碼器(Stacked Auto-encoders)。