唐智杰
1958年,計算科學家Rosenblatt提出了由兩層神經元組成的神經網絡。他給它起了一個名字--“感知器”(Perceptron),感知器是當時首個可以學習的人工神經網絡。Rosenblatt現場演示了其學習識別簡單圖像的過程,在當時的社會引起了轟動。
人們認為已經發現了智能的奧秘,許多學者和科研機構紛紛投入到神經網絡的研究中。美國軍方大力資助了神經網絡的研究,并認為神經網絡比“原子彈工程”更重要。這段時間直到1969年才結束,這個時期可以看作神經網絡的第一次高潮。
時至今日,大數據技術已進入人們地生活,作為一項發展前景廣闊地技術,其實還有很多作用有待挖掘,比如為人們地生活帶來方便,為企業帶來更多利益等。在大數據的時代背景下,數據的處理與分析就成了一個被提上日程的問題,而大數據與人工智能的緊密相關性決定了數據的發展模式必定是大數據+人工智能的模式。因為人工智能算法的訓練與調優離不開大量數據員,就需要使用大數據分析技術來對數據源做出歸類與過濾,以提供優質的數據。人工智能的出現于發展具有重大的意義。
生物神經網絡主要是指人腦的神經網絡,它是人工神經網絡的技術原型。人腦是人類思維的物質基礎,思維的功能定位在大腦皮層,后者含有大約1011個神經元,每個神經元又通過神經突觸與大約103個其它神經元相連,形成一個高度復雜高度靈活的動態網絡。作為一門學科,生物神經網絡主要研究人腦神經網絡的結構、功能及其工作機制,意在探索人腦思維和智能活動的規律。
人工神經網絡是生物神經網絡在某種簡化意義下的技術復現,作為一門學科,它的主要任務是根據生物神經網絡的原理和實際應用的需要建造實用的人工神經網絡模型,設計相應的學習算法,模擬人腦的某種智能活動,然后在技術上實現出來用以解決實際問題。因此,生物神經網絡主要研究智能的機理;人工神經網絡主要研究智能機理的實現,兩者相輔相成。
多少年以來,人們從醫學、生物學、生理學、哲學、信息學、計算機科學、認知學、組織協同學等各個角度企圖認識并解答上述問題。在尋找上述問題答案的研究過程中,逐漸形成了一個新興的多學科交叉技術領域,稱之為“神經網絡”。神經網絡的研究涉及眾多學科領域,這些領域互相結合、相互滲透并相互推動。不同領域的科學家又從各自學科的興趣與特色出發,提出不同的問題,從不同的角度進行研究
當人類首次發明計算機時,就已經開始思考如何讓計算機變得智能。如今,人工智能(artificial intelligence)已經成為一個非?;馃岬念I域,并且具有眾多活躍的研究課題以及惠及生活方方面面的實際應用。這個領域目前正在以幾何倍的速度增長著,并且未來也將持續健康發展。人們希望可以借助人工智能自動地處理一些主觀的,非規范性的事物,如識別圖像等。
在人工智能發展初期,計算機很容易處理一些人類很難甚至是無法解決的問題,這些問題可以用一種形式化的數學規律來描述。人工智能真正面臨的任務是那些很難用形式化符號描述的任務,當然對于人類來說很容易執行。舉個例子,人們能夠輕松識別對方說的話,也能夠輕易識別圖像中的物體。對于這類問題,計算機卻無法給出自己的判斷。
計算機很擅長助理抽象和形式化的任務,但是人類卻覺得這是很困難的腦力勞動。早在上個世紀,計算機就在國際象棋方面戰勝了人類選手。但一直到最近幾年,計算機才在語音和圖像識別任務中達到人類一般水平。通常一個人的思維發育需要海量有關外界的知識。相當一部分領域的知識是主觀的,并且很難用形式化的結構表示清楚。同人類一樣,計算機也要獲得同樣數量級的知識才能表現得智能化。因此,對于研究人工智能領域的學者來說,關鍵的挑戰就是如何將這些主觀的、非形式化的知識教會計算機來學習。
早期的研究項目有一些基于知識庫方法,這種方法用近似于窮舉的方式將知識用結構化的符號進行存儲,然后設計相應的邏輯規則讓計算機來理解這些符號的聲明??上攵?,這樣的工程耗時又費力,失敗也是意料之中的。究其原因,這些結構化符號和聲明是由人類主觀選取的,人類尚無法構造出可以精確地描述世界的算法規則。
人工神經網絡為人工智能的研究帶來了前所未有的期望。人工神經網絡并不是近代的產物,上世紀50年代就驗證了其可行性,為什么直到最近幾年才被普遍接受?這也是研究深度網絡算法的意義之所在。首先日俱增的數據量得以存儲,出現了很多專門用于研究神經網絡的數據集,這些數據集越來越大并且質量都很高,如圖1-1所示。人們迫切希望有一種算法能從海量數據中發現事物的本質。其次是大規模的模型已經出現,經過近幾十年的發展,模型中神經元的連接數已經達到了數十億級,逐漸接近人類大腦的連接數。科學家預計這種增長勢頭將穩定持續到未來若干年。最后人工神經網絡模型做決策的能力一直在提高,各大數據集上的準確率不斷被刷新。深度學習發展迅速,但仍然很年輕,還有很多未知領域的研究和實際應用等著人類去發掘。