岳未央
人工智能(AI)機器學習是誕生于20世紀中葉的一門年輕的學科,它對人類的生產、生活方式產生了重大的影響,也引發了激烈的哲學爭論。佛羅里達國際大學計算與信息科學學院助理教授馬克·弗雷森(Mark Finlayson)認為,AI帶來的真正危險不在于艾隆·馬斯克(Elon Musk)和斯蒂芬·霍金(Stephen Hawking)(他對AI完全不懂)所述的機器人會胡作非為。真正的危險在于:AI會如何影響我們對待自己的方式,這就像核武器的威懾力那樣。并且這一可能性與我們的距離遠比我們自己設想的要近,它幾乎就是已經在發生的事實:Uber聲稱要給我們提供許多無人駕駛汽車。如果這件事真的發生了,想象一下相關行業的利潤不是與全世界競爭共享,而是流入一個單獨的公司中或者一個人的口袋中時,世界會發生怎樣的劇變?
有一個說法,說科技的進步是遠遠超過人類本身的進化,之所以科技和信息技術有如此飛速的成長,主要的一個原因就是所謂的摩爾定律,摩爾定律就是我們的計算能力每過18個月就翻一次倍,在過去一直按照摩爾定律進行。
今后的發展如果按常規的技術用摩爾定律進行推進的話,會碰到一個瓶頸。為何會出現這種情況呢?本質上的原因是在于如果把一臺電腦放在自己的大腿上,時間長了我們會覺得很燙。這是因為在計算過程中電子的能耗非常大,而假設每個三極管所產生出來的熱量都是差不多,經過18個月翻一次倍速的運行增長,機器本身的發熱量也將相應翻一次倍。這就意味著目前的這臺機器已經無法滿足日常的“超負荷”運行需求,我們需要更高的技術和更好的材料來承載更高速能帶來的更大負荷。
但是對于科學家來說這是一個非常好的機會,能不能尋找一個新型創新摩爾定律能夠繼續往前進非常關鍵。摩爾定律會碰到這樣的問題:在趕集的集市,想象你是一輛跑車,它在趕集的時候始終在碰撞,如果不能散發熱量就會受到阻礙。如果想到這個原理大家就可以想到我們為什么不為電子在芯片的層次做一個高速公路,這就是科學研究的發明,電子在芯片層次有一個車道的概念,能夠各行其道互不干擾。在右邊我們可以使用尾燈,這個車往前走,在左邊的話我們是往前開,如果能把高速公路的運動模式實現在電子芯片層次的運動模式,我們真正意義上有一個新的工作原理,使得摩爾定律能夠往前推進。
之所以人工智能在最近一段時間能夠有突飛猛進的成長,主要是幾個原因:一個受到摩爾定律的影響,由于計算能力每過18個月就翻一次倍,用的芯片就能夠做非常快速的信息處理,單位元能夠做的機器處理比人的大腦神經元都來得多。如果能把機器芯片模仿人的大腦神經元,就能形成一個網狀的神經機構,大數據的時代使得及其能夠快速學習。人工智能現在還只是停留在仿生學的一個階段,可以做一個類比,比如人類曾經非常向往飛翔,我們之所以向往飛翔就是看到鳥會飛,看到鳥會飛,我們就想自己能不能也長一個翅膀飛。比如偉大的藝術家達 . 芬奇曾經設計過人身上輔助一個翅膀能飛起來,所以這是一個簡單的仿生學。但我們人類真正能夠學會飛行是由于我們理解了飛行的原理——空氣動力學,一旦我們理解了飛行的原理就可以造大飛機,大飛機看起來和鳥不完全一樣,但卻是從鳥那邊來的啟發。所以這對于人工智能來講也是最大的挑戰,現在的人工智能還僅僅停留在用神經元仿生的原理,而我們真正需要的則是一個能夠發展人工智能的理論基礎。
人工智能是怎樣發展起來的
回顧整個人工智能發展史,不得不去引發高度關注的是“機器學習”這樣一個重要的鋪墊式技術發展進程:
奠基時期
20世紀50年代初到60年代中葉
Hebb于1949年基于神經心理學的學習機制開啟機器學習的第一步。此后被稱為Hebb學習規則。Hebb學習規則是一個無監督學習規則,這種學習的結果是使網絡能夠提取訓練集的統計特性,從而把輸入信息按照它們的相似性程度劃分為若干類。這一點與人類觀察和認識世界的過程非常吻合,人類觀察和認識世界在相當程度上就是在根據事物的統計特征進行分類。而這個研究成果也就正式揭開“機器學習”也就是“人工智能”技術的第一篇章。
從60年代中到70年代末,機器學習的發展步伐幾乎處于停滯狀態。雖然這個時期基于邏輯的機器歸納學習系統取得較大的進展,但未能投入實際應用。這個時期的研究目標是模擬人類的概念學習過程,并采用邏輯結構或圖結構作為認知基礎。機器能夠采用符號來描述概念,并提出關于學習概念的各種假設。
事實上,這個時期整個AI領域都遭遇了瓶頸。當時的計算機有限的內存和處理速度不足以解決任何實際的AI問題。要求程序對這個世界具有兒童水平的認識,研究者們很快發現這個要求太高了:1970年沒人能夠做出如此巨大的數據庫,也沒人知道一個程序怎樣才能學到如此豐富的信息。于是AI研究就此告一段落,人們的“人工智能”夢也因此暫時進入休眠狀態。
20世紀70年代末到80年代中葉
從70年代末開始,人們從學習單個概念擴展到學習多個概念,探索不同的機器學習策略和各種學習方法。這個時期,機器學習在大量的時間應用中回到人們的視線,又慢慢復蘇。1980年,在美國的卡內基 . 梅隆大學(CMU)召開了第一屆機器學習國際研討會,標志著機器學習研究已在全世界興起。此后,機器歸納學習進入應用。
蓬勃發展時期
21世紀初至今
機器學習發展分為兩個部分,淺層學習(Shallow Learning)和深度學習(Deep Learning)。1)這個階段的人工神經網絡具有優異的特征學習能力,學習得到的特征能對數據有更本質的認識和分類;2)深度神經網絡在訓練上的難度,可以通過“逐層初始化”來有效克服,且這種學習能夠在無監督的狀況下實現的(網絡系統基于語料庫自動抓取)。
神經網絡模型貌似能夠實現更加艱難的任務,如目標識別、語音識別、自然語言處理等。但是,應該注意的是,這絕對不意味著其他機器學習方法的終結。盡管深度學習的成功案例迅速增長,但是對這些模型的訓練成本是相當高的,而維護和二次開發的成本依舊很高。
由此我們可以看出機器學習的發展并不是一帆風順的,它也經歷了螺旋式上升的過程,成就與坎坷并存。其中大量的研究學者的成果才有了今天人工智能的空前繁榮,是量變到質變的過程,也是內因和外因的共同結果。
人工智能在關鍵領域的“跨界合作”
AI和自動化機器人已經對我們的生活產生了極大的沖擊,從打掃衛生這樣簡單的事到像自動駕駛汽車和Google DeepMind這樣的復雜任務。AI現在覆蓋的領域已經非常火,有大數據、移動互聯網、有人工智能,總體而言人工智能有兩個主要的應用路徑:
一是用云端大量的數據做計算來成為行業決策的重要輔助工具,而這種途徑通常只適用于大企業。伴隨著大數據、云計算等新一代信息技術的快速發展和智能化應用需求的日益凸顯,今年“阿爾法狗”將人工智能的話題推向了一個新熱度。人工智能技術的突飛猛進不僅體現在神秘的機器人領域,它在人們日常生活中的發展和應用同樣越來越引人注目。
人們對新事物總是充滿恐懼。就在大家擔心無人駕駛汽車是否弊大于利的時候,AI重塑金融規律的創新也引起許多人對其中的法律和道德問題的顧慮。讓一個軟件程序來決定,誰擁有投資開戶的資格,誰能夠獲得貸款(征信),應該收取多少的費率,甚至在主流金融體系之外的金融服務客戶都可能收獲意想不到的后果。但也有些人認為,沒有什么能夠比算法更公平公正了——純粹數學,畢竟,不會有偏見,對吧?
這個論點的缺陷之一是,算法也是人為創建的,通常會在連他們都意識不到的細微處隱含了偏見。這些偏見也許會被嵌入到算法當中。比如,去年卡內基 . 梅隆大學 的研究者測試谷歌的算法是如何向用戶推送廣告時發現,廣告設置中的“男性”和“女性”標簽中,谷歌會給“男性”用戶推薦薪酬更高的招聘廣告。更極端地說,一個人工智能引擎做出信貸決策時,也許會傾向于只認可常春藤盟校畢業的,或者家庭收入超過30萬美元的群體。
人工智能,究其本質而言,還不能完全控制今天的以規則為基礎的系統。在AI里面,電腦可以隨著時間的推移來學習人們通常是如何做的:通過接收信息,然后決策基于這些數據進行征信決策,并不斷觀察結果進行風控。隨著它們在錯誤和正確的信息中不斷學習,它們會不斷修正自己的規則和算法,然后開始作出它們自己的結論。
喬治 . 華盛頓大學社群主義政策研究所國際事務教授兼主任Amitai Etzioni指出,無人駕駛汽車被指示不要超速,但它們也被設計了學習程序。當周圍的汽車加速時,它也會加速。它們所謂的標準是根據周圍的參照而對結果做出調整。
使用人工智能自動化決策的另一個問題是,它們是否會使用智能合約技術自動執行,謂之可依賴性。“一不小心,我們就可能無法實現我們認為通過自動化能夠做好的一切,”多倫多一名專門研究反洗黑錢規則、反恐怖主義集資、跨國資產追回的律師,Digital Finance Institute聯合創始人克里斯丁·度海枚(Christine Duhaime)表示,“原因是,我們實現越高水平的自動化后,就越難與人類溝通問題。如果一個自動生成的決策將對客戶造成消極后果,那么這需要對其有一個保護的機制。”
確保決策過程中所有被用到的數據都是精確且最新的,這對企業來說是一個特別的責任,除非用戶明確表示授權,同時企業在適當的時候具備恰當的技術安保措施和隱私保護政策,并且只訪問特許儲存的數據。度海枚指出,在AI中還有一個危險隱患是,該技術實則將那些無法使用計算機或移動設備的殘疾人和老者排除在外了。“在這樣的情況下,我們打著普惠金融的旗號,最后卻將大部分客戶拒之門外,我們實際也沒有解決銀行現存問題的能力。這只不過是制造了不可解的新的金融問題罷了。”
其次就是被用于與生物科技領域的人工智能技術。生物學者通常通過人工智能來讀許多醫學的圖片,比如看X光的圖片、看超聲波的圖片、看核磁共振的圖片。這也是在生物基因技術產業上非常好的布局。日前,CB Insights 研究公司整理出一份醫療領域AI創業圖景,統計了全球活躍其中的 92 家初創公司。在 2011 年,人工智能醫療公司的融資交易只有 10 起,而到了 2015 年,這個數字達到了 60 起。
Frost & Sullivan 的分析師 Harpreet Singh Buttar表示,“到 2025 年,不管是人類大健康管理,還是利用虛擬形象與患者交流,AI 都會滲透其中,貫穿生活的方方面面。”從中我們也能看到人工智能+醫療的一些關注熱點。
圖像及診斷類:從 2015 年 1 月開始,圖像及診斷類的 22 家 AI 創業公司中,有17家獲得了天使/ A 輪融資,可以感受到這一領域已經呈井噴之勢。Frost & Sullivan的一份報告指出,2005年以來,醫學成像資料存儲量已經增長10倍,并且隨著更多先進設備的推出還會繼續增長。
藥物挖掘公司:目前, 8 家藥物挖掘公司中已經有 6 家獲得了風投,藥物挖掘同樣也是一個值得關注的領域,相關的新興公司也不少。
以腫瘤治療為代表的精準醫療:腫瘤治療因其復雜性及個性化的特點,如果能運用人工智能實現“降維”精準打擊,無疑能提高治療的效率,說不定又會有一條生命因為科技而被拯救呢?
遠程病患監控:目前的初創公司主要是通過自然語言處理及深度學習實現這一功能,當患者通過語音描述癥狀時,系統能基于海量數據庫的知識給予反饋。
醫療算法平臺:如果在醫生資源或醫院資源上受到了限制,專注算法并將方案提供給醫療供應商也同樣是一個不錯的選擇。
“AI的下一個挑戰就是把不同的層面聯系在一起,首先要有非常精密的程序。”牛津大學計算機系主任、教授邁克爾·伍迪季(Michael Wooldridge)表示,英國、美國和中國很多人都使用智能手環,它能夠監控人的心率、血糖、走了多少步等,所有這些信息給到AI,就能去實現一些健康的應用。在英國,一種觀點是人工智能最大的應用就是在醫療體系的優化上。英國國家醫療系統的病例,包括所有英國人的病例數據和用藥記錄結合AI技術,將有望極大地完善英國的全民醫療體系。“今天所講的AI就能夠運用到醫療領域,確實為整個醫療行業帶來新的發現,所以人工智能的下一個風口應該是在醫療領域。”