商政淳
摘 要:人工智能是繼互聯(lián)網(wǎng)革命之后的又一次人類文明重大進(jìn)步,將極大的改變?nèi)藗兩畹母鱾€(gè)方面,本文嘗試對(duì)人工智能科學(xué)和技術(shù)做一個(gè)深入淺出全貌梳理,以加深對(duì)其本質(zhì)的認(rèn)識(shí)。
關(guān)鍵詞:人工智能;數(shù)理邏輯;機(jī)器學(xué)習(xí)
一、引子
人工智能在科學(xué)上不是一個(gè)生疏的名詞,由于近期阿爾法圍棋機(jī)器人在與人類頂級(jí)職業(yè)棋手的對(duì)決賽事上,戰(zhàn)績(jī)斐然,從而再次喚起了公眾對(duì)人工智能的高漲熱情。不僅如此,考試答題、新聞寫(xiě)作、無(wú)人駕駛汽車、人臉識(shí)別等等,人工智能涉足眾多領(lǐng)域,發(fā)展前景令人期待。人工智能究竟是什么?這是一個(gè)廣闊且深邃的話題,這里嘗試著做一個(gè)簡(jiǎn)明的闡述。概括地講:人工智能的目標(biāo)是實(shí)現(xiàn)計(jì)算機(jī)像人類一樣思考和行動(dòng)。
二、從計(jì)算談起
人類一直夢(mèng)想把自己的思維數(shù)學(xué)化,即實(shí)現(xiàn)思維過(guò)程可計(jì)算,這是早期人工智能萌芽。計(jì)算分為:“運(yùn)算”和“推理”,人工智能借助于后者。從自然語(yǔ)言中提煉知識(shí),主要包括概念和推理。當(dāng)然不是所有的自然語(yǔ)言都能用來(lái)思考,選擇能夠判斷非真即假的陳述句作為基本概念的描述,例如:“雪是白的”、“1+1=2”,叫做“命題”。大量陳述句可以被繼續(xù)分解為兩個(gè)部分,例如:“張三是學(xué)生”(主體身份)、“張三和李四是兄弟”(主體間關(guān)系),叫做“謂詞”。最終用非、和、或等進(jìn)行組合搭配,形成接近現(xiàn)實(shí)社會(huì)的復(fù)雜概念。
概念之間存在從前提到結(jié)論的因果關(guān)系,語(yǔ)言實(shí)踐總結(jié)出三類推理關(guān)系。
(1)必要不充分:“地面潮濕(前提),下雨了(結(jié)論)”;
(2)充分不必要:“如果天不下雨(前提),我就去(結(jié)論)”;
(3)充分且必要:“觸犯刑律,當(dāng)依刑法論處(互為前提和結(jié)論)”。
提取充分不必要為推理形式,即前提為真,結(jié)論必為真。
在直觀、不嚴(yán)謹(jǐn)、非形式化的基礎(chǔ)上,完成重要升華——數(shù)學(xué)化,主要包括形式化和公理化。
所謂形式化就是用符號(hào)替代自然語(yǔ)言。例如: P替代陳述句; P(x)替代謂詞,其中P代表屬性和關(guān)系,x代表主體;┐、∧、∨替代非、和、或;→替代推理等等。所謂公理化就是從最少的幾條公理出發(fā),使用規(guī)則,進(jìn)而得出所有結(jié)論。即用最少的符號(hào)、規(guī)則、公理、推理表達(dá)完整體系。至此就初步建立了一套數(shù)理邏輯的系統(tǒng)方法,模擬人腦的思考過(guò)程。
專家系統(tǒng)就是以數(shù)理邏輯為基礎(chǔ)開(kāi)發(fā)的早期人工智能典型產(chǎn)品,它只需給出初始和約束條件,根據(jù)規(guī)則,就可以由計(jì)算機(jī)自動(dòng)演繹得出結(jié)果。這個(gè)階段的人工智能非常初級(jí),完全是以人的先驗(yàn)知識(shí)為化身,沒(méi)有學(xué)習(xí)能力,理論上也存在重大缺陷,根據(jù)哥德?tīng)柌煌耆ɡ恚嬖诩炔荒茏C明為真,也不能證明為假的命題。一句話,存在數(shù)理邏輯人工智能范疇無(wú)法求解的問(wèn)題。
三、知識(shí)從哪里來(lái)
早期人工智能還存在一大問(wèn)題,知識(shí)系統(tǒng)的開(kāi)發(fā)需要領(lǐng)域?qū)<液腿斯ぶ悄軐<乙煌槿耄@給大規(guī)模應(yīng)用普及帶來(lái)極大障礙,如何實(shí)現(xiàn)計(jì)算機(jī)自我學(xué)習(xí)——機(jī)器學(xué)習(xí),成為下一代人工智能的迫切任務(wù)。
機(jī)器學(xué)習(xí)目標(biāo)是研究知識(shí)的形成,參照人類經(jīng)驗(yàn):海量外部感知+人腦思考=知識(shí),由此假想出機(jī)器學(xué)習(xí)技術(shù)組成是:輸入訓(xùn)練數(shù)據(jù)+學(xué)習(xí)算法=輸出知識(shí)模型,學(xué)習(xí)算法是核心。
人類存在兩種主要學(xué)習(xí)方式:對(duì)已有知識(shí)的學(xué)習(xí)(監(jiān)督、半監(jiān)督學(xué)習(xí))和自我學(xué)習(xí)(無(wú)監(jiān)督學(xué)習(xí))。
(一)監(jiān)督學(xué)習(xí)
監(jiān)督學(xué)習(xí)是有參照學(xué)習(xí)。例如:西瓜包括色澤、根蒂、敲聲、重量、產(chǎn)地等一系列“特征”,每個(gè)特征又包括一系列“值”,如色澤:青綠、烏黑、淺白……;根蒂:卷縮、稍卷、硬挺……;敲聲:濁響、沉悶、清脆……;產(chǎn)地:南方瓜、本地瓜、北方瓜……。每個(gè)西瓜都有一組數(shù)據(jù),一堆西瓜構(gòu)成一組輸入訓(xùn)練數(shù)據(jù)。參照標(biāo)準(zhǔn)可以是簡(jiǎn)單的“好瓜”、“壞瓜”,也可以是復(fù)雜的“沙瓤瓜”、“水瓤瓜”……。依據(jù)參照標(biāo)準(zhǔn)進(jìn)行分類(算法),當(dāng)很多組訓(xùn)練數(shù)據(jù)反復(fù)訓(xùn)練之后,就得到一個(gè)選擇西瓜的“模型”。
(二)無(wú)監(jiān)督學(xué)習(xí)
無(wú)監(jiān)督學(xué)習(xí)是無(wú)參照學(xué)習(xí)。例如:一堆西瓜,分別測(cè)量每個(gè)西瓜的指標(biāo),如“密度”、“含糖率”、…,反復(fù)對(duì)比西瓜之間的數(shù)據(jù),最后將相似度高的放在一類。
(三)人工神經(jīng)元網(wǎng)絡(luò)
為了深度模擬人類思考,機(jī)器學(xué)習(xí)人工智能干脆直接移植了人腦神經(jīng)元網(wǎng)絡(luò)機(jī)制,也稱“深度學(xué)習(xí)”。神經(jīng)元由細(xì)胞體和細(xì)胞突組成,細(xì)胞突又分為樹(shù)突和軸突,樹(shù)突接收外來(lái)刺激(多個(gè)),軸突發(fā)出刺激(一個(gè)),無(wú)數(shù)神經(jīng)元相互對(duì)接,連接成神經(jīng)元網(wǎng)絡(luò)。參照建立人工神經(jīng)元網(wǎng)絡(luò)模型:用突觸(可賦權(quán)值的多路輸入)替代樹(shù)突;用替加法器代細(xì)胞體;用激活函數(shù)替代軸突。由于“模型”先定,訓(xùn)練數(shù)據(jù)是逆向傳播(輸出到輸入),核心算法是“加權(quán)取合”,最后正向求解(輸入到輸出)。例如:選西瓜從神經(jīng)元網(wǎng)絡(luò)的輸出端反向訓(xùn)練,每個(gè)西瓜都在多路輸入上留下“權(quán)值”:青綠(色澤)、卷縮(根蒂)、濁響(敲聲)……反復(fù)訓(xùn)練數(shù)據(jù)后得到具體問(wèn)題的神經(jīng)元網(wǎng)絡(luò)。
四、實(shí)踐出真知
神經(jīng)元網(wǎng)絡(luò)幾乎涵蓋了所有震撼應(yīng)用!激發(fā)了對(duì)人類原始智能進(jìn)化的空前興趣,探索低級(jí)智能機(jī)制——行為人工智能,成為人工智能研究的又一大亮點(diǎn)。
遺傳算法是行為人工智能的典型代表。與人工神經(jīng)元網(wǎng)絡(luò)一樣,行為人工智能直接移植了自然生物進(jìn)化機(jī)制。
自然生物進(jìn)化的機(jī)理是:物競(jìng)天擇。種群中優(yōu)質(zhì)個(gè)體有機(jī)會(huì)勝出是“物競(jìng)”,實(shí)際勝出則是“天擇”。
參照建立人工遺傳算法機(jī)制:確定初始種群;適應(yīng)度計(jì)算替代物競(jìng);選擇、交叉和變異替代天擇。
人工遺傳算法的步驟是:計(jì)算出種群中所有個(gè)體接近未來(lái)目標(biāo)的系數(shù)(適應(yīng)度計(jì)算);用概率選出優(yōu)秀個(gè)體(選擇);個(gè)體間大概率成對(duì)交叉復(fù)制重組(交叉);個(gè)體內(nèi)小概率突變(變異);在沒(méi)有外界干預(yù)下反復(fù)迭代完成進(jìn)化。
五、智慧之光伸向遠(yuǎn)方
數(shù)理邏輯、機(jī)器學(xué)習(xí)、行為智能是三個(gè)發(fā)展階段,是從高、中、低三個(gè)層次模擬人類智能,也是一個(gè)整體。數(shù)理邏輯是自上而下的方法,把先驗(yàn)知識(shí)存儲(chǔ)在“黑箱”中,不必知道黑箱內(nèi)部構(gòu)造。優(yōu)點(diǎn)是:用接近人類自然語(yǔ)言的形式表達(dá)知識(shí)和推理。不足是:應(yīng)用繁雜,無(wú)法普及,沒(méi)有學(xué)習(xí)能力。
機(jī)器學(xué)習(xí)是自下而上的方法,設(shè)計(jì)“黑箱”內(nèi)部結(jié)構(gòu),基于部分先驗(yàn)知識(shí),自我訓(xùn)練。優(yōu)點(diǎn)是:應(yīng)用簡(jiǎn)潔,效率突出,具備學(xué)習(xí)能力。不足是:知識(shí)表達(dá)隱含晦澀。行為智能也是自下而上的方法,借鑒人類智慧歷經(jīng)漫長(zhǎng)實(shí)踐進(jìn)化而來(lái)的事實(shí),模擬身體的運(yùn)作機(jī)制,物競(jìng)天擇。優(yōu)點(diǎn)是:擅長(zhǎng)解決適應(yīng)性、行為反應(yīng)等問(wèn)題。不足是:無(wú)法解決高級(jí)智能問(wèn)題。
總之,人工智能無(wú)論在理論和實(shí)踐上還都相當(dāng)初級(jí),只是借助計(jì)算機(jī)技術(shù)的鼎力相助,使原始的人工智能得以在應(yīng)用中大放異彩,人工智能的未來(lái)充滿坎坷,但無(wú)限美好。