在大數(shù)據(jù)與人工智能發(fā)展得如火如荼的今天,機(jī)器可以輕而易舉地挖掘到海量數(shù)據(jù)。更進(jìn)一步,數(shù)據(jù)間的相關(guān)性很容易被發(fā)現(xiàn),由此人們將更多的目光放在了相關(guān)性上,甚至一度出現(xiàn)了“相關(guān)性能夠取代因果性”的呼聲,這其實(shí)是人們還沒有弄清楚相關(guān)性的本質(zhì)的表現(xiàn)。從人的好奇本心出發(fā),從認(rèn)識(shí)發(fā)展的數(shù)千年歷史來看,人類的目光從來不會(huì)停留在眼前實(shí)用的水平之上,人們總會(huì)不斷地追問“為什么”這樣的“形而上學(xué)”問題,因此,“因果”就成了人類理解世界的基本框架,它是貫穿哲學(xué)和科學(xué)史的一個(gè)極其重要的核心概念。
在相關(guān)性凸顯的大數(shù)據(jù)時(shí)代,如何厘清相關(guān)性與因果性兩者之間的關(guān)系,自然成為人們爭(zhēng)論不休的一個(gè)熱門話題。我們擬從認(rèn)識(shí)的不透明性(Epistemic Opacity)這一分析角度出發(fā),以期使人們對(duì)相關(guān)性與因果性之間的復(fù)雜關(guān)系能有若干新的理解。
從古希臘伊始,哲學(xué)先賢們就不斷追尋世界的本原,而后科學(xué)從哲學(xué)母體當(dāng)中逐漸分離出來;當(dāng)然,無論是哲學(xué)還是科學(xué),其不斷發(fā)展在某種程度上都是為了能夠?qū)崿F(xiàn)對(duì)世界的所謂“理解”,即透明性認(rèn)識(shí)。然而,到了20世紀(jì),隨著計(jì)算機(jī)的出現(xiàn)與應(yīng)用,一種以計(jì)算機(jī)為核心研究工具的計(jì)算科學(xué)應(yīng)運(yùn)而生,特別是在當(dāng)前的人工智能領(lǐng)域,認(rèn)識(shí)的“不透明性問題”的表現(xiàn)日益突出,由此引發(fā)了許多學(xué)者的關(guān)注。
在有關(guān)世界本原問題的探索之路上,古希臘哲學(xué)家畢達(dá)哥拉斯獨(dú)辟蹊徑,提出了“萬物皆數(shù)”的觀點(diǎn),實(shí)際上強(qiáng)調(diào)了對(duì)世界的數(shù)學(xué)描述與抽象化認(rèn)識(shí)的重要性。到了近代科學(xué)發(fā)展時(shí)期,伽利略直接把宇宙看成是一部由數(shù)學(xué)寫成的大書,并用實(shí)驗(yàn)與數(shù)學(xué)相結(jié)合的方式研究自然界。牛頓作為經(jīng)典力學(xué)的集大成者,建立了以運(yùn)動(dòng)力學(xué)三大定律和萬有引力定律為公理基礎(chǔ)的理論體系,開創(chuàng)了近代科學(xué)分析、解決問題的基本科學(xué)方法論模型或范式。及至當(dāng)代,惠勒又進(jìn)一步提出了“萬物源于比特”的主張;同時(shí)伴隨計(jì)算科學(xué)的深入發(fā)展,一種新的世界觀即計(jì)算主義逐步形成,它把宇宙看作是可計(jì)算的量子計(jì)算機(jī),形成的是信息論式的科學(xué)范式,把物質(zhì)粒子看作是信息模式,把物理規(guī)律看作是算法,認(rèn)為萬物都可通過算法理論而實(shí)現(xiàn)。總之,從數(shù)的角度來理解世界,早已成為科學(xué)認(rèn)識(shí)中最悠久的傳統(tǒng)——人類一直都在追求的對(duì)世界的透明化認(rèn)識(shí),離開了數(shù)這一核心要素根本就無從談起。尤其是關(guān)于量的認(rèn)識(shí)還代表了人類認(rèn)識(shí)的深化程度:一個(gè)學(xué)科是否成熟的標(biāo)志之一,就是看它是否從定性研究階段進(jìn)入了定量研究階段。于是,“數(shù)學(xué)化”由于其專門化和符號(hào)化的特征,順理成章地成為人們表達(dá)科學(xué)思想與理論的最主要的形式,我們也可以將這一過程及其結(jié)果稱之為“科學(xué)表征”。認(rèn)識(shí)的透明性也因此與科學(xué)表征密切聯(lián)系在一起。我們以一種能被人類進(jìn)行明確審查、分析、解釋的方式來表示系統(tǒng)的狀態(tài)以及這些狀態(tài)之間轉(zhuǎn)換時(shí)所遵循的規(guī)則或規(guī)律,我們所熟悉的自然科學(xué)的形式化表征以及人文科學(xué)的語言表征通常都是透明的——理論模型以及模型的每個(gè)部分如獨(dú)立擲幣的過程及投擲概率的恒定性等都可以被明確地表征。但是,在計(jì)算機(jī)科學(xué)中,“‘透明性’更可能涉及到一種信息不可見的情形,例如,一種應(yīng)用程序或者計(jì)算過程反對(duì)其使用者來說是透明的”。總的來說,在透明的表征中,透明性主要是指認(rèn)識(shí)主體對(duì)研究對(duì)象能夠作出適合于人類語言規(guī)則的解釋,即研究主體可以訪問、得到并能以自身理解的方式來把握系統(tǒng)的本質(zhì),它強(qiáng)調(diào)的是認(rèn)識(shí)論意義上的可理解性與確定性。
計(jì)算主義主張宇宙萬物都可通過某種算法而實(shí)現(xiàn)其可計(jì)算性,而反計(jì)算主義則對(duì)這種建立在還原論基礎(chǔ)之上的認(rèn)識(shí)論觀點(diǎn)充滿了質(zhì)疑。單就物理世界而言,包含隨機(jī)性的真實(shí)物理世界與計(jì)算機(jī)可模擬的理想化的世界之間存在巨大差異,可計(jì)算結(jié)構(gòu)僅僅是真實(shí)世界結(jié)構(gòu)的一部分,因?yàn)槟承┪锢磉^程并不能由算法實(shí)現(xiàn)可計(jì)算性,物理理論并不能展現(xiàn)那些不可計(jì)算元素,人類得到的只是關(guān)于世界的有限認(rèn)識(shí),計(jì)算主義不能實(shí)現(xiàn)完全透明化地認(rèn)識(shí)世界,在認(rèn)識(shí)層面上不可避免地含有不透明性。
認(rèn)識(shí)不透明性的概念是美國科學(xué)哲學(xué)家保羅·漢弗萊斯(Paul Humphreys)在深入研究計(jì)算科學(xué)時(shí)提出的。在他看來,由于我們無法直接審視與核查計(jì)算機(jī)模擬過程中的大多數(shù)步驟,致使“核心模擬初始狀態(tài)和最終狀態(tài)間的動(dòng)態(tài)關(guān)系是認(rèn)識(shí)上不透明的”。他將認(rèn)識(shí)不透明性產(chǎn)生的根本原因歸結(jié)為人類有限的計(jì)算能力,因?yàn)樵谟?jì)算科學(xué)的實(shí)踐層面,面對(duì)巨大的計(jì)算量,人類不可能審查全部的計(jì)算過程,這就造成人類在認(rèn)識(shí)上存在著盲區(qū),即不透明性:“假若認(rèn)識(shí)主體X在時(shí)間t不了解與這個(gè)過程相關(guān)的所有認(rèn)識(shí)論元素,那么該過程相對(duì)于主體X在t時(shí)刻是認(rèn)識(shí)上不透明的”,即“認(rèn)識(shí)不透明性背后的含義是:主體不了解或無法知道與可證明特定計(jì)算步驟的有關(guān)內(nèi)容”。總之,認(rèn)識(shí)不透明性現(xiàn)在已經(jīng)成為與“計(jì)算方法”密切聯(lián)系在一起的一個(gè)顯著特征,由此也成為人類在認(rèn)識(shí)論上繞不開的一個(gè)問題。
近年來,在大數(shù)據(jù)與人工智能的語境下,人工智能憑借大數(shù)據(jù)技術(shù)尤其是運(yùn)用多層神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)算法技術(shù)已經(jīng)進(jìn)入了發(fā)展的快車道,其運(yùn)算速度與準(zhǔn)確度在某些方面已超越人類。與此同時(shí),不透明性在人工智能領(lǐng)域中也有了新的表現(xiàn)。(1)某些商業(yè)機(jī)構(gòu)封鎖關(guān)于人工智能中的關(guān)鍵技術(shù)細(xì)節(jié),從而構(gòu)成“專利壁壘”,這種基于人為因素造成的不透明性不屬于認(rèn)識(shí)論層次上的問題。(2)認(rèn)識(shí)論維度上的不透明性主要包括:a)算法層面,諸如由多個(gè)隱含層的人工神經(jīng)網(wǎng)絡(luò)構(gòu)成的復(fù)雜算法,此種算法類似黑箱,造成了算法的不可解釋性問題;b)數(shù)據(jù)層面,不透明性與數(shù)據(jù)偏見息息相關(guān)。在人們收集與選擇數(shù)據(jù)時(shí),偏見會(huì)隨著人類自身的進(jìn)入而滲透在數(shù)據(jù)中,致使用于訓(xùn)練的數(shù)據(jù)帶有原始性偏見,用具有偏見性的數(shù)據(jù)訓(xùn)練算法,又會(huì)產(chǎn)生算法偏見與算法歧視等一系列問題;c)智能體層面,智能體由算法、數(shù)據(jù)和計(jì)算機(jī)硬件協(xié)同組成,它的內(nèi)部工作機(jī)制相當(dāng)復(fù)雜,縱使假設(shè)人類可實(shí)現(xiàn)對(duì)算法和數(shù)據(jù)的透明性認(rèn)識(shí)也未必能夠透明地認(rèn)識(shí)作為整體性存在的智能體。這些不透明性共同導(dǎo)致了人工智能難以被解釋的困境,即“當(dāng)人工系統(tǒng)做出的決定傳達(dá)給‘人類系統(tǒng)’時(shí),必須填補(bǔ)一個(gè)重要的決策后認(rèn)知差距:解釋性差距”;換句話說,針對(duì)人工系統(tǒng)的自動(dòng)決策,“我們能觀察到它的輸入與輸出,但是卻不能說出輸入是如何變成輸出的”。
當(dāng)下所出現(xiàn)的用相關(guān)性取代因果性的極端看法,實(shí)質(zhì)上是沒有認(rèn)清兩者的區(qū)別與聯(lián)系。在我們看來,要從相關(guān)性中去尋求因果性,主要是要在認(rèn)識(shí)論層面上克服不透明性的困難。
首先,相關(guān)性是指一個(gè)事物或?qū)傩缘淖兓瑫r(shí)會(huì)引起別的事物或?qū)傩韵鄳?yīng)發(fā)生確定的變化,但這樣的知識(shí)有時(shí)卻不能被透徹地理解。例如,令人費(fèi)解的一個(gè)典型的相關(guān)事例就是超市中啤酒與嬰兒尿布銷量之間存在的明顯的正相關(guān)聯(lián)系。所以,相關(guān)性注重的往往是事物之間的表面關(guān)系而不是本質(zhì)聯(lián)系。假如人們僅僅依據(jù)相關(guān)性來把握事物間的關(guān)系,其認(rèn)識(shí)有時(shí)就會(huì)存在模糊性與不確定性,也就是我們這里所強(qiáng)調(diào)的不透明性。因?yàn)槭挛镩g的相關(guān)關(guān)系有時(shí)會(huì)帶有一定的欺騙性和錯(cuò)誤性,比如對(duì)于古代的西方人,很長(zhǎng)時(shí)間一直堅(jiān)信“物體越重,下落的速度越快”等。這些問題的存在表明,人類并不容易挖掘出現(xiàn)象背后真正的因果關(guān)系,進(jìn)而實(shí)現(xiàn)知識(shí)的透明化。
那么,我們?nèi)绾尾拍鼙苊庹J(rèn)識(shí)的不透明性,順利找到正確的因果性呢?毫無疑問,發(fā)現(xiàn)相關(guān)性有利于找到因果性;從相關(guān)性到因果性,是科學(xué)知識(shí)發(fā)展的必由之路!
當(dāng)近代科學(xué)在牛頓力學(xué)和還原論思想的引導(dǎo)下走向輝煌的時(shí)候,一個(gè)由嚴(yán)格因果性決定的世界呈現(xiàn)在人們的眼前。然而,隨著認(rèn)識(shí)對(duì)象的復(fù)雜化,不確定性不可避免地滲入科學(xué)規(guī)律之中,統(tǒng)計(jì)學(xué)意義的因果性觀念逐漸削弱了機(jī)械決定論式的因果觀。例如,在熱力學(xué)系統(tǒng)的研究中,人們無法準(zhǔn)確地刻畫每個(gè)分子的微觀運(yùn)動(dòng)狀態(tài),只能從宏觀角度去統(tǒng)計(jì)性地研究整個(gè)系統(tǒng),從而作出關(guān)于所有分子的平均運(yùn)動(dòng)狀態(tài)的說明。我們的研究表明:統(tǒng)計(jì)規(guī)律所展現(xiàn)出的因果性仍舊是確定的、客觀的。但本文這里所要強(qiáng)調(diào)的問題是,宏觀的統(tǒng)計(jì)相關(guān)性與微觀的隨機(jī)性即認(rèn)識(shí)的不透明性之間的關(guān)系,第一次打破了機(jī)械決定論所蘊(yùn)含的宏觀統(tǒng)計(jì)決定論與微觀因果決定論之間的“一一對(duì)應(yīng)”關(guān)系,即預(yù)示了相關(guān)性與因果性之間可能存在的復(fù)雜關(guān)系,認(rèn)識(shí)的透明性問題也由此變得內(nèi)容更加豐富起來了。
如今,得益于大數(shù)據(jù)技術(shù)與計(jì)算機(jī)硬件的發(fā)展即算力的提升,加之以數(shù)據(jù)為訓(xùn)練導(dǎo)向的深度學(xué)習(xí),人們更容易用適當(dāng)?shù)那€類型來擬合觀察到的數(shù)據(jù),得到相應(yīng)的數(shù)據(jù)之間“明顯”的相關(guān)關(guān)系,但這種關(guān)系的本質(zhì)終歸還是建立在統(tǒng)計(jì)學(xué)之上的!即“深度學(xué)習(xí)只是讓機(jī)器具備了高超的能力,而非智能。這種差異是巨大的,原因就在于后者缺少現(xiàn)實(shí)模型。與30年前一樣,當(dāng)前的機(jī)器學(xué)習(xí)程序(包括那些應(yīng)用深度神經(jīng)網(wǎng)絡(luò)的程序)幾乎仍然完全是在關(guān)聯(lián)模式下運(yùn)行的”。這意味著,若僅僅依靠挖掘到的數(shù)據(jù),是不能識(shí)別出帶有方向性的因果關(guān)系的。因?yàn)榧词故菓?yīng)用多層神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí),從內(nèi)部整體來看,它從最初的數(shù)據(jù)表征形式經(jīng)過每層神經(jīng)網(wǎng)絡(luò)加工,連續(xù)不斷生成新的表征形式,到最終輸出某些數(shù)據(jù)表征結(jié)果,這一過程雖然類似于科學(xué)和數(shù)學(xué)中的推理過程,但是我們能否理解這個(gè)“推導(dǎo)”過程,仍然取決于它能否被透明地認(rèn)識(shí)清楚。這是因?yàn)椋幱谳斎攵撕洼敵龆酥虚g的“多層神經(jīng)網(wǎng)絡(luò)”作為表征世界的內(nèi)部模型十分復(fù)雜:一是其中的某些層級(jí)可能發(fā)揮的僅是輔助作用,并不具有任何實(shí)際的表征意義,這樣的無意義表征層并不會(huì)妨礙我們的“理解”,就像在物理學(xué)中,為了方便起見,我們經(jīng)常把物體進(jìn)行理想化處理,視它們?yōu)闆]有質(zhì)量的質(zhì)點(diǎn)一樣;二是多層神經(jīng)網(wǎng)絡(luò)層與層之間的轉(zhuǎn)換需要牽涉到數(shù)億級(jí)別的參數(shù)以及復(fù)雜的非線性,從而導(dǎo)致我們不可能透明地去認(rèn)識(shí)這個(gè)形式變換的過程,這大大地提高了人類理解的難度;三是神經(jīng)網(wǎng)絡(luò)在共同作用的整個(gè)過程中,內(nèi)部整體處于一種自動(dòng)構(gòu)建過程,建模人員能夠了解的只是模型的靜態(tài)結(jié)構(gòu)即組成模型的組件,但對(duì)于模型的自動(dòng)化動(dòng)態(tài)工作方式還是無法透徹把握;四是復(fù)雜算法作為人工智能技術(shù)的核心組成要素,其“不透明性”似乎是它的天然屬性,因?yàn)椤八惴ㄟ^程中的高水平的自動(dòng)化可以內(nèi)在地增加不透明性,以數(shù)千個(gè)參數(shù)為前提的基于挖掘數(shù)據(jù)的分析可能很難向人類解釋”,整個(gè)運(yùn)行過程就猶如一個(gè)黑箱!
總之,基于多層神經(jīng)網(wǎng)絡(luò)協(xié)同作用等基礎(chǔ)之上的以機(jī)器學(xué)習(xí)為代表的大數(shù)據(jù)和人工智能,其內(nèi)部運(yùn)行隱含著很多層級(jí)的“認(rèn)識(shí)不透明性”。那么,如何克服認(rèn)識(shí)上的這種不透明性,從相關(guān)性最終獲得因果性,我們下面擇要討論一二。
如前所述,目前以機(jī)器學(xué)習(xí)為代表的人工智能的本質(zhì),仍是以統(tǒng)計(jì)相關(guān)模型為基礎(chǔ)的,這意味著無論用多大的數(shù)據(jù)量來訓(xùn)練機(jī)器,它都無法達(dá)到人類智能的高度。那么,其間的鴻溝到底是什么呢?“貝葉斯網(wǎng)絡(luò)”之父朱迪亞·珀?duì)枺↗udea Pearl)認(rèn)為,真正的類人智能機(jī)器即強(qiáng)人工智能應(yīng)該具有像人類那般的因果推斷能力。這一標(biāo)準(zhǔn)的提出,將相關(guān)性與因果性的關(guān)系賦予了更豐富的內(nèi)容,更確切地講是從人的本質(zhì)的高度,強(qiáng)調(diào)了我們必須要從相關(guān)性走向因果性,從而實(shí)現(xiàn)認(rèn)識(shí)的透明性。
為了使機(jī)器擁有類人的因果推斷能力,珀?duì)柺状螛?gòu)建了一個(gè)可以反映人類因果推斷能力的由關(guān)聯(lián)、干預(yù)與反事實(shí)三個(gè)層級(jí)共同構(gòu)成的因果關(guān)系之梯。
處于第一層級(jí)的關(guān)聯(lián)要解決的問題是:通過觀察(seeing)來尋找事物間的規(guī)律即相關(guān)性。在關(guān)聯(lián)層中,雖然是在相關(guān)性的基礎(chǔ)上對(duì)事物的未來發(fā)展作出預(yù)測(cè),但是此關(guān)聯(lián)層的相關(guān)性的真實(shí)性還難以被確定。第二層級(jí)的干預(yù),涉及在觀察的基礎(chǔ)上通過采取行動(dòng)(doing)去改變現(xiàn)狀。干預(yù)層的doing不同于關(guān)聯(lián)層的seeing,前者是主動(dòng)性行為,而后者是被動(dòng)性觀察;干預(yù)層通過主動(dòng)施加某個(gè)行動(dòng)從而來觀察相應(yīng)的改變,而后變量之間的相關(guān)性得以確證,但因果性未必能得到確認(rèn)。第三層級(jí)的反事實(shí),表示在一個(gè)虛構(gòu)的世界中,具有想象能力(imagining)的人類能夠思考類似“假設(shè)我當(dāng)時(shí)采取與在真實(shí)世界中不同的行動(dòng),那會(huì)怎樣”的問題等。在反事實(shí)的世界里,我們能夠可靠地去尋找關(guān)于背后解釋的推斷,從而確認(rèn)事件間的因果性。
基于對(duì)因果關(guān)系之梯的上述理解,我們要從相關(guān)性中發(fā)現(xiàn)因果性,必須經(jīng)歷從關(guān)聯(lián)到干預(yù),再從干預(yù)到反事實(shí)的兩次飛躍。具體分析如下:
首先,在從關(guān)聯(lián)到干預(yù)中,如何識(shí)別“混雜因子”是一個(gè)復(fù)雜的相關(guān)過程中的主要問題。珀?duì)栒J(rèn)為可采取“前后門”調(diào)整的方式,即分別從因果性具有的前后方向的不同角度改變和考察相關(guān)性中不同因素的作用,亦即通過某種干預(yù)行動(dòng)并確定干預(yù)后的影響以充分掌握由X開始指向Y的直接的因果路徑中的所有變量的數(shù)據(jù),從而有助于因果模型的建立。我們認(rèn)為,從關(guān)聯(lián)到干預(yù)的過程,其實(shí)也是一個(gè)從觀察到的尚未知其真假的相關(guān)性到相關(guān)性得以確證的過程,而混雜因子則是本文所強(qiáng)調(diào)的認(rèn)識(shí)不透明性的重要表現(xiàn)形式之一,所以去混雜的過程就是消除認(rèn)識(shí)不透明性的過程。然而,在這個(gè)過程中,蘊(yùn)藏在相關(guān)性中的因果性此時(shí)還不一定能得到確證。
其次,從干預(yù)到反事實(shí),是因果模型形成的最終過程。在反事實(shí)中,珀?duì)栐谝蚬麍D的基礎(chǔ)上試圖建立結(jié)構(gòu)因果模型。所謂因果圖,是珀?duì)柦?gòu)的一種用于表征因果模型的圖示工具,它是由代表變量的點(diǎn)和表示變量之間存在已知或者似乎存在因果關(guān)系的箭頭一起組成的圖。從干預(yù)走向反事實(shí),也是借助于因果圖,同時(shí)結(jié)合他自己提出的do算子,可以“測(cè)試”一個(gè)隱含在相關(guān)性中的因果性的過程。例如對(duì)吸煙究竟能否致癌的分析——在科學(xué)史上,有關(guān)吸煙究竟能否導(dǎo)致肺癌的問題曾引發(fā)了一場(chǎng)激烈的爭(zhēng)論,因?yàn)槿藗儾荒芡该鞯卣J(rèn)識(shí)吸煙是否導(dǎo)致肺癌的整個(gè)過程。珀?duì)栐谧约旱闹髦校没诩僭O(shè)代表因果信息所繪制出的因果圖和do算子方法,確實(shí)為我們逐步揭示了吸煙致癌的因果機(jī)制。
由此可見,珀?duì)査岢龅睦碚撚^點(diǎn),即通過因果關(guān)系之梯的層層遞進(jìn),給我們提供了一種從表觀的、復(fù)雜的統(tǒng)計(jì)相關(guān)性如何走向真正的因果性的可行的方法論策略,有助于我們消除可能橫亙?cè)谙嚓P(guān)性與因果性之間的認(rèn)識(shí)論上的不透明性。當(dāng)然,像我們上面分析過的,認(rèn)識(shí)的不透明性有各種不同表現(xiàn)和不同類型,如何克服它們,需要更細(xì)致、具體和有針對(duì)性的分析,特別是需要更多的富于啟發(fā)性的觀點(diǎn)的提出,讓我們共同期待!