
大數據中一個耳熟能詳的說法是:大數據長于分析相關關系,而非因果關系。但這可能是一個偽命題。如何從相關關系中推斷出因果關系,才是大數據真正問題所在。這個問題,被稱為因果推斷(causal inference),它是蘋果iPhone 6的語音識別和谷歌的無人駕馭汽車技術的基礎。這個領域的大牛,美國工程院院士于達·珀爾(Judea Pearl,國內一般譯為朱迪亞·珀爾)因此獲得2011年的圖靈獎。珀爾院士提出概率和因果推理演算法,徹底改變了人工智能最初基于規則和邏輯的方向。
珀爾院士的思想,在圖靈問題的頂層設計高度,改變了我關于大數據的認識。與珀爾院士的深度思想交流事出偶然。“美國大師行”的舊金山站安排9月3日下午見珀爾院士。本來只是禮節性的見面,請他簡單介紹一下研究成果。但珀爾院士顯然理解錯了,以為是專業交流,于是準備了64頁的數學講義。當他聽說聽眾竟然來自媒體、法律、經濟等文科背景時,不禁瞠目結舌。他說:“對不起,我不知道你們……”。改講義已來不及了,只好硬著頭皮,對牛彈琴。不料,兩小時后,珀爾院士談得興起,早忘了我們是學什么的,奔放的數學思想噴薄而出,圖論、概率論、非線性數學的公式像袋鼠一樣,隔著十幾步十幾步地跳躍,如黃河之水,一發而不可收。時間已到,主辦方反復提示無效,又講了一個多小時。
我身旁的兄弟,被我晃醒,好像還在夢中,幾乎已經坐不正了。我靠一杯一杯的咖啡支撐,勉強聽著。之后,卻意外地聽入了迷,最后聽到如醉如癡。