胡建華
以生成語法為代表的形式語言學是一門經驗科學,其研究目標是回答語言學中的柏拉圖問題,即探究人類的語言能力。形式語言學研究的對象是人類的心靈,歸根結底是研究人腦的奧秘。
1957 年,Chomsky 的《句法結構》(Syntactic Structures)出版,標志著語言學研究開始從對語言本體的研究轉向對人類心智系統的研究。Chomsky 秉持心智主義(mentalism)的語言觀,以人腦中的語言官能(language faculty)為研究對象,將關注的重點從外在的語言轉向大腦中的語言計算機制,從而推動了認知科學的發展,并實現了語言學從語言本體研究到心理語言學研究、再到生物語言學(biolinguistics)研究的重要跨越。
Chomsky 一直致力于解決語言學中的“柏拉圖問題”(Plato’s Problem),即語言知識的由來問題(Chomsky,1986:51)。語言學中的柏拉圖問題涉及兒童語言獲得中的“刺激貧乏”(poverty of stimulus)或“輸入貧乏”問題。兒童在獲得語言的過程中,從周圍環境中接觸到的語言數據是貧乏、零散且有限的,這些外部環境中的數據輸入雖然可以促進兒童語言的生長(growth)與發展,但卻無法決定兒童語言的生長與發展,因此也就無法說明兒童是怎樣獲得自己的母語的。“語言獲得的刺激貧乏說”所著眼的不是環境數據在量上的貧乏,而是外部數據輸入與兒童所獲得的語言結構知識之間的不對稱。兒童所接觸到的外部數據是有限的,但兒童所獲得的語言知識以及可以產出的語句卻是無限的。
在Chomsky 的生成語言學出現之前,美國語言學的主流是結構主義語言學。結構主義語言學的哲學基礎是邏輯經驗主義(logical empiricism),或稱邏輯實證主義(logical positivism),其心理學基礎是行為主義(徐烈炯,2019)。經驗主義秉承18 世紀英國哲學家John Locke 的白板(blank slate)說,認為人的語言知識都是后天獲得的,獲得的方式是行為主義的刺激—反應(stimulus-response)學習機制。行為主義心理學的代表人物是Skinner(1957),他認為人的行為是對外部環境刺激的反應。正面的反應會得到鼓勵并保持,負面的反應則會使反應中斷。按照這一學說,兒童語言的獲得就是通過這樣一個刺激—反應過程進行的。當兒童說出的語句和成人的語言不同時,會得到成人的糾正,這便是負面的反應。當他們成功地模仿了成人的語句時,會得到認可和鼓勵,于是就產生正面的反應,當這種正面的反應形成條件反射,被保持并形成習慣后,就獲得了和成人一樣的語言。但是,相關研究發現,父母對兒童話語的糾正往往僅限于事實,很少去糾正兒童的語法錯誤(Brown & Hanlon,1970)。另外,兒童在獲得語言的過程中可以模仿的語句是有限的,而且,兒童即便是模仿成人的語言,也往往要對成人的語言進行改造,而不是對成人的語言進行機械的復制。因此,所謂的模仿也是創造性的模仿。這說明,兒童對成人語言的模仿與鸚鵡學舌式的簡單模仿是完全不同的,兒童的模仿是他們已經獲得的語言能力運作的結果,而不是產生其語言能力的原因。兒童憑借極其有限的經驗就可以在短短的幾年之內學會其母語;不管世界上的語言有多么不同,兒童獲得其母語的時間大致相同。這些事實用刺激—反應說很難解釋清楚。我們認為,兒童的語言獲得之所以具有迅速性和一致性,就是因為這一切都是由先天基因決定的,而不是由后天學習決定的。如果兒童語言獲得的迅速性和一致性是由后天學習決定的,可以設想不同兒童的不同學習行為自然會產生完全不同的結果,而這樣一來,兒童語言獲得的迅速性和一致性就必然會變成一件不可思議的事情。
除此之外,兒童語言的獲得還受年齡的限制。在許多其他事物的學習上,年長的兒童明顯優于年幼的兒童,成人優于兒童;但在語言學習上,情況卻不同。語言學習的能力,不管是一語還是二語,都隨著人年齡的增長而下降;這種現象在手語獲得上也是如此。總之,語言學習是越早越好(Newport,1988)。在二語獲得中,成人的詞匯記憶能力要強于兒童,但發音和造句能力卻比兒童差許多。一個兒童將聲音語言作為第一語言獲得以后,可以很順利地再去獲得手語。同樣,一個兒童將手語作為第一語言獲得以后,也可以很順利地再獲得聲音語言。但是,如果一個兒童在語言獲得的關鍵期結束前沒有接觸并獲得任何語言,那他以后就什么語言都無法獲得了。語言獲得之所以有關鍵期,當然是與大腦的發育有關。有關研究發現:幼兒到了2 歲左右,已具備近似成人的腦結構,到了3 歲,大腦中所有主要的纖維束已經可以觀察到;3 歲以前灰質含量增長得很快,4 歲時達到峰值,然后緩慢下降(Huttenlocher &Dabholkar,1997)。語言獲得的過程也是一個大腦發育成熟的過程,因此語言獲得是有生物基礎的。
與動物的訊號系統不同,人類語言具有“以有限生無限”的特點,人可以說出自己以前沒有聽到過的句子,也可以說出自己以前沒有說過的句子。按Chomsky(2016)的說法,人類語言的這一特點,代表了人類語言的基本屬性(Basic Property)。人類這種語言生成能力為人類所獨有,動物則不具備,而且這種能力在個人、種族以及民族之間沒有任何差別。因此,這種能力具有生物遺傳學上的意義。Chomsky 認為,人類的語言能力受大腦物質結構的限制,所反映的是大腦的奧秘。基于這一原因,Chomsky 認為生成語言學所探究的實際上是人腦的奧秘,是人類的心靈及其認知機制;語言歸根結底是人作為人所具有的生物屬性,因此,生成語言學也被稱作生物語言學。
生物語言學持先天論(innateness hypothesis)的語言觀。先天論的語言觀認為:①所有人類語言都具有復雜的結構;②兒童從他們所接觸的環境數據中無法獲得這些復雜結構以及幫助他們掌握這些復雜結構的明確線索。兒童之所以能迅速地獲得語言,是因為他們大腦中有一種語言官能,這一語言官能獨立于一般認知能力而存在。在這一點上,生物語言學與認知語言學的觀點是截然相反的。認知語言學認為,語言能力是一般認知能力的一部分。如果這一觀點成立,我們就應該在語言能力與一般認知能力之間找到某種密切的聯系,比如某些語言領域的問題會在一般認知領域找到類似的反映,反之亦然。如果我們發現凡是出現語言障礙都會伴隨著智力障礙的出現,或者如果智力較低,語言能力也會較低,那么我們或許可以說語言能力是認知能力的一部分。但是,實際情況并非如此。事實上,語言能力的發展可以比智力的發展好很多;而在一些臨床癥狀中,有一些語言受損的病人,智力卻完好無損。這表明,我們還不能簡單地把語言能力還原為一般的認知能力。語言很可能屬于一個獨立于一般認知能力之外的模塊(module)。一些有關威廉姆斯癥(Williams syndrome)的研究似乎也支持模塊說。威廉姆斯癥是一種代謝性神經發展障礙,由7 號染色體上的基因問題引起。前人的一些研究(Reilly et al.,1990;Pinker,1991)發現,患有該癥的人智力較低,無法完成許多認知任務,但他們運用基本句法規則進行表達卻并無問題。事實上,患此癥的人所使用的句子結構往往還比較復雜。
認為生物因素在語言獲得中起決定性的作用,進而假定人腦中存在一個語言官能,這種說法是有爭議的。不過,當我們仔細分析反對Chomsky 學說的其他觀點時,就會發現這些觀點也沒有提供能讓人信服的、可以驗證的語言獲得機制。實際上,還沒有人可以在不假定生物因素在語言獲得中起作用的情況下對語言獲得作出合理的解釋。許多生物學家都認可語言的生物觀。1969 年,諾貝爾生理學或醫學獎獲得者、生物學家Salvador E. Luria 在Life:The Unf inished Experiment一書中說道:“對生物學家來說,就語言結構以及邏輯結構而言,設想在大腦網絡中存在某種由遺傳決定的、進化選擇的連接模式并用其作為一種有效工具來處理生活事件,是完全有意義的。”(Luria,1973:141)免疫學家Niels Jerne 在他的諾貝爾獎獲獎演講稿“The Generative Grammar of the Immune System”(后發表于Science)中講道:“兒童可以很容易地獲得任何他們出生環境中的語言,這似乎十分神奇。Chomsky 對語法的生成研究認為這只能用人腦中內在特征所賦予的、深層的、具有普遍性的語言能力來解釋。從生物學角度來講,這一語言學習遺傳能力的假設意味著在染色體的DNA 中有語言能力的編碼。如果有一天這一假設得到證明,那么語言學就成了生物學的一個分支。”(Jerne,1985:1059)
現代遺傳學研究發現,哺乳動物染色體中有一種叫作“FOXP2”的基因,與語言能力的發展關系密切。Lai et al.(2001)的文章“A Forkhead-domain Gene is Mutated in a Severe Speech and Language Disorder”曾引起學界的廣泛注意。其研究發現,定位于人類7號染色體上的一個基因的突變明顯地會引起語言失常,這個基因就是所謂的FOXP2。該基因與一般智力之間的關系不大,但它對語言有重要的影響:它不僅會影響說話的能力,還會影響聽與理解語言的能力。FOXP2 基因影響人的句法與說話能力的發展,同時對喉微妙的控制能力也有影響。這一基因是用來打開其他基因的轉錄因子(transcription factor),如果這一基因出現問題,人便無法發展出正常、完整的語言。FOXP2 基因具有可遺傳性,它與語言能力的聯系是通過研究一個家族史語言障礙病例發現的。
根據Enard et al.(2002)的研究,大概在20 萬年前,FOXP2 基因的一種突變形式出現在人類身上,這種突變形式成功地被復制并通過后代遺傳,最后取代了其他版本的等位基因。這一突變使該基因首次在大腦某個區域打開,并發展出新的功能①利用DNA進行繁殖,簡單生物變得豐富多彩。細胞分裂時,首先進行DNA復制,從而使子代的每個細胞都有完整的一套染色體。DNA 復制雖然是精確的,但有時也會出錯。基因中的堿基可以用4 個字母表示:A(adenine,腺嘌呤)、C(cytosine,胞嘧啶)、G(guanine,鳥嘌呤)和T(thymine,胸腺嘧啶)。A 與T 配對形成堿基對,C 與G 配對形成堿基對。單根鏈子的DNA 可以通過組裝一根與自己互補的鏈子來復制自己。這樣,DNA 就由兩條互相纏繞的鏈子形成,即形成雙螺旋結構。連接這兩條鏈子的是堿基。如果某個堿基丟失或錯位,DNA 復制就會出錯,從而發生突變。突變是人類演化成今天這個樣子的關鍵原因,否則我們永遠只是最原始生物的拷貝。突變的特點是只涉及個體,不會同時出現在一群人身上。。那么,FOXP2是不是人類專有的語言基因呢?答案是否定的。首先需要指出的是,這個基因不是人類獨有的,它在所有的哺乳動物身上都存在,老鼠、猴子、紅毛猩猩、大猩猩和黑猩猩都有這一基因,這或許是因為它們有著共同的祖先的緣故②一般認為,人和大猩猩的祖先是在600萬—800萬年前分開的,而人與黑猩猩的祖先分離則是500 萬—700 萬年前的事。黑猩猩和大猩猩基因之間的區別比黑猩猩與人類基因之間的區別還要大。黑猩猩與人類基因的相似度達到98%,其大腦的化學物質與人類大腦相同;黑猩猩也有人類那樣的免疫系統、消化系統、血液系統、淋巴系統和神經系統。。Shu et al.(2005)研究發現,幼年小鼠的FOXP2 基因如果有缺陷,那么當它們與父母、兄弟姐妹分開時,發出超聲波信號的能力就會受到影響。另外,如果人類的語言能力是指人類的內在語法,即以有限的規則生成無限多語句的能力,也就是“說出并理解以前從沒說出或聽到過的語句”的能力,那么這一基因就不是為語言專設的③布朗(Brown)在Genome 2(《基因組2》,科學出版社,2006年翻譯版)一書中指出,深入研究基因組的功能會幫助我們發現人類特性的某些重要特征,但基因組無法解釋為何只有莫扎特才能譜寫出《莫扎特第四十交響曲》。從基因數目上看,我們僅比果蠅(fruitf ly)復雜3 倍,比線蟲(nematode)復雜兩倍,因此單純用基因無法解釋人何以成為人。。當然,正如前文所指出的那樣,人類的FOXP2 基因大概在20 萬年前發生了突變,這說明人類的FOXP2基因與其他哺乳類動物的這一基因不盡相同。
Fitch et al.(2005)認為FOXP2 應屬于廣義語言官能,而不是所謂的語法基因。Hauser et al.(2002)把語言官能分為廣義語言官能(Language Faculty in the broad sense,FLB)與狹義語言官能(Language Faculty in the narrow sense,FLN),認為只有FLN 才是人所獨有的,動物并不具備。那么,FLN 是什么呢?Hauser et al.(2002)認為它是遞歸(recursion)能力。遞歸包括尾部遞歸(tail recursion)和中心遞歸(centre recursion)(楊彩梅,2020)。Fitch & Hauser(2004)指出,小絹猴(tamarins)不具備產生復雜等級結構的短語結構語法的能力。Gentner et al.(2006)指出,歐洲椋鳥(European startlings)可以識別AnBn性質的中心內嵌結構,即識別具有中心遞歸性質的聲音序列。對于這一實驗結果,Marcus(2006)并不完全認可,他認為歐洲椋鳥雖經過實驗者對其正面反饋的積極強化,但也僅僅是能對熟悉的聲音進行擴展,而人類的遞歸能力卻遠不限于此。
人類的語言能力實際上是一種結構化的能力。所謂結構化的能力,指的是生成和分析結構的能力。在下面的英語例句中,例(1-3)是肯定句,例(4-6)是一般疑問句。
例(1)Mary is at home.
例(2)Bill can sing.
例(3)Mary will be at home.
例(4)Is Mary at home?
例(5)Can Bill sing?
例(6)Will Mary be at home tomorrow?
當我們對比以上肯定句與一般疑問句時就會發現,英語中從肯定句到一般疑問句存在一條規則,即把肯定句中的助動詞移到句首,就可以形成一般疑問句。那么這一規則是不是可以正確地描述英語母語者所擁有的關于英語一般疑問句的知識呢?在回答這個問題前,我們先來看例(7)。
例(7)Bill will believe that Mary is at home.
在例(7)這個肯定句中有兩個助動詞性質的詞“will”和“is”。那么,應該將哪個移到句首?
例(8)Will Bill believe that Mary is at home?
例(9)*Is Bill will believe that Mary at home?
對比例(8)和例(9)的合法性可以看出,在形成一般疑問句時,如果句子中有多個助動詞,似乎應該移動最左邊的那個。這一新的規則既可以生成合法的一般疑問句例(8),又可以排除不合法的例(9),似乎是對一般疑問句知識的正確概括和描述。但是,遇到例(10)這樣的句子時,這一概括就出現問題了。
例(10)The man who can sing is at home.
如果移動最左邊的助動詞,得到的是例(11)這樣的不合法的句子。
例(11)*Can the man who sing is at home?
要想得到正確的疑問句,應該向句首移動例(10)中最右邊的助動詞,而不是最左邊的,見例(12)。
例(12)Is the man who can sing at home?
從表面上看,例(8)和例(12)是用兩個互相矛盾的規則形成的,而這顯然是不可能的。那么,怎樣才可以正確地生成例(8)和例(12)呢?要想正確地生成這兩個結構,我們需要具有一種結構分析的知識。首先我們需要把例(7)和例(10)分別分解成例(13)和例(14)這樣的結構。
例(13)

例(14)

把例(7)和例(10)分析成例(13)、例(14)所示結構后,我們就可以確定例(8)和例(12)是通過移動主句(即以上結構圖中的S1)中的AUX(auxiliary,助動詞)規則生成的。根據這一規則,例(13)中的“is”和例(14)中的“can”都不能移動,因為它們位于S2之內,都不是S1的助動詞。以上例子顯示,要正確地描寫一般疑問句的形成規則,只把語句作為線性語符串來分析是不夠的,重要的是還要分析句子的結構。
現在的問題是:兒童的結構知識是從哪里來的,他們是如何獲得在形成一般疑問句時要移動主句AUX 這一知識的?首先,兒童獲得語言時所面對的初始語言數據(Primary Linguistic Data,PLD)是有限的,這些數據只能是他們聽到的句子,而且往往是像例(1-6)那樣簡單的句子。其次,兒童一般沒有機會被告知像例(9)和例(11)這樣的句子是不能說的。那么,這就產生了一個問題:是什么原因促使兒童只生成例(8)和例(12),而不生成例(9)和例(11)這樣的句子?能不能認為兒童不說例(9)和例(11)這樣的句子是因為他們沒有機會聽到這樣的句子呢?顯然不能,因為兒童可以說出許多他們從沒聽到過的正確的句子。兒童憑借什么知識或通過何種途徑,才能做到只說正確的句子而不說錯誤的句子?僅從兒童所接觸到的語言數據似乎很難獲知兒童是如何獲得語言的。對于這一問題,Chomsky(1986:8)用例(15)作出了進一步的說明。
例(15)a. I wonder who [the men expected to see them].
b. [the men expected to see them].
c. John ate an apple.
d. John ate.
e. John is too stubborn to talk to Bill.
f. John is too stubborn to talk to.
盡管例(15a)和例(15b)方括號內的成分完全相同,但在例(15a)中代詞“them”可以與“the men”共指,而在例(15b)中則不可以,“them”只能指句子外的其他成分。再看例(15c)和例(15d),例(15c)中動詞“ate”帶賓語,例(15d)中動詞“ate”不帶賓語。當動詞不帶賓語時,動詞作用的對象是任指的。假設兒童接觸到這兩個語句時會歸納出以上知識,那么他們在接觸到例(15e)和例(15f)時,就應該用所歸納出的這一知識來理解兩個句子,但實際上他們對例(15e)和例(15f)的理解并不是這樣的。例(15f)中“talk to”的賓語雖然沒有出現,但其作用的對象卻不是任指的,而是受句子主語John 的約束,即必須指John。
傳統上,人們往往用歸納法(induction)或類推法(analogy)來解釋語言學習的機制。但是,顯然從例(15a)無法類推出例(15b),從例(15c)和例(15d)也無法類推或歸納出例(15e)和例(15f)。例(15)中的例句涉及結構依存(structural dependency)知識,到目前為止,如何正確地描述人類的結構依存知識仍是一個難題。再看例(16)中的兩個例句(胡建華、潘海華,2001;胡建華、石定栩,2006)。
例(16)a. Maryisaw a picture of heri/herselfi.
b. Maryitook a picture of *heri/herselfi.
例(16a)和例(16b)構成最小對比對(minimal pair),但前者允許代詞與主語共指,后者卻不允許。一般來講,代詞與反身代詞構成互補分布(complementary distribution),如例(17)所示,但這一互補分布卻在例(16a)中被中和(neutralized)了。
例(17)a. Johnilikes *himi.
b. Johnilikes himselfi.
下面我們舉一些漢語的例子來顯示內在語言知識的復雜性,從而進一步說明我們所面臨的難題,即怎樣才能解釋兒童語言的獲得機制。
例(18)a. 小明i 說小麗j 喜歡自己i/j。
b. 小明i 說我j 喜歡自己*i/j。
例(19)a. 小明i 給我j 一張自己i/j 的照片。
b. 小明i 從我j 的抽屜里找到一張自己i/*j 的照片。
在例(18a)中,“自己”可以分別指遠的先行語和近的先行語;而在例(18b)中,“自己”不能指遠的先行語。在例(19a)中,“自己”既可以指遠的先行語,又可以指近的先行語;而在例(19b)中,“自己”只能指遠的先行語,不能指近的先行語。在相關的實驗中,4 歲多的兒童就已經可以作出正確的判斷。但問題是,兒童是憑什么來作出這些判斷的?是父母教給他們的嗎?是他們自己從大量的語言數據中歸納出來的嗎?
兒童可以正確地判斷例(18)和例(19)中反身代詞的指稱,說明他們具有某種句法結構知識。在例(18b)中反身代詞只能指近的先行語,而在例(19a)中反身代詞可以越過近的先行語而指遠的先行語,這是因為這兩例中近的先行語不同:例(18b)中近的先行語是主語,例(19a)中近的先行語是賓語。
比較例(19a)和例(19b)中反身代詞的先行語,會發現這兩例中近的先行語的句法位置有所不同。這兩例的句法結構分別如例(20)和例(21)所示。


例(20)與例(21)的不同之處在于:例(20)中的兩個先行語都成分統制(c-command)反身代詞,例(21)中只有主語成分統制反身代詞。成分統制的定義如下:
A 成分統制B,當且僅當支配(dominate)A 的第一個分支節點同時也支配B,且A 不支配B。
形式語言學研究的一個重要目標就是回答語言獲得中的柏拉圖問題,即語言知識的由來。形式語言學的研究表明,人類語言雖然表面上千差萬別,但實際上都以復雜而又相同的計算結構為基礎,生活在任何語言環境中的所有正常兒童都可以自然地獲得語言。由于這一計算結構的存在,嬰兒的大腦天生就能分類接受刺激,正確、迅速地獲得語言。在抽象的層面,語言獲得的過程可以用以下公式表征:
L:S0, E→ST
在以上公式中,學習函數或算法L把學習者的初始狀態S0在環境經驗E的基礎上,影射到終端狀態ST。在研究語言的獲得時,獲取兒童語言發展的數據固然十分必要,但僅有數據是不夠的,因為數據本身并不能揭開語言獲得與發展①先天論者一般不使用“發展”(development)這個詞,因為“發展”是心理學領域的概念,很容易和后天經驗相聯系(王蕾,2020)。的柏拉圖之謎。要想洞察其中的奧秘,最為重要的是能夠在相關數據的基礎上發現語言獲得和發展的機制,即學習函數或算法L。
人類語言能力的研究是一種科學研究。科學研究有幾種方法:歸納法、類推法和演繹法(deduction)。通過歸納法和類推法所得出的結論在可靠性上僅具有或然性,而通過演繹法所得出的結論在可靠性上則具有必然性。
結構主義語言學研究使用的方法是歸納法。歸納法往往和分類法一起使用,而且分類還往往是研究的目的。實際上,科學研究是不以分類為最終目標的,分類往往只是通向所追求目標的一條途徑。科學研究的目的是揭示自然現象背后那些肉眼無法看到的過程和機制,比如原子運動的規律等,而要達到此目的,研究者往往要提出一些科學假設,然后通過實驗等方法進行驗證。歸納法比較素樸,但問題比較多,用這個方法很難逼近真理。除了歸納法,人們在研究中常使用的還有類推法。但是,有些知識根本無法用歸納法或類推法來獲得。比如,地球到月球之間的距離,就無法通過歸納或類推得出;愛因斯坦關于相對論的知識也無法用歸納法或類推法獲得,愛因斯坦主要是靠他的物理、數學的知識以及抽象思維推理形成了相對論。
兒童語言獲得的奧秘也一樣無法通過歸納法或類推法搞清楚。兒童獲得語言時,所接觸的句子是有限的,但他們能聽懂并說出的句子卻是無限的。用歸納和類推無法說明人類的語言能力。比如,我們雖然可能沒有機會聽到例(22)這兩個句子,但我們卻知道它們在解讀上的差別,而這一知識是無法歸納或類推出來的。
例(22)a. 每個警察都抓過一個小偷。(無歧義:警察>小偷)
b. 每個小偷都被一個警察抓過。(有歧義:警察>小偷;小偷>警察)
再看例(23-27)中的英語例句:
例(23)a. who did everybody see [a picture of __ ]?
b. *who is [a picture of __ ] seen by everybody?
例(24)a. who bought what?
b. *what did who buy?
例(25)a. *what did who give __ to Mary?b. what did who give __ to whom?
例(26)*what did who buy why?
例(27)a. ?which book did how many students buy?
b. ?what did which student read?
c. which book did which student read?
用歸納法或類推法來尋找以上例句合法或不合法的規律,肯定也行不通。我們判斷例(23b)不合法時,是憑借從例(23a)中歸納或類推出來某條規律嗎?我們能通過歸納法或類推法從例(24-27)中得出一條規律嗎?
再看以下例(28-29)中的漢語例句:
例(28)a. 他現在來。
b. 他什么時候來?
c. 他現在來還是不來?
d. 他現在來不來?
e. 他現在來不?
例(29)a. 他現在來比較好。
b. 他什么時候來比較好?
c. ?? 他現在來還是不來比較好?
d. *他現在來不來比較好?
e. *他現在來不比較好?
我們從例(28)可以類推出例(29)嗎?我們從例(28)中歸納出的知識可以合法地生成例(29)中所有的句子嗎?顯然不能。
漢語疑問詞可以出現在復雜名詞詞組之中進行發問,如例(30)所示:
例(30)你喜歡看[NP[S誰寫__ ]的書]?
但在例(31)中,疑問詞就不能出現在復雜名詞詞組之中(Hu,2002/2019)。
例(31)*你喜歡看[NP[S他為什么寫__ ]的書]?
漢語不及物動詞有時可以帶賓語,如例(32)所示:例(32)王冕死了父親。
但我們卻不能通過類推得到例(33):
例(33)*王冕病了父親。
“死”是不及物動詞,為什么可以帶賓語?“病”同樣也是不及物動詞,為什么就不能帶賓語?當我們試著把例(32)和例(33)的區別歸為兩句動詞之間的區別時,我們又會遇到例(34)(胡建華,2008):
例(34)a.王冕家病了一個人。
b. *王冕家笑了一個人。
在例(34a)中,原本在例(33)中不能帶賓語的不及物動詞“病”卻又可以合法地帶賓語了,而其帶賓語的原因顯然不能簡單地歸結于賓語的類型,即不能簡單地說是用“一個人”替換了“父親”的結果,因為在例(34b)中,不及物動詞“笑”也是用“一個人”這種類型的名詞詞組做賓語,句子卻仍然不合法。
在科學研究中我們需要進行理論抽象,需要作科學假設,需要進行演繹推導。
例(30)和例(31)這樣的句子,與例(35)和例(36)中的英語疑問句具有某種相似性。
例(35)a. who read the books that who wrote?
b. who likes the books that criticize whom?
例(36)*who read the books that John wrote why?
英語形成疑問句,必須有一個疑問詞在句首,所以英語中沒有對應例(30)的形式。
例(37)*who do you like the book that __ wrote?
例(37)不合法,其原因與例(38)句子不合法是一樣的。
例(38)*金庸,我喜歡讀[[ __ 寫]的小說]。(我喜歡讀[[金庸寫]的小說]。)
例(38)顯示,從復雜名詞詞組中無法進行一般的話題化操作,也就是說,其中的成分不能移出來做話題。由于這一原因,復雜名詞詞組被稱為“孤島”(island)。孤島會形成一種屏障,如果其中相關的成分移出去,就會違法;另外,孤島之外的成分也無法越過這一屏障對它獲得解讀的位置進行管轄。如果這一說法成立,那么我們可以說例(31)之所以不合法,是因為其中牽涉到了移位,雖然這一移位不是顯性的。假設所有的疑問詞都必須在抽象的邏輯句法層面移位,比如,不管表層形式是“你喜歡誰?”還是“who do you like? ”,在邏輯句法層面疑問詞都需要通過移位形成例(39)所示的結構。
例(39)which x, you like x?
如果這一假設成立,那么例(31)不合法與例(37)不合法的原因就相同了,即移位越過了孤島。由于假設所有的疑問詞都要在邏輯句法移位,那么例(36)中的“why”也需要移位,而這一移位越過了孤島。當我們再來看例(29)中不合法的句子時,就會發現例(29)中的“A-not-A”疑問形式實際上也移出了孤島。在例(29)中是一個句子做主語,而主語位置具有名詞性,所以例(29)中的疑問詞如果移位,也會越過句子和名詞,即越過復雜名詞詞組,因此違反了孤島限制。
至此,我們似乎通過假設抽象的移位,成功地解釋了以上例句中的問題。但實際上,問題并沒有完全解決,因為還存在例(30)和例(31)的對比。按我們的假設,例(30)中也應該存在越過孤島的抽象移位,但句子為什么仍然合法?例(30)的合法與例(35)的合法具有可比性,要解釋清楚這些句子中涉及的句法規則,僅用抽象移位顯然是不夠的(Hu,2002/2019;胡建華、潘海華,2003)。當我們觀察并著手解決這些問題時,我們的理論就會有新的發展。
有很多學者不喜歡使用移位方法來處理相關問題,對于抽象的LF 移位更是反感,他們質疑:所謂的LF 移位在哪里,怎么看不見?我們認為,移位以及LF 等技術處理當然是可以質疑的,但質疑的方式要講究科學性。對于科學研究來說,以感官經驗作為判斷的依據,大概是靠不住的。比如,我們如果單憑感官經驗一定會得出太陽圍繞著地球轉的結論,而實際上太陽從來不圍繞著地球轉,而是地球始終圍繞著太陽轉。
致力于探究柏拉圖問題的生成語言學(又稱形式語言學)是一門經驗科學,和理論物理學在研究上有許多相同之處,都采用演繹的方法來研究自然現象(語言也是一種自然現象)。生成語言學雖然也使用一些數學方法,但它本身不是數學。作為經驗科學,最重要的一點是它的一些假設具有可以被證偽(falsif iable)的特性。Popper(2002:1)在The Logic of Scientif ic Discovery一書中指出,“科學家,不管是理論科學家還是實驗科學家,提出一些觀點或理論系統,進而對它們一步一步地進行檢測(test)。尤其是在經驗科學領域,他們建構假設或理論系統,通過觀察或實驗的手段,用經驗來檢測理論”。他認為,以觀察法和歸納法為基礎的研究很難被稱為科學理論,科學理論本質上是一種抽象的知識,是一種極富創造力的猜想或假設。科學假設只能間接地得到證明。從邏輯上講,實驗所得出的數據無法確定一個科學理論的真,但可以對其證偽。Popper (2002:18)認為,假設或理論只能通過證偽而不能通過證實(verif ication)的途徑來證明其是否為真。按照這一觀點,任何具有可證偽性的科學觀點在被證偽之前便可以假定為真。是否具有可證偽性被認為是科學與非科學的分水嶺。
根據Popper(1999:14)的觀點,科學的進步需要經歷4 個階段:第一個階段是面對已有的問題(old problem);第二個階段是提出嘗試性的理論(tentative theories)對問題進行解釋;第三個階段是通過討論、檢測、實驗等方法對這些嘗試性的理論進行糾錯、證偽,而經過證偽或排錯幸存下來的理論,不是更具正確性,而是更適于處理相關問題;第四個階段是通過討論、檢測、實驗而形成新的問題(new problem)。就像生物的進化一樣,理論的進化要經過適者生存的自然選擇過程。同樣,就像一時幸存之物種不能保證世世代代地存活一樣,一時沒被證偽的理論也不能保證一直不會被證偽。但不管怎樣,經過進化的理論肯定代表著一種進步:它不僅可以處理更加復雜的問題,同時也會引發越來越有趣、越來越深刻的新問題。科學的進步就是在猜想與證偽之間進行的,就像物種的進化是在基因變異與選擇之間進行的一樣。Popper(1979:261)對科學發展與生物進化自然選擇之間的相近之處有如下論述:
我們的知識的增長是經由一個類似達爾文所提出的“自然選擇”的過程而形成的結果,即各種假設的自然選擇:我們的知識,在任何一個時刻,都是由那些在生存競爭中表現出(相比較而言)適應性而存活下來的假設構成,那些不具有適應性的假設則在這一競爭中被淘汰。
進化觀可以解釋科學理論的局限性和不穩定性。一些科學理論雖然會盛極一時,但這并不能保證它不會被更好的理論所取代。比如,以太說就在理論的生存競爭中被淘汰。科學理論的進化觀不僅可以解釋科學的不斷進步,還可以解釋我們為什么永遠無法證明任何理論是絕對正確的。
經驗科學致力于用經驗數據來對理論或假設進行證偽。那么,什么樣的經驗數據可以證偽?答案是:反例(counterexample)。但問題并非這么簡單,關鍵問題是如何看待反例——是一個反例就可以把整個理論推翻,還是需要很多反例?Chomsky(2002)提出,經驗科學研究要用伽利略式的科學研究方法。伽利略式的科學研究方法是1979 年諾貝爾物理學獎獲得者、核物理學家Weinberg(1976)提出的一個術語。Chomsky 認為,要想洞察事物運作的深層規律,必須采用伽利略式的科學研究方法,不為一些瑣碎的數據所困擾。亞里士多德認為,落體的速度是由其重量決定的,而伽利略認為一個100 磅重的鐵球和一個1 磅重的鐵球從100 米高空落到地面上的速度是一樣的,但經驗數據卻顯示伽利略是錯的。伽利略在反例面前并沒有放棄自己的理論,而是對這一問題作了更深入的研究,進而發現空氣阻力與摩擦力對落體的影響。這個事例顯示,伽利略式的科學研究方法在重大科學發現中至關重要。
經驗數據與理論推導之間存在一種張力。處理好二者之間的關系,對科學研究來說十分重要。對于經驗數據與理論推導之間的關系,愛因斯坦(Einstein,1940)有如下論述:
科學是一種嘗試。在作這種嘗試的時候,我們企圖把我們紛然雜陳的感覺經驗,與一個在邏輯上一致的思想系統相吻合。在這個系統中,單個兒的經驗必須與理論的構造相應。這也就是說,這二者相應之結果的定奪必須是單一的,而且是令人信服的。
這些感覺經驗是些外界提供的數據;而用于說明這些資料的理論則是人造的。人造的理論是人借著極度的努力以求適用資料所獲知的結果。這樣的理論是假定性的,從來不曾完全是最后的定論,而是常常可被質問和懷疑的。
(譯文引自殷海光,2004:263)
愛因斯坦在《關于廣義引力論》一文中講道:
如果理論的基本概念和基本假設是“接近于經驗”的,這理論就具有重大的優點,對這樣一種理論給以較大的信任,那肯定也是理所當然的。特別是因為要由經驗來反駁這種理論,所費的時間和精力都要比較少得多,完全走錯路的危險也就比較少。但隨著我們知識深度的增加,在我們探求物理理論基礎的邏輯簡單性和統一性時,我們勢必愈來愈要放棄這種優點。
(愛因斯坦,2010:679)
愛因斯坦還講道:
理論科學在越來越大的程度上被迫以純數學的、形式的考慮為指導……理論家從事這樣的工作,不應該吹毛求疵地認為他們是“富于幻想”;恰恰相反,他們應該有權讓自己的想象力自由奔馳,因為要達到目的沒有別的辦法。
(譯文引自楊振寧,2002:181)
楊振寧認為,物理學中新概念的發展有兩個重要的指導原則:一方面必須永遠扎根于新的實驗探索,因為離開這個根基,物理學將有陷于純數學演算的危險;另一方面,又絕不能總是被符合當時接受為實驗事實的要求所束縛,因為依賴于純邏輯和形式的推導,是物理學這個領域中許多重大概念發展的基本要素(江才健,2002:410)。
物理學家最注重的是形成這樣一些概念的可能性,楊振寧指出,用愛因斯坦的話說,就是一個“完整的可用的理論物理系統”能夠被建構起來。這樣一個理論系統體現了普適的基本規律:“用這個系統,宇宙能夠用純粹推導的方式建造起來”(江才健,2002:452)。
建立在科學假設基礎上的演繹推導在真理探求的過程中必不可少。形式語言學所使用的研究方法是演繹法,它十分注重理論工具的構造。殷海光(2004:264)指出,科學發展的階段越高,其理論工具就越精密;在這方面,理論物理學所使用的理論工具達到了人類所能企及的巔峰,而一些欠發達的學科,研究素材雖多,但卻沒有什么好的理論工具,所以往往是意見與理論不分,隨便發表點見解也可以堂而皇之地稱之為理論。按照殷海光(2004)的說法,函數、集合、關系等概念都還是一些低級別的理論工具。依據這一標準,我們的語言學研究也還算不上是一門發達的學科。
我們知道科學是不斷進步的,而科學知識也在不斷的變化之中。沒有什么稱之為科學的東西是可以不變的。之所以如此,是因為我們大概只能一步一步地逼近真理,卻不能直接地找到真理。我們在嘗試解釋許多復雜而不可見的自然現象時,往往會作理論假設。實際上,初民在首次嘗試理解可見的自然現象(如閃電或疾病)的潛在原因時,也要作些假設,會想象出種種神靈等神秘力量的存在。當物理學家或生物學家嘗試理解這些現象時,他們所設想的也是一些超出我們感知世界的東西,如電磁場、微小的病菌以及更小的亞原子微粒等。在這一點上,科學與迷信的差別實則只有一步之遙,這一步的區別就在于科學是經過證偽法選擇的,而迷信則不是。牛頓關于力等于質量乘以加速度的物理定律是可以被證偽的,如果該理論是正確的,那么使物體獲得某個加速度的力,就應該等于使一個只有它一半質量的物體獲得兩倍的加速度所需的力。如果我們發現的結果并非如此,而實驗方法又是可靠的,該理論就有可能被否定。而迷信如果不靈,又不愿意被否定,肯定還要找出其他理由來搪塞。
生成語言學從Chomsky(1957)開始,經歷了標準理論、原則與參數理論,一直到目前的最簡方案階段。最簡方案更加注重對人類語言基本特性的探究,希望建立一個簡單的句法計算系統,用以推導復雜的人類語言。生成語言學一直致力于用更為簡單的原則對復雜的語言現象作出更加系統、統一的解釋,這與自然科學研究所致力于達到的目標是一致的。1979 年,Steven Weinberg 在獲得諾貝爾物理學獎時發表了題為“Conceptual Foundations of the Unif ied Theory of Weak and Electromagnetic Interactions”的演講,他在開篇便講道:“Our job in physics is to see things simply, to understand a great many complicated phenomena in a unif ied way, in terms of a few simple principles.”(我們從事物理學研究,就是以簡馭繁,用幾條簡單的原則,對紛繁復雜的現象作統一的理解)。Sean Carroll在2007 年出版了一本關于進化發育生物學(evo devo)的書,書名是Endless Forms Most Beautiful: The New Science of Evo Devo and the Making of the Animal Kingdom。他認為,動物歷經進化之后,雖然外在似乎呈現無盡的形式,但卻有內在的統一性,其多樣性無論是在數量上還是在品種上都受基因與進化選擇的限制。現代基因科學發現,控制昆蟲身體與器官式樣(design)的基因與控制我們人類身體樣式的是同一基因。
最后要指出的一點是,形式語言學在具體的研究中所考察的似乎都是一些小的問題,如反身代詞的約束條件,代詞的指稱限制以及句法成分移位的制約機制等。其實,科學的語言學就是研究小問題的,其他的科學實際上研究的也是小問題。比如,為什么蘋果只往地上落、不朝天上飛,為什么北極熊長著厚皮毛等。這些小問題似乎不需要牛頓或達爾文告訴我們,這是我們都知道的事實。但牛頓和達爾文卻從這些小問題中發現了萬有引力定律和適者生存的自然法則,為我們增加了以前沒有的新的知識(徐烈炯,2019:2)。科學語言學的研究目標也是拓展人類的知識領域,它所研究的問題都是目前還沒有答案的問題,解決這些問題就會為我們增加新的知識。自然科學總是忙于解決小問題,似乎眼光不夠遠大,但自然科學的迅速發展就是從把大問題置換成小問題開始的。當它把“宇宙是怎么起源的?”“生命本質是什么?”這類大問題置換成“石頭是怎么下落的?”“血液在血管內是怎么循環的?”這類小問題時,就開啟了現代科學的迅速發展之門。這一置換所產生的效應是驚人的,因為小問題中蘊含著大道理。
(匿名評審人提出了很好的意見,謹此致謝!)