計算語言學是一個橫跨語言學、數學和計算機科學的交叉學科。語言學和數學都是有著相當長歷史的古老學科。語言學歷來被看作是典型的人文科學,數學則被許多人看作是最重要的自然科學。在學校教育中,語文和數學被認為是兩門最基礎的學科,成為任何一個受教育者的必修課。它們似乎成了學校教育的兩個極點:一個極點是作為文科代表者的語文,另一個極點是作為理科代表者的數學。很少有人想到,這兩門表面上如此不同的學科之間竟然會存在著深刻的學術聯系。計算機科學是研究計算機的新興學科,帶有相當強的工程性質和濃烈的技術色彩,屬于高科技的范疇,表面上看來,作為典型的人文科學的語言學與屬于高科技的計算機科學也不會存在什么瓜葛。因此,在一般人的心目中,這門橫跨語言學、數學和計算機科學的計算語言學似乎是不可思議的,甚至是有悖于常識的,就是連“計算語言學”這個名稱也幾乎是荒謬絕倫的。
然而,一些具有遠見卓識的學者卻早就洞察了語言學、數學和計算機科學之間的緊密聯系。1847年,俄國數學家布里亞柯夫斯基(В.Я.Буляковский)提出了用概率方法來進行語法、詞源及語言歷史比較研究的思想。1894年,瑞士語言學家索緒爾(De Saussure)指出,“在基本性質方面,語言中的量和量之間的關系可以用數學公式有規律地表達出來”,后來,他在其名著《普通語言學教程》(1916年)中又指出,語言學好比一個幾何系統,“它可以歸結為一些待證的定理”?!?br>