999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大語言模型在哪里挑戰了語言學?

2025-01-10 00:00:00石鋒
語言戰略研究 2025年1期
關鍵詞:人工智能

提 要 “人工智能教父”辛頓對喬姆斯基的批評,值得語言學者思考:大語言模型究竟在哪里挑戰了語言學?本文討論以下問題:(1)搞大語言學還是小語言學?這一問題涉及語言學研究對象拓展和研究范式轉換。當前特別需要把小語言學觀念轉變為大語言學觀念,建立基于數據和概率統計的多學科、跨領域的科學觀。大語言學向外融合文、理、醫、工等多學科,向內跨越語音、語法、語義、語用等多領域,海闊天空,大有作為。(2)語言和思維可分還是不可分?人類的思維可以離開語言,語言不可離開思維。思維是為了交流,沒有新信息,思維會失去活力而枯竭。不能人為地把思維和交際分離開。(3)語言習得是先天的,還是經驗的?人工智能棄用喬姆斯基的語言先天論,轉而基于語言經驗論,取得了里程碑式的成功。(4)人工智能會不會有思維,甚至有生命?人工智能不會具有生命。人工智能的語言是離開思維的語言。流利的語言并不等于自主的思維。離開人類智能的主宰操控,人工智能將一事無成。我們要學會駕馭人工智能,適應這個有了人工智能的世界,去創造更加美好的未來。

關鍵詞 人工智能;大語言學;自主思維;概率匹配;復雜適應系統

中圖分類號H002 文獻標識碼A 文章編號2096-1014(2025)01-0087-10

DOI 10.19689/j.cnki.cn10-1361/h.20250108

一、引 言

2022 年年底,ChatGPT 橫空出世,人工智能進入大語言模型時代。有著“人工智能教父”之譽的杰弗里·辛頓(Geoff rey E. Hinton)2024 年10 月8 日獲得諾貝爾物理學獎后,在獲獎訪談中說:“神經網絡在處理語言方面,比喬姆斯基語言學派產生的任何東西都要好得多。”此前,他在都柏林大學學院接受尤利西斯獎章的獲獎感言中,就曾毫不客氣地指出“語言學家被一個叫喬姆斯基的人誤導了好幾代”(陳國華2024)。他對喬姆斯基語言學的批評,引起了語言學界的強烈反響,或贊同,或反對,莫衷一是。我聯想到以前有兩個人對于西方語言學的評論。一個是鮑林杰(Bolinger 1981):“沒有哪一個科學領域像語言學那樣,存在著如此之多的謬誤,不僅存在著,而且還繼續被當作真理傳授著。”一個是杰里內克(Jelinek 1988):“每次我炒掉一位語言學家,言語識別系統的表現就會提升。”可是他又說:“我可以跟語言學家很好地合作。”(Jelinek 2005)作為語言學家,重要的不是去贊成或反對,而是需要認真反思:大語言模型在哪里挑戰了語言學?語言學該怎樣把挑戰變為機遇?

正如雅可布森高度稱贊索緒爾開創現代語言學的歷史功績的同時,也指出“甚至其中的錯誤和矛盾也能給人啟示”(羅曼·雅柯布森1942/2001 :66),實際上,有些語言學的基本問題,從索緒爾就開始改變了(石鋒2013)。喬姆斯基不過是把這種改變推向極致。我曾寫過《音義結合是任意的嗎?——重讀雅可布森評索緒爾之一》(石鋒2013)、《語言之謎:來自人工智能的挑戰》(石鋒2023)等文章。以下是幾個不成熟的想法,拋磚引玉,請大家指正。

二、大語言學還是小語言學?

關于搞大語言學還是小語言學的問題,涉及語言學研究對象的拓展和研究范式的轉換,或者如沈家煊所說的,是關系到語言學的內涵和外延的擴展a。索緒爾(1980:43)強調純語言學:“我們的關于語言的定義是要把一切跟語言的組織、語言的系統無關的東西,簡言之,一切我們用‘外部語言學’這個術語所指的東西排除出去的。”喬姆斯基(Chomsky 1965)堅持語言研究的對象是“理想化的說話人和聽話人的語言知識”。可見,從索緒爾的純語言學到喬姆斯基的理想說話人,思想觀念是一脈相承的。這好像是自己給自己劃出一個小語言學的圈圈,把語言跟人群和社會隔絕開來。小語言學是追求規則性的還原論科學觀,大語言學則是追求概率性的演化論科學觀。我們當前特別需要把小語言學觀念轉變為大語言學觀念,建立基于數據和概率統計的多學科、跨領域的科學觀。

語言是什么?“語言是人跟人互通信息,用發音器官發出來的、成系統的行為的方式。”(趙元任1980 :3)英國著名語言學家杰弗里·利奇講:“語言學天生是跨學科的…… 語言天然地分布在多個學科的邊界處。”語言學天然具有多學科的性質。這意味著語言學從來不是一個獨立自足的學科。

雅可布森、拉波夫、王士元都提倡并且實踐大語言學的研究。例如,雅可布森對照兒童的語言發展,考察失語癥病人的語言消退,寫出《兒童語言,失語癥和語音普遍現象》(1941)。他帶著學生哈勒(M. Halle)跟聲學語音學家方特(G. Fant)合作完成《語音分析初探:區別性特征及其相互關系》(1951)。拉波夫研究異質有序的語言變異。他的團隊經過長期廣泛的調查訪談和實驗測算,寫出多年學術積累的三卷本巨著《語言變化原理:內部因素》(1994)、《語言變化原理:社會因素》(2001)、《語言變化原理:認知和文化因素》(2010)。王士元最早利用計算機建成漢語方言語料庫,創立詞匯擴散理論;現在又在研究演化語言學,利用腦科學技術探索兒童語言產生和老年語言衰退的神經機制。

大語言學內部具有跨領域的特征。語音、詞匯、語法、語義、語用等分野并沒有明確的獨立性。“真的語言是大半有規則,小半不規則的一個系統。”(趙元任1965a/2002 :590)不僅是全部語言成分大半有規則,小半不規則,而且還應該包括全部的語言分野、語言范疇和語言層級的劃分,這些同樣是大半有規則,小半不規則的。這就意味著,在任何單一分野或單一層級內部不可能解決這一分野和這一層級的所有問題,都不是自足的。即語言學內部各分野、各層級之間也要互相補充、彼此結合才有可能解決問題。

那種語言內部的語音、詞匯、語法、語義、語用各自成為一統,相互分離的想法和做法,都是不可取的。為什么語調問題一直難以解決?因為這本來就不是單純的語音問題。為什么漢語的主語謂語問題長期糾纏不清?因為這根本就超出了語法的小圈子。所以趙元任說:“漢語里主謂結構的含義并非像大多數印歐語言那樣是動作者與動作的關系,而是話題與說明的關系。作為一個特例,動作者與動作的關系也含于其中。”(趙元任1954/2002 :805)可見他根本就沒有把語法、語義和語用之間的界限看作不可逾越的雷池。

呂叔湘、朱德熙(1952)《語法修辭講話》把語法和修辭結合在一起。陸儉明(2024)的“語義制約語法”講“語法問題說到底是語義問題”。沈家煊(2020)提出,大語法“同時是‘語義語法’‘語用語法’‘聲韻語法’”。這些都表明我們中國語言學是有著大語言學傳統的。美國歐哈拉(J. Ohala)提倡語音學跟音系學結合。我們的“語音格局”學術理念和研究范式就是用實驗的方法研究音系學的捷徑。這說明我們在這方面的觀念和實踐上并不落后。

綜上所述,人工智能對語言學挑戰的重要意義之一,就是用事實打破了小語言學、純語言學的舊框框,帶給我們建立新的大語言學觀念和研究范式的機遇。語言學是經驗科學,不是玄學。不能只是在書齋里坐而論道,而是要去調查、實驗、探索、發現。大語言學向外融合文、理、醫、工等多學科,向內是跨越語音、語法、語義、語用等多領域,海闊天空,道路寬廣,大有作為。

三、語言和思維,可分還是不可分?

我在《語言之謎:來自人工智能的挑戰》一文中寫道:“語言是用來交際的還是用來思維的?喬姆斯基說語言是思維的,不是交際的,這個可以討論。語言和思維可分還是不可分?喬姆斯基認為語言和思維不可分,這也可以討論。”其中第九節就是討論“語言和思維可以分開嗎?”,這里再做些補充說明。

語言和思維的關系問題,其實是一個老問題。很多教科書上都講思維離不開語言。其實是語言離不開思維。20 多年前我給學生上語言學概論課就講過,人類思維可以分為形象思維、抽象思維、悟性思維和技術思維,其中只有抽象思維跟語言關系密切,需要語言來使抽象思維清晰化、條理化,并且用語言來表達出來(石鋒2023)。形象思維,如畫家用圖畫來表現思想,音樂家用旋律來抒發感情,可以不用語言;悟性思維,是一個謎題糾纏于心,久拖未解,偶遇觸發,恍然大悟,也可以不用語言。技術思維,如體育運動、工藝制作、非遺傳承,都是可以不用語言就能夠完成的。

這幾種思維方式當然不是各自孤立的,而是彼此聯系,相互補充的。所以,對于人類來說,思維可以離開語言,而語言不可離開思維。這是一種單向的蘊含。語言中有很多這樣單向蘊含的不對稱現象。人們常常會有“只可意會,不可言傳”的狀態。因為人的一切活動行為都是由思維來支配的。思維所涵蓋的范圍比語言更加廣闊。這個問題澄清了,解決了,才好進一步理解和認識大語言模型生成的語言為什么會一本正經地胡謅,那是因為它只是基于語言數據而不是基于認知思維。

在中國傳統文化中,語言和思維不是一回事。道可道,非常道;名可名,非常名。可是在西方傳統文化中,語言和思維常常混在一起,如:語言的邊界就是世界的邊界(維特根斯坦語)。其實,語言知識并不是人類所學習和掌握的全部知識。人們通過形象思維、悟性思維和技術思維同樣可以獲得知識。當然,抽象思維以語言作為表達工具是很重要的。“人類之所以演化成為‘地球主宰’,很大程度上是因為我們發明了語言。”(王士元2024)特別是記錄語言的文字可以突破空間和時間的限制,把人類的知識傳播開來,積累起來。這樣,后人就能夠站在前人的肩上不斷進步。這種文化的演進比生理的演進在時間上要縮短千百倍。我們說思維可以離開語言,只是對于事實的陳述,并不否認語言對于人類社會的重要作用。

再來看語言是用于思維還是用于交際的問題。喬姆斯基是主張語言用于思維而不是用于交際。最近有幾位神經科學家在《自然》(Nature)刊物上發文(Fedorenko et al. 2024),用實驗證明語言主要是一種交流的工具,而不是一種思考的工具。她們利用功能性磁共振成像(fMRI)技術,找出那些專門參與語言以及思考和推理的大腦區域,發現當人們進行各種形式的思考時,大腦中跟語言相關的區域是沉默的,即思維能力是由大腦的其他區域支持的。因此語言是用于交際的,沒有語言,同樣可以思維。

根據腦成像的證據,嚴重失語癥病人(失去語言交流能力)照樣可以解決數學計算、下棋,具有做出決策的能力。同時,智力障礙疾病或者神經精神疾病的患者,思維和推理能力受到限制,可他們的基本語言功能不一定有問題。另外,口吃的人語言產生卡頓并不表明他的思維卡頓。我們往往會記得別人的相貌而想不起他的名字,這說明直接的視覺圖像記憶跟間接的語言符號提取是不同步的。語言不是思維的必要條件。這個結論對于我們認識理解大語言模型的原理和本質極為重要。

人們在準備講述一個事件、論證一個觀點、寫作一篇文章的時候,先要在大腦里想好表達的條理次序和選用的詞語句式。這就是人們在思考問題時的內部語言,可以看作自問自答,自己跟自己交際。思考的目的是什么?是為了說出來更好地表達思想,跟他人交流信息。寫文章的目的是什么?是為了給別人看,更廣泛地交流信息。外部語言就是我們平常講的自然語言,內部語言就是前語言。只有表達出來成為語言,別人才能知道,你的思考才有意義。同時,通過交流,得到反饋的信息。交際就是交流信息,只有通過交流得到新信息,思維才會有內容。沒有新信息,思維會失去活力而枯竭。交際是思維得以進行和發展的基礎條件。所以,我們大可不必對思維和交際進行人為的分離和割裂。

四、語言習得是先天的,還是經驗的?

人工智能棄用喬姆斯基的語言先天論,轉而基于語言經驗論,取得了里程碑式的成功。經驗是什么?經驗就是頻率,經驗就是概率。經驗多就是高頻,經驗少就是低頻。高頻就是概率大,低頻就是概率小。趙元任(1965b/2002 :522)講:“小孩子學語言,就是老聽老聽,老聽那種語言在什么情形說甚么話。他把說那種話跟那種情形聯系起來,就可以知道那句話的意義了。”不斷地增加概率,熟能生巧。兒童就是這樣學會說話的。

拉波夫(Labov 1994 :745)寫道:“語言學習的實際情況顯示出:兒童所習得的變異規則的使用頻率,是和他們所處的環境相匹配的。”他強調:“這并不是一個關于兒童學習會表現出概率匹配的假設。它只是對所觀察到的事實進行一個簡單的描述。”第二語言習得的情況也是一樣,“學習一個語言是要說過的若干分量,若干種的話。說到了自己會說出像樣的話了,以后就出口成話了”(趙元任1965a/2002 :589)。這就是語言的涌現,功到自然成。

語言的本質就是一種語言符號的概率分布模式。我在《語言之謎:來自人工智能的挑戰》第7 個問題“人類是怎樣學習語言的?”的討論中,曾經提出語言習得的概率匹配法則:母語習得和二語習得的本質就是對語言要素連同其語境和論域的概率匹配。概率增加到相當大,就會發生涌現,習慣成自然,就成為語感。

形式模仿和概率匹配是人和動物共有的本能。概率匹配其實就是高級的模仿。本能都是先天的。可見,語言不是先天的,形式模仿和概率匹配才是先天的語言學習機制。概率需要實踐經驗的積累儲存,包括形式的儲存和內容的儲存。孔子的“學而時習之,不亦樂乎”中的“時習之”,就是經常地練習。對于人類語言的概率性質,其實有些學術敏感的語言學者早就有意或無意的,在不同程度上有所發現,并有所研究。只是大多都被學者們所忽略,或者都被視為非主流、非本體,而被排除在主流和本體之外。

雅可布森研究的兒童學母語的語音遵循的順序,其實就是概率大的先學會,概率小的后學會。哈佛大學教授齊夫在20世紀40年代就提出詞頻分布的齊夫定律(Zipf’s Law)a。王士元的詞匯擴散理論,哪些詞先變,哪些詞后變,都跟詞的頻率有關。我們曾考察天津話聲調的變化(石鋒,王萍2004),發現朝向標準語的變化是低頻詞領先,背離標準語的變化是高頻詞領先。沈家煊(1999)的《不對稱和標記論》中,無標記是高頻成分,有標記是低頻成分。語法就是用法的固化。概率大的就是規則,概率小的就是例外。陸儉明的語義和諧律和語義制約語法說,也是跟概率相聯系的。何謂和諧?共現概率大,就和諧;共現概率小,就不和諧。優選論風靡一時,最具概率色彩,這一點可能提倡者自己都沒有意識到。優選就是優勢選擇。優勢就是概率大,劣勢就是概率小,肯定沒有百分之百的情況。我們依據實驗數據做出語音格局、語言格局,就是語音成分或語言成分的概率分布模式。

趙元任(1965a/2002 :587)曾經說可以把現代的中國話定義為:“現在活著的中國人說過的所有的話加起來的總和”。這句話好像有些熟悉哦!現在的人工智能就是基于大語言模型的,這個語言的定義正符合現在的大語言模型的設計思想。趙先生至少早在1965 年就把它的輪廓勾勒出來,并且把這個定義的理念成功地應用于語言習得和語言教學當中。真是了不起!所以現在的人工智能就是在繼續拓展那些“非主流”語言學家已經在做的,并且需要其他語言學家都來做的事情。

前面講過,“真的語言是大半有規則,小半不規則的一個系統”(趙元任1965a/2002 :590)。語言實際上就是一種復雜適應系統,即開放的系統。對于封閉系統,適用于規則;對于開放系統,適用于概率。即,簡單封閉系統是規則系統,復雜開放系統是概率系統。語言就是一種概率分布模式。兒童學會母語,學生學會一種外語,就是學會這種概率分布模式,進行概率匹配和模式匹配。這就是人類語言的一個重要奧秘,也是大語言模型重要的設計原理和工作原理。

對于人工智能的成功,對于大語言模型的原理,有的學者講“不可解釋”,用那些先天論的理念和規則系統的觀點當然不可能解釋語言這種概率系統。當年機器翻譯有兩條路線,一條走規則,一條走概率。這就是對于語言是規則系統還是概率系統的兩種不同的觀念。以規則為基礎最多只能達到70% 左右的正確率,這應該就是那有規則的大半。統計路線當時受到數據量的限制,加之硬件算力不足,軟件算法不精,遭遇冷落。如今這3 個難題都可以解決,人工智能一飛沖天。以概率為基礎的正確率能達到多少?那70% 有規則的正確率肯定是100% ;剩下30% 不規則的正確率可以在90% 以上。這加起來的正確率應該超過95%。所以,語言并不是規則系統,而是一種基于概率的復雜適應系統。

人工智能深度學習跟人類大腦學習方式是否相同?有人說二者完全不同,有人說二者完全一樣,這兩種說法都各有偏頗。實際上應該是有同有異。相同的方面主要是,在采用概率匹配基本原理方面具有一致性。心理學界對兒童學習語言時的概率詞切分即語音統計學習已經有大量實驗證實發現,是成熟的范式。實驗證明,人腦的感知和理解語言,也是預測式的,由記憶概率和輸入信號的自然特征共同擬合,即相互匹配。

人類有很多科學技術是對各種生物的模仿,而人工智能則是不完全地模仿人類自身獲取知識、習得語言的過程。人工神經網絡就是對人類大腦神經元突觸連接而成的神經網絡的模仿。所以人工智能可以說是人腦的不完全仿制品,或按照史有為的說法,是類仿生制品。所謂心理詞庫就是大腦中的記憶庫,詞語連同它所在的結構和語境一起儲存在神經網絡的長時記憶中,這相當于大語言模型的詞向量數據庫。連接強度就是概率權重。人工神經網絡、深度學習、大語言模型的成功,在很大程度上是一種仿生學的實踐。

這里順便對一個人們關注的問題做出簡單的解釋。兒童語言和人工智能語言同樣都很少有語法錯誤,這是出于同樣的原因:輸入的都是正常語料,當然會輸出正常的語句。

五、人工智能語言跟人類自然語言有什么差異?

面對當前人工智能的快速進展,人們開始談論人工智能是否會成為硅基生命,是否會優于人類這種碳基生命,甚至會出現硅基生命取代碳基生物的前景。如OpenAI 公司前首席科學家伊利亞就非常擔心,感覺大語言模型似乎出現了某種自我意識。馬斯克也是強烈地戒備ChatGPT 可能會具有自我意識。人工智能的發展使我們有機會和有條件重新反思生命和非生命,意識和非意識,思維和非思維,語言和非語言。

如果我們前面講的是大語言模型對主流語言學理論的挑戰,以及大語言模型對人類語言的挑戰,那么這里已經涉及大語言模型對人類自身的挑戰了。我們可以把問題分解為3 個不同的層面:(1)生命和非生命,即生物和非生物之間的根本區別在哪里?這關系到人工智能是否可以有生命。(2)人工智能和人類智能的根本區別在哪里?這關系到人工智能是否具有自我意識和思維能力。(3)人工智能的語言和人類的自然語言根本區別在哪里?這關系到人類學習語言和機器學習語言,二者之間的相同點和不同點。

這樣有助于把問題導向清晰和簡化。人們在第一個問題上可能就看法不同,即對生物和非生物的認識理解不一樣。對第一個問題觀點相同的人,有可能在第二個問題上產生分歧,即能否把語言知識和思維能力區分開。對前兩個問題都意見一致的人,有可能在第三個問題上產生分歧,即怎樣認識人工智能產生的語言。

第一個問題比較容易解決。人工智能不會具有生命。當年叫作“人工智能”(Artifi cial Intelligence,AI),就是采用了一個神奇的名稱。其實AI 的A(artifi cial),意義就是“假的”,不是真的。世界由物質、能量和信息構成。生命的本質表現,就是通過生命體自身和外界的信息交換和物質交換,為自身的生存和繁衍提供能量。這種內源性可持續的能量獲取和能量消耗相互平衡,生命就可以不斷延續。這是生命的核心特征和判定標準,人工智能顯然達不到這一點。所謂硅基生命只是一種幻想式的比喻說法,或者就是一種戲稱。

第二個問題聯系到人工智能和人類智能的根本區別。依據第一個問題的答案,人類智能有生命,人工智能無生命。自主意識的核心特征就是:具有主觀能動性。這表現為獨立確定目標,主動提出問題,自主進行決策。人工智能不會具備這一點。人工智能可以產出流利通順的語言,但是流利的語言并不等于自主的思維。語言能力不等于思維能力。人類制造工具,是為了增強人的能力。正如汽車比人跑得快,輪船比人游得遠,人工智能在多方面超出人的能力,是正常現象。人工智能具有的全部語言能力和各種其他能力,都是人類智能進行決策、設計、運作的結果。離開人類智能的主宰操控,人工智能將一事無成。

第三個問題是人工智能的語言和人類語言的對比。這直接聯系到語言學。上文第四節語言習得講的,多是二者之間的相同點,即:人類語言是概率系統,兒童習得母語和學生學習外語,都是靠概率匹配;大語言模型同樣是依據詞語搭配的共現概率進行預測,同樣是一種概率匹配。我還發現另一個有趣的類似現象。兒童在一歲半到兩歲時,突然會說很多的詞語和句子。這就是語言的涌現。大語言模型也會有涌現發生,當訓練參數達到500 億時,顯示出越來越接近人類語言的表現。(馮志偉,張登柯2024)復雜適應系統的概率積累到相當程度,達到一個奇點,就會產生涌現。

現在就可以討論人工智能語言跟人類自然語言之間有什么差異了。最大的鴻溝之別就是人工智能沒有生命,沒有自主意識。前面講到人類的語言是離不開思維的,而人工智能產生的卻是離開思維的語言。很多學者指出過的一些問題都是源于這個基本的不同點。例如,人工智能缺乏情感表達和語用能力,難以理解人類語言中的歧義、反語、雙關、幽默等意義,常常會一本正經地胡謅。更重要的是人工智能沒有價值觀、正義感和道德觀,不會判斷真假和好壞,誠實和欺騙。(石鋒2023)離開思維的人工智能語言缺失真值判斷,當然是不可靠的,必須要經過人類的審查,剔除虛假信息,才能付諸使用。

人類有語言能力和思維能力,人工智能有語言能力,無思維能力。人類的思維能力先于語言能力,強于語言能力,大于語言能力,生成語言能力。因為人類語言能力是思維能力的派生品,所以人類語言中可以反映出部分人類的思維能力的過程和結果。這就是有的人誤以為人工智能具有自主意識的原因。

人類語言是具身輸入的,包括了語言交際的雙方背景,說話時的場合情景等信息,所以除了語言內部的聯系之外,還獲取了語言和外部世界的聯系。人工智能數據庫只是語言文本的輸入,只能獲得語言內部的詞匯、語句之間的聯系,所以,有學者稱其為“語能”而非“智能”(李葆嘉2024),是“言知”而不是“親知”(陳保亞,陳樾2024)。這也是不完全模仿人類的意義。當然,人類語言會有生理遺忘、心理偏好等因素,這也是大語言模型所沒有的。

人們早就注意到,人工智能需要大量數據,十億、百億,以至千億,而兒童習得語言似乎“輸入貧乏”。其實量的問題只是表象,質的差別才是根本。兒童具身互動輸入的語料是語音+ 語義+ 語境+事件+ 人物+ 場景+ 褒貶+ 好惡+ 色彩+ 聲音+ 氣味+ 味道+ 剛柔…… 的多通路并行、多模態整合的優質高效數據,而且是在互動反饋中同步優化的漸進式存儲,隨時做出概率權重,即連接強弱的調整。人工智能輸入的大量數據只是基于單通道、單模態文本的混雜低效語料,還必須加上各種訓練調整,后補模仿人類的互動。現在新模型可以處理多模態對象,要像人類一樣跟語言無縫統合,還有很長的路要走。

實際上,3 歲兒童的詞匯輸入量大約有1300 萬~ 4500 萬(Hart amp; Risley 1995)。如果按照語音+語義+ 語境+ 事件+ 人物+ 場景…… 等等信息,假設每個詞向量有100 個參數,那么,兒童輸入的數據量盡管比不上人工智能,相差也并非想象的那么多。而且兒童的優化語料數據比人工智能的混雜語料數據不知道要強上多少倍!人工智能數據量為什么多多益善呢?因為“沙里淘金”,混雜語料不過都是沙子,經過各種訓練調整,優化淘汰之后,才得到“真金”。殊不知,兒童輸入的數據本身就已經是“真金”。

最后,也是最為重要的根本點:人工智能沒有個性。因為大語言模型數據庫來自互聯網,不可能把每一個提供語料的人都區分出來。所以,人工智能不懂得人際交往的遠近親疏。而人類社會網絡中的每個人都是獨特的“這一個”,人類語言是有個性的。這是人工智能語言和人類自然語言之間的根本性差別。(石鋒2023)這里順便提醒大家一個問題:人工智能的深度學習系統可以用于不同語言之間的轉譯,可以切換到不同語言內部的問答聊天。這些都是基于同樣的系統,并沒有改換不同的系統。那無數學人夢寐以求的“普遍語法”是不是就已經由人工智能實現了?!

六、結 語

最近的網絡上又見到人工智能新發展的兩個重要信息。一是OpenAI 公司推出最新推理模型GPT-o1,采用“思維鏈”(CoT,chain of thought)訓練模式,極大提高了模型的推理能力。據說新模型在多項評測指標上已達“博士級”智能水平。OpenAI 公司首席執行官奧特曼表示,這代表了人工智能領域的新范式:具備通用推理能力的人工智能。一是ImageNet 創始人李飛飛聯合創建空間智能公司(World Labs),把空間智能作為人工智能領域新的研究前沿。她認為,我們正處在一次“寒武紀大爆發”中,現在不只是文本,像素、視頻、音頻方面都在開始出現可能的人工智能應用和模型。視覺空間智能非常根本,與語言一樣根本。再加上每天有無數的人在使用它,其實就是訓練它,不斷接近人類的偏好。人工智能的未來具有廣闊的發展空間。

在這種人工智能快速發展的大勢所趨之下,語言學向何處去?語言教學和語言研究向何處去?確實值得每一位語言學人認真思考。“ChatGPT 對我們既是挑戰,也是機遇。”(沈家煊2023)“這對于解釋第一語言習得的奧秘會有新思路,對于第二語言教學會有新啟發。”(李宇明2023)“這是中國語言學唯一一次超越或者引領世界語言學的機會。”(劉海濤,鄭國鋒2021 ;劉海濤2024)“不要問時代和社會真的會不會拋棄語言學,而要問語言學真的能為時代和社會做些什么!”(袁毓林2024)以上幾位語言學家的意見,值得重視。

人工智能的挑戰對于語言學來說,確實是個極好的轉向科學化道路的機遇。我在今年第15 屆演化語言學國際研討會的主旨報告中,講到“殊途同歸”:“如果不同學者的大方向一致,不同的理論和方法最終總會殊途同歸,彼此相容。”(石鋒2024)不同的理論和方法,應該沒有根本分歧,可以統合在一起,渾然一體,形成一個更具普遍性的綜合性理論體系和方法范式。語言學的科學化應該是我們共同的努力方向。趙元任的“多能性”精神提倡包容開放,想來也是在寄希望于未來的殊途同歸吧。

世界進入了人工智能的時代。每個人的工作與生活都將會受到影響而發生不同程度的改變。首先要全面革新舊有的觀念,正確理解認識和學會使用人工智能,學會在人工智能的幫助下進行語言教學和語言研究。同時要保持清醒的頭腦和冷靜的思考,對人工智能要有客觀的評估,過低和過高都不利于對它的理解和使用。要記住對人工智能的答案結果必須認真檢查,注意其中的胡謅成分。人工智能的本質就是人類制造出來由人來操控的工具,不管它現在或將來會有多大的功能,這個本質屬性是不會改變的。我們將會像使用電腦和手機一樣,學會駕馭人工智能,適應這個有了人工智能的世界,去創造更加美好的未來。

參考文獻

陳保亞,陳 樾 2024 《人類語言習得的親知還原模式—— 從ChatGPT 的言知還原模式說起》,《北京大學學報(哲學社會科學版)》第2 期。

陳國華 2024 《杰弗里·辛頓接受尤利西斯獎章時發表的獲獎感言》,《當代語言學》第4 期。

馮志偉,張登柯 2024 《ChatGPT 與語言研究》,載楊旭,羅仁地《ChatGPT 來了》,上海:上海教育出版社。

李葆嘉 2024 《辛頓如斯說:神經網絡語模吸收了語義學理論》,“實驗語言學+”云上論壇報告(10 月15 日)。

李宇明 2023 《“人機共生”的時代》,《語言戰略研究》第4 期。

劉海濤 2024 《從語言數據到語言智能:數智時代對語言研究者的挑戰》,《中國外語》第5 期。

劉海濤,鄭國鋒 2021 《大數據時代語言學理論研究的路徑與意義》,《當代外語研究》第2 期。

陸儉明 2024 《語義制約語法芻議》,《河北大學學報(哲學社會科學版)》第2 期。

羅曼·雅柯布森 1942/2001 《雅柯布森文集》,錢軍,王力,譯注,長沙:湖南教育出版社。

呂叔湘,朱德熙 1952 《語法修辭講話》,北京:開明書店。

沈家煊 1999 《不對稱和標記論》,南昌:江西教育出版社。

沈家煊 2020 《漢語大語法五論》,上海:學林出版社。

沈家煊 2023 《ChatGPT,趙元任,新文科——一個語言學家的思考》,《中國語言戰略》第1 期。

石 鋒 2013 《音義結合是任意的嗎?—— 重讀雅可布森評索緒爾之一》,載石鋒,彭剛《大江東去:王士元80 歲慶壽文集》,香港:香港城市大學出版社。收入石鋒《秋葉集》,天津:南開大學出版社。

石 鋒 2023 《語言之謎:來自人工智能的挑戰》,《實驗語言學》第2 號。

石 鋒 2024 《拉波夫之問:音在變,還是詞在變?》,《實驗語言學》第4 號。

石 鋒,王 萍 2004 《天津話聲調的新變化》,載石鋒,沈鐘偉《樂在其中:王士元教授七十華誕慶祝文集》,天津:南開大學出版社。

索緒爾 1980 《普通語言學教程》,高名凱,譯,北京:商務印書館。

王士元 2024 《第15 屆演化語言學國際研討會開幕式致辭》,《實驗語言學》第4 號。

袁毓林 2024 《如何測試ChatGPT 的語義理解與常識推理水平?—— 兼談大語言模型時代語言學的挑戰與機會》,《語言戰略研究》第1 期。

趙元任 1980 《語言問題》,北京:商務印書館。

趙元任 1954/2002 《漢語語法與邏輯雜談》,載趙元任《趙元任語言學論文集》,北京:商務印書館。

趙元任 1965a/2002 《羅素的抽象原則跟語言教學》,載趙元任《趙元任語言學論文集》,北京:商務印書館。

趙元任 1965b/2002 《外國語教學的方式》,載趙元任《趙元任語言學論文集》,北京:商務印書館。

Bolinger, D. 1981. Aspects of Language. New York: Harcourt College Publisher.(《語言要略》,方立,等,譯,北京:外語教學與研究出版社,1993 年版)

Chomsky, N. 1965. Aspects of the Theory of Syntax. Cambridge, MA.: MIT Press.

Fedorenko, E., S. T. Piantadosi amp; E. A. F. Gibson. 2024. Language is primarily a tool for communication rather than thought.Nature 630, 575–586.

Hart, B. amp; T. R. Risley. 1995. Meaningful Diff erences in the Everyday Experience of Young American Children. Baltimore, MD:Paul H. Brookes Publishing Co.

Jelinek, F. 1988. Applying information theoretic methods: Evaluation of grammar quality. In Workshop on Evaluation of NLP Systems, Wayne, PA.

Jelinek, F. 2005. Some of my best friends are linguists. Language Resources and Evaluation 1, 25–34.

Labov, W. 1994. Principles of Linguistic Change: Internal Factors. John Wiley and Sons Limited.( 《語言變化原理:內部因素》,石鋒,郭嘉,譯,北京:商務印書館,2019 年版)

責任編輯:韓 暢

猜你喜歡
人工智能
我校新增“人工智能”本科專業
用“小AI”解決人工智能的“大”煩惱
汽車零部件(2020年3期)2020-03-27 05:30:20
當人工智能遇見再制造
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
AI人工智能解疑答問
人工智能與就業
IT經理世界(2018年20期)2018-10-24 02:38:24
基于人工智能的電力系統自動化控制
人工智能,來了
數讀人工智能
小康(2017年16期)2017-06-07 09:00:59
人工智能來了
學與玩(2017年12期)2017-02-16 06:51:12
主站蜘蛛池模板: 成人午夜久久| 国产中文在线亚洲精品官网| jijzzizz老师出水喷水喷出| 亚洲国产AV无码综合原创| 国内嫩模私拍精品视频| 亚洲色图欧美激情| 美女高潮全身流白浆福利区| 99久久99这里只有免费的精品| 台湾AV国片精品女同性| 国产精品刺激对白在线| 国产黑丝一区| 国产女人在线观看| 噜噜噜久久| 欧美日本在线一区二区三区| www亚洲精品| 九九热在线视频| 国产精品综合久久久 | 在线网站18禁| 日韩成人在线一区二区| 欧美专区在线观看| 亚洲午夜福利在线| 欧美在线视频不卡| 成人午夜在线播放| 亚洲无码视频喷水| 一区二区自拍| 亚洲精品综合一二三区在线| 88国产经典欧美一区二区三区| 国产一区二区网站| 在线欧美日韩国产| 思思热精品在线8| 国产福利大秀91| 国产免费久久精品99re不卡 | 精品无码日韩国产不卡av| 欧美一级视频免费| 制服丝袜一区| 四虎免费视频网站| yy6080理论大片一级久久| 精品久久综合1区2区3区激情| 一级毛片无毒不卡直接观看| 人妻丰满熟妇AV无码区| 激情综合网激情综合| 精品福利网| 久久永久视频| 精品三级网站| 亚洲天堂日韩av电影| 亚洲精品国产首次亮相| 欧美激情视频在线观看一区| 久久综合色视频| 国产理论最新国产精品视频| 在线免费亚洲无码视频| 全部免费特黄特色大片视频| 久久大香香蕉国产免费网站| av在线无码浏览| 狂欢视频在线观看不卡| 精品欧美一区二区三区久久久| a级毛片在线免费| 91青青视频| 美女被操黄色视频网站| 亚洲精品777| 国产v欧美v日韩v综合精品| 亚洲专区一区二区在线观看| 国产一区二区三区在线精品专区| 国产福利微拍精品一区二区| 国产欧美成人不卡视频| 亚洲福利视频一区二区| 婷婷久久综合九色综合88| 高清不卡一区二区三区香蕉| 亚洲免费播放| 四虎成人在线视频| 又黄又湿又爽的视频| 国产成人h在线观看网站站| 久久综合干| 亚洲精品福利视频| 日韩小视频在线观看| 国产精品综合久久久| 亚洲AV成人一区二区三区AV| 久久久久中文字幕精品视频| 国产精品2| av在线人妻熟妇| 国产爽爽视频| 国产清纯在线一区二区WWW| 孕妇高潮太爽了在线观看免费|