999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

在人類生境約束下思考語言的設(shè)計(jì)原理和運(yùn)作機(jī)制*

2022-11-15 02:00:16袁毓林
語言戰(zhàn)略研究 2022年6期
關(guān)鍵詞:符號(hào)人類語言

袁毓林

(澳門大學(xué) 人文學(xué)院中國語言文學(xué)系 澳門 999078;北京大學(xué) 中文系/中國語言學(xué)研究中心/計(jì)算語言學(xué)教育部重點(diǎn)實(shí)驗(yàn)室 北京 100871)

提 要 文章述評(píng)了霍凱特提出的人類語言的13種設(shè)計(jì)特征,并重點(diǎn)討論其中的語言符號(hào)離散性和二元構(gòu)型特征。從自然語言處理的角度看,離散性使語言符號(hào)的形式與意義之間存在著語義鴻溝,需要把自然語言的詞向量化為連續(xù)性數(shù)值才可以進(jìn)行計(jì)算,這種運(yùn)算的結(jié)果可以從語言學(xué)上進(jìn)行解釋。由于語言系統(tǒng)和生物系統(tǒng)在二元構(gòu)型上存在相似性,可以將自然語言處理的一些模型運(yùn)用于生物分子研究領(lǐng)域。根據(jù)托馬塞洛關(guān)于人類溝通的起源和合作性心理平臺(tái)的學(xué)說,任何訴諸語言本身有某種繁復(fù)而自足的深層結(jié)構(gòu)的幻想都是不切實(shí)際的,語言學(xué)家應(yīng)該把語言置于人類生境(即人類進(jìn)化與生存的現(xiàn)實(shí)境況)下,來思考語言的設(shè)計(jì)原理和運(yùn)作機(jī)制,從而對語言的結(jié)構(gòu)方式和功能效用有更加切實(shí)的了解,進(jìn)而開辟一種更具人文主義情懷的語言學(xué)研究進(jìn)路。

一、引言:語言研究受人類生境的約束

語言研究面臨的第一道門檻是問題的提出和方法的抉擇,而問題和方法的確定又往往取決于研究者對于語言的結(jié)構(gòu)與功能、來源與演化等根本問題的認(rèn)識(shí)。為了檢討我們秉持的基于人文主義的語法研究道路的合理性,本文首先介紹和簡評(píng)霍凱特(Hockett 1960)提出的人類語言的13種設(shè)計(jì)特征,然后討論對于語言符號(hào)離散性的3種理解及其各自的側(cè)重點(diǎn),再介紹在自然語言處理領(lǐng)域中,怎樣用“詞嵌入”模型,把離散性的語言符號(hào)向量化為連續(xù)性數(shù)值,以及這種詞向量在有關(guān)計(jì)算任務(wù)中的應(yīng)用與效果;接著介紹和討論語言系統(tǒng)和生物系統(tǒng)在二元構(gòu)型(雙重分節(jié)性)上的相似性,特別是由這種二元雙層編碼的相似性而引發(fā)的、自然語言處理的有關(guān)算法和模型在生物分子領(lǐng)域中的運(yùn)用及其效果;最后介紹和評(píng)論托馬塞洛(Tomasello 2010)關(guān)于人類溝通的社會(huì)起源和語言奠基于其上的合作性心理平臺(tái)的學(xué)說,主張語言學(xué)家應(yīng)該把語言置于人類進(jìn)化與生存的現(xiàn)實(shí)境況(簡稱“生境”)下,來思考語言的設(shè)計(jì)原理和運(yùn)作機(jī)制,從而對語言的結(jié)構(gòu)方式和功能效用有更加切實(shí)的了解,進(jìn)而開辟一種更具人文主義情懷的語言學(xué)研究進(jìn)路(approach)。也就是說,語言研究受人類生境的約束,語言理論只能戴著現(xiàn)實(shí)語言生境的鐐銬跳舞,要丟掉任何不切實(shí)際的企圖為語言建造一座宮殿的幻想(袁毓林2019)。

二、人類語言系統(tǒng)的設(shè)計(jì)特征

霍凱特(Hockett 1960:90~92)首次提出人類語言有13種設(shè)計(jì)特征,包括:①對這些設(shè)計(jì)特征的名稱的翻譯,參考了王士元(2017:9),但不完全相同。對于這些特征的解釋、舉例和說明,我們加入了自己的認(rèn)識(shí)。如果要引用,務(wù)請核對原文。

(1)口耳通道(vocal-auditory channel)②vocal-auditory channel可以有“發(fā)聲-聽覺通道、口叫-耳聽通道”等多種翻譯。。它區(qū)別于手語的姿勢、蜜蜂的跳舞、刺魚的求愛儀式;它的好處是可以解放手腳等身體部位,便于人類在交談的同時(shí)從事其他活動(dòng)。

(2)四散傳播與定向接收(broadcast transmission and directional reception)。一個(gè)語言信號(hào)可以被一定范圍內(nèi)的任何聽覺系統(tǒng)聽到,并且聲音來源可以用雙耳鎖定。

(3)迅速消失(rapid fading)。這意味著語言信號(hào)不會(huì)為了聽者的方便而多停留一會(huì)兒,不同于動(dòng)物的足跡和臭跡會(huì)保持一段時(shí)間。所以人類發(fā)明了書寫記錄,這是人類非常晚近的文化進(jìn)化的成果。

顯然,(2)(3)兩點(diǎn)是由聲音的物理性質(zhì)決定的,也是(1)的不可避免的結(jié)果。

(4)互換性(interchangeability)。說話人可以產(chǎn)出任何他可以理解的語言消息。但是,雄性刺魚和雌性刺魚各自特有的求愛示意動(dòng)作卻是互不相同的,雙方都不能使用對方的合適動(dòng)作。另外,人類母嬰之間進(jìn)行交際時(shí),雙方都不適合發(fā)出對方特有的信號(hào),或者做出對方典型的回應(yīng)表達(dá)。

(5)完全反饋(total feedback)。當(dāng)人類說話時(shí),他會(huì)注意聽跟他說話相關(guān)的一切事物;而雄性刺魚并不會(huì)看它自己的眼睛和腹部的色彩,盡管它主要以此來刺激雌性刺魚。反饋是十分重要的,因?yàn)樗沟盟^的交際行為的內(nèi)化成為可能;而這種內(nèi)化的交際行為至少構(gòu)成了思維的主要部分。

顯然,這(4)(5)兩點(diǎn)是通過跟其他交際系統(tǒng)進(jìn)行比較才得以明確的。

(6)專門化(specialization)。它說的是:身體努力和發(fā)出言語聲波只是讓它成為一種信號(hào)。一只狗喘著氣吐出舌頭,給自己降溫和保持合適的體溫,但這只是一種生理動(dòng)作。在吐舌喘氣的同時(shí),它可能偶爾附帶著發(fā)出一些聲音,從而會(huì)讓其他狗(或人)知道它在哪兒和感覺如何;但是,這種傳遞信息的方式并不是專門化的。

(7)語義性(semanticity)。指在語言中,一段消息觸發(fā)了特定的結(jié)果,因?yàn)橄⒅械臉?gòu)成成分(比如詞)跟我們周圍世界中反復(fù)出現(xiàn)的特征或情境有一種相對固定的聯(lián)系。例如,英語單詞salt指鹽,而不是糖或胡椒粉。據(jù)此,上面(6)中狗的吐舌行為不具備語義性,它不是一個(gè)意指狗很熱的信號(hào),而只是狗很熱的一個(gè)部分(一種表現(xiàn))。長臂猿的呼叫則具有語義性。長臂猿有一種表示危險(xiǎn)的叫聲,其意義并不比我們叫喊“火!”更寬泛和模糊。

(8)任意性(arbitrariness)。在一個(gè)語義交際系統(tǒng)中,有意義的消息成分跟其意義之間的聯(lián)結(jié)可以是任意的或非任意的;但是,在語言中這種聯(lián)結(jié)是任意的。比如,英語單詞salt并不是鹽,dog并不是狗;whale(鯨)形體短小卻表示一種很大的物體,而microorganism(微生物)形體較大卻表示一種很小的物體。相反,圖畫看上去就像其所畫的事物。如果一只蜜蜂要報(bào)告它發(fā)現(xiàn)的蜜源地很近,它會(huì)跳舞跳得很快;如果很遠(yuǎn),就跳得很慢。“任意性”這種設(shè)計(jì)特征有任意武斷這種不利之處,但是也有其巨大的優(yōu)勢:對于要交際的內(nèi)容沒有什么限制。

(9)離散性(discreteness)。盡管人類的發(fā)音器官可以發(fā)出許多不同的聲音,但是任何一種語言卻只使用其中很少的一部分聲音;并且,這些不同的一部分聲音之間的差別在功能上是絕對的(不受限制的)。比如,英語單詞pin和bin對于耳朵來說只在清濁這一點(diǎn)上有差別。如果說話人在說pin時(shí)跑了音,朝著bin的發(fā)音方向去了,帶著噪聲說了pin(或bin),但聽話人很可能基于語境仍能明白說話人說的是什么單詞。這種語言的基本的、構(gòu)成信號(hào)的單元中的離散性特征,不同于通過嗓音示意的方式來進(jìn)行的對聲音效果的使用。后者存在一種實(shí)際上是連續(xù)的程度等級(jí),比如,人們在表示憤怒的時(shí)候會(huì)提高聲音,而在表示信任時(shí)會(huì)降低聲音。

(10)超越時(shí)空(displacement)。顯然人類在這一點(diǎn)上幾乎是唯一的:可以談?wù)撛诳臻g或時(shí)間(或兩者)上距離交談當(dāng)下及地點(diǎn)遙遠(yuǎn)的事物。這種超越時(shí)空特征在人類近親的發(fā)聲打信號(hào)行為中無疑是缺乏的,盡管它倒是出現(xiàn)在蜜蜂的跳舞打信號(hào)行為中。

(11)能產(chǎn)性(productivity)。指語言有這樣一種性能:說出以前從來沒有說過或聽過的話語,并且能夠被操這種語言的其他人理解。如果一只長臂猿發(fā)出任何叫聲,那只是一個(gè)小型的由數(shù)量有限的熟悉的叫聲組成的庫藏中的這一種或那一種。長臂猿的呼叫系統(tǒng)是封閉的。而語言是開放的,或者說是能產(chǎn)的,人們可以創(chuàng)造新的話語,把在舊的話語中熟悉的片段放在一起,按照在舊的話語中熟悉的配列模型來組裝。

(12)傳統(tǒng)傳授(traditional transmission)。人類基因中帶有獲得語言的性能,也許還有一種很強(qiáng)的獲得語言的內(nèi)驅(qū)力;但是,任何一種語言的許多具體而微的慣例卻是通過教和學(xué)來代際傳授的。這種“傳統(tǒng)傳授”在長臂猿的呼叫系統(tǒng)或其他哺乳動(dòng)物的發(fā)聲信號(hào)中到底起什么或多大作用,還不得而知;盡管在一些實(shí)例中,同一種系的動(dòng)物(不管它們在世界的哪個(gè)地方)的發(fā)聲的一致性,在很大程度上要?dú)w因于其基因。

(13)二元構(gòu)型(duality of patterning)①王士元(2017:9)譯作“二重層級(jí)性”,其實(shí)也可以譯作“雙層構(gòu)型”,或者“構(gòu)型的兩重性”。。任何語言中有意義的成分,日常語言所謂的“詞”,或者語言學(xué)家所謂的“語素”,其數(shù)量都是十分龐大的。然而它們卻是由一組數(shù)量較少的具有區(qū)別性的語音經(jīng)過數(shù)量不多的配列方式來表示的,并且這些語音本身是不具有意義的。這種二元構(gòu)型可以用英語單詞tack、cat和act來說明:雖然它們在整體意義上各不相同,但是它們都是由3個(gè)相同的基礎(chǔ)的不表示意義的語音經(jīng)過不同的排列組成的。其實(shí),這種二元構(gòu)型就是通常所說的“雙重分節(jié)”。

霍凱特(Hockett 1960:92)指出:這13個(gè)設(shè)計(jì)特征并不都是各不相關(guān)的,其中有一些是互相依存的。特別是,一個(gè)系統(tǒng)不可能是任意的或非任意的,除非它是語義的(即只有語義性交際系統(tǒng),才談得上其形式與意義之間的關(guān)系是任意的還是非任意的——袁按);同樣,一個(gè)系統(tǒng)不可能具有二元構(gòu)型特點(diǎn),除非它是語義的(即只有語義性交際系統(tǒng),才談得上其形式表示意義的方式是否是二元構(gòu)型的——袁按)。并且,這個(gè)列舉也不企圖囊括不同種系的交際行為的所有已經(jīng)發(fā)現(xiàn)的特征,而只包含對于語言來說顯然重要的特征。

根據(jù)霍凱特(Hockett 1960:93)的圖示,陸地哺乳動(dòng)物以下的爬行動(dòng)物、兩棲動(dòng)物、脊椎動(dòng)物、脊索動(dòng)物不采用口叫-耳聽式交際,其交際系統(tǒng)也不具備上述13個(gè)設(shè)計(jì)特征。大象之類的陸地?zé)嵫溉閯?dòng)物,具有社會(huì)行為,會(huì)玩耍,其交際系統(tǒng)具有(1)~(5)特征,即發(fā)聲-耳聽通道、迅速消失、完全反饋、互換性、四散傳播與定向接收;猴子等靈長類動(dòng)物,具有雜食性,有可動(dòng)的面部肌肉,擁有雙眼視覺和雙手,還能夠手-眼協(xié)調(diào),其交際系統(tǒng)除了(1)~(5)之外,還具有(6)~(8)特征,即專門化、語義性、任意性;古猿雖然可以雙足行走,但不能直立,偶爾使用工具,其交際系統(tǒng)除了(1)~(8)之外,還具有2種特征,即(9)離散性和(12)傳統(tǒng)傳授;而人類會(huì)制造和攜帶工具,有喉嚨和軟腭,具有幽默感、元音色彩和音樂,其交際系統(tǒng)除了(1)~(9)和(12)之外,還具有3種特征,即(10)超越時(shí)空、(11)能產(chǎn)性、(13)二元構(gòu)型。

霍凱特(Hockett 1960:92)指出,這13個(gè)特征中的9種已經(jīng)出現(xiàn)在原始古猿的口叫-耳聽式交際中;并且,這9種特征在今天的長臂猿和人類交際系統(tǒng)中可以得到證實(shí)。比如,長臂猿有一打左右不同的呼叫,每一種合適的發(fā)聲反應(yīng)都針對一種反復(fù)出現(xiàn)的、生物學(xué)上重要的情境類型:發(fā)現(xiàn)了食物,察覺到捕食動(dòng)物,性興趣,需要母親照顧,等等。這樣,探索人類語言的起源問題,就是要確定:這種交際系統(tǒng)是怎樣發(fā)展出另外的4種特征(超越時(shí)空、能產(chǎn)性、充分發(fā)展的傳統(tǒng)傳授、最后發(fā)展出來的二元構(gòu)型)的?從而回應(yīng)作者在該文章標(biāo)題之下的題記中所指出的:人類是唯一能夠使用抽象符號(hào)來進(jìn)行交際的動(dòng)物。但是,這種能力跟其他動(dòng)物的交際系統(tǒng)共享許多特征,并且正是從這些比較原始的系統(tǒng)中產(chǎn)生出來的。

霍凱特(Hockett 1960)隨后對于人類語言形成這4個(gè)特征的條件、生存價(jià)值等進(jìn)行了假設(shè)和說明。特別是從可區(qū)分的聲音刺激的數(shù)量的有限性的角度,解釋了對于人類語言這種復(fù)雜的交際系統(tǒng)來說,二元構(gòu)型是必要的。這里不再贅述。下面兩節(jié),我們將重點(diǎn)討論語言符號(hào)的離散性與二元構(gòu)型特征。

三、語言符號(hào)的離散性特征和向量化表示

從文獻(xiàn)上看,關(guān)于語言符號(hào)的離散性特點(diǎn),有3種不同的理解。第一種是上文提到的霍凱特(Hockett 1960)所謂的:構(gòu)成信號(hào)的單元(即語音)在區(qū)別性功能上的絕對性(不受限制性)。比如,英語等語言,輔音的清濁具有對立功能(能夠區(qū)別詞的語音形式,從而區(qū)別詞的意義),但是清輔音的送氣與否則不具有對立功能;而漢語普通話,輔音的清濁不具有對立功能,但是清輔音的送氣與否則具有對立功能。換句話說,我們只能把語流中聽到的某個(gè)音素,歸類到該語言中具有區(qū)別性價(jià)值的、數(shù)量有限的一套音位的某一個(gè)音位之中,不同的音位之間不具有連續(xù)性,是非此即彼的。所以,當(dāng)你聽到一個(gè)介于pin和bin之間的英語單詞的含混發(fā)音時(shí),你必須斷定它是pin還是bin。顯然,霍凱特(Hockett 1960)所謂的語言系統(tǒng)的離散性設(shè)計(jì)特征,主要著眼于語言的聲音形式及其類別的非連續(xù)性方面。具體指語言的基本的信號(hào)單元(音素或音位)之間的區(qū)別是絕對的、類別性的,而不是連續(xù)的。比如,現(xiàn)代實(shí)驗(yàn)語音學(xué)證明:不同元音之間的差別,主要體現(xiàn)在第二共振峰的不同上;并且,對于第二共振峰的一定范圍內(nèi)的實(shí)際音素,母語聽話人要么聽成[o],要么聽成[u],要么聽成……,等等;而不會(huì)聽成介于[o]和[u]……之間的某種在類別上兩可的元音,如此等等。推而廣之,對于一個(gè)語音片段,本地聽話人要么聽成甲詞(如pin)、要么聽成乙詞(如bin)、要么聽成……,而不會(huì)聽成是介于甲詞與乙詞……之間的某種兩可的東西。

第二種理解是指連續(xù)的語流可以切分成大小不同的分析單位。比如,哈里斯(Harris 1954:158)在討論分布分析可以發(fā)現(xiàn)語言成分時(shí)指出:“首要的分布事實(shí)是:可以把任何語流劃分(切割)成一個(gè)個(gè)部分,循此我們就可以在特定的語流中,找到某一個(gè)部分相對于其他部分的若干出現(xiàn)規(guī)律。這些部分是離散性成分,它們在特定的語流中有一定的分布(一組相對的位置);并且,每一段言語都是一些成分的特定的組合。”他所謂的“語言成分”包括音位、語素、詞、短語以至于句子。與此相似,中國語言學(xué)界一般從語言結(jié)構(gòu)可以逐層切分為大小不同的語言單元的角度,來定義語言符號(hào)系統(tǒng)的離散性特點(diǎn)。比如,馮志偉(2007:41)對離散性的描述,大意為:連續(xù)不斷的語流卻是由許多離散的單元所組成的,包括組合軸上的“段落—句子—短語—詞—語素—音節(jié)—音素”及其各聚合類中的離散單元。

第三種理解是自然語言處理文獻(xiàn)上的未加明確定義的用法,大意是指語言符號(hào)在形式線索上的疏離性,即語素、詞等語言單位,其在意義上的相關(guān)關(guān)系通常得不到形式上的表征。比如,即使是“移動(dòng)電話”和“手機(jī)”這樣的同義詞語,除非你已經(jīng)知道它們所指相同,否則從這兩個(gè)詞語的形式本身,你是無從了解它們的意義關(guān)系的。結(jié)果,語素和詞等語言單元成了一個(gè)個(gè)疏離(各自獨(dú)立、沒有連續(xù)性)的單位。這是用“離散性”來反映語言符號(hào)的這種象征性的符號(hào)學(xué)特點(diǎn)。顯然,語言符號(hào)的這種離散性特點(diǎn),是可以從語言符號(hào)的任意性上推導(dǎo)出來的。前者強(qiáng)調(diào)了單個(gè)符號(hào)的音義結(jié)合的武斷性(arbitrariness,也譯作“任意性”),后者強(qiáng)調(diào)符號(hào)之間語義關(guān)系在形式表征上的不透明性。這就解釋了為什么索緒爾的《普通語言學(xué)教程》沒有專門討論語言符號(hào)的離散性特點(diǎn)。因?yàn)檎Z言符號(hào)的音義結(jié)合的任意性,規(guī)定了語言符號(hào)之間的語義關(guān)系在形式表征上的不透明性。從數(shù)據(jù)科學(xué)的角度看,文本等自然語言是一種象征性的符號(hào)數(shù)據(jù),①關(guān)于信號(hào)數(shù)據(jù)和符號(hào)數(shù)據(jù)的區(qū)別,參考趙軍等(2018:58)。只在某種語言共同體的人們的大腦中具有心理上的實(shí)在性。因?yàn)椋缢骶w爾(1981:4)所指出的,語言符號(hào)的音義結(jié)合,在邏輯上是任意性的;什么樣的意義用什么樣的聲音來表達(dá),并沒有必然的理由。于是,兩個(gè)語言符號(hào)(比如,語素或者詞)即使在意義上有關(guān)系(比如,同義、反義、類義、上下義、蘊(yùn)含等),但是在形式上也未必表現(xiàn)出來。這就是自然語言處理文獻(xiàn)上所謂的自然語言符號(hào)的離散性特點(diǎn),及其在數(shù)值表示上的不連續(xù)性。②語素、詞等語言符號(hào)不容易用連續(xù)的數(shù)值來表示,即使用詞表中的ID號(hào)碼(編號(hào))、甚至用獨(dú)熱向量(one-hot vector)來表示,也不能反映語義相關(guān)的詞語之間的意義聯(lián)系。

其實(shí),作為對數(shù)據(jù)的數(shù)學(xué)屬性的刻畫,離散是跟連續(xù)相對的。比如,一個(gè)120名學(xué)生的班級(jí)考試,如果按百分制計(jì)分,那么,學(xué)生的成績可以從低到高畫出一條曲線,③這條曲線一般是中間高、兩頭低,能夠反映分?jǐn)?shù)的正態(tài)分布:高分段和低分段的人數(shù)少,中間分段的人數(shù)多。這種連續(xù)的分?jǐn)?shù)是一種數(shù)值型的連續(xù)屬性。如果改成5分制,或者“優(yōu)秀、良好、及格、不及格”之類的等級(jí)制,就是一種有序的離散屬性。據(jù)此,上述3種對語言符號(hào)的離散性的認(rèn)識(shí)都有一定的道理,都揭示了語言符號(hào)非連續(xù)性的一個(gè)側(cè)面,只是側(cè)重點(diǎn)有所不同罷了。

從自然語言處理的角度看,語言符號(hào)離散性特點(diǎn)的結(jié)果是,語言符號(hào)的形式與意義之間存在著巨大的空檔。這就是所謂的語義鴻溝現(xiàn)象,①關(guān)于語義鴻溝,參考趙軍等(2018:58)。意思是從符號(hào)的形式(聲音或者文字)上提取到的信息到符號(hào)所表示的意義之間有很大的距離。這種語義鴻溝,給自然語言處理的文本表示和計(jì)算處理帶來了巨大的挑戰(zhàn)。為了機(jī)器處理的方便,通常需要把自然語言文本的符號(hào)數(shù)據(jù)轉(zhuǎn)化為數(shù)值數(shù)據(jù)。由于文本的基本單元是詞,因而面向數(shù)值計(jì)算的詞的表示問題,成為近年來自然語言處理領(lǐng)域的一個(gè)熱點(diǎn)問題;并且,形成了一種用數(shù)值表示文本實(shí)值向量形式的“詞嵌入”(word embedding)技術(shù)。這種技術(shù)根據(jù)哈里斯(Harris 1954)關(guān)于“意義相似的詞有相似的分布(即出現(xiàn)在相似的上下文)”的思想,用神經(jīng)網(wǎng)絡(luò)來從文本語料上學(xué)習(xí)和發(fā)現(xiàn)兩個(gè)或更多單詞一起出現(xiàn)的概率,從而將意義相似的單詞聚合在一起,在向量空間中形成一個(gè)聚類;并且,賦予它們各自獨(dú)立但相似的向量。2013年,Google團(tuán)隊(duì)發(fā)布了可用以提取詞向量的word2vec工具包,其目標(biāo)是理解兩個(gè)或更多單詞一起出現(xiàn)的概率,從而將具有相似意義的單詞匯聚在一起,在向量空間中形成一個(gè)聚類。word2vec本質(zhì)上是一種只有兩層的淺層神經(jīng)網(wǎng)絡(luò),其中主要包含兩種語言模型:連續(xù)詞袋(continuous bag of words,CBOW)模型和跳字(skipgram)模型。前者基于上下文預(yù)測當(dāng)前單詞,將當(dāng)前單詞的周圍單詞作為輸入來產(chǎn)生單詞作為輸出;后者將單詞作為輸入,理解單詞的意思,并將其分配給上下文來預(yù)測單詞周圍的單詞。打一個(gè)比方,前者是玩選詞填空游戲,后者是玩詞語接龍游戲。但是,兩者的共同點(diǎn)是根據(jù)本地(附近)單詞的上下文來預(yù)測單詞。跟其他深度學(xué)習(xí)模型一樣,word2vec可以從過去的數(shù)據(jù)和過去出現(xiàn)的單詞中學(xué)習(xí);進(jìn)而根據(jù)過去的事件和上下文,準(zhǔn)確地猜測一個(gè)單詞的意思,就像我們理解語言的方式一樣。比如,我們聽到或看到“男孩”和“男人”以及“女孩”和“女人”這幾個(gè)單詞,如果能夠理解它們的意義,就能夠在它們之間建立聯(lián)系。同樣,word2vec也可以形成這種連接,并且為這些單詞生成向量。這些單詞被緊密地放在同一個(gè)簇中,以確保機(jī)器知道這些單詞意味著類似的事情。一旦給了word2vec一個(gè)語料庫,它就會(huì)產(chǎn)生一個(gè)詞匯表;其中,每一個(gè)單詞都有一個(gè)自己的向量。這就是所謂的神經(jīng)詞嵌入。簡單地說,這個(gè)神經(jīng)詞嵌入是一個(gè)用數(shù)字寫的單詞。②以上參考Bokka et al.(2019)§1.5,中譯本第13~16頁。當(dāng)然,中間加入了我們的理解和發(fā)揮。

由于這種詞向量是連續(xù)的數(shù)值,因而可以進(jìn)行加減運(yùn)算。并且,這種運(yùn)算的結(jié)果可以從語言學(xué)上進(jìn)行解釋,從而具有語言學(xué)的意義。比如,Man(男人)和Woman(女人)之間的詞向量距離跟King(國王)和Queen(王后)之間的距離大致相同,方向也一樣。結(jié)果,用king這個(gè)詞的向量(記作:Wking)減去man的詞向量(記作:Wman),再加上woman的詞向量(記作:Wwoman),得到的與結(jié)果最近的詞是queen。也就是說,在詞向量空間里,諸如Wking- Wman+ Wwoman≈ Wqueen、Wking- Wman≈ Wqueen-Wwoman這樣的等式關(guān)系基本成立。同樣的等式關(guān)系還適用于形容詞的原形和最高級(jí),比如:Wbiggest-Wbig+Wsmall≈ Wsmallest、Wbiggest- Wbig≈ Wsmallest- Wsmall,等等。③參考Goldberg(2017),中譯本第122頁;詳見Mikolov et al.(2013)。如果說在等式 Wbiggest- Wbig≈ Wsmallest-Wsmall中,等號(hào)前后的向量值大概地表示了“英語形容詞最高級(jí)”之類的概念或意義,那么在下列等式WParis- WFrance≈ WRome- WItaly中,等號(hào)前后的向量值大概地表示了“首都”之類的概念或意義。這種結(jié)果是語言學(xué)家所始料未及的。

四、語言與生物類似的二元構(gòu)型和編碼模型

關(guān)于語言在構(gòu)型上的雙層性特點(diǎn),袁毓林(1998)在前賢研究及其相關(guān)文獻(xiàn)的基礎(chǔ)上,進(jìn)行了總結(jié)。現(xiàn)在擇要簡述如下。

語言是一個(gè)層級(jí)系統(tǒng),它通過屬于純形式的音位層次的分級(jí)組合和屬于音義結(jié)合體的符號(hào)層次的分級(jí)組合,產(chǎn)生無窮多的形式,來表示人類交際所需的無窮多的意義。這就是人類語言信息編碼的雙重分節(jié)原理。雙重指語言由音位和符號(hào)兩個(gè)大的層級(jí)構(gòu)成,分節(jié)指在音位和符號(hào)層上分別都可以由較小的單位組成較大的單位。可以表示如下:

音位→音節(jié)→音節(jié)群?語素→詞→詞組→句子

雙重分節(jié)的編碼原理使語言成為一種極為經(jīng)濟(jì)而有效的信息系統(tǒng),通過大約50個(gè)最基本的語音元素的多層次組合來表示無窮的意義。

袁毓林(1998)還在相關(guān)生物學(xué)文獻(xiàn)的基礎(chǔ)上,綜述和構(gòu)想了生物遺傳信息編碼與人類語言信息編碼在雙重分節(jié)方面的類同性。

生物體也是一個(gè)層級(jí)系統(tǒng),可以表示為:

細(xì)胞→組織→器官→系統(tǒng)

比層級(jí)性更有意思的是,如果把生物體的性狀看作一種信息或意義,把生物性狀賴以實(shí)現(xiàn)或表達(dá)出來的生化物質(zhì)基礎(chǔ)看作一種信號(hào)或符號(hào),那么可以發(fā)現(xiàn):生物信息的編碼(即生物性狀跟其生化物質(zhì)基礎(chǔ)之間的表達(dá)或?qū)崿F(xiàn)關(guān)系)明顯地遵循了雙重分節(jié)的原理。比如,人體的10萬種生物性狀是由10萬種蛋白質(zhì)決定的。奇妙的是,決定人體性狀的10萬種蛋白質(zhì)是僅由20種氨基酸通過不同的排列來造成的。幾個(gè)、幾十個(gè)到幾百個(gè)氨基酸以一定的順序連接起來,組成一條條長長短短的多肽鏈。多肽鏈又可以盤旋折疊,形成蛋白質(zhì)的高級(jí)結(jié)構(gòu)。

概略地說,氨基酸是一種分子中同時(shí)含有氨基和羧基的有機(jī)化合物,是組成蛋白質(zhì)的基本單位。氨是氮和氫的化合物,化學(xué)分子式為NH3;氨基是氨分子中失去1個(gè)氫原子而形成的一價(jià)原子團(tuán)(-NH2)。羧基是由羰基和羥基組成的一價(jià)原子團(tuán)(-COOH),羰基是由碳和氧兩種原子組成的二價(jià)原子團(tuán)(=C=O),羥基是由氫和氧兩種原子組成的一價(jià)原子團(tuán)(-OH)。也就是說,通過氫、氧、碳、氮4種元素在不同層次上的分級(jí)組合形成數(shù)以萬計(jì)的蛋白質(zhì),從而為實(shí)現(xiàn)或表示數(shù)以萬計(jì)的生物性狀提供了足夠的生化物質(zhì)。這種生物信息的編碼方式,可以圖示于下:

如果把生化物質(zhì)跟語言形式做一個(gè)類比,那么這里的原子相當(dāng)于音素或音位,原子團(tuán)相當(dāng)于音節(jié),分子相當(dāng)于音節(jié)群;它們都是用有限的基本形式,通過分級(jí)組合的方式來形成無窮多的復(fù)雜形式,用以實(shí)現(xiàn)或表達(dá)無窮多的信息。

現(xiàn)在,生物學(xué)家已經(jīng)知道,組成DNA大分子的核苷酸都是由糖、磷酸和堿基組成的,它們的成分基本相同;其中的糖分子是脫氧核糖,所含的堿基有4種:腺嘌呤(A)、胞嘧啶(C)、鳥嘌呤(G)和胸腺嘧啶(T)。因此,不同的核苷酸鏈(即DNA)的差異就在于堿基排列次序的不同。正是DNA分子中的這種堿基的順序決定了組成蛋白質(zhì)分子的氨基酸的順序。也就是說,遺傳信息是由4種堿基通過一定的排列次序來編碼的。這種為氨基酸在蛋白質(zhì)中的排列順序編碼的DNA上面的堿基順序,就是著名的遺傳密碼。

自然界的生物千變?nèi)f化,為什么僅靠這4個(gè)堿基就能蘊(yùn)藏和表示這么多信息,創(chuàng)造出如此眾多的生物呢?其中很重要的一點(diǎn)是采用了雙重分節(jié)的結(jié)構(gòu)原則:不是用一個(gè)堿基直接來表示一種氨基酸,而是用三個(gè)堿基組成的三聯(lián)體來表示一種氨基酸;①因此,這種三聯(lián)體被稱為“密碼子”(codon)。不是用一個(gè)氨基酸分子來實(shí)現(xiàn)一種生物性狀,而是用多個(gè)氨基酸組成的蛋白質(zhì)大分子來實(shí)現(xiàn)一種生物性狀。有了這樣一種翻番增量的結(jié)構(gòu)原則,再加上一個(gè)DNA上可以有上億個(gè)堿基對給這樣的物質(zhì)材料做基礎(chǔ),生物的多樣性問題也就不難理解了。

既然生物分子在功能性構(gòu)造方面跟自然語言有以下的平行性:

最小的信號(hào)單位:A、G、C、T4個(gè)堿基~30來個(gè)音位/字母

最小的信息單位:20種氨基酸/核苷酸鏈~幾千個(gè)語素/幾萬個(gè)單詞

復(fù)合的信息單位:蛋白質(zhì)/基因片段~句子

全局的信息單位:蛋白質(zhì)復(fù)合體/基因~段落

那么,自然會(huì)讓人想到:處理自然語言卓有成效的有關(guān)算法,能不能運(yùn)用到生物分子領(lǐng)域呢?畢竟,DNA中有31.6個(gè)堿基對,三聯(lián)碼的起止有時(shí)不好判斷。也就是說,DNA鏈中處處有歧義。比如:……。這看起來是個(gè)終止符,而那跟它部分交接的看起來是個(gè)天冬氨酸。于是,只能把所有可能的排列全都統(tǒng)計(jì)一遍。其中,所統(tǒng)計(jì)的DNA(或RNA)中長度為K的子序列稱為K-mer。這種子序列的頻率信息,可以應(yīng)用到跟基因相關(guān)的諸多任務(wù)中。比如,基因組錯(cuò)配檢測、致病基因檢測、重復(fù)序列檢測、重組點(diǎn)位檢測、蛋白質(zhì)生產(chǎn)速率控制、基因突變或多態(tài)性鑒定、人類線粒體單倍群分類、物種分類、物種豐富度估算,等等。盡管由于每3個(gè)核苷酸編碼一個(gè)氨基酸,即3個(gè)核苷酸構(gòu)成一個(gè)傳遞生物信息的密碼子,因而,K = 3是一個(gè)具有生物學(xué)意義的取值;但是,它也會(huì)導(dǎo)致特殊信息的丟失。比如,……ATGTGTGTGTGTGTGTGTG……,其實(shí)只是在復(fù)讀。而且,1個(gè)密碼子最多對應(yīng)1個(gè)氨基酸,那只是蛋白質(zhì)的“字母”。如果要理解一段基因序列的功能,顯然K需要取更大的值。也就是說,不同的K值有不同的作用。

Asgari & Mofrad(2015)首次將Word2Vec的思想運(yùn)用到蛋白質(zhì)分類領(lǐng)域,提出了Protein Vector(ProtVec)和Gene Vector(GeneVec)的概念。這種做法基于蛋白質(zhì)“結(jié)構(gòu)決定功能”的假說:蛋白質(zhì)是由氨基酸排列而成后,憑借分子內(nèi)和分子間作用力形成特定的空間結(jié)構(gòu),然后發(fā)揮功能的。具體地說,氨基酸序列形成蛋白質(zhì)的一級(jí)結(jié)構(gòu),由氫鍵導(dǎo)致的折疊形成蛋白質(zhì)的二級(jí)結(jié)構(gòu),由多個(gè)二級(jí)結(jié)構(gòu)在空間中排列后的三維結(jié)構(gòu)形成蛋白質(zhì)的三級(jí)結(jié)構(gòu)(單條肽鏈),一條以上的肽鏈相互作用形成的蛋白質(zhì)分子形成蛋白質(zhì)的四級(jí)結(jié)構(gòu)。這樣,當(dāng)氨基酸的排列相似時(shí),蛋白質(zhì)的空間結(jié)構(gòu)也會(huì)相似,最終功能就會(huì)相似。如果這個(gè)理論成立,那么蛋白質(zhì)分類就能參考自然語言處理上比較文本相似度的辦法來尋找模型。Asgari & Mofrad(2015)據(jù)此將氨基酸片段轉(zhuǎn)換為向量,即ProtVec。為了驗(yàn)證ProtVec有意義,他們用氨基酸向量之和來表示蛋白質(zhì),并利用二分類模型“支持向量機(jī)”(SVM)對長度相近的蛋白質(zhì)進(jìn)行分類。結(jié)果,在7020個(gè)蛋白質(zhì)族中,平均達(dá)到了93%以上的準(zhǔn)確率。這顯示出,Prot-Vec確實(shí)能夠較好地區(qū)分不同類型的蛋白質(zhì)。特別是對于“氨基酸排列不變,但沒有穩(wěn)定的三維結(jié)構(gòu)”的無序蛋白質(zhì),ProtVec的分類效果很好。這可能是因?yàn)镻rotVec關(guān)注的是蛋白質(zhì)的第一、二級(jí)結(jié)構(gòu)所包含的信息。基因向量GeneVec跟蛋白質(zhì)向量ProtVec的使用假設(shè)基本類似,目前它們主要用于:蛋白質(zhì)分類、蛋白質(zhì)結(jié)構(gòu)可視化、蛋白質(zhì)空間結(jié)構(gòu)預(yù)測、蛋白質(zhì)反應(yīng)機(jī)理分析、蛋白質(zhì)功能預(yù)測、基序提取、基因段功能檢測、功能性基因檢測,等等。

值得一提的是,自然語言處理模型正在不斷演進(jìn),處理效果也在不斷提升。2018年,Google團(tuán)隊(duì)在Transformer架構(gòu)的基礎(chǔ)上,開發(fā)了預(yù)訓(xùn)練語言模型BERT(Bidirectional Encoder Representation from Transformers,基于轉(zhuǎn)換器的雙向編碼表示模型),在多項(xiàng)自然語言處理任務(wù)上取得了當(dāng)時(shí)的最好成績。BERT在各種自然語言處理任務(wù)上的運(yùn)用越來越廣泛,以至于有人喊出“萬物皆可BERT”的口號(hào)。于是,也有人嘗試把BERT模型引入生物分子領(lǐng)域,進(jìn)行分子功能預(yù)測。但是,至今在效果和合理性方面都沒有出彩的表現(xiàn)。

總之,基于自然語言和生物分子在信息編碼方面的某種相似性,自然語言處理中的一些思想和模型是可以運(yùn)用到生物分子研究領(lǐng)域的。但是,許多神經(jīng)網(wǎng)絡(luò)模型是針對自然語言數(shù)據(jù)的結(jié)構(gòu)特點(diǎn)而設(shè)計(jì)的,它們在生物分子等研究領(lǐng)域的適用性問題,尚需做進(jìn)一步的研究。當(dāng)然,我們樂意看到將來有朝一日,有人發(fā)現(xiàn)(或發(fā)明)能夠同時(shí)適用于人類語言和生物編碼的通用模型。①以上關(guān)于將自然語言處理中的“詞向量”等運(yùn)用于生物分子的介紹,根據(jù)白鹡鸰(2020)。

五、人類語言交際的起源和所依托的心理平臺(tái)

至少從表面上看,使用有聲語言進(jìn)行交往溝通是人類跟動(dòng)物的顯著差別。因此,反過來說,觀察和研究語言可以讓人類更好地認(rèn)識(shí)自己的本性。平克(Pinker 2007)指出:

語言與人類生活有密切不可分的關(guān)系。我們不僅用語言傳遞信息、游說他人,我們也用它來威脅、引誘他人,當(dāng)然,語言還可以用來發(fā)誓賭咒。語言反映了我們對現(xiàn)實(shí)的領(lǐng)悟,不僅如此,它還是我們留在他人心目中的活生生的印象,是把人們緊密聯(lián)系在一起的紐帶。我希望你也能相信這個(gè)事實(shí):語言是通向人性的窗口。(前言,第II頁)

仔細(xì)觀察我們的語言——人們的交談、玩笑、詛咒、法律糾紛、為嬰兒取的名字,能讓我們對“我們到底是誰”這個(gè)問題有更加深刻的感悟。(前言,第I頁)

那么,自然語言這種人類溝通方式是怎樣產(chǎn)生的?或者說,它是建立在什么樣的心智或心理基礎(chǔ)上的呢?對此,托馬塞洛(Tomasello 2010)提出了下列富有啟發(fā)意義的語言演化假設(shè):

人類最初的溝通模式,就是比手劃腳(即自然的手勢——引按),以手指物是人類獨(dú)有的原始溝通形式。手勢這種由社會(huì)認(rèn)知及社會(huì)動(dòng)機(jī)的基礎(chǔ)結(jié)構(gòu)所促成的新的溝通模式,便形成了一種心理平臺(tái)。不同系統(tǒng)、各種規(guī)約的(conventional)語言溝通模式(總共6000種),就奠基在這層平臺(tái)之上。比手劃腳是人類溝通的演化史上最關(guān)鍵的過渡點(diǎn),體現(xiàn)了人類獨(dú)有的社會(huì)認(rèn)知與社會(huì)動(dòng)機(jī)形式,這些都是后來發(fā)展規(guī)約的語言所必備的。(中譯本第2頁。引文中有少量自己的改譯,與中譯本文字不盡相同,如果要引用,務(wù)請核對原文。下同。——引按)

為什么這種貌似簡陋不過的以手比物、指指點(diǎn)點(diǎn),居然能夠成為人類溝通的肇始和標(biāo)志,并且成為約定俗成的有聲語言得以奠基于其上的心理平臺(tái)呢?托馬塞洛(Tomasello 2010)別具洞察力地揭開了一個(gè)人們通常熟視無睹的秘密,即人類手勢直指具有一種利他性的社會(huì)化功用:

人類以手指物這個(gè)平凡的動(dòng)作,從演化論的角度來看,還有個(gè)不平凡的方面,就是它的利社會(huì)動(dòng)機(jī)(prosocial motivation)。我用手指一指圖書館邊上那輛好像是你前男友的自行車,從而提醒你:他可能在里面,你還要不要進(jìn)去;這是因?yàn)椋艺J(rèn)為這可能是你想知道的事情。在人以外的動(dòng)物界里,這種有效傳遞信息的溝通相當(dāng)罕見,即使是我們的近親靈長類也不會(huì)如此……。因此,當(dāng)小黑猩猩嗚咽地尋找媽媽時(shí),鄰近的其他黑猩猩也都會(huì)知道。但是,即使它們知道它的媽媽在哪兒,也不會(huì)特地伸出前臂指點(diǎn)或比劃一下。(中譯本第4頁)

你看,人獸之間,就差這么一點(diǎn)點(diǎn):能不能伸出友愛的小手指點(diǎn)一下下。顯然,利他性的社會(huì)動(dòng)機(jī)有助于滋養(yǎng)人類的團(tuán)結(jié)與合作精神,培養(yǎng)更加社會(huì)化的主體(subject)與主體交互(intersubject)意識(shí)。托馬塞洛(Tomasello 2010)特別強(qiáng)調(diào)人類溝通的合作性質(zhì):

人類的溝通動(dòng)機(jī)基本上是合作性的,我們不僅會(huì)告知對別人有幫助的事,而且當(dāng)我們對別人有所求時(shí)所用的主要方法之一,就是讓別人知道我渴望什么,并期待他們會(huì)主動(dòng)協(xié)助。所以我若想喝杯水,可以明說我要水(告訴你我想要的),我也知道多半情況下,你主動(dòng)協(xié)助的傾向(我們彼此都知道的),會(huì)把我這個(gè)告知的舉動(dòng),有效地轉(zhuǎn)變成充分發(fā)展的請求。

人類的溝通行為本質(zhì)上是一種合作的事業(yè),在(1)彼此假定的共同概念基礎(chǔ)下,(2)彼此假定的合作溝通動(dòng)機(jī)下,以最自然且平順的方式進(jìn)行。(中譯本第4頁)

其實(shí),也正是這種根深蒂固的合作精神及其在交際雙方之間的不言自明性,培育了一種人類的主體間性(intersubjectivity):我們對特定情境中事物的感覺、經(jīng)驗(yàn)、認(rèn)知、理解等,并不是專屬于我們個(gè)人的,而是為我們的社團(tuán)群體所共享的。這構(gòu)成了我們可以互相交際、互相理解的基礎(chǔ)。正是在這種心心相印的共享空間中,我們實(shí)現(xiàn)了人際交往和語言溝通。①詳見 Fultner(2012 :216)。

托馬塞洛(Tomasello 2010)還嘗試揭示人類溝通在精神和心理方面的條件:

共同概念基礎(chǔ)(common conceptual ground)包括共同的注意力、共有的經(jīng)驗(yàn)、相同的文化知識(shí)。這是人類溝通必備的重要條件。(中譯本第3~4頁)

人類合作行為以共享意圖(shared intentionality)為前提條件,這種活動(dòng)的主體一定是復(fù)數(shù)的“我們”:大家有共同的目標(biāo)、共同的意念、共有的知識(shí)、共享的信仰——而且都是在具有合作動(dòng)機(jī)的情境下進(jìn)行。(中譯本第5頁)

人類的合作式溝通(不管用自然的手勢,還是武斷的語言規(guī)約)是人類獨(dú)有的合作活動(dòng)之一例。它同樣以共享意圖為基礎(chǔ)。共享意圖的[社會(huì)認(rèn)知]技巧與[利社會(huì)的]動(dòng)機(jī)(與常規(guī)),構(gòu)成了人類溝通的合作性的基礎(chǔ)結(jié)構(gòu)。

對于人類溝通如何從自然的手勢發(fā)展到規(guī)約的語言,托馬塞洛(Tomasello 2010)勾畫了如下這幅宏偉的草圖:

以手指物(pointing)奠基于人類自然而然地會(huì)循著別人的目光凝視物品,比劃示意(pantomiming)則基于人類會(huì)自發(fā)地解讀別人的動(dòng)作。這種自然的反應(yīng),讓手勢成為由人猿的溝通進(jìn)步到武斷的語言溝通之間的過渡點(diǎn)。

在互助活動(dòng)的情境下,參與者間有共同的意圖與關(guān)注,并借由自然的手勢溝通來協(xié)調(diào),演化史上武斷的語言規(guī)約才會(huì)隨之誕生。約定俗成的語言(先是手語式的,再來才是口說的)于是依附在已知的手勢上,以共享的(而且眾人彼此知道是共享的)社會(huì)學(xué)習(xí)經(jīng)驗(yàn),取代了自然的比手劃腳。這個(gè)過程當(dāng)然是由人類獨(dú)特的文化學(xué)習(xí)和模仿技能所促成,讓他們得以用獨(dú)特的有利方式,從他人也從自己的意念狀態(tài)學(xué)習(xí)。同樣也是在演化過程中,人類開始創(chuàng)造并傳遞文化中由不同的語法規(guī)約組成的復(fù)雜語言結(jié)構(gòu),并將繁復(fù)的信息以不同的語言結(jié)構(gòu)編碼為不同的類別(types),以便運(yùn)用在反復(fù)出現(xiàn)的溝通環(huán)境中。

對人類溝通及語言所持的這種觀點(diǎn),可以說推翻了喬姆斯基的言論,因?yàn)槿祟悳贤ㄖ凶罨A(chǔ)的方面,是因應(yīng)一般的合作與社會(huì)互動(dòng)所產(chǎn)生的生理調(diào)適,而純語言的溝通,包括語法方面,則是由文化建構(gòu),并經(jīng)由個(gè)別的語言社群代代相傳。(中譯本第7~8頁)

人類溝通的基本的社會(huì)意圖/動(dòng)機(jī):分享、告知、請求。(中譯本第91頁)

托馬塞洛(Tomasello 2010)還構(gòu)擬了下面這個(gè)基于合作的語言交際的圖示(中譯本第72頁):

圖1 合作式人類溝通簡圖(C =溝通者;R =接收者)

這就是人類語言交際的現(xiàn)實(shí)生態(tài),任何訴諸語言本身有某種繁復(fù)而自足的深層結(jié)構(gòu)的幻想,都是不切實(shí)際的。要知道,目前我們對人腦的工作機(jī)理所知甚少。我們只知道不同物種的神經(jīng)元數(shù)量有巨大的差別。據(jù)報(bào)道:蛔蟲有302個(gè)神經(jīng)元,果蠅有10萬個(gè)神經(jīng)元,老鼠有7500萬個(gè)神經(jīng)元,貓有10億個(gè)神經(jīng)元,黑猩猩有67億個(gè)神經(jīng)元。而人類有860億個(gè)神經(jīng)元,大腦神經(jīng)元之間的連接約150萬億個(gè)。但是,人類對于自己大腦的工作機(jī)制充滿困惑。神經(jīng)科學(xué)家還沒有辦法詳細(xì)解釋:大腦神經(jīng)元之間的電化活動(dòng)交互作用,是如何變成我們腦海中的想法、情緒、記憶和推理活動(dòng)的?也就是說,支撐語言生成和理解的人類神經(jīng)系統(tǒng)是非常唯物和機(jī)械的;雖然神經(jīng)元的數(shù)量極其龐大,但是神經(jīng)元之間的作用方式只有簡單的連接和斷開兩種狀態(tài)。這是腦科學(xué)對語言學(xué)理論的一種剛性的約束。

六、結(jié)語:在人類社會(huì)互動(dòng)和文化實(shí)踐的視域下研究語言

我們相信,語言是現(xiàn)代人類最近20萬年以來通過改造手勢、叫聲等溝通手段逐步演化出來的;雖然有聲語言提高了人類交際的效率,但是在面對面交流時(shí)仍有高達(dá)2/3的語義依靠肢體動(dòng)作、眼神表情乃至心理默契等非語言信號(hào)。①出處失記,特此說明和致歉。因此,語言是一種不完善的“編碼-解碼”型信息系統(tǒng),必然依賴于“示意-推理”等關(guān)聯(lián)性合作機(jī)制。雖然我們贊成喬姆斯基的觀點(diǎn)——兒童生下來頭腦中并非白板一塊,而是有各種先驗(yàn)的認(rèn)知結(jié)構(gòu)和語言能力,但是我們相信,在語言運(yùn)用中,交際雙方共享的基于經(jīng)驗(yàn)的概念結(jié)構(gòu)是認(rèn)知結(jié)構(gòu)和語言能力發(fā)揮作用的基礎(chǔ)性認(rèn)知資源,對于語句構(gòu)成及其意義識(shí)解起著重要的作用;并且,各種認(rèn)知模塊之間有著廣泛的交流和互動(dòng),語言官能并不是一種獨(dú)立的認(rèn)知系統(tǒng)。

正是在上述思想的啟迪下,我們進(jìn)行了幾個(gè)基于社會(huì)互動(dòng)和文化實(shí)踐的語句意義識(shí)解的個(gè)案研究,來解釋漢語、英語、日語和韓語中的相關(guān)現(xiàn)象。下面舉3個(gè)案例。

案例一:基于接近心理和樂觀原則的接近性副詞及相關(guān)句式的句法語義研究。詳見袁毓林(2013)和袁毓林、鄭仁貞(2015)。

案例二:基于勞酬均衡原理的“白”類副詞及其相關(guān)句子的語義識(shí)解研究。詳見袁毓林(2014a)和樸珉娥、袁毓林(2015)。

案例三:基于疑善信惡心理的“懷疑”類動(dòng)詞識(shí)解的跨語言比較研究。詳見袁毓林(2014b)和樸敏浚、袁毓林(2016)。

通過這幾個(gè)語義識(shí)解案例的研究,我們發(fā)現(xiàn),人們對于特定詞語和構(gòu)式的語義理解是一個(gè)句法、詞匯、語義、語用等多平面知識(shí)互動(dòng)的過程;并且,期間還要援引“反通常性”的“疑善信惡”之類社會(huì)心理學(xué)原則。顯然,這種語義識(shí)解是基于社會(huì)互動(dòng)文化和實(shí)踐經(jīng)驗(yàn)的。

猜你喜歡
符號(hào)人類語言
人類能否一覺到未來?
學(xué)符號(hào),比多少
幼兒園(2021年6期)2021-07-28 07:42:14
人類第一殺手
語言是刀
文苑(2020年4期)2020-05-30 12:35:30
“+”“-”符號(hào)的由來
1100億個(gè)人類的清明
讓語言描寫搖曳多姿
變符號(hào)
累積動(dòng)態(tài)分析下的同聲傳譯語言壓縮
人類正在消滅自然
奧秘(2015年2期)2015-09-10 07:22:44
主站蜘蛛池模板: 亚洲成a人片| 国产成人一区| 波多野结衣二区| 久久久国产精品无码专区| 丁香婷婷在线视频| 国产又黄又硬又粗| 免费看美女毛片| av性天堂网| 精品无码专区亚洲| 国产一区二区免费播放| 中文国产成人久久精品小说| 欧美国产日本高清不卡| 亚洲精品在线影院| 在线观看欧美精品二区| 波多野结衣中文字幕一区二区| 亚洲视频一区| 日韩欧美国产综合| 久热99这里只有精品视频6| a级毛片视频免费观看| 中文字幕久久精品波多野结| 亚洲国产精品VA在线看黑人| 精品视频一区二区观看| 国产精品专区第1页| 天堂亚洲网| 欧美成人午夜视频免看| 久久久无码人妻精品无码| 国产精品hd在线播放| 狠狠色成人综合首页| www.99精品视频在线播放| 中文字幕乱码二三区免费| 色婷婷在线影院| 精品亚洲国产成人AV| 毛片免费在线视频| 激情综合婷婷丁香五月尤物| 四虎免费视频网站| 91精品伊人久久大香线蕉| 一级高清毛片免费a级高清毛片| 国产aaaaa一级毛片| 中文字幕欧美日韩| 日本在线视频免费| 亚洲天堂在线视频| 国产在线第二页| 无码精油按摩潮喷在线播放| 国产区人妖精品人妖精品视频| 麻豆国产精品一二三在线观看| 国产黄在线观看| 丰满人妻久久中文字幕| 九九久久精品免费观看| 亚洲无码视频一区二区三区| 国产精品不卡片视频免费观看| www.国产福利| 永久免费精品视频| 18禁高潮出水呻吟娇喘蜜芽| 日本欧美视频在线观看| 亚洲天堂网站在线| 九九九九热精品视频| 亚洲av综合网| 91日本在线观看亚洲精品| 国产经典免费播放视频| 手机精品视频在线观看免费| 国产精品女主播| 暴力调教一区二区三区| 亚洲一级色| 无码高潮喷水专区久久| 国产精品999在线| 亚洲欧美自拍中文| 女人18一级毛片免费观看| 国产亚洲日韩av在线| 亚洲一道AV无码午夜福利| 免费看久久精品99| 国产原创演绎剧情有字幕的| 91小视频在线观看免费版高清| 久久大香伊蕉在人线观看热2| 亚洲手机在线| 日本精品视频| 亚洲女同一区二区| 中文字幕丝袜一区二区| 97色婷婷成人综合在线观看| 日本在线欧美在线| 亚洲成网站| 国产SUV精品一区二区| 久久夜色撩人精品国产|