999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

對抗與聯(lián)結(jié):生成語法與語料庫語言學(xué)

2018-08-28 09:44:16蔡穎瑩
北方文學(xué) 2018年20期
關(guān)鍵詞:人工智能

蔡穎瑩

摘要:隨著1957年《句法結(jié)構(gòu)》的出版,語言學(xué)研究進(jìn)入了一個(gè)全新的時(shí)代,即喬姆斯基語言學(xué)革命。而語料庫語言學(xué)自上世紀(jì)50年代以來受到了質(zhì)疑與挑戰(zhàn)。隨后,由于計(jì)算機(jī)技術(shù)的快速發(fā)展,語料庫語言學(xué)又逐漸走向復(fù)蘇。本文旨在通過分析生成語法與語料庫語言學(xué)在研究理念、研究范圍和研究方法等層面的差異,及其存在的局限,闡述二者的對抗關(guān)系。同時(shí),通過二者在人工智能領(lǐng)域的應(yīng)用,剖析生成語法與語料庫語言學(xué)的聯(lián)結(jié)關(guān)系,從而挖掘其合作潛力。

關(guān)鍵詞:語料庫語言學(xué);生成語法;人工智能;對抗;聯(lián)結(jié)

20世紀(jì)50年代,隨著喬姆斯基理論改變了語言學(xué)研究的實(shí)證方向,語料庫語言學(xué)作為語言研究方法受到了普遍質(zhì)疑。長久以來,生成語法和語料庫語言學(xué)被稱為兩種截然不同、相互對立的研究范式。生成語法和語料庫語言學(xué)的發(fā)展也伴隨著雙方的互相批判。本文首先通過分析生成語法和語料庫語言學(xué)在研究范圍、研究方法和研究思路上的差異,以及各自存在的優(yōu)勢和不足,闡述二者的對抗關(guān)系。同時(shí),本文借助生成語法和語料庫語言學(xué)在人工智能領(lǐng)域,尤其是自然語言處理層面的互補(bǔ),揭示兩者在一定程度上的聯(lián)結(jié)關(guān)系,從而挖掘生成語法和語料庫語言學(xué)的合作潛力。

一、生成語法與語料庫語言學(xué)的對抗

生成語法和語料庫語言學(xué)在研究范圍、研究方法和研究程序上有較大的差異。

1957年喬姆斯基《句法結(jié)構(gòu)》的出版標(biāo)志著生成語法的誕生。生成語法采用數(shù)學(xué)模擬方式來進(jìn)行語言研究,使用符號和公式來規(guī)定概念,表達(dá)規(guī)則,以嚴(yán)密的方法把語言機(jī)制形式化,以達(dá)到用有限的公式來生成無限的句子的目的。生成語法認(rèn)為,語言學(xué)的目的就是要形式化地構(gòu)造出語法的公理系統(tǒng),用以精確地描寫人的語言能力(沈家煊,2004)。生成語法的研究范圍限于人的語言知識或語言能力,而不是語言的運(yùn)用(徐烈炯 1988)。在研究方法上,生成語法主要采用內(nèi)省法,即語言學(xué)家本人作為資料提供人,將自己的語感作為判斷語言現(xiàn)象歧義、正誤、可接受性等的依據(jù)。在研究程序上,生成語法的研究一般包括九個(gè)步驟:定向、選題、發(fā)現(xiàn)、描寫、解釋、推廣、論證、批評、反應(yīng)(Botha 1981)。

語料庫語言學(xué)是當(dāng)代語言學(xué)與計(jì)算機(jī)科學(xué)交叉的一門新興學(xué)科。它用計(jì)算機(jī)手段對巨量的語料庫進(jìn)行高速檢索、統(tǒng)計(jì)和展示,以揭示真實(shí)語言使用的傾向性規(guī)律及其所傳遞的意義、功能乃至思想意識(何安平 2012)。Hunston(2002)曾指出,語料庫語言學(xué)無論對語言研究還是語言的應(yīng)用研究都具有革命性的作用。語料庫語言學(xué)研究自然語言的使用,在研究范圍上一般涉及語言定量分析、詞典編纂、自然語言理解等領(lǐng)域。在研究方法上,主要包括兩個(gè)步驟:對自然語言進(jìn)行加工、標(biāo)注;對已經(jīng)標(biāo)注好的語料,采用數(shù)理統(tǒng)計(jì)的方法進(jìn)行研究。在研究程序上,語料庫語言學(xué)內(nèi)部有兩個(gè)不同的取向:“基于語料庫”和“語料庫驅(qū)動(dòng)”,兩者在語料庫的性質(zhì)、語料庫建設(shè)以及語料庫分析方面有較大差異。

生成語法和語料庫語言學(xué)在研究理念上的本質(zhì)差異造成了兩者的對抗關(guān)系。喬姆斯基強(qiáng)調(diào)區(qū)分語言能力和語言應(yīng)用兩個(gè)概念。他認(rèn)為,語言學(xué)研究的對象應(yīng)當(dāng)是人腦的語言能力而非語言應(yīng)用。喬姆斯基(1965)指出,“任何自然語料都是偏頗的”,由于自然語料會(huì)受到各種因素的影響,因而以自然語料為研究對象、對語言應(yīng)用進(jìn)行分析的語料庫語言學(xué)無法揭示語言本質(zhì)。然而,Sinclair(1991)認(rèn)為,語料庫的研究方法“能夠系統(tǒng)地對大數(shù)量的文本語料進(jìn)行審視,使我們有可能發(fā)現(xiàn)一些以前從未有機(jī)會(huì)發(fā)現(xiàn)的語言事實(shí)。”同時(shí),生成語法具有高度的抽象性復(fù)雜性。雖然喬姆斯基一再強(qiáng)調(diào)短語結(jié)構(gòu)規(guī)則和轉(zhuǎn)換的簡單化,然而深層結(jié)構(gòu)自身顯得抽象和復(fù)雜。再者,生成語法只能揭示人類語言能力的某些比較狹窄的方面,無法進(jìn)行語言的歷時(shí)研究以及對創(chuàng)造性語言的研究(如詩歌)。最后,生成語法的研究語料存在先驗(yàn)論的特性。例如在《句法結(jié)構(gòu)》中,喬姆斯基分析了28個(gè)自造的例句,這樣的語言數(shù)據(jù)脫離了語境,而語境恰恰在判斷句子是否合乎語法或是否可接受上具有重要作用。

二、生成語法與語料庫語言學(xué)的聯(lián)結(jié):人工智能

(一)人工智能的產(chǎn)生與發(fā)展

對人工智能(Artificial Intelligence,簡稱AI)的正式研究發(fā)軔于1956年的達(dá)特茅斯會(huì)議。在此次會(huì)議上,約翰·麥卡錫首次提出了“人工智能”這一概念。也是在這次會(huì)議上,模擬人的啟發(fā)式搜索問題解決的計(jì)算機(jī)程序“邏輯理論家”證明了《數(shù)學(xué)原理》中的38條邏輯推理。這一事件被認(rèn)為機(jī)器執(zhí)行認(rèn)知任務(wù)的第一個(gè)實(shí)例,因而1956年也被稱為“AI誕生年”。

20世紀(jì)60年代,人工智能的研究活動(dòng)越來越受到重視,研究者對求解、博弈、機(jī)器視覺、自然語言理解等領(lǐng)域進(jìn)行了深入研究,人工智能進(jìn)入高速發(fā)展時(shí)期。從20世紀(jì)80年代開始,經(jīng)過六十余年的發(fā)展,原先作為計(jì)算機(jī)科學(xué)領(lǐng)域分支的人工智能已成為跨領(lǐng)域的交叉學(xué)科,甚至成為人類科技?xì)v史發(fā)展上的本質(zhì)奇點(diǎn)。

(二)生成語法與語料庫語言學(xué)的聯(lián)結(jié)

人工智能的核心在于“智能”和“自動(dòng)化”,一般根據(jù)“智能”和“自動(dòng)化”程度將人工智能的發(fā)展分為三個(gè)階段即:機(jī)器學(xué)習(xí)、機(jī)器智能、機(jī)器意識。實(shí)現(xiàn)“智能”和“自動(dòng)化”的關(guān)鍵技術(shù)主要包括自然語言處理(Natural Language Processing,簡稱NLP)、自動(dòng)推理(Automated Reasoning)、機(jī)器學(xué)習(xí)(Machine Learning)等。其中,NLP涉及對語言的處理能力,是人工智能的高級表現(xiàn)形式。NLP的實(shí)現(xiàn)離不開語言學(xué),尤其是生成語法與語料庫語言學(xué)。

1.生成語法在AI領(lǐng)域的應(yīng)用

在1956年達(dá)特茅斯會(huì)議召開的同時(shí),喬姆斯基也在同年提出了生成語法,后發(fā)表在1957年出版的《句法結(jié)構(gòu)》中。生成語法的要領(lǐng)是:某一語言的全部合乎語法的句子是從一組抽象的符號通過一套規(guī)則的操作而生成出來的。當(dāng)今大多數(shù)用計(jì)算機(jī)來模擬人類認(rèn)知過程的系統(tǒng)都是基于這種“符號操作”模式,整個(gè)人腦被視為一部按程序操作符號的巨型計(jì)算機(jī)。可見,人工智能在發(fā)展初期就吸收了生成語法的觀點(diǎn)。同時(shí),傳統(tǒng)NLP涉及一個(gè)重要的步驟,即句法分析。生成語法在這一層面發(fā)揮著無可替代的作用。對于如:“今天晚上去吃火鍋吧,不,去吃燒烤吧。”這樣的句子,機(jī)器本身無法意識到句子中自我糾正這一環(huán)節(jié)。那么,利用句法樹便可以對句子成分之間的結(jié)構(gòu)進(jìn)行簡化,幫助機(jī)器在識別和理解句子的過程中,對說話人的真正意圖進(jìn)行識別。

2.語料庫語言學(xué)在AI領(lǐng)域的應(yīng)用

NLP實(shí)現(xiàn)的前提是對機(jī)器的大量訓(xùn)練。通過對自然語言進(jìn)行詞語解析、信息抽取、時(shí)間因果、情緒判斷等技術(shù)處理,最終達(dá)到讓計(jì)算機(jī)“懂得”人類語言認(rèn)知。在NLP的底層數(shù)據(jù)層,語料庫功不可沒。例如,作為NLP基本步驟之一的分詞就需要語料庫技術(shù)的支持:

a.她憑她的才能得到了這份工作。

b.她這樣的人才能夠留下來,是我們的幸運(yùn)。

在上述兩個(gè)句子中,a句中的“才能”明顯是一個(gè)詞,而b句中的“人才”和“能夠”卻應(yīng)該分開。在訓(xùn)練分詞模型的過程中,針對固定詞表進(jìn)行“一刀切”顯然不可取。這時(shí)就需要大量的語料輸入幫助模型達(dá)到更好的準(zhǔn)確率。與之類似,現(xiàn)行的聊天機(jī)器人、機(jī)器翻譯等基于NLP開發(fā)的人工智能,在建設(shè)初期都離不開語料庫作為語義識別的基礎(chǔ)。

總而言之,生成語法和語料庫語言學(xué)在人工智能的發(fā)展過程中均發(fā)揮著重要作用。一方面,基于語料庫訓(xùn)練的機(jī)器,學(xué)到的是大概率下最可能的說法,因而生成的語言常常令人感到乏善可陳,丟失了人類語言的創(chuàng)造性。另一方面,純粹依靠生成語法的人工智能,雖然能生成無限多的句子,卻無法保證句子的正確性。由此可見,生成語法和語料庫在人工智能領(lǐng)域,尤其是NLP技術(shù)層面,存在互補(bǔ)的作用。

三、結(jié)論

本文通過分析生成語法和語料庫語言學(xué)在研究范圍、研究方法和研究思路上的差異,解釋了生成語法和語料庫語言學(xué)的對抗關(guān)系。同時(shí),本文以生成語法和語料庫語言學(xué)在人工智能領(lǐng)域,尤其是自然語言處理層面的互補(bǔ)關(guān)系,厘清了兩者的聯(lián)結(jié)關(guān)系。因而,生成語法和語料庫語言學(xué)并非傳統(tǒng)觀點(diǎn)中單純對立關(guān)系,而是既對立又統(tǒng)一的復(fù)雜關(guān)系,共同寓于語言學(xué)研究中。

事實(shí)上,許多語料庫語言學(xué)家積極投入語言理論的研究,而許多生成語法學(xué)家也十分關(guān)注作為理論研究基礎(chǔ)的數(shù)據(jù)。而其在人工智能領(lǐng)域的聯(lián)結(jié)或?qū)㈩A(yù)示著生成語法和語料庫語言學(xué)將在更多領(lǐng)域碰撞出意想不到的火花。

參考文獻(xiàn):

[1]Botha,R.The Conduct of Linguistic Inquiry[M].The Hague:Mouton,1981.

[2]Chomsky,N.Aspect of the Theory of Syntax[M].Massachusetts:The MIT Press,1965.

[3]Hunston,S.Corpora in Applied Linguistics[M].Cambridge:Cambridge University Press,2002.

[4]Sinclair,J.Corpus,Concordance,Collocation[M].Oxford:Oxford University Press,1991.

[5]何安平.語料庫語言學(xué)[J].中國外語,2012(5):19.

[6]沈家煊.人工智能中的“聯(lián)結(jié)主義”和語法理論[J].外國語,2004(3):2-9.

[7]王琦.語料庫語言學(xué)的發(fā)展及其與生成語法的關(guān)系[J].西北師大學(xué)報(bào)(社會(huì)科學(xué)版),2007(6):110-114.

[8]徐烈炯.生成語法理論[M].上海:上海外語教育出版社,1988.

[9]徐愚.機(jī)器與語言——對人工智能語義問題的探尋[D].北京:中共中央黨校,2016.

猜你喜歡
人工智能
我校新增“人工智能”本科專業(yè)
用“小AI”解決人工智能的“大”煩惱
汽車零部件(2020年3期)2020-03-27 05:30:20
當(dāng)人工智能遇見再制造
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
AI人工智能解疑答問
人工智能與就業(yè)
基于人工智能的電力系統(tǒng)自動(dòng)化控制
人工智能,來了
數(shù)讀人工智能
小康(2017年16期)2017-06-07 09:00:59
人工智能來了
主站蜘蛛池模板: 欧美综合在线观看| 狠狠综合久久久久综| 亚洲中文无码av永久伊人| 青青青国产视频手机| 亚洲AⅤ无码国产精品| 亚洲啪啪网| 国产在线无码av完整版在线观看| 欧美日韩精品综合在线一区| 国产成人精品一区二区不卡| 99偷拍视频精品一区二区| 久久无码高潮喷水| 国产手机在线小视频免费观看 | 高清码无在线看| 国产尤物在线播放| 四虎成人精品| 手机在线免费不卡一区二| 成人午夜久久| 亚洲精品天堂自在久久77| 亚洲天堂视频在线免费观看| 国产99精品视频| 国产一区自拍视频| 91精品国产福利| 亚洲成人播放| 国内a级毛片| 亚洲欧美成人综合| 国产麻豆永久视频| 国产精品成人第一区| 久草视频中文| 毛片免费视频| 国产综合另类小说色区色噜噜| 国产激情影院| 欧美精品另类| 亚洲人成网18禁| 高清不卡毛片| 国内精品九九久久久精品| 久久国产精品夜色| 国产aⅴ无码专区亚洲av综合网| 国产美女无遮挡免费视频| av一区二区三区在线观看| 在线无码av一区二区三区| 黄色网页在线观看| 青青青草国产| 97影院午夜在线观看视频| 热久久综合这里只有精品电影| 欧美成人午夜在线全部免费| 亚洲高清国产拍精品26u| 久久99热66这里只有精品一| 91久久夜色精品国产网站| 久久人人97超碰人人澡爱香蕉| 国产第四页| 国产在线视频二区| 欧美一级在线| 亚洲精品不卡午夜精品| 国产尤物在线播放| 久久黄色一级片| 尤物成AV人片在线观看| 美女扒开下面流白浆在线试听| 成人韩免费网站| 无码精品福利一区二区三区| 亚洲国内精品自在自线官| 无码有码中文字幕| 国产成人精品18| 国产精品福利在线观看无码卡| 亚洲精品卡2卡3卡4卡5卡区| 欧美激情福利| 国产精品人莉莉成在线播放| 天天综合网色| 日本免费一级视频| 99ri国产在线| 国产欧美视频一区二区三区| 在线视频亚洲欧美| 国产福利免费视频| 日韩精品欧美国产在线| av在线人妻熟妇| 午夜啪啪网| 久久综合结合久久狠狠狠97色| 深夜福利视频一区二区| 99re66精品视频在线观看| 亚洲中文在线视频| 久久久久人妻一区精品| 亚洲日韩日本中文在线| 亚洲综合色婷婷中文字幕|