999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

喬姆斯基的形式語言理論與計算機程序的電路控制

2023-11-28 11:10:18
西部學刊 2023年21期
關鍵詞:符號計算機語言

陳 銳

(中南大學 馬克思主義學院,長沙 410083)

生成語法學的奠基者艾弗拉姆·諾姆·喬姆斯基(1928年12月7日—,以下簡稱喬姆斯基)認為,自然語言所蘊含的遞歸性結構,可以轉換為具有一階謂詞邏輯形式的普遍語法,而一階謂詞邏輯也是計算機語言的邏輯基礎,計算機語言與喬姆斯基語言學具有完全的邏輯等價性,意味著人的認知推理過程可以通過電子機械方式進行自動化表達。

一、語言學的升級版——一階謂詞邏輯

(一)語言表達數學化的嘗試

1879年,德國著名的邏輯學家弗雷格第一次用精確的句法構造出形式化的人工語言,開始了將語言推理數學化的探索,稱為一階謂詞演算系統,即數理邏輯中的命題演算和謂詞演算。在謂詞邏輯中,命題分解成個體詞和謂詞兩個部分。個體詞表示可以獨立存在的事或物,它的詞匯包含形式邏輯所有的符號以及變量、常量、函數、固定的符號和關系共五類符號。謂詞則用來刻畫個體的性質、狀態或個體間的關系。

二十世紀五十年代,哲學家、當世語言學泰斗、形式語言理論的奠基者喬姆斯基發現,作為最為經典的一種形式符號推理系統,一階謂詞邏輯雖然屬于數理邏輯范疇,但利用自然語言的句法結構和語義結構所具有的遞歸性,通過將語言的短語結構轉換為公理系統的形式邏輯,同樣可以構造出人類語言的普遍語法和形式化表征。只要能將自然語言系統改造為符號邏輯演算系統,就可以用數學方法描述人的認知過程,用數學符號構造知識表達與推理的系統。從此,語言學這門傳統的人文學科成為一階謂詞邏輯的擴充或歸約,具有了自然科學的屬性。

(二)喬姆斯基語言學與計算機程序語言的邏輯共性

喬姆斯基在《句法結構》中提出了轉換生成語法理論,被認為是二十世紀最偉大的語言學研究成果。他認為,人類語言按照詞序遵循句法、句法遵循語法的方式建構而成,不論是自然語言還是人工語言,所有的人類語言都具有共同的基本語法結構,深層認知架構中自帶轉換生成規則的語法,使不同語言的互譯成為可能。而兒童天生具有適用于所有語言的學習能力,這種與生俱來的能力得益于所有語言體系共同的深層語法結構,通常被稱作普遍語法理論。作為一種人工語言,計算機語言雖然表現形式與自然語言大相徑庭,但同樣是人類大腦智力活動的產物,帶有人類認知結構的共同特性,因此從形式語言的角度來看,不同的計算機程序語言之間以及人工語言與自然語言之間,都具有共同的深層結構,也就是說,人機溝通以及機器與機器的溝通乃至模擬人類語音的人工智能遵循著同樣的語法規則,于是,在一階謂詞邏輯以及喬姆斯基語言學基礎上,正式誕生了龐大的計算機程序語言體系。

二、語言學、邏輯學與計算機科學的公理遞歸屬性

(一)一階謂詞的公理遞歸演繹性質

公理化系統就是一個形式演繹系統,由一組有限的公式構成,它們由公理或是從公理推演出來的定理組成。遞歸是公理系統最核心的演繹方式,是指以有限數量的公理為基礎推演出下一級次的定理,通過不斷自我演算的方式,公理可以推導出無限的命題。一階謂詞邏輯的公理形式演繹體現在將有窮或無窮的符號集,賦值給合乎定義的有限數量的邏輯公式,得到無窮的邏輯表達式的集合,其中邏輯公式被反復調用,具有遞歸的屬性。

一階謂詞邏輯采用公理形式表現抽象的演繹過程,因此以一階謂詞邏輯為平臺,語言學、邏輯學、數學、計算機科學等不同領域的研究者可以利用其穩定的遞歸特性構造不同的公理演繹系統,這些演繹系統不但遵循相同的遞歸模式生成無限的語句和函數,彼此之間也能互相轉換,應用于不同的場景[1]。

(二)喬姆斯基語言學的公理化遞歸演繹

喬姆斯基語言學的主要概念和思想幾乎都來自數學,其中“遞歸”是最核心的概念。“遞歸”的數學定義是,在函數的定義中使用函數自身的方法,描述以自相似方法重復事物的過程。在喬姆斯基理論中,遞歸指一個短語規則在生成句子的過程中無限制地重復使用。十九世紀的德國哲學家洪堡指出語言具有遞歸的演繹特征,即“把有限的手段作無限的使用”。從有限數量的詞匯中,以遞歸方式應用語法規則,可以得到任意數量、任意長度的句子。喬姆斯基深受數學形式主義學派的影響,力圖為語言建立一個永恒正確的模型,其畢生精力致力于把數學形式結構移植到語言學,以實現其語言公理化的理想。在《句法結構》一書中,喬姆斯基將人類千差萬別的語言提煉出一套普遍語法,這是一個排除現實具體意義的純形式系統,其核心運行機制就是運用一套具有公理演繹特性的形式化語法規則推導出自然語言的邏輯結構,最后生成無限的句子集合[2]。喬姆斯基認為,普遍語法的生成時間先于兒童習得母語,即這套元規則本自具足于大腦的生物結構之中,兒童習得母語或外語的過程,都是把該語言的具體符號代入這套早已準備好的語言自動機,自動機對語言材料的處理過程是,先為語言學建立一套有限的短語結構,再設立一套規則,最后生成出所有該語言合乎語法的句子,并根據形式系統的篩選,自動排除掉所有不合語法的句子。

喬姆斯基短語結構的遞歸性具體演示如下。所有的句子的深層結構都由名詞短語NP和動詞短語VP構成,名詞短語NP一般是由名詞N加一個介詞短語Det構成,動詞短語則由名詞短語NP加一個動詞V構成,其遞歸特性可以逐層分解為:(1)S=NP+VP;(2)NP=Det+N;(3)VP=V+NP,S=NP+V+NP。我們發現,名詞短語NP在深層結構中重復出現,構成遞歸過程的核心要素,這個無限的遞歸過程就是語言遞歸性的體現??梢?短語結構語法與公理系統十分相似,可以說,轉換生成語法的短語結構充分體現了語言的遞歸原理的公理特性,體現了遞歸原理的公理化方法來描述自然語言的語法[3]。

圖1 短語結構語法層次圖

(三)計算機程序語言的遞歸推演

如前所述,遞歸性是一階邏輯、自然語言的根本性質之一,因此同樣也是程序語言的重要構造形式。遞歸算法將許多復雜的問題分解為規模較小的子問題,通過直接或間接地不斷重復自我調用,不斷逼近臨界值,達到臨界值后,便跳出遞歸循環,結束整個遞歸算法的操作。如1+2+3……+n的運算程序,實際就是n次重復調用i=i+1以及sum=sum+i兩個函數得到結果。遞歸程序如果用“樹”型圖表示,可更直觀地看到,其與喬姆斯基短語結構的語法層次結構圖相似的遞歸特性[4]。

“樹”作為計算機的一種基本數據結構,是由n個有限節點組成一個具有層次關系的有限集合,“樹”有且只有一個根,除根外其余結點互不相交,里面每一個節點具有相同的數據結構,都是由起始節點開始,往下延伸的每個分支節點代表一個推理步驟,上下節點之間是“一對多”的遞歸關系,每一步先在上一層節點中進行遞歸搜索,如果沒有滿足結束條件,就一層層往下延伸,不斷直接或間接地進行自我的調用[5]。計算機數據的遞歸結構會以樹狀圖或堆棧圖的形式呈現。無論采用哪種形式,基本的結構都是相同的:一個數據元素引用了同類型的其他元素。這種結構可以繼續下去,形成更深的層級。每個層級都可以有它的子層級,而這些子層級又可以有自己的子層級,以此類推。

圖2 數據遞歸結構圖

如圖2所示,根節點是數據的最初或最高級別,在許多情況下,根節點可能代表一個數據集或一組數據的總體。在子節點這個層級,我們開始看到數據的子集或更具體的分類,在上面的例子中,A和B是根節點的子節點。孫子節點是子節點的進一步細分,例如,A1和A2是A的子節點,然后A1a、A1b、A2a、A2b是A1和A2的子節點;同樣,B1、B2是B的子節點,然后B1a、B1b、B2a、B2b是B1和B2的子節點。這個結構可以繼續下去,形成更深的層級。這種數據結構通常用于表示具有層次關系的數據。

最后,程序語言的遞歸性是由計算機芯片電路的遞歸性決定的。1938年,現代信息論創始人香農利用布爾代數的“邏輯乘”“邏輯加”和“邏輯非”的運算法則將電子元件組成“與”“或”“非”三種“門電路”模塊,這三種最基本的布爾邏輯電路以遞歸式的重復嵌套方式,構成了計算機的硬件基礎——集成電路。所以,程序語言結構與芯片電路設計的遞歸布局具有邏輯同一性。

三、計算機程序語言與喬姆斯基形式語言的數理邏輯表達

(一)一階邏輯構造計算機程序語言

一階謂詞邏輯所構建的形式語言是一組數學符號和規則來描述的語言。任何一種語言都是由該語言的字母表及其他基本符號所組成的滿足一定規則的符號串的集合。弗雷格認為,數學的自然數可以用純邏輯的術語來定義,因此所有數學公式都可以轉化為一種純粹邏輯的體系,用邏輯導出它們的性質。例如4這個自然數可以定義為所有元素數為4的集合,意思是說,4這個數字既可以定義為不可分解的終結符號,也可以定義為一個可分解的非終結符。這個偉大的創見深刻地揭示了邏輯學、數學與計算機科學的內在聯系,使得通過機械電子設備進行邏輯推理的自動化演算成為可能,它是計算機程序設計語言的前身,拉開了計算機模擬人類理性思維過程的序幕。

所謂計算機程序,就是一個動作執行過程,由數據和指令(或算法)兩部分構成,主要作用是告訴計算機在何時何地對什么數據做什么操作。何時,就是指令執行序列;何地,就是數據所在的內存地址以及操作所占用的內存地址,換句話說,大部分程序的工作就是對內存中的數據進行操作[5]。

所謂計算機程序語言是指計算機能夠接收和處理的、具有一定語法規則的語言。人們指揮計算機完成某個任務,程序語言擔負著人與計算機之間的溝通任務。這個語言是人機都能“讀懂”的語言,所謂機器“讀懂”,就是指程序語言符合芯片電路設計的布爾代數邏輯,布爾代數是計算機內部運算的邏輯基礎。布爾代數邏輯又與一階謂詞邏輯相兼容,所以計算機高級語言和邏輯學有著本質的聯系。計算機程序語言的發展分為機器語言、匯編語言和高級語言三個階段。比如,計算機程序語句“如果x是數學家,那么他必定是教授”。可以轉換為一階邏輯表達式:?x(Math(x))→Prof(x)。箭頭“→”代表“如果,那么”(if…then…)的意思,“如果……,那么……”是邏輯學最基礎的邏輯關系,也是程序語言三大結構:順序結構、循環結構、選擇結構的核心表達。

(二)喬姆斯基形式語言的數理邏輯化表達

喬姆斯基的短語結構文法的具體表達,首先是將語言系統定義一個四元組G=(VN,VT,S,P),其中VN是非終結符號的集合,VT是終結符號的集合,S是初始符號,P是規則集合。非終結符號,非終結符是一個類或集合的記號,可理解為一個可拆分的元素,所以也叫語法變量或語法范疇。與之相反,終結符號不代表類,而是一個個體記號,是不可拆分的最小元素,所以是指組成語言的不可再分的基本符號。符號串則是由終結符號和非終結符號組成的任何有窮序列,俗稱句子。如果P的規則形式為A→β,A∈VN,A是非終結符號中非空的符號串,β∈(VN∪VT)*,β是包含終結符號與非終結符號的符號串。這個規則表示,如果存在一個符號串A,那么它可以被替換為符號串β,也就是一個函數可以表達為任意一句符合規則的句子,此文法被稱作上下文無關文法,或稱2型文法[6]。

四、喬姆斯基形式系統與計算機程序范式系統如何相互轉換

(一)計算機程序語言與形式語言的推理形式互換

正因為共同的公理化遞歸演繹性質,喬姆斯基形式語言理論直接促進了計算機程序語言的公理化進程,語言學與計算機程序系統獲得同等的表達效應。這個計算機程序語言的形式文法描述就是著名的巴科斯—諾爾范式(也稱為巴科斯—瑙爾范式),簡稱BNF。這個由美國人巴科斯和丹麥人諾爾命名的形式語法體系是一種程序元語言體系,如今的計算機各種高級程序語言都遵循這一語法范式[7]。

計算機科學家已經證明,巴科斯—諾爾范式等價于喬姆斯基的2型文法。比如程序if…else…語句的合法性,用2型語法推理如下:(1)if…else…語句的語法規則是,if之后可以跟著else,也可以不跟else,但else前面必須有if;(2)換算為喬姆斯基形式語言推理形式,用i代表if,e代表else,那么if…else…語句的形式文法規則是:S→SS|iS|iSeS|ε;(3)據此推斷ieie、iie、iieie都是合法句子,因為e前面都有i,而ieei則是不合法句子,因為e前面有e[8]。

(二)計算機形式文法與喬姆斯基形式語言的文法規則互換

BNF語法規則同樣可以用喬姆斯基轉換生成語法的形式表達,比如喬姆斯基短語結構四元組分為初始符號、終結符、非終結符和規則集合四個元素,在巴科斯—諾爾范式中,初始符號就是設定一個程序語句的開始狀態;終結符是不可再分的字母、單詞符號、數字、界符等;非終結符可以看成是程序標識符或程序語句結構等等語法范疇,例如,“算術表達式”這個非終結符代表某種算術式組成的類。

喬姆斯基的形式語言理論在被稱作“伽利略式的語言革命”。計算機科學家經過多重論證已經確定,喬姆斯基形式語言與計算機的自動機理論具有等價性,喬姆斯基總共發現了四型文法,皆與四種計算機語言自動機相對應。四種文法所產生的語言分別被計算機的四種語言自動機所接受和識別,既能描述自然語言,也能描述程序設計語言。如前所述,計算機程序語言的形式文法(巴科斯—諾爾范式)等價于喬姆斯基的2型文法,而喬姆斯基的3型文法,或稱正規文法,已被應用在人工智能的自動翻譯、語言識別等領域,因此喬姆斯基的4種類型文法被計算機科學界稱作喬姆斯基分類[9]。

五、程序語言如何控制芯片電路

如前所述,由于計算機程序語言的公理特性,使得計算機從機器語言、低級語言到高級語言在邏輯上皆具等價性,能夠互相轉譯,我們把這種互譯稱為編譯。計算機的功能由數據和控制兩部分構成,這些功能的實現都要使用“0”“1”二進制數表示,所以在所有的程序設計語言中,只有由“0”“1”組成的機器語言被計算機芯片直接理解和執行,其他程序設計語言編寫的程序叫做源程序,機器語言程序稱為目標代碼[10]。

根據喬姆斯基的形式語法理論原理,源程序和目標程序在語法邏輯上是等價的。為了不讓a、b、c、d、A、B、C、D這些大小寫字母以及各種常用的符號在轉換為“0”“1”過程中各自編碼產生混亂,美國標準化組織出臺了ASCII編碼,使用相同的編碼規則,統一規定了哪些符號對應哪些二進制數。比如加號“+”的ASCII碼可以表達為二進制“0010 1011”的形式。

在計算機芯片運行過程中,電路開關的通斷是基礎。芯片是由幾十億到幾百億的晶體管嵌套組合而成,所有的操作最終還原為一個晶體管的通或者斷,所以ASCII碼“1”“0”兩個符號所表征的最終物理形式就是有序的電壓的高低,稱為高電平和低電平。高電平表示打開電路,低電平表示關閉電路,也可以反過來設計,低電平表示打開電路,高電平表示關閉電路。

所謂計算機語言“指令”,就是某個代表一定控制命令的機器代碼,以“0”“1”的方式激活芯片內部一堆“開關”的狀態,高電平“開”、低電平“關”,或者低電平“開”、高電平“關”,這一堆高低電平的最終組合就叫“輸出”,其正好與“指令”所期待的演算結果相一致??傊?從FORTRAN、COBOL、LISP等高級語言轉譯匯編語言,再到機器語言直到還原為高低電壓的有序變化,這是一個層層轉換模擬的過程,所有的程序語言最終都將在芯片電路中還原為高電平或低電平兩種通斷信號,最終呈現為計算機屏幕中的圖像。

六、物質與意識的辯證統一

語言是思想政治教育的主要工具和強力支撐,是思想意識表達的物質外殼,正確的意識離不開準確的語言表達[11]。辯證唯物主義認為,世界的本原是物質,物質是不依賴于人的意識并能為人的意識所反映的客觀實在。物質決定意識,意識是對物質的反映。同時,意識對物質具有能動作用。也就是說,意識能夠正確反映客觀事物,在此基礎上,意識能夠反作用于客觀事物。正確的意識對客觀事物的發展具有促進作用,錯誤的意識對事物的發展起阻礙作用[12]。

計算機科學的奠基人圖靈設計了一臺可以在一套普遍語法規則之下運行所有計算機程序的機器,這臺機器被稱作圖靈通用機,其設計主旨與喬姆斯基形式語言有著異曲同工之妙,他們共同為人工智能的語言模擬乃至語言創造指明了理論方向。因此,計算機程序語言是人的意識能動性的一種特殊表現,反映了正確的人類意識對于物質世界的反作用。雖然語言改變了物質電路,但語言不能決定物質。計算機的本質是將意識器官的部分功能電子化、自動化,通過操控物理機器中的電子變化模擬大腦的思維過程,語言代碼實質上是對計算機芯片電路的映射,電路電壓的有序變化才是控制過程的物質真相。所以意識的本質是對物質世界的反映,物質對意識具有決定作用,物質與意識是辯證統一的關系。

猜你喜歡
符號計算機語言
學符號,比多少
幼兒園(2021年6期)2021-07-28 07:42:14
計算機操作系統
語言是刀
文苑(2020年4期)2020-05-30 12:35:30
基于計算機自然語言處理的機器翻譯技術應用與簡介
科技傳播(2019年22期)2020-01-14 03:06:34
“+”“-”符號的由來
讓語言描寫搖曳多姿
信息系統審計中計算機審計的應用
消費導刊(2017年20期)2018-01-03 06:26:40
變符號
累積動態分析下的同聲傳譯語言壓縮
我有我語言
主站蜘蛛池模板: 国产素人在线| 日韩福利在线视频| 最新无码专区超级碰碰碰| 欧美在线黄| 日日碰狠狠添天天爽| 国产三级视频网站| 2021亚洲精品不卡a| 国产成人综合网| 四虎影视永久在线精品| 亚洲精品国产综合99久久夜夜嗨| 九九免费观看全部免费视频| 亚洲AⅤ波多系列中文字幕 | 欧美国产日韩另类| 99精品久久精品| 在线观看免费AV网| 欧美性色综合网| 最新日韩AV网址在线观看| 婷婷99视频精品全部在线观看| 伊人久久婷婷五月综合97色| 中文字幕亚洲无线码一区女同| 国产成人综合久久| 综合久久久久久久综合网| 欧美综合区自拍亚洲综合绿色| 一级毛片免费播放视频| 欧美成人精品在线| 高清无码不卡视频| 青青久久91| 免费A∨中文乱码专区| 九九线精品视频在线观看| 欧美黄网站免费观看| 成年人视频一区二区| 香蕉色综合| 色婷婷色丁香| 欧美啪啪视频免码| 成人国产一区二区三区| 日本五区在线不卡精品| 美女免费精品高清毛片在线视| 日日拍夜夜操| 亚洲日韩欧美在线观看| 国产免费福利网站| 久久国产精品影院| 99久久精品免费观看国产| 亚洲国产精品日韩专区AV| 99在线免费播放| 亚洲欧美h| 国产激爽大片在线播放| 日韩激情成人| 欧美日韩专区| a级毛片免费网站| 国产精品19p| 波多野结衣久久高清免费| 538国产在线| 亚洲色图在线观看| 91色国产在线| 午夜国产大片免费观看| 日韩视频免费| 小说 亚洲 无码 精品| 亚洲天堂伊人| 亚洲AⅤ永久无码精品毛片| 国国产a国产片免费麻豆| 99re在线免费视频| 天天摸夜夜操| 97国产精品视频自在拍| 亚洲国产成人在线| 欧美日韩资源| 免费啪啪网址| 久久亚洲国产一区二区| 国产麻豆精品久久一二三| 最新加勒比隔壁人妻| 99久久精品视香蕉蕉| 四虎永久免费地址| 亚洲成网777777国产精品| 欧美a级完整在线观看| 日本一区中文字幕最新在线| 成人精品午夜福利在线播放| 欧美一级高清免费a| 国产最新无码专区在线| 久久精品人人做人人综合试看| 99人妻碰碰碰久久久久禁片| 欧美色99| 国产一在线观看| 久久亚洲综合伊人|