999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

表音漢字的國際意義

2013-04-29 00:44:03陳耀西陳紅根
現代語文 2013年2期
關鍵詞:人工智能

陳耀西 陳紅根

摘 要:本文以表音漢字的規律性、適應性和適用性,論證了表音漢字對我國信息社會的重大影響和使用價值:發展中文的計算機軟件、推進中國的信息產業、提升中國工業的自動化水平、促進我國的人工智能運用。進而指出表音漢字與漢語國際傳播戰略的密切關系:以漢字的優勢與其它文字比拼,才能取得國際傳播的優勢地位。

關鍵詞:表音漢字 三維結構 計算機語言 信息產業 人工智能 傳播戰略

《走自主信息化之路》一文,已經收進IEEE文庫。該文章的發表,使表音漢字走向世界邁開了第一步。當今信息社會,語言競爭非常激烈,在談論漢語國際傳播時,首先就有一個漢語國際傳播戰略問題。

一、展現表音漢字,事關漢語國際傳播戰略

什么是漢語國際傳播戰略?大家知道,優勝劣汰是一切事物發展、變化的總趨勢,也是漢語國際傳播戰略必然遵循的基本規律。漢字拼音化,就是展現漢字的優勢。以漢字的優勢與其它文字比拼,才能取得國際傳播的優勢地位。

當今世界,文字大致可分為印歐系語言的拼音文字系統和漢字系統。拼音文字系統是多音節文字系統,漢字是單音節文字系統。漢字由象形、表意到拼音,可以說:漢字是唯一代表世界文字發展史全過程的文字,這是一件很了不起的大事。西方的拼音文字已經將象形、表意拋棄了,只剩下一個拼音階段。

(一)西方拼音文字幾乎是“純習俗”符號,而漢字是有理據的

《符號學》指出:“語言,是最龐大的幾乎‘純習俗符號”[1]。這是西方人對自己拼音文字作的結論。所謂“純習俗”符號,即全靠約定俗成,無理可講,相沿成習。說明西方拼音文字是無理據的。與漢字相比,簡直是天淵之別。

圍繞漢字拼音,中華民族艱苦奮斗了幾個世紀,蓋因沒有找到漢字的編碼規則。但是,要說漢字有編碼規則,那將是有違文字發展規律的事,既沒有人相信,也沒有人去做。可是,漢字在形成形聲字時,已經是在以字造字,是有意識的,與當時的社會哲學思想密切相關。漢字沿著形聲字的道路發展,必然形成“音、形、義”三維結構,這是我國歷代學者不斷研究與總結的結果。因此,漢字發展成為有規律的文字是必然的。

首先,漢語已經實現了拉丁字母拼音,總計416個單音節。因此,漢字必然是單音節字,它與西方拼音文字的多音節字相區分,這是漢字的第一個特點。“漢語拼音”只能給“漢字注音”,形成很多同音字。因此,它還不是文字,不能用來支撐計算機語言。

其次,漢字以形聲字為主。形聲字已經占漢字總數的90%。由于形聲字的構字已經模式化,即:形聲字=部首+基本字。形聲字的部首不發音,是符號,所以部首是字“綴”。可惜,這一特征長期被國人所忽視。文字是龐大的體系,漢字416個單音節字,不通過加“綴”,是不可能形成龐大的文字體系的。語言學家索緒爾說:“語言是一連串的區分行為,在模糊不確定的概念層與同樣模糊不確定的語言層上區分出相應的單位。”[1]語言,正如任何符號系統,其特征是區分一物與組成一物兩者沒有什么不同。通過加“綴”來區分同音字,這是漢字的第二個特點。

第三,漢字的同音基本字發展經歷了兩千多年,趨于穩定。在字和字之間,已經形成“音、形、義”的“三維結構”體系(參閱陳耀西,陳紅根《走自主信息化之路》一文)。這個體系是規律化的。如果這個體系不是規律化的,即使加“綴”,也不可能實現拼音化。這是漢字的第三個特點。

到2004年,因為找到了實現漢字拼音的方法,即找到了漢字的“音、形、義”三維結構規律,故可在國家推行的《漢語拼音》的基礎上,用加綴法,以一個漢字復制一個拼音字。它不是生拼硬湊,之所以能順利地實現漢字拼音化,是由于有“音、形、義”三維結構理論的支撐。不然,龐大的漢字體系,是無法著手進行拼音化工作的。所以,表音漢字不是無源之水、無本之木,而是在漢民族的語言文字風俗習慣下成長的拼音文字。形聲字就是加綴字,這是漢民族的文字特色。所以漢字拼音化是水到渠成、順理成章之事。

當西方人對西方拼音文字作的結論是‘純習俗的符號時,而東方文化的代表——漢字,卻被發現是有規律的“音、形、義”三維結構。按照漢字的這個編碼規則,用西方任何一個國家的拼音字母表,都可以拼出漢字的拼音文字。無論是法國、英國、德國、還是俄國的拼音字母表,除個別發音與漢語發音習慣不同外(例如:俄語的卷舌音,漢語就沒有。我國采用的是拉丁文字母表。)。如果將此問題引申一下,這個問題將說明:漢字在世界文字中是唯一具有普遍意義的文字。只有尋找到漢字的編碼規則后,人們才知道漢字的可貴。

(二)正視英語熱

2011年5月18日,《教育部、國家語委發布2010年中國語言生活狀況報告》指出:“青少年漢語能力和漢字書寫能力正在下降和退化。在一個文化高速傳播的時代,我們的母語卻正在被淡忘,這是一個悲哀?!边@個報告說明教育部、國家語委敢于正視問題。

在信息社會,計算機無孔不入。計算機硬件的核心是芯片,計算機軟件的核心是計算機語言?,F今我國沒有中文的計算機語言,全都是英文的計算機語言,例如:BASIC語言、FORTRAN語言、C語言等,中文進入不了中央處理器。特別是數量巨大的庫文件,英語在編程領域的廣泛應用,使得英文壟斷了軟件領域。在這個范疇里,漢字事實上已經被邊緣化。信息社會,我們的母語不能支撐計算機語言,不能編軟件,已經被邊緣化,青少年當然淡忘母語,轉向英語。現在,哪一個行業不用計算機?哪一所學校不學英語?甚至連中國幼兒園的小朋友也在學英語。對于這種現象必須引起我們的高度重視。

(三)正確認識漢字的作用

《符號學》認為:“人類文化是一種語言文明,大部分規模較大的符號體系,是建筑在語言這初始體系之上的二度體系。”[1]語言是“初始體系”,是“基準模型”,是區別計算機語言等人工語言的自然語言?!罢Z言不但是人類社會最大的符號體系,而且大得不成比例,其他符號體系與之相比實在太小,而且全都可以被語言混雜、解釋、置換?!盵1]只有自然語言是最完善、最科學的符號體系。社會發展到今天被稱為信息社會,人們一下子將注意力集中在語言學上,因為計算機語言就是自然語言的二度體系,它們的關系如下:

自然語言——→計算機語言——→機器語言(ASCII碼)

語言和信息的關系成為當今社會最基本的、最核心的關系,這個關系處理得好與不好,不但涉及到社會發展的快慢、國家的強弱;而且關系到民族的生死存亡。因為只有自然語言才是計算機語言的支撐、解釋體系。如果一個國家的計算機語言不是由本國的自然語言支撐,那么它必定要靠編譯成計算機語言的那種自然語言支撐。社會由工業社會向信息社會轉型,要求漢字適應信息社會的需要,現在漢字實現了拼音化,就應該急起直追,用表音漢字編譯中文的計算機語言。使計算機語言適應漢民族的語言風俗習慣,發展中文的計算機軟件,推進中國的信息產業,提升中國工業的自動化水平。

但是,我國目前使用計算機卻是“借用”英語為橋梁,漢字內碼用的是阿拉伯數字編碼。我國目前還沒有一臺真正意義上的國產計算機。計算機“識別”漢字問題并沒有真正解決,當然更談不上計算機“理解”漢字問題。這就是不解決漢字拼音化的嚴重問題。

大家知道,在利用ASCII碼時,西方的拼音文字都用一個字節來保存,一個字節由8個二進制的位組成(注:二進制是我國發明的),用來表示無符號的整數的話,范圍正好是=0~255。而嚴重的問題出現在東方文字,中國、朝鮮和日本的文字包含大量的漢字符號。例如,中國的文字不是拼音文字,漢字作為符號有數萬之多,遠遠超過256個字符,因此,ISO的8859標準實際上不能處理中文的字符。中國的專家通過借鑒ISO8859的編碼思想,認為:既然一個字節的256種字符不能表示中文,就使用兩個字節來表示一個漢字。漢字的編碼問題好像是解決了,其實不然。臺灣也使用中文,由于歷史的原因,那里沒有使用大陸的簡體字,還在使用繁體字,而且臺灣也制定了一套表示繁體中文的字符編碼,稱為BIG5。不幸的是,雖然臺灣也使用兩個字節來表示一個漢字,但沒有像我們兼容ASCII一樣兼容簡體字,他們使用了大致相同的編碼范圍來表示繁體的漢字。所以ISO8859的悲劇又出現在同樣使用漢字的中國人身上了。同樣的編碼在大陸和臺灣的編碼中實際上表示不同的字符,大陸的玩家在玩臺灣的游戲軟件時,經常會遇到亂碼的問題,根源就在于:大陸的計算機默認字符的編碼就是GB2312,當碰到臺灣使用BIG5編碼的文字時,就會做出錯誤的轉換。由于歷史和文化的原因,日文和韓文中也包含許多的漢字,像漢字一樣擁有大量的字符,可是,日韓語言的字符編碼同樣與中文編碼有沖突,日文電腦游戲在大陸上一樣也會出現無法理解的亂碼。在20世紀80年代后期,互聯網出現了,一夜之間,地球村上的人們可以直接訪問遠在天邊的服務器,電子文件在全世界傳播,在一切都在數字化的今天,計算機內存中用阿拉伯數字編碼的漢字到底代表什么字?這就成為一個真正的大問題。

當漢字表音化之后,由于漢字可用拉丁字母表示,漢字即可利用二進制編碼,以一個字節來表示一個表音字字母。于是,以漢字為載體的東方文字就可以以一個編碼表出現在互聯網上。表音漢字與簡體、繁體漢字兼容,中國大陸和臺灣的漢字編碼是同一的、一致的。日文和韓文中的許多漢字也與繁體漢字兼容,少數古漢字盡管現今少用,也可包容在同一編碼表中。

當今世界,只存在東方的漢字和西方的拼音文字兩大體系?,F在,漢字與拼音文字兼容了,世界文字進入了并軌期,互聯網將不需要因文字的復雜性而產生層層編碼,互聯網將變得簡單易行。

二、漢字的適應性是漢語國際傳播的銳利武器

秦始皇統一全國后,“書同文”,秦小篆為通行的規范字體;到了漢代,隸書成了正宗;魏晉以后正楷風行;解放后,漢語拼音。漢字的發展與時俱進。當紙成為我國的“四大發明”之一時,文字從刻在竹簡上變為寫在紙上。漢字要寫在紙上,就必須適應“寫”的要求,漢字由篆體字變成隸字,橫平豎直,書寫方便,漢字體型發生了劇烈變化,順理成章。同一個道理,信息社會,漢字要“寫”進計算機,計算機代替了紙,計算機讀寫漢字要用拼音字,漢字現在也實現了拼音字的目標,就好像篆字轉換成隸字一樣,現在要將漢字轉換成拼音字,以適應信息社會的需要。這本來是順乎天理,合乎人情的事。但是,有的人總擔心“失掉”漢字,不同意推行拼音字,這與一些錯誤的輿論有關。例如:拼音會使漢字“沙漠化”、拼音字要“取代”漢字等等。其實這種錯誤的輿論是由于不理解漢字的生命力所造成的。仔細想一想:實現拼音字時,是靠漢字的規律去實現的,漢字原封未動。在歷史的長河中,如果因發展需要漢字轉換成其他的什么文字時,漢字這種規律性文字,還可轉換成另一種文字。我們為什么要丟掉漢字呢?更何況拼音字與漢字一一對應,拼音字本身就是漢字的一個類別,猶如篆字、隸字一樣,多一種文體多一條路,這有什么不好呢?篆字、隸字不是照樣存在嗎?漢字的任何改革,都應遵循漢字的“音、形、義”三維結構規律。遵循了漢字的“音、形、義”三維結構規律,漢字的形態可能會變,但實質不會改變。例如“誰”的拼音字“yshuizr”由三部分組成:部首“y”代表“言”,讀音“shui”,后綴“zr”。而后綴“zr”恰恰是“隹”的部首。所以,表意字是表音字的后盾,表意字為什么要丟掉呢?

三、漢字文字要素的完整性,使表音漢字具有確立的文字地位

由于表音字與表意字是無縫對接,是落實“漢語拼音”。解放后,黨和政府大批語言文字專家一起,花了那么大的人力、物力、財力,不就是要實現拼音漢字嗎?但是,當時未找到漢字的“音、形、義”三維結構規律,只實現了“漢語拼音”。即便這樣,也為漢字的發展做出了不可磨滅的貢獻?,F在,實現了拼音漢字,只是當時工作的繼承,不是什么另類之舉,不值得大驚小怪。表音字既與表意字不矛盾,又與“漢語拼音”不沖突,表音字去做表意字做不到的事情,有何不可呢?

(一)區分同音字,成為漢字發展道路上的一個糾結

漢字的詞由字組成,豐富的詞語極大地提高了漢語的表達力。但是,在1999年2月出版的《語言文字詞典》的“一語兩文”條目的第八段的末尾卻說:“人們擔心拼音文字不能區分同音詞。其實同音詞屬于語言的詞匯問題,通過對詞匯的整理,完全能夠加以區分?!盵2]這里所說的拼音文字是指416個注音字,注音字無法區分同音字。這個問題在中國語文現代化學會2002年第5次學術年會發表的《漢語現代化——中國語文現代化學會第5次學術會議綜述》中已經明確指出:“用拼音給漢字注音,用拼音漢語用于漢字不方便使用的領域,已經在逐漸走拼音化道路。”[4]實際上否定了“詞匯整理”論。

大家都知道:漢字的同音詞取決于同音字。不能區分同音字,也就不能區分同音詞。正因為同音字問題才使漢字不能支撐計算機語言,才使得我國不得不“借用”英文的計算機語言。表音漢字則實現了區分同音字問題。因為它具備文字的三要素,用數學的語言說,是“音、形、義”三變量俱全。而注音字只有一個“音”變量?!霸~匯”再怎么“整理”,也“整”不成文字。所以,非要將注音字說成是我國的拼音文字,是無知的、愚蠢的霸道形為。

例如:“意義”用注音字表示為:(yi yi),“一心一意”表示為:(yi xin yi yi)。顯然,它不能“通過對詞匯的整理”而加以區分;其次,是想通過標聲調來區分同音字。小學的拼音教學實踐早已證明:此路也不通。因某些基本字的同音字太多。如讀音“yi”的字竟達30個之多,加聲調也不能解決區分問題;且因加聲調后,每一個字有4個聲調,在計算機使用時,一個聲調是一個字符,實際上是增加了字符數而又不能解決根本問題;更因聲調在不同地區的人群中差異太大,不易掌握。然而,表音字就不是這樣。上述例子“意義”表示為:(yib yim);“一心一意”表示為:(yir xin yir yib),顯然可以區分同音詞;其次,表音字的后綴有詞性,詞的結構受到語法制約;第三,表音字的一維書寫方式,使字和字之間可以連寫,其結果將彌補歧義和語法的不足。例如:“意義”表示為:(yib yim),可寫成“yibyim”。

(二)表音漢字具有完整的文字要素系統

“音、義、形”集成的表音漢字,是由表意漢字復制而成,是有規律的文字,“它把漢字所能表達的一切予以保留”。所以,表音漢字的文字地位是確立的,是勿庸置疑的。它具備文字的易學性、全面性、系統性、可使用性、通用性等。其全面性、系統性、通用性都概括在“音、形、義”三維結構的規律中。

文字與語言不同,漢語是依靠語境來區分同音字的。因此,單音節的拼音文字與多音節的拼音文字同樣具有使用價值。只是單音節的拼音文字由于理論性較強,其“三維結構”規律難以發現,但不等于說單音節的拼音文字不可能“后來居上”。顯然,表音漢字是規律化文字,在實用性上,它已占有先機。更能吸引人的是:漢字的多樣性(象形字、表意字、表音字)使其各具特色,豐富多彩。大家知道,多彩的文化生活是燦爛的:象形字的印章;表意字的詩配畫;單音節字的易讀性。不難預料:單音節的拼音文字在世界文字史上,必將譜寫輝煌的篇章。

1.表音漢字適應ASCII的要求

漢字在沒有拼音化時,漢字編碼在計算機的ASII碼中使用的是阿拉伯數字編碼。當有了拼音漢字后,就可利用26個拉丁字母進行編碼,實現我國計算機的內存轉軌,拋棄兩個字節表示一個漢字的編碼方案。

當漢字拼音化之后,由于漢字與拼音文字兼容,以漢字為載體的東方文字就可以用一個編碼表出現在互聯網上,由于拼音漢字與簡體、繁體漢字兼容,所以,中國大陸和臺灣的漢字編碼是同一的、一致的。日文和韓文中的許多漢字也與繁體漢字兼容,少數古漢字也可包容在同一編碼表中。這樣做,有很多好處:

首先:簡體字“釁”與繁體字“釁”的拼音漢字都是“xinp”,在編碼表中是相同的。這樣,當我們要使用簡體字時,就選擇簡體字;要使用繁體字時,就選擇繁體字。又如簡體字“樣”與繁體字“樣”的拼音漢字都是“myangh”,使用時很方便。

其次,內存編碼表可以隨時擴充。因為拼音漢字在ASCII編碼表中用26個拉丁字母的編碼,不需“借用”阿拉伯數字?!敖栌谩卑⒗當底质節h字內碼擴展很困難。低字節與高字節由16個二進制位組成。26個拉丁字母的每一個字符,只需一個字節表示。國標GB2312只有6763個漢字,擴展到GBK時為20902個漢字,再擴展怎么辦?GBK是沒有包括繁體漢字的。然而,用拼音漢字就沒有這個問題,漢字庫可隨時擴展,用戶個人可以擴展,國家也可定期擴展,不受限制,適應漢字“量大字雜”的特點。

第三,表音漢字用于內存編碼安全,不同于用阿拉伯數字編碼。此外,聽說俄羅斯軍隊用俄文編程,不用英文編程,目的在于信息安全。

第四,在互聯網上,便于與東方文化的國家交流。漢字是東方文字的源頭,漢字拼音化了,對東方文字就有影響,也有利于其他東方國家文字的發展。在互聯網上,文件中將是拼音漢字在世界各地傳播,不再是“借用”的阿拉伯數字。

第五,在軟件編程、漢字輸入、文字處理等方面,都用拼音漢字。通過表音漢字,與漢字點陣字型庫掛接,即可實現漢字輸入。漢字輸入不再有“瓶頸”問題。更重要的是:表音字與表意字的復制關系,可實現漢字的機器輸入,這有利于大信息量輸入。

2.拼音漢字適應編程要求

在軟件領域,我國使用英文計算機語言,“借用”英文編程。有了拼音漢字,可用拼音字設計計算機語言,例如,BASIC語言常用的語句可用拼音字代替:

漢字 英文 表音漢字

讀 INPUT YDUV

寫 PRINT XIEV

完 END WANV

則 THEN ZE

到 TO DAOV

令 LET LINGV

如果設計中文編譯器,就可以實現中文的計算機語言。這樣,我們就不受英文的制約。在歐美國家,高中生都會編程,計算機成為普及工具,這就有利于發揮國民的創造力。試想,在信息社會,一個國家如果只能依靠少數精英掌握英文,使用計算機編程,這個國家能有多大的創新能力?能有多少驚人成果出現?計算機是信息社會的生產工具,沒有編程能力哪來的創新能力?這是我國進入信息社會的根本大事。這個問題不解決,怎能實現信息社會?如果有人認為中國不通過計算機語言的實踐就可跨入信息社會,就類似于清朝的“洋務運動”,認為可以通過“買機器”實現工業化。事實證明:工業社會“買”不來,信息社會同樣也“買”不來。

所以,表音漢字的“綴”,不是為加綴而加綴;表音漢字的“拼音”,不是為拼音而拼音。它們是一個系統工程。大家分析一下:從發現漢字的“音、形、義”三維結構規律,到實現表音漢字;利用表音漢字做計算機的內存;利用表音漢字輸入/輸出;利用表音漢字設計中文的計算機語言;利用中文的計算機語言編寫軟件/庫文件。以上這些工作,僅屬于計算機識別漢字范疇的工作,它顯然已經是一個巨大的系統工程。千萬不要認為表音漢字是可以這樣,也可以那樣隨意而做的一件事。沒有“音、形、義”三維結構規律,是不可能實現表音漢字的。

每當談到中文編程問題時,就有人懷著“誰動了我的奶酪”的感情說:“沒有必要!”當提出要分析漢字的詞性時又有人說:“谷歌早晚會懂得分析詞性的。”這種觀點當然不能讓人同意。因為“谷歌”是一家外企公司,把中國人應做的事,寄托在外國人“早晚會懂”上,那我國還有什么希望發展自主的信息產業?想當初,漢字沒有拼音化時,中國人用英文的計算機語言編程,那是情有可原;現在漢字也拼音化了,中國人還要用英文的計算機語言編程,這不就讓人不可思議了嗎?!

四、從兩大語系的特點對比,明確表音漢字標明詞性的必要性

在漢字拼音化的進程中,漢字一直存在兩個糾結,一個是如何區分同音字問題;另一個是彰顯漢字的語法問題。

(一)漢字的第二個糾結是漢語語法問題

人工智能時代對語言文字將提出更嚴格的要求,中國人與機器人的交流一定是漢語,不可能通過翻譯與機器人交談。外文翻譯成中文有直譯和意譯兩種,無論哪種翻譯,由于語言風俗習慣不同,對中國人來說都將造成很大的麻煩。當漢語用于“人工智能”分析時,人們再想“借用”英文這個橋梁,那就“此路不通”了!加工對象在哪里呢?再反對漢字拼音化時,恐怕是追悔莫及,悔之晚矣!

例如:漢語中,大量的虛詞運用,是一種重要的語法手段,漢語的虛詞比英語豐富得多,有相當數量的助詞。如:“的”“得”“地”“著”“了”“過”“們”等。因此,語法結構有較大的區別,這是眾所周知的。因此,今日之選擇,要為將來之應用負責。漢語必須有適合人工智能的文字。

《人工智能原理》指出:“朱德熙先生在《語法答問》一書中曾精辟地指出,和印歐語相比,漢語的主要特點”[5]有以下三點:

第一,漢語的詞類缺乏形式標記;

第二,漢語詞類跟句法成分之間不存在簡單的一一對應關系。試看在英語中:

主賓語 謂語 定語 狀語

| | | |

名詞 動詞 形容詞 副詞

而在漢語中,這種關系變成了多對多關系,如下圖所示:

第三,漢語句子的構造原則跟短語(即詞組)的構造原則基本一致。例如拿動詞來說,在英語短語中,不允許有限定動詞出現,如果要出現動詞的話,只能是動詞的不定式或分詞形式;只有句子及其包含的子句才能有一個限定動詞充當主要動詞。可是漢語的情形完全不同,動詞和動詞結構不論在句子的哪個位置上出現,形式完全一樣。

《人工智能原理》還指出:“漢語的這些特點對于用計算機來進行句法分析是極其不利的?!被谶@些理由,并且考慮到漢字在產生之初,一般只有一個意義,稱為本義;隨著使用范圍的擴大,往往會在本義的基礎上產生若干個新的意義,稱為引申義?;跐h字為單音節字的特點,在實現基本字表音化時,必須利用前、后綴來標明表音漢字的詞性。這既利于根據本義追索其字源,又利于分析句法成分。

正如呂叔湘先生在《現代漢語規范詞典》的“序一”中所言:“詞義的發展脈絡,詞性的標注等問題,卻不簡單。他們也自知當前不能全部做好,我認為他們還有自知之明,但做總比不做好。萬事開頭難,只要開了頭,隨著科學的發展和研究的深入,總有一天會完備起來。”盡管這段話是在2010年8月買到該詞典后才看到的,但由于該詞典對詞性的標注是目前所見到的最全面、內容最豐富的詞典。所以,我們又將此前的詞性標注,依該詞典進行了新的審查修訂。我們深深地感到:詞性的標注是一個需要不斷進行研究的學術問題。呂叔湘先生及《現代漢語規范詞典》的編著者為什么如此重視詞性的標注?因為它是漢語研究必須要做的基礎工作,也是人工智能的重大前提條件之一。正因如此,我們做了下面幾項工作:

1.基本字大都為前三文,表音化時,沒有前綴,只有后綴,后綴標明本義詞性。

2.常用基本字是名詞,不加后綴。因為在表音漢字中常用名詞是使用最多的。為了使用簡便,所以是隱含的名詞詞性。

3.形聲字的前綴為部首,是表示形聲字的含義的,當然與詞性有關。表音漢字的前綴是具備詞性功能的,再加上基本字的后綴帶來的詞性,所以形聲字的詞性要具體問題具體分析。例如,部首“扌”的形聲字,幾乎都是動詞,部首“邑”的形聲字,幾乎都是名詞。

例如:“(jianz)戔(小,少)、(shjianz)淺、(zhjianz)箋、(bkjianz)賎、(dqjianz)殘、(jjianz)銭”。其中,基本字“(jianz)戔”,后綴為“z”說明為形容詞。其形聲字(shjianz)淺、(bkjianz)賎、(dqjianz)殘是形容詞;(zhjianz)箋、(jjianz)銭則是名詞,與竹器、金屬有關。因此,表音漢字能承擔詞性的任務。將漢字的隱含詞性變成顯性詞性,這將是漢字的重大變化。在GB18030漢字庫中,基本字有1641個;另外,還有502個獨體字,其實也是基本字,故總計為2143個字。因此,將基本字標注詞性,是一件非常艱巨而又十分有意義的工作,它是漢字實現表音化而追求的目標之一。注音字是沒有詞性功能的,不能把注音字當成拼音文字。正如前文所說:計算機“識別”漢字問題并沒有真正解決,是因為漢字的拼音化沒有真正解決?,F在我國計算機使用的輸入法,如五筆字型是拆字法,“kl”能代表“中國”嗎?就連微軟公司的輸入法,也是顯示一排同音字,最后靠人的智力來分辨后選取所需的漢字。只有表音漢字輸入法,才能實現表音漢字與表意漢字一對一的關系。輸入表音漢字“yib”,只顯示一個表意漢字“意”,不可能顯示另外的任何漢字,這才稱得上是計算機“識別”了漢字。至此,也就可利用表音漢字編譯中文的計算機語言,實現中文的編程。

(二)表音漢字使漢字字形的變化成為可能

朱德熙先生在《語法問答》中指出:“傳統語法受印歐語影響,所以一般把漢語與印歐語比較,其中最最顯著的特點是漢語字形沒有變化,即漢語缺乏形態變化?!痹跐h字表音化之后,漢字的形態變化將成為可能。因為基本字具有詞性,且由于漢字的一字多詞性的特點,以及漢字沒有形態變化的傳統。要使漢字既具備詞性變化,又保持漢字形態不變的傳統,在基本字標注本義詞性的基礎上,再標注引申義的詞性。計算機使用時,文章中只須本義詞性時基本字的原形不變;當需要用引申義的詞性時,再加注引申義的詞性。此時,以引申義的詞性為該字的詞性。對此,用符號加注詞性成為一種較好的解決辦法:

名詞用符號“?”表示,動詞用符號“~”表示,形容詞用符號“?”表示,副詞用符號“`”表示??梢詫⑦@些符號加在字的后面。

此外,在加后綴時,對23個聲母字沒有全部用完,保留有“n”,以便在語法分析需要時,作為改變字形時使用。例如,在分析句子時,由于句子中會出現數個動詞,標明主要動詞是很必要的,在動詞后再加“n”,表示主動詞,有利于語法分析。

例如:“我們的共產黨和共產黨所領導的八路軍、新四軍,是革命的隊伍?!边@句話用表音漢字表示時為:

“Wo rmenp de gong chanv dang he gong chanv dang suom ywlingv cwdaop de bar lup jun、xinh sir jun,shid get mingb de dui rwur.”在這句話中,動詞有三處: chanv(產)、ywlingv(領)、shid(是)。顯然,shid(是)為主要動詞,標明shid(是)為“shidn”,對計算機識別是有利的。語法是智能運用的依托,不解決漢語語法的顯性表示問題,就不利于漢語的人工智能運用。

五、展望

人類又一次迎來了新一輪的技術革命。這次由大規模數據、智能化生產以及無線網絡所引領的技術革命,將推動經濟增長,帶來社會巨變。

信息技術已經進入一個大規模數據時代。處理能力和數據存儲實際上是免費的。掌上數碼設備如iPhone手機的運算能力能讓上世紀70年代的IBM主機自愧不如。互聯網正演變為“云”網絡——所謂“云”是指一個由數以千計的數據中心都可以讓1990年的任何一臺超級計算機看上去像是洪荒年代的產物。驚人的數據處理能力使以往無法想象的服務和業務成為可能。這其中就包括文字的處理能力,由此可見,表音漢字有利于大規模信息處理。

基于計算機設計的,自然界不可能有的物質特性的新材料,如隱形材料被設計出來,這些新材料與三維打印相結合,會對經濟發展產生爆炸性影響。所謂三維打印實際上是利用計算機、激光、新材料,“打印”飛機等精密零部件。這種近乎完美的計算化設計和直接制造的時代,令人們制造產品的方式產生巨大的改變。所以,支撐計算機軟件的計算機語言,并不是一個轉瞬即逝的社會現象,而是一個長期支撐社會實踐過程的客觀事物,千萬不要輕視計算機語言的社會價值,我國應該有中文的計算機語言。

對自然語言的理解,一直是語言信息處理技術的一個高層次的重要研究方向,一直是人工智能所關注的核心課題之一。顯然,如果計算機能夠理解自然語言,人-機間的信息交流能夠以人們所熟悉的本族語言來進行,那將是計算機技術的一項重大突破。另一方面,由于創造和使用自然語言是人類高度智能的表現,因此對自然語言理解的研究也有助于揭開人類智能的奧秘,深化我們對語言能力和思維本質的認識。所以說,這個研究方向在語言應用方面和語言理論方面都有重大意義。

參考文獻:

[1]趙毅衡.符號學文學論文集[C].天津:百花文藝出版社,2004.

[2]何立.語言文字詞典[M].北京:學苑出版社,1999.

[3]石純一等.人工智能原理[M].北京:清華大學出版社,1993.

[4]李行健.現代漢語規范詞典[Z].北京:外語教學與研究出版社,

2010.

[5]陳耀西,陳紅根.《走自主信息化之路》,IEEE文庫,2011.

(陳耀西 河南鄭州 解放軍信息工程大學測繪學院 450052;陳紅根 河南鄭州 河南職業技術學院 450046)

猜你喜歡
人工智能
我校新增“人工智能”本科專業
用“小AI”解決人工智能的“大”煩惱
汽車零部件(2020年3期)2020-03-27 05:30:20
當人工智能遇見再制造
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
AI人工智能解疑答問
人工智能與就業
IT經理世界(2018年20期)2018-10-24 02:38:24
基于人工智能的電力系統自動化控制
人工智能,來了
數讀人工智能
小康(2017年16期)2017-06-07 09:00:59
人工智能來了
學與玩(2017年12期)2017-02-16 06:51:12
主站蜘蛛池模板: 亚洲丝袜中文字幕| 国产另类视频| 亚洲天堂精品在线观看| 日韩黄色在线| 国产视频久久久久| 国产在线视频欧美亚综合| 国产精品55夜色66夜色| jijzzizz老师出水喷水喷出| 天天摸夜夜操| 亚洲国产精品无码久久一线| 高清无码手机在线观看| 国产高清在线丝袜精品一区| 国产色婷婷| 日韩精品无码免费一区二区三区 | 在线亚洲精品自拍| 久久久久亚洲Av片无码观看| 国产女人综合久久精品视| 福利视频一区| 午夜啪啪网| 国产91av在线| 青青青国产精品国产精品美女| www.亚洲国产| 国产人人射| 色有码无码视频| 国产va免费精品| 欧美精品v欧洲精品| 乱系列中文字幕在线视频| 午夜日b视频| 无码视频国产精品一区二区| 亚洲日本一本dvd高清| 国产丝袜啪啪| 精品一区二区久久久久网站| 国产成人免费| 亚洲首页在线观看| 激情综合婷婷丁香五月尤物| 99re这里只有国产中文精品国产精品| 99国产在线视频| 青草娱乐极品免费视频| 亚洲精品自在线拍| 国产精品开放后亚洲| 久久成人18免费| 波多野结衣无码AV在线| 久久久久久尹人网香蕉| AV在线天堂进入| 亚洲第七页| 午夜视频免费试看| a天堂视频| 久热精品免费| 亚洲床戏一区| 干中文字幕| 国产精品成人免费视频99| 萌白酱国产一区二区| 国产91导航| 中文字幕人妻av一区二区| 亚洲一级毛片| 好紧好深好大乳无码中文字幕| 欧美午夜小视频| 亚洲日韩高清在线亚洲专区| 色婷婷成人| a级免费视频| 国产不卡一级毛片视频| 婷婷综合亚洲| 免费看一级毛片波多结衣| 伊人久久久久久久久久| 狠狠色成人综合首页| 2022精品国偷自产免费观看| 国产主播一区二区三区| 日本三区视频| 亚洲欧洲天堂色AV| 国产成人精品无码一区二| 久操中文在线| 久久综合伊人77777| 在线观看国产精品日本不卡网| 国产在线第二页| 婷五月综合| 国产成人夜色91| 无码精油按摩潮喷在线播放| 中国美女**毛片录像在线| 国产欧美在线观看精品一区污| 国产人成在线视频| 亚洲最新在线| 一本大道无码日韩精品影视|