999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

AI自然語言處理系統(tǒng)內(nèi)的中英文角色新解

2021-11-21 21:25:42李薇陳秋麗孫愛娜
現(xiàn)代英語 2021年3期
關(guān)鍵詞:英文人工智能英語

李薇 陳秋麗 孫愛娜

(1.廣州新華學(xué)院(東莞校區(qū)),廣東 東莞 523133;2.廣州南方學(xué)院,廣東 廣州 510970)

一、中英文在人工智能發(fā)展中的角色

在現(xiàn)代社會(huì),英語已成為連接全球計(jì)算機(jī)網(wǎng)絡(luò)的工作語言。事實(shí)上,英語確實(shí)已在全球視聽市場、互聯(lián)網(wǎng)技術(shù)、文字處理軟件(word processor)以及外語教學(xué)領(lǐng)域中占據(jù)著絕對(duì)優(yōu)勢。

眾所周知,中文漢字閱讀值極高的優(yōu)點(diǎn)早已為世界所公認(rèn),據(jù)來自高速公路管理部門的一項(xiàng)交通信息資料顯示,司機(jī)在以時(shí)速80千米行駛的公交車上,可以瞬間看清路邊標(biāo)志牌上的漢字,而漢字下方的阿拉伯?dāng)?shù)字則一晃而過難以辨識(shí),這項(xiàng)調(diào)查揭示,人眼對(duì)漢字的辨識(shí)時(shí)間遠(yuǎn)遠(yuǎn)少于分辨阿拉伯?dāng)?shù)字所需的時(shí)間。由此可見,漢字易于辨識(shí)的優(yōu)勢顯然更加符合人工智能創(chuàng)新發(fā)展的實(shí)際需要。

二、中英文特點(diǎn)對(duì)比分析

(一)中英文字的語音識(shí)別比較

作為意音字(meaning-phonetic logogram)的漢語,其聲母韻母拼合音節(jié)就有415個(gè),再加上四聲調(diào),普通話就多達(dá)1294個(gè)可辨別字義的音節(jié)。由于漢語存在四種音調(diào)以及種類繁多的各地方言(wild dialects),若發(fā)音不準(zhǔn),就會(huì)給人工智能的語音識(shí)別帶來極大的困難。

英文采用從古羅馬發(fā)展而來的拉丁字母,共由26個(gè)字母組成,發(fā)音以字母為基礎(chǔ)。英文沒有中文那種繁復(fù)的聲調(diào),所以,語音輸入時(shí)只要保持中等語速,人工智能就很容易準(zhǔn)確識(shí)別每一個(gè)字母。由于英語同音詞較少,英文在語音識(shí)別的效率上就較大地領(lǐng)先于漢語。

長期以來,英美等國家的西方人士對(duì)于漢語的聲調(diào)十分生疏,而漢語所謂的聲調(diào)就是音高。英語里也有音高,例如,當(dāng)你說“OK?”的時(shí)候,用的是一個(gè)上升的音高,而說“OK!”時(shí),則用了下降的音高,在英語里,這兩種不同的音高只是傳達(dá)了不同的語氣,而詞本身的意義并無改變。

(二)中英文在文字識(shí)別系統(tǒng)方面的比較

中文字與詞的信息量記錄遠(yuǎn)比英文信息量大,所以,當(dāng)人們翻閱聯(lián)合國工作文件時(shí),就會(huì)發(fā)現(xiàn)同樣內(nèi)容的中文文本比英語文本要薄許多,這是因?yàn)闈h字是一個(gè)字一個(gè)音節(jié)的緣故。雖然英文字中,由兩個(gè)字母組成的詞語與一個(gè)漢字所占的位置相同,但實(shí)際上,英語詞的大量音節(jié)通常都是由多個(gè)字母所組成的。例如,由3個(gè)或4個(gè)英文字母組成的詞box、jump,由5個(gè)或 6 個(gè)字母組成的詞 great、yellow等。由此可見,英文字母所占的空間位置顯然大大地超過漢字。

以漢字為基礎(chǔ)單位的中文,橫豎都可以排列,但作為線性文字的英文卻只能橫排,因此,漢字的獨(dú)立表意能力當(dāng)然就比英文強(qiáng)。例如,“他讀課文”,當(dāng)你看見“讀”字,就可大致推斷出后一個(gè)詞意,而英文:“She went to have a rest.”當(dāng)你看到“have”時(shí),卻仍然無法預(yù)測后面詞語的意思。直到出現(xiàn)“rest”,你才明白“have a rest”是“休息”的意思。由此可見,英語表意更多是依賴于短語或整句的上下文內(nèi)容,閱讀者若不看完全部文字內(nèi)容,就難以明白它的準(zhǔn)確意思。由于人工智能的跳躍識(shí)別能力還比較弱,因此,英語文字的表意方式就略遜于中文。

(三)中英文在多義字/詞方面的比較

中英文里的一字/詞多義(polysemy pun)情況普遍存在,例如,中文“好”,可表示:贊成、優(yōu)良、正常及圓滿等多重意思。例如,英文“open”,就包含:開業(yè)、開放、打開、展開等不同含意。

由于世間萬物紛繁,人類情感富于變化(enriching emotion),所以,同一個(gè)中文/英文的詞語,往往隱含著不同的意思,這無疑會(huì)影響人們思維上的正確理解。同時(shí),一字/詞多義的現(xiàn)象也常常會(huì)給人工智能的識(shí)別造成較大的麻煩。目前,由于人工智能系統(tǒng)識(shí)別多義字/詞的能力較弱,其在處理上述這類詞語時(shí)常會(huì)出現(xiàn)差錯(cuò)。

(四)中英文字/詞的同音異義現(xiàn)象比較

中文里有大量同音異義詞(homonyms pun),這類詞語若從字形上看大多互不相同,所以非常容易區(qū)別。但如果單獨(dú)讀某一字/詞,那么,中文的同音異義詞就常會(huì)造成理解錯(cuò)誤。例如,機(jī)制(jī zhì)、機(jī)智(jī zhì),自決(zì jué)、自覺(zì jué)等。

而以音為主的英語,由于其字母拼寫的不同,其詞語自然就具有不同的音。所以,盡管英語也有因同音異義而造成理解誤差的情況,但這種現(xiàn)象比漢語字/詞少了許多。例如,right(正確的)、write(寫字),Meat(肉類)、meet(遇見)等。

三、漢英文字檢索、字庫與文字顯示

(一)文字檢索

根據(jù)漢字的優(yōu)勢與特點(diǎn),語言學(xué)家們?cè)O(shè)計(jì)出多種有理檢索方法,例如“部首檢索法”,它是根據(jù)漢字字形結(jié)構(gòu),把有相同部分的字排列在一起,這些相同的部分即為部首。另外,漢字中也有無理檢索的現(xiàn)象(irrational retrieval),雖然人們?cè)陔娔X上可以設(shè)漢字文件名,但由于電腦機(jī)器內(nèi)主要是以英文字母與阿拉伯?dāng)?shù)字為主,相比之下,使用漢字的確不如使用英文方便。

英文中的無理檢索非常普遍,常用的使用情況包含“密碼設(shè)置與檢索(password setting and retrieval)”,這種檢索方法主要運(yùn)用于英美等國的情報(bào)單位及軍事絕密部門。

(二)字庫

在字庫格式方面,美國Apple公司與Microsoft公司聯(lián)手推出的新型數(shù)字化字形描述技術(shù)(TT技術(shù)),以及Adobe公司特別為描述圖像與文字而專門設(shè)計(jì)的Post Script語言(PS語言),現(xiàn)已成為流行的頁面描述語言形式。

英文利用字母線性羅列打字(linear listing of letters),其所占的“字庫”空間極小,這是英文字庫的一大優(yōu)勢,而一個(gè)漢字往往得占兩個(gè)字母的空間,加之漢字與字母不能對(duì)應(yīng),因此就得另外建立漢字庫。而國際漢字庫的建立以及輸入法的改進(jìn),極大地方便了億萬電腦使用者,它使得電腦更快地向千家萬戶迅速普及。

(三)在電腦的顯示方面

近年來,索尼公司繼XEL-1產(chǎn)品之后,推出基于OLED技術(shù)而開發(fā)的新產(chǎn)品,由于其對(duì)比度超高、色彩飽和度豐富、重量輕且厚度極薄,視角廣且反應(yīng)速度更快,因而引領(lǐng)了新一代平面顯示器潮流,而3D顯示器,更是顯示技術(shù)發(fā)展的終極夢想。

電腦顯示分為低、中、高三種分辨率,雖然漢字無法在低分辨率顯示器上顯示,但由于微電腦多采用高分辨率顯示器(clear resolution display),目前漢字顯示效果還不錯(cuò),但英語字母與文字在低、中、高三級(jí)分辨率上都比較清晰,所以英文在電腦顯示分辨率上的優(yōu)勢是顯而易見的。

(四)在鍵盤與打字方面

以拼音為主的智能化ABC鍵盤輸入法,輸入極為方便且界面友好,字與詞的輸入按“全拼”“簡拼”與“混拼”形式輸入即可,并不需切換輸入方式。此外,智能ABC還可提供動(dòng)態(tài)詞匯庫系統(tǒng),而現(xiàn)有的基本詞庫具有用戶自定義詞匯以及設(shè)置詞頻調(diào)整等操作,其所具有的智能作用,可不斷滿足不同用戶的需求。

例如,當(dāng)中國用戶需用漢語拼音字母打字時(shí),利用英文鍵盤是完全可行的,而電腦上的“全拼”“雙拼”打字狀況也大都如此。但漢語拼音字母的出現(xiàn)頻率高低與英文的情況不太一樣。例如,“Z”鍵,在英語中的使用頻率較低,所以安排在第三鍵左下。

(五)在輸入法方面

目前,漢字輸入技術(shù)日趨向系統(tǒng)化、智能化、機(jī)助化以及標(biāo)準(zhǔn)化方向發(fā)展。對(duì)英美等英語用戶國家而言,電腦輸入是非常容易的事,它只是比英文打字機(jī)增多了一些符號(hào)鍵與功能鍵,一般就是按字母順序羅列輸入即可。鑒于漢字的特殊性,專家創(chuàng)造出遠(yuǎn)比英文字母輸入法更加豐富多彩的方式,常見方式包括:字根法、筆形筆順法、全拼法及讀音法等。

漢字的特殊字形可用來簡化詞語的編碼,從而使中文詞語輸入速度超過英文,而英文的詞語輸入?yún)s無其他可以簡化的輸入法,它必須按照詞語的字母順序逐一輸入,因此,英語詞語在輸入速度上則略遜于中文。

四、結(jié)語

目前,隨著英語國家強(qiáng)勢文化影響力的日益擴(kuò)大,特別是美國在電腦、互聯(lián)網(wǎng)信息與人工智能技術(shù)方面的領(lǐng)先態(tài)勢,使得英語的優(yōu)勢地位在一段時(shí)間內(nèi)仍會(huì)持續(xù)存在。

中文漢字是義音兼表(meaning and sound)的語素音節(jié)文字,這一特征使得每一個(gè)漢字都仿佛是一個(gè)集成信息塊,能兼具形、意、義三個(gè)語言要素,加之漢字信息量大,用漢字作書面語就比用其他語言簡單許多。

簡而言之,中文與英文這兩大世界性主流語言,盡管在語言、文字、語義等多方面存在較大差異與區(qū)別,但它們卻都在蓬勃發(fā)展的人工智能“自然語言處理”NLP系統(tǒng)工程中,繼續(xù)發(fā)揮著各自不可替代的獨(dú)特作用。

猜你喜歡
英文人工智能英語
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能與就業(yè)
數(shù)讀人工智能
小康(2017年16期)2017-06-07 09:00:59
英文摘要
英文摘要
下一幕,人工智能!
英文摘要
英文摘要
讀英語
酷酷英語林
主站蜘蛛池模板: a毛片在线播放| 第一区免费在线观看| 国产成人亚洲精品蜜芽影院| 日韩 欧美 小说 综合网 另类| 国产精品妖精视频| 五月天在线网站| 国产一级特黄aa级特黄裸毛片| 欧美视频在线观看第一页| 亚洲av无码专区久久蜜芽| 亚洲高清在线天堂精品| 国产成人在线无码免费视频| 台湾AV国片精品女同性| 亚洲欧美日韩高清综合678| 欧美日本视频在线观看| 国产精品蜜芽在线观看| 国产欧美又粗又猛又爽老| 欧美日韩成人| 国产在线拍偷自揄观看视频网站| 最新国语自产精品视频在| 日本精品视频| 久久久久中文字幕精品视频| 亚洲国产清纯| 91成人在线免费视频| 欧美精品亚洲日韩a| 亚洲v日韩v欧美在线观看| 夜精品a一区二区三区| 国产在线专区| 午夜三级在线| 国产一区二区影院| 色婷婷成人网| 91香蕉视频下载网站| 国产成人亚洲精品色欲AV| 亚洲免费福利视频| 日韩最新中文字幕| 国产老女人精品免费视频| 国产精品欧美亚洲韩国日本不卡| 久久午夜夜伦鲁鲁片无码免费| 国产无码高清视频不卡| 国产亚洲一区二区三区在线| 青草国产在线视频| 黄色网址免费在线| 日本黄网在线观看| 18黑白丝水手服自慰喷水网站| 国产欧美综合在线观看第七页| 国产视频a| 国内精品久久久久久久久久影视| 动漫精品啪啪一区二区三区| 色AV色 综合网站| 国产亚洲高清在线精品99| 狠狠色狠狠综合久久| 人妻一区二区三区无码精品一区 | 成年人国产视频| 亚洲精品成人7777在线观看| 白浆视频在线观看| 亚洲一级毛片在线观播放| 免费毛片a| 国产精品熟女亚洲AV麻豆| 国产精品30p| 亚洲精品成人福利在线电影| 40岁成熟女人牲交片免费| 中文字幕在线观| 成人福利视频网| 欧美性精品| 国产成人你懂的在线观看| 精品国产黑色丝袜高跟鞋 | 久草视频精品| 香蕉久久国产超碰青草| 日韩精品久久久久久久电影蜜臀| 一本二本三本不卡无码| 成人在线欧美| 免费人欧美成又黄又爽的视频| 一个色综合久久| 成人毛片免费观看| 欧美精品亚洲精品日韩专区| 久久综合伊人 六十路| 视频一本大道香蕉久在线播放 | 亚洲色成人www在线观看| 99热这里只有精品5| 91亚洲精品第一| 亚洲第一区在线| 国产成人乱无码视频| 97se亚洲综合在线天天|