999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

淺談中文篇章級句間語義關系及標注

2019-03-07 11:21:04李雨欣
考試周刊 2019年16期

摘 要:中國文化博大精深,漢字的發展在中國更是有著幾千年的輝煌歷史。在歷史的發展進程中,以漢字形成的中文篇章往往以句間語義關系的復雜性,更加具有豐富的內涵。篇章句間關系作為中文篇章語義分析的重要內容,具有自身的特點,通過對中文篇章句間關系層次化語義關系進行合理分析,能夠有效對句間關系進行理解描述。本文從中文篇章級句間語義關系及語料標注角度出發,提出幾點自身的見解。

關鍵詞:中文篇章級語義分析;句間關系;語料標注

近年來,隨著中文在世界的影響力逐漸加強,語言文化的研究熱潮逐漸興起,而中文篇章級句間語義的強大,給現代自動化系統中的自動分析及問答、文本質量及內容評價帶來諸多的不便。對于篇章級句間語義關系及標注是語義分析的重要內容,本文通過中文篇章級句間關系的語義分析方法,簡單分析并介紹中文的語義關系的含義,通過對于中文篇章語義關系及標注中存在的問題,提出了自己的建議。

一、 篇章級句間語義關系的含義

在中文篇章級句間語義關系及標注上,首先應明確篇章級句間語義關系的含義。首先,篇章的組成并不是簡單的詞組及句子間的簡單羅列,它更強調一種邏輯思維性。在我們日常接觸到的篇章中,都是通過將一定的信息進行整合后按照結構進行密切組織。通常,將一定的信息按照不同的組織結構進行組織,往往會產生不同的語義。例如,對于句子:“那個小女孩跑了起來,結果那只狗跟上叫了起來。”“那只狗跟上叫了起來,結果那個小女孩跑了。”在這段話中,前者強調小女孩的跑動引起了狗跟上并叫了起來,而后者強調是狗跟上并叫了起來,所以小女孩才會跑掉。從語義關系來看,兩者所體現的主體含義并不相同,由此可見句子間的組織結構影響著邏輯上的語義關系。

二、 面向中文的篇章級句間語義關系

(一) 語義單元的切分

通常在理解整個篇章時,需要把握每個組成篇章的句子的含義。而要充分理解一句話、一個句子的含義,就需要將句子分解為更小的語義單元,在充分理解每個詞組、詞語的含義上,理解一段話,最終通過了解各個句子的含義結合篇章的整體結構,理解篇章的整體思想及所要表達的主旨含義。因此,對于基礎的把握即對于基本語義單元的理解就格外重要。中文基本的語義單元從組成上來看可分為以下幾種:中文單詞;由詞組組成的短語;由短語連成的從句;進而組成的完整的句子;最終通過文本塊組成全部的篇章。

(二) 語義樹的構建

國內對于基本語義單元的分析通常通過語義樹來實現。從語義樹來看,動詞短語組成了最基本的語義單元,當簡單從句中僅包含一個基本的語義單元時,這個簡單從句同樣可以作為一個語義單元。當基本的語義單元組合在一起時,同樣可以生成一個語義單元。而從每個句子至少包含一個語義單元來看,篇章級的句間關系往往就存在于語義單元間,當然,整個關系是在相同層次的語義單元作用下形成的。

三、 基于篇章級語義標注的分析及解決對策

(一) 語義標注中存在的問題

1. 信息及內容的缺失

目前,中文本身所表達的語義是非常豐富的,從語義的組成來看,其組織方式靈活多樣,同英文不同,相似關系的詞組間可表達出豐富多彩的含義。因而在對于計算機標注過程中,會出現諸多困難。首先便是句法成分問題導致的信息缺失。在日常的語義中,中文篇章中往往存在較多的短句,這些短句雖不完整,但所隱藏的含義卻是可以通過人工標注進行理解及感悟,而基于計算機的角色標注卻無法完成。這些短句雖不完整,但卻有著完整的語義,在現代的計算機高速發展下,是否將這些元素參與到篇章構成中值得去思考。

2. 歧義關系的存在

中文語義關系是復雜的,這也導致組成中文篇章的復雜性,語義表達方式上的豐富多樣性,注定了其具有歧義性的特點。中文篇章中存在較多的歧義語義,舉例來說,“××唱片公司自成立以來,僅占整個唱片公司市場份額的0.05%,目前僅有一少部分群體購買該公司的唱片”。前面的一句更多的是闡述的事實。而“目前僅有一少部分群體購買該公司的唱片”更多的是介于“解釋說明”及更進一步的“遞進關系”之上,帶有一定的歧義關系。而如何解決這一問題更值得研究學者的思考。

3. 句法與語義關系是否屬于篇章級句間關系并不明確

在中文篇章中,通常會包含多個分句,這些分局作為多個語義的組成,往往具有并列的屬性,對行文的開展具有良好的推動及促進作用。在計算機的語義標注中,往往會出現對于句法的模糊概念,即無法通過篇章句間關系進行有效處理。

(二) 篇章級語義標注的解決對策

1. 加強中文篇章句間語料關系標注及語料庫的構建

語料關系及語料庫構建更像是一個大的數據庫,而通過這一數據庫的建設,可以豐富中文篇章語料標注中的數據分析,當出現類似的語料關系或語料關系相近時,通過語料關系庫中的標注組合,實現語料關系的自動識別及構建。

2. 加大學術研究力度,實現語義分析器的設計與實現

例如,句子:“【快樂是人的本性】,【但是】,【【我們要想一直快樂】,【一定要保持樂觀的心態】】”。這段句子中,由3個基本的語義單元組成,通過這三個語義單元的相互邏輯關系,加上【但是】這一轉折關系,組成了整體的句子,而“【【我們要想一直快樂】,【一定要保持樂觀的心態】】”這一語義單元又由兩個基本語義單元組成。通過語義單元的遞推關系,往往能夠更好地理解句間語義關系,進而用遞推的方式理解整個篇章。通過加大學術上的科研力度,創建語義分析器,可實現語義的自動標注。

3. 構建中文篇章句間關系類型及句間關系元素的自動識別法

構建中文篇章句間關系類型及句間關系元素的自動識別法是一個漫長的過程。例如,針對句法及語義關系可以通過添加相應的句法關系類別。又如,對于中文短句,允許其作為整體元素進行出現,近而判斷語義的完整性,還可以通過建立多級語義關系嵌套方式實現句間關系元素的自動識別。

四、 結語

中文篇章級句間語義關系及標注具有一定的復雜性,其研究與發展存在一定的艱難性,不過在充分把握篇章級句間語義關系的基礎上,合理看待篇章語義標注上的難題,定能引導中文篇章級句間語義關系及標注走向成功。

參考文獻:

[1]姬建輝.中文篇章級句間關系分析[D].哈爾濱:哈爾濱工業大學,2014.

[2]張牧宇,秦兵,劉挺.中文篇章級句間語義關系體系及標注[J].中文信息學報,2014,28(2):28-36.

作者簡介:

李雨欣,遼寧省朝陽市,遼寧省朝陽市第二高級中學。

主站蜘蛛池模板: 亚洲天堂免费| 色香蕉影院| 国产美女视频黄a视频全免费网站| 成人午夜亚洲影视在线观看| 亚洲人成在线免费观看| 国产精品自拍露脸视频| 最新国产你懂的在线网址| 欧美成人看片一区二区三区| 漂亮人妻被中出中文字幕久久| 熟女视频91| 国产国产人在线成免费视频狼人色| 亚洲第一在线播放| 中文字幕欧美日韩高清| 亚洲最新在线| 色偷偷男人的天堂亚洲av| 亚洲中文字幕手机在线第一页| 亚洲精品久综合蜜| 国产精选自拍| 中文字幕免费在线视频| 国产欧美视频综合二区 | 国产一级毛片网站| 日韩亚洲高清一区二区| 免费aa毛片| 国产成人精品高清在线| 国产精品999在线| 日韩精品一区二区三区大桥未久 | 日韩欧美91| www精品久久| 99re在线视频观看| 91小视频在线观看免费版高清| 亚洲精品天堂自在久久77| 欧美日在线观看| 91在线视频福利| 亚洲色欲色欲www网| 国语少妇高潮| 亚洲中文字幕av无码区| 欧美日韩国产在线人成app| 国产日韩丝袜一二三区| 久久国产精品影院| 国内精品九九久久久精品| 成人福利视频网| 五月婷婷精品| 直接黄91麻豆网站| 一区二区午夜| 国产91无码福利在线| 日本成人不卡视频| www.国产福利| 免费欧美一级| 99精品在线看| 欧美性猛交一区二区三区| 国产人成在线视频| 国产精品一区二区在线播放| 天堂网国产| 91人人妻人人做人人爽男同| 亚洲av无码久久无遮挡| 中文字幕1区2区| 久久综合亚洲色一区二区三区 | 欧美成人在线免费| A级毛片高清免费视频就| 亚洲欧美在线看片AI| 日韩欧美中文| 亚洲成人福利网站| 99精品在线视频观看| 久久 午夜福利 张柏芝| 综合色天天| 日本久久网站| 91娇喘视频| 久久99精品久久久久纯品| 亚洲高清免费在线观看| 国产男人天堂| 久久久久久国产精品mv| 国产毛片高清一级国语 | 亚洲国产天堂在线观看| 色香蕉网站| 亚洲日韩精品伊甸| 成人在线亚洲| 无码中文字幕精品推荐| 呦女精品网站| 香蕉久久国产超碰青草| 欧美日韩中文字幕在线| 91久久偷偷做嫩草影院电| 欧美乱妇高清无乱码免费|