999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

中文問(wèn)答系統(tǒng)中問(wèn)題理解的研究

2008-01-01 00:00:00姜東洋
電腦知識(shí)與技術(shù) 2008年5期

摘要:對(duì)中文問(wèn)答系統(tǒng)中的問(wèn)題理解技術(shù)進(jìn)行了研究。問(wèn)題理解是問(wèn)答系統(tǒng)的基礎(chǔ),問(wèn)題理解的核心內(nèi)容是問(wèn)題分類。本文對(duì)基于規(guī)則和統(tǒng)計(jì)方法的問(wèn)題分類體系做了介紹,提出了基于事件框架的問(wèn)題語(yǔ)義描述模型,給出了疑問(wèn)意向的形式化定義。同時(shí)借助知網(wǎng),對(duì)問(wèn)題空間的大小進(jìn)行評(píng)測(cè)。

關(guān)鍵詞:?jiǎn)柎鹣到y(tǒng);問(wèn)題理解;知網(wǎng);事件框架

中圖分類號(hào):TP183文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2008)05-10896-03

1 問(wèn)題理解方法研究

1.1 問(wèn)題分類方法

(1)基于規(guī)則的方法。在漢語(yǔ)方面,多數(shù)問(wèn)答系統(tǒng)也采用規(guī)則的方法進(jìn)行問(wèn)題分類[1-3];采用基于語(yǔ)義信息和基于混合信息的分類體系的問(wèn)答系統(tǒng)均采用規(guī)則的方法。

(2)基于統(tǒng)計(jì)的方法。統(tǒng)計(jì)學(xué)習(xí)的方法是指在進(jìn)行答案類型識(shí)別時(shí),問(wèn)題可以看作是給定答案類型標(biāo)注集的情況下的分類。

2 事件框架模型的提出

2.1 問(wèn)句事件框架中心成分的確定

問(wèn)句事件框架中心成分的確定是疑問(wèn)意向識(shí)別的基礎(chǔ),同時(shí)也是疑問(wèn)意向識(shí)別的一個(gè)重要組成部分。本問(wèn)在對(duì)大量問(wèn)句進(jìn)行觀察、研究的基礎(chǔ)上,提出了一種基于知網(wǎng)的事件框架中心成分確定方法。

2.2 基本概念定義

(1)問(wèn)句變體:表達(dá)形式不同而疑問(wèn)意向相同的問(wèn)題,我們稱它們中的任意一個(gè)為另外一個(gè)的問(wèn)句變體。

(2)語(yǔ)義所指事件和語(yǔ)義所指屬性:在事件框架中,中心成分為具體的事件類型或?qū)傩灶愋停?xí)慣稱作問(wèn)題的語(yǔ)義所指事件和語(yǔ)義所指屬性。

2.3 事件框架中心成分確定

2.3.1 問(wèn)題語(yǔ)義所指事件抽取

基于知網(wǎng)的核心候選事件獲取,由于事件類問(wèn)句中關(guān)鍵詞主要是動(dòng)詞和名詞。所以問(wèn)句的相關(guān)事件的抽取又可分為兩個(gè)部分:動(dòng)詞相關(guān)事件的抽取以及名詞相關(guān)事件的抽取。

(1)動(dòng)詞本身語(yǔ)義就對(duì)應(yīng)著事件。顧本文對(duì)于動(dòng)詞的相關(guān)事件抽取,就是抽取動(dòng)詞的知網(wǎng)定義中的主義原。

例1:

動(dòng)詞:編輯

知網(wǎng)定義:DEF={compile|編輯}

相關(guān)事件:compile|編輯

另外對(duì)于多義動(dòng)詞,在候選事件抽取階段我們并不對(duì)其進(jìn)行語(yǔ)義排歧,而是從其在知網(wǎng)中所有的概念定義中抽取相關(guān)事件。

例2:

動(dòng)詞:寫

知網(wǎng)定義:DEF1={compile|編輯}

DEF2={describe|描寫}

DEF3={write|寫}

相關(guān)事件:compile|編輯、describe|描寫、write|寫在“《水滸傳》是誰(shuí)寫的”這個(gè)問(wèn)句中,動(dòng)詞“寫”的語(yǔ)義應(yīng)表示為上述DEF1,但此處我們并不進(jìn)行排歧,而是選取全部的相關(guān)事件到候選事件集中。

(2)名詞相關(guān)事件的獲取。名詞在語(yǔ)義上表示的是實(shí)體,而在客觀世界中,實(shí)體與事件是相互關(guān)聯(lián)、相互依存的。體現(xiàn)在知網(wǎng)中,所有實(shí)體義原的框架定義中甚至部分名詞概念的定義中,都包含了實(shí)體與事件的關(guān)系。同時(shí)在次特征文件中也給出了該領(lǐng)域相關(guān)的事件。所以,與名詞概念相關(guān)事件主要在三個(gè)位置提取:概念定義文件、實(shí)體義類樹文件、次特征文件。選擇如下特征進(jìn)行候選事件的可信度評(píng)測(cè):

與問(wèn)句中詞的關(guān)聯(lián)度特征:在當(dāng)一個(gè)候選事件原ES與某個(gè)詞語(yǔ)WORD滿足以下四種情況時(shí),我們認(rèn)為ES與WORD相關(guān)(相關(guān)強(qiáng)度由強(qiáng)及弱)。

① ES是WORD的概念定義中的主義原;

② ES直接出現(xiàn)在WORD的概念定義中;

③ ES出現(xiàn)在WORD的次特征義原框架定義中;

④ ES出現(xiàn)在WORD對(duì)應(yīng)的主義原的框架定義中或ES出現(xiàn)在WORD對(duì)應(yīng)的主義原的上位義原的框架定義中;

語(yǔ)義符合度特征:在知網(wǎng)中,該候選事件語(yǔ)義角色框架中必要角色數(shù)與句子中的實(shí)體數(shù)對(duì)比情況(或多或少),也分四種情況:相同或相差一個(gè)、二個(gè)、三個(gè);

事件冗余度特征:候選事件集合中該事件的總個(gè)數(shù);

相關(guān)詞數(shù)冗余度特征:?jiǎn)柧渲信c該事件義原相關(guān)的詞的個(gè)數(shù)情況。

候選環(huán)境特征:候選事件E在候選集C中的候選事件的相互位置關(guān)系特征。候選事件能否成為問(wèn)題語(yǔ)義所指事件與這個(gè)特征有很大關(guān)系。例如,在一個(gè)多動(dòng)詞的問(wèn)句中(兼語(yǔ)句、連動(dòng)句),只有一個(gè)動(dòng)詞所對(duì)應(yīng)的事件為問(wèn)題語(yǔ)義所指事件,而本文中在兼語(yǔ)句中選第一個(gè)動(dòng)詞所對(duì)應(yīng)事件為問(wèn)題語(yǔ)義所指事件,而連動(dòng)句選最后一個(gè)動(dòng)詞所對(duì)事件為問(wèn)題語(yǔ)義所指事件。候選環(huán)境特征主要有如下幾種情況:

① 問(wèn)句為多動(dòng)句并且事件ES為使動(dòng)類事件(知網(wǎng)中事件的一種);

② 問(wèn)句為多動(dòng)句并且事件ES為一般事件并且所對(duì)應(yīng)動(dòng)詞不是問(wèn)句中的最后一個(gè)動(dòng)詞;

③ 問(wèn)句為多動(dòng)句并且事件ES為一般事件并且所對(duì)應(yīng)動(dòng)詞是問(wèn)句中的最后一個(gè)動(dòng)詞;

④ 問(wèn)句為多動(dòng)句并且事件ES為利用類事件;

⑤ 無(wú)動(dòng)句中,事件ES是變關(guān)系或變屬性類事件;

⑥ 無(wú)動(dòng)句中,事件ES不是是變關(guān)系或變屬性類事件;

⑦ 其他情況。

將上述五種特征分為兩組,其中前4種特征為一組,成為A組,后一種特征組成B組。這樣A組特征屬于從單個(gè)候選事件的角度評(píng)價(jià)事件的可信度,而B組特征則是從全局的角度來(lái)遴選問(wèn)題語(yǔ)義所指事件。據(jù)此考慮,我們將A組特征用一個(gè)四階矩陣來(lái)表示:

其中αij∈{0,1}, αij=1(1≤i≤4, 1≤j≤4)A中的行向量分別表示其中四種特征,而行向量的每個(gè)元素分別表示四種特征的可能取值。當(dāng)特征取定一個(gè)值時(shí),矩陣的對(duì)應(yīng)位便置1。其中αi4 (1≤i≤4)代表每種特征最有利取值。其他元素順序?qū)?yīng)。所以對(duì)于根據(jù)一個(gè)問(wèn)句而從知網(wǎng)中獲取的全部的事件義原,我們都可以為它生成一個(gè)A矩陣,來(lái)表示它在問(wèn)句中所處的情況。然后我們分別用兩個(gè)向量:

然后選擇可信度最大的事件義原作為本問(wèn)題的語(yǔ)義所指事件返回。

對(duì)于B組特征每個(gè)具體情況,我們將其視為一個(gè)規(guī)則,所以對(duì)于當(dāng)前問(wèn)句QS,以及當(dāng)前候選事件ES,規(guī)則a的規(guī)則函數(shù)表示為:

同時(shí),則這個(gè)規(guī)則具有一定的權(quán)重Weighta。于是則一個(gè)候選事件是問(wèn)題語(yǔ)義所指事件的可信度為:

(6)

在這個(gè)公式中,我們將兩組特征看成是兩個(gè)先后的過(guò)程了。

2.3.2 屬性框架的確定

問(wèn)題語(yǔ)義所指屬性、屬性的宿主以及屬性的屬性值等三個(gè)組成部分。并且這三個(gè)部分在語(yǔ)義上具有很大的相關(guān)性。我們確定的屬性框架的確定算法如下:

(1)如果答案類型為屬性值類概念,則根據(jù)知網(wǎng)確定該屬性值對(duì)應(yīng)的屬性類型是什么,同時(shí)確定該屬性對(duì)宿主語(yǔ)義類型的要求,并以此作為語(yǔ)義約束條件在問(wèn)句中問(wèn)點(diǎn)開始,逐漸向前尋找名詞短語(yǔ)(符合該語(yǔ)義類型的限制)作為該屬性的宿主。

(2)否則如果問(wèn)句問(wèn)點(diǎn)左右窗口為3的范圍內(nèi)出現(xiàn)了屬性值類概念,然后根據(jù)知網(wǎng)確定其對(duì)應(yīng)的屬性類型(可能對(duì)應(yīng)多種屬性類型)。最后根據(jù)答案類型滿足哪種屬性類型對(duì)宿主語(yǔ)義類型的要求來(lái)確定問(wèn)句的語(yǔ)義所指屬性。

2.4 實(shí)驗(yàn)結(jié)果及分析

我們從哈工大標(biāo)準(zhǔn)問(wèn)句集中隨機(jī)選擇200個(gè)問(wèn)句,并人工方式將一個(gè)問(wèn)句擴(kuò)充至2、3個(gè)疑問(wèn)意向相同的問(wèn)句,最終得到507個(gè)問(wèn)句,實(shí)驗(yàn)中性能指標(biāo)定義如下:

實(shí)驗(yàn)中根據(jù)經(jīng)驗(yàn)人工設(shè)置R、B的值。具體設(shè)置如下:

下表是實(shí)驗(yàn)結(jié)果數(shù)據(jù)統(tǒng)計(jì):

3 結(jié)束語(yǔ)

本文對(duì)中文自動(dòng)問(wèn)答系統(tǒng)中的問(wèn)題理解技術(shù)進(jìn)行了研究。提出了一種基于疑問(wèn)意向的問(wèn)題分類體系。深入的研究了事件框架中心成分的確定方法。目前,事件類問(wèn)題與屬性類問(wèn)題的區(qū)分算法過(guò)于簡(jiǎn)單,只用了少量的詞級(jí)規(guī)則,下一步可以在規(guī)則質(zhì)量和數(shù)量上進(jìn)一步改進(jìn)算法。而問(wèn)題語(yǔ)義所指事件的選擇目前只參考了四種因素,接下來(lái)我們希望從問(wèn)句中提取更多的約束條件來(lái)提高問(wèn)題語(yǔ)義所指事件選擇的正確率。

參考文獻(xiàn):

[1]米歇爾, 著;曾華軍,張銀奎, 等譯. 機(jī)器學(xué)習(xí)[M]. 北京:機(jī)械工業(yè)出版社,2003.

[2]楊曉峰, 李堂秋, 等. 漢英機(jī)器翻譯中疑問(wèn)句疑問(wèn)信息的分析研究[J]. 計(jì)算機(jī)應(yīng)用研究,2001.

[3]魯川. 漢語(yǔ)語(yǔ)法的意合網(wǎng)絡(luò)[M]. 北京:商務(wù)印書館,2001.

“本文中所涉及到的圖表、注解、公式等內(nèi)容請(qǐng)以PDF格式閱讀原文”

主站蜘蛛池模板: 中文字幕免费播放| 99久久国产综合精品女同| 中文字幕伦视频| 一区二区三区国产| 91麻豆久久久| 国产在线视频导航| 成人久久18免费网站| 538国产视频| 国产一级裸网站| 国产一区二区三区免费观看| 日韩无码真实干出血视频| 日韩精品专区免费无码aⅴ| 国产高颜值露脸在线观看| 国产第八页| 亚洲欧美在线看片AI| 欧美午夜在线观看| 国产原创演绎剧情有字幕的| 国产又粗又爽视频| 伊人中文网| 亚洲无码不卡网| 国产美女视频黄a视频全免费网站| 中国一级特黄大片在线观看| 少妇高潮惨叫久久久久久| 国产精品人人做人人爽人人添| 国产99视频精品免费视频7| 伊人久久婷婷| 1024国产在线| 国内精品久久九九国产精品| 久久人搡人人玩人妻精品 | 九九九久久国产精品| 国产成人综合日韩精品无码不卡| 国产精品视频系列专区| 四虎亚洲精品| 久久久久亚洲精品成人网| 99re视频在线| 欧美亚洲激情| 久久午夜夜伦鲁鲁片无码免费 | 无码区日韩专区免费系列| 99草精品视频| 国产小视频免费| 久久中文电影| 国产精品视频久| 精品无码日韩国产不卡av| 国产美女无遮挡免费视频网站 | 欧美一区二区福利视频| 四虎成人在线视频| 亚洲精品自在线拍| 亚洲精品视频免费| 中文字幕亚洲乱码熟女1区2区| 国产成本人片免费a∨短片| www成人国产在线观看网站| 欧美中出一区二区| 亚洲中文久久精品无玛| 久久成人国产精品免费软件| 99re在线观看视频| 国产成人艳妇AA视频在线| 国产激情在线视频| 亚洲第一黄色网| 欧美午夜视频在线| 久久精品亚洲热综合一区二区| 免费精品一区二区h| 四虎亚洲国产成人久久精品| 欧美另类视频一区二区三区| 久久夜色精品国产嚕嚕亚洲av| 免费jjzz在在线播放国产| 中文字幕在线视频免费| 久久青草免费91观看| 国产永久在线视频| 久久国产精品娇妻素人| 波多野结衣一二三| 中文字幕久久精品波多野结| 久久无码高潮喷水| 日韩视频免费| 香港一级毛片免费看| 女人一级毛片| 91国语视频| 欧美国产精品不卡在线观看 | 久久综合国产乱子免费| 1769国产精品视频免费观看| 免费高清毛片| 超清无码一区二区三区| 日韩小视频在线观看|