999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

文摘評估方法

2014-10-21 20:07:51王曉霞
電腦迷 2014年17期
關鍵詞:機械意義評價

王曉霞

摘 要 本文主要闡述了文摘的三大評估方法以及機械文摘質量自動評估的實現,通過對各種方法的具體介紹來選擇合適的文摘評估方法。

關鍵詞 摘要 評估 評價方法

中圖分類號:TP391 文獻標識碼:A

自動文摘的評價方法大致可分為三大類:(1)直接(direct)評價方法;(2)基于任務的評價(task based)方法;(3)基于目標的評估(target-based)方法。以下為具體介紹:

1直接評價方法

在自動文摘研究的初期,主要是系統的開發者對文摘系統進行評價測試,根據評測結果來指導研究工作。因此,他們大多采用直接分析文摘質量的方法來對系統性能進行評價。如下方法:

(1)與“理想摘要”進行比較

這種方法的核心思想是將獲得的摘要與“理想摘要”進行對比,根據兩者的相似性進行評價。與“理想摘要”越接近,則說明摘要的質量越高。

(2)其他方法

提問回答評價方法認為好的摘要必須能夠闡述原文中的關鍵要點,因此,該方法要求首先對文章進行分析,取出其中的要點,根據摘要中是否包含這些要點來進行評價研究。他認為用于考試而提出的問題通常反映了文章的主題。

2基于任務的評價方法

為了克服直接評價方法的弱點,近年來一些研究者提出應采用基于任務的評價方法來對自動文摘系統進行評價,即將摘要應用于特定的任務,根據文摘系統對該任務的促進作用來評價文摘系統的性能。Brandow嘗試在IR(information retrieval)任務中評價文摘系統。對比采用摘要進行檢索與原文進行檢索的準確度,來確定是否可以在IR中利用摘要來代替原文。Mike(1994)嘗試在一個新聞分析任務中,根據利用摘要進行新報分析的效果來進行評價。此外,由于情報處理領域中有許多具體任務,因而不斷有研究者提出新的任務、用于基于任務的評價方法。

3基于目標的評估方法

這里只介紹Edmundson方法。Edmundson的評估是典型的基于目標的評估方法,他的評估目的是比較各種自動文摘方法的優劣:標題關鍵詞法,位置法,文中關鍵詞法,指示性詞語以及這四備戰方法的組合。Edmundson采用了3種評估方法,分別為客觀評估、主觀評估、統計錯摘的句子。下面重點介紹方法的基本原理及其實現技術。

評測的內容選擇以原文為依據,評估文摘是否比較準確全面地表達了原文的中心意思,其實質就是文章質量評測。通常,人們一般對文摘有長度限制,在表達同樣意思的前提下,認為短文較長文摘要好。這樣,好的機械文摘便可定義為“選取了最少的句子數,并全面表達了原文中心意思的機械文摘?!?/p>

語篇語言學的理論認為,語篇在意義上存在一種層次關系,即:

語篇的中心意思=各組成意義段的中心意思按一定邏輯關系的組合

意義段的中心意思=各組成子意義段的中心意思按一定邏輯關系的組合。

子意義段的中心意思=各組成下位子意義段的中心意思按一定邏輯關系的組合。

直至不能再劃分為更小的子意義段。

需要指出的是,在任何具體語篇中,這種分層是有窮的,而且由于受長度限制,到子意義段的文摘已屬少見,一般文摘到意義段已足夠。

這種意義上的層次關系必然要在形式上體現出來,即文章的句子之間大致存在一種層次關系,構成一種樹形(金字塔形)結構。層次越高所含的句子數目越少。

4機械文摘質量自動評估的實現

(1)機械文摘質量自動評估的模型,在這個模型中,主動要有3個方面的工作要做:

①原文(相當于考試的題目)的選擇。

②評價(這是評估的核心)。

③專家文摘的獲得。

(2)原文的選擇

這一部分工作只能由人來完成,最重要的選擇標準是原文對于參加比較的各文摘系統具有可比性。

(3)評價

評價是文摘自動評測的核心部分。在進行評價時,有以下幾個基本規定:

①專家文摘和機械文摘都存入文中文件中。

②為使專家文摘與機械文摘具有可比性,只允許專家從原文中抽取句子,而不允許專家根據自己對原文的理解重新生成句子。

③專家文摘和機構文摘的句子都按照在原文中出現的先后順序給出。

④定義

重合率p=匹配句子數/專家文摘句子數?00%

每一個機械文摘的重合率為按n個專家給出的文摘得到的重合率的平均值。

平均重合率=pi/n?00%

其中,pi為相對于第i個專家的重合率; N為專家的數目。

(4)在系統的實現中,有以下兩個因素會給評測帶來一定的困難;

①文摘中的句子長度不定,有的句子過長。

②文摘的句子數目過多。

據觀察,這兩個問題可以解決的。

第一個問題在一篇文章里,任意互不相同的每句話的前15個字均不相同,而句子只能從原文中摘取,因此每句話的前15個字可用來代替該句子。即若機械文摘句子的前15個字組成的字串與專家文摘中句子的前15個字組成的字串相同,則認為該機械文摘句與專家文摘句重合。

第二個問題的解決方案在于對文摘長度的限制。在實踐中,如果文摘過長,就會失去其作為摘要的意義??梢砸幎ǎ簷C械文摘除了規定摘取率外還規定一個指標即文摘的總字數不能多于1000個漢字。設漢語句平均長度大于10個字,所以句子數目最多只有100。

(5)專家文摘的獲得

進行系統評價所必需的專家文摘應具有以下條件;

①專家文摘應與機械文摘有相同的摘取率

②專家文摘應該是機器可讀的。

③專家文摘的句序應與原文中的句序相一致。

猜你喜歡
機械意義評價
一件有意義的事
新少年(2022年9期)2022-09-17 07:10:54
SBR改性瀝青的穩定性評價
石油瀝青(2021年4期)2021-10-14 08:50:44
有意義的一天
調試機械臂
當代工人(2020年8期)2020-05-25 09:07:38
簡單機械
機械班長
按摩機械臂
詩里有你
北極光(2014年8期)2015-03-30 02:50:51
基于Moodle的學習評價
保加利亞轉軌20年評價
主站蜘蛛池模板: 日韩东京热无码人妻| 欧美成人第一页| 国产伦精品一区二区三区视频优播 | 国产青榴视频| Jizz国产色系免费| 亚洲日韩高清在线亚洲专区| 美女被操91视频| 人妻无码AⅤ中文字| 1769国产精品视频免费观看| 免费在线国产一区二区三区精品| 久久五月视频| 男女男免费视频网站国产| h网址在线观看| 天天激情综合| 99精品免费在线| 一区二区三区四区日韩| 亚洲成a人在线观看| 国产精品亚洲va在线观看 | 国产精品任我爽爆在线播放6080 | 亚洲精品桃花岛av在线| 久久公开视频| 四虎国产精品永久在线网址| 东京热高清无码精品| 67194成是人免费无码| 午夜激情婷婷| 中文成人无码国产亚洲| 中文国产成人久久精品小说| 亚洲av片在线免费观看| 97视频免费在线观看| 思思99热精品在线| 波多野结衣久久高清免费| 操国产美女| 亚洲码一区二区三区| 亚洲一区二区精品无码久久久| 女人18毛片水真多国产| 国产迷奸在线看| 国产 在线视频无码| 久久免费精品琪琪| 成年看免费观看视频拍拍| 国内自拍久第一页| 国产精品亚洲欧美日韩久久| 五月婷婷亚洲综合| 天堂成人在线| 亚洲欧美一区二区三区麻豆| 在线综合亚洲欧美网站| 91破解版在线亚洲| 狠狠v日韩v欧美v| 亚洲天堂免费| 原味小视频在线www国产| 91在线无码精品秘九色APP | 四虎永久免费地址| 久久中文无码精品| 久久超级碰| 国产91在线|中文| 成人毛片免费在线观看| 国产精品成人一区二区不卡| 欧美中出一区二区| 国产日韩久久久久无码精品| 成人a免费α片在线视频网站| 老熟妇喷水一区二区三区| 国产成人艳妇AA视频在线| 波多野结衣一区二区三区AV| 国产又黄又硬又粗| 五月天久久综合| 又大又硬又爽免费视频| 国产精品久久国产精麻豆99网站| 亚洲人成网站在线播放2019| 欧美不卡二区| 91精品国产一区| 日本成人一区| 71pao成人国产永久免费视频| 性色在线视频精品| 欧美a在线看| 青青草原偷拍视频| 欧美国产精品不卡在线观看| 中文字幕日韩欧美| 国产91蝌蚪窝| 亚洲经典在线中文字幕 | 久久中文电影| 动漫精品啪啪一区二区三区| 亚洲AV无码一二区三区在线播放| 99热这里只有精品在线观看|