999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于分級(jí)特征值的信息摘要過濾算法研究

2013-04-09 12:54:26安徽工商職業(yè)學(xué)院電子信息系安徽合肥230041
關(guān)鍵詞:文本信息系統(tǒng)

未 培,莊 彥 (安徽工商職業(yè)學(xué)院電子信息系,安徽 合肥230041)

路況播報(bào)系統(tǒng)中路況信息來源于多種渠道,如熱線電話、駐點(diǎn)記者、微博、網(wǎng)頁留言等,通過上述渠道收集的信息存在內(nèi)容重復(fù)的現(xiàn)象,需要對(duì)收集的路況信息進(jìn)行甄別。由于不同信息采編人員對(duì)同一路況信息的表述不盡相同,這給信息的比對(duì)帶來了困難[1-2]。為解決上述問題,筆者交通路況播報(bào)系統(tǒng)中重復(fù)信息過濾問題進(jìn)行了研究。

1 特征值的設(shè)定和分級(jí)

對(duì)于路況播報(bào)系統(tǒng)中的路況信息,基本上均可描述為“什么時(shí)間,什么路段,發(fā)生了什么路況”這樣的格式語句。顯然,時(shí)間、地點(diǎn)和路況信息可以提取出來作為算法特征值,如圖1所示。

1)時(shí)間值的選取 考慮到1h內(nèi)在同一地點(diǎn)發(fā)生2次相同路況信息的概率非常小,基本可以不計(jì),因此,可以選取整數(shù)點(diǎn)作為時(shí)間取值來構(gòu)成時(shí)間特征值。為了減少時(shí)間特征值數(shù)量,提高匹配效率,將時(shí)間特征值設(shè)定為7∶00~22∶00。

2)路況信息的選取 交通路況信息所描述的路況信息包括道路擁堵、車輛相撞、追尾、道路施工等,因此,將上述路況信息設(shè)置為路況特征值。

3)地點(diǎn)的選取 由于城市中許多街巷道路對(duì)駕車出行人員影響不大,因而城市主要路段的路況信息作為地點(diǎn)特征值。

為了提高路況信息的比對(duì)效率,按照每一種特征值的數(shù)量由少到多的順序,將上述3種特征值分別設(shè)置為一級(jí)、二級(jí)和三級(jí)。首先匹配一級(jí)特征值,如果一級(jí)特征值不相同,則說明2條路況信息不同,即非重復(fù)內(nèi)容,這樣就不需進(jìn)行二級(jí)和三級(jí)特征值的比對(duì);如果一級(jí)特征值比較結(jié)果相同,則需進(jìn)行二級(jí)特征值的比對(duì),若2條路況信息不同,可以結(jié)束比對(duì),若相同,則需再進(jìn)行三級(jí)特征值的比對(duì),這樣可最終確定2條路況信息的異同。

圖1 特征值的設(shè)定和分級(jí)圖

2 偽代碼

1)設(shè)定參數(shù) 等待錄入的路況信息文本為NT (一個(gè)文本,需要進(jìn)行重復(fù)內(nèi)容比對(duì)的信息文本);系統(tǒng)中已錄入的路況信息文本為OT(多個(gè)文本,重復(fù)內(nèi)容比對(duì)的參照文本);路況特征值PR (多個(gè)特征值);時(shí)間特征值為PT (多個(gè)特征值);地點(diǎn)特征值為PL(多個(gè)特征值)

2)確定步驟 偽代碼確定步驟如下[3]:①將NT與PR中的路況信息進(jìn)行匹配,匹配出某一PRi;②將步驟①匹配出來的PRi與OT進(jìn)行比對(duì),如果找到一個(gè)或多個(gè)OTj與之相匹配則進(jìn)行步驟③,否則,轉(zhuǎn)到步驟⑧繼續(xù)執(zhí)行;③將NT與PT中的時(shí)間信息進(jìn)行匹配,匹配出某一PTk;④將PTk與OTl進(jìn)行比對(duì),如果比對(duì)成功則進(jìn)行步驟⑤,否則,轉(zhuǎn)到步驟⑧繼續(xù)執(zhí)行;⑤將NT與PL中的地點(diǎn)信息進(jìn)行匹配,匹配出一個(gè)或多個(gè)PLm(信息中的路名可能有多個(gè));⑥PLm與OTl進(jìn)行比對(duì),如果比對(duì)成功 (如有多個(gè)路名,需全部匹配),找到一個(gè)OTn,則進(jìn)行步驟⑦的操作,否則,轉(zhuǎn)到步驟⑧繼續(xù)執(zhí)行;⑦全部匹配成功,為重復(fù)信息,舍棄該信息。⑧匹配不成功,非重復(fù)信息,信息錄入成功。

3 算法流程

基于分級(jí)特征值信息摘要過濾算法流程圖如圖2所示。

實(shí)現(xiàn)代碼如下:

private void GEIFA ( string matchingString)

……

if (Pan Duan (eigenvalue1, eigenvalue2,

eigenvalue3))

//用PR值和list_total進(jìn)行比對(duì) (PR值唯一)

list_1=list_total.Where(x=>x.Contains

(eigenvalue1 [ 0])).To List ( );

if(list_1.Count>=1)

//用PT值和list_1進(jìn)行比對(duì) (PT值唯一)

list_2 = list_1.Where ( x = >

x.Contains ( eigenvalue2 [ 0])).To List();

if(list_2.Count>=1)

foreach(string item_string in list_2)

bool result=true;

foreach(string eig3 in

eigenvalue3)

if(!item _ string.Contains

(eig3))result=false;

圖2 基于分級(jí)特征值信息摘要過濾算法流程圖

//此條信息匹配PL信息全部成功

if(result==true)list_3.Add (item_string);

if(list_3.Count>=1)

MessageBox.Show (“此條待播報(bào)信息又重復(fù),無法添加!”);

else

//保存此條信息 list_total.Add (this.textBox1.Text.Trim ());

File.Append All Text(“OT_Info.txt”,

this.textBox1.Text,Encoding.Default);

list_total.RemoveAll(x=> { if(string.IsNullOr Empty ( x))return true;return false;});

fillingrtb ( list_total);

else

//保存此條信息

list_total.Add ( this.textBox1.Text.Trim ( ));

File.Append All Text(“OT_Info.txt”,this.textBox1.Text,Encoding.Default);

list_total.RemoveAll(x=> {if(string.Is NullOr Empty ( x))return true;return false;});fillingrtb ( list_total);

else

//保存此條信息list _ total.Add (this.textBox1.Text.Trim ()); File.Append All Text ( “OT _Info.txt”,

this.textBox1.Text,Encoding.Default);

list_total.Remove All(x=> {if ( string.Is NullOr Empty ( x))returntrue;return false;});

fillingrtb ( list_total);

4 應(yīng) 用

交通路況播報(bào)系統(tǒng)中重復(fù)信息過濾界面如圖3所示。

該算法結(jié)合路況播報(bào)系統(tǒng)的特點(diǎn),由等待錄入系統(tǒng)的路況信息中提取出重要的多個(gè)特征值信息,然后通過特征值與已存儲(chǔ)在系統(tǒng)中的信息進(jìn)行比對(duì),查找出重復(fù)信息并丟棄到棄用列表中,如果特征值沒有全部吻合,則說明等待信息不是重復(fù)信息,可以錄用。實(shí)際應(yīng)用表明,該算法能夠很好地解決路況播報(bào)系統(tǒng)中出現(xiàn)的內(nèi)容相同但表述不同的信息過濾問題,因而具有可行性。

圖3 交通路況播報(bào)系統(tǒng)中重復(fù)信息過濾界面

[1]徐鳳梅,魏瑋 .交通廣播:現(xiàn)狀與對(duì)策 [J].新聞前哨,2009,21(3):20-22.

[2]吳以四 .路況實(shí)時(shí)網(wǎng)上播 [J].信息方略,2008 (5):12-13.

[3]余飛 .基于模式匹配算法的考生報(bào)到結(jié)果預(yù)測(cè) [J].巢湖學(xué)院學(xué)報(bào),2012,10(5):45-47.

猜你喜歡
文本信息系統(tǒng)
Smartflower POP 一體式光伏系統(tǒng)
WJ-700無人機(jī)系統(tǒng)
ZC系列無人機(jī)遙感系統(tǒng)
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識(shí)別
電子制作(2018年18期)2018-11-14 01:48:06
連通與提升系統(tǒng)的最后一塊拼圖 Audiolab 傲立 M-DAC mini
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
展會(huì)信息
如何快速走進(jìn)文本
主站蜘蛛池模板: 在线观看精品自拍视频| 国产白丝av| 97人妻精品专区久久久久| 欧美区一区| 男人的天堂久久精品激情| 香蕉久久永久视频| 久久精品国产精品国产一区| 国产内射一区亚洲| 日韩欧美中文字幕在线精品| 日韩在线欧美在线| 亚洲色图在线观看| 日韩毛片免费观看| 国产自在线拍| 国产成人精品视频一区二区电影| 韩国福利一区| 亚欧美国产综合| 亚洲日本一本dvd高清| 久久亚洲黄色视频| 欧美福利在线观看| 国产精品极品美女自在线网站| 99国产精品国产| 日韩a级毛片| 免费无码AV片在线观看国产| 国产一区二区精品福利| 欧美国产成人在线| 香蕉蕉亚亚洲aav综合| 最新加勒比隔壁人妻| 青青青视频蜜桃一区二区| 99精品国产自在现线观看| 亚洲综合色在线| 国产女人在线视频| 波多野结衣二区| 丁香综合在线| 日韩精品欧美国产在线| 亚洲福利一区二区三区| 天堂网亚洲系列亚洲系列| 国内精品伊人久久久久7777人| 国产喷水视频| 三级欧美在线| 91精品国产综合久久不国产大片| 久久精品国产亚洲AV忘忧草18| 欧美专区在线观看| 在线免费看片a| 亚洲精品动漫| 青青草综合网| 不卡无码网| 色亚洲成人| 免费三A级毛片视频| 色婷婷国产精品视频| 狼友视频一区二区三区| 国产青青操| 亚洲精品视频网| 欧美一区二区精品久久久| 欧美成在线视频| 日本午夜网站| 日韩欧美91| 国模私拍一区二区| AV网站中文| 亚洲无码不卡网| 宅男噜噜噜66国产在线观看| 国产精品免费久久久久影院无码| 四虎免费视频网站| 国产美女无遮挡免费视频| 日本精品一在线观看视频| 最新国语自产精品视频在| 国产欧美日韩一区二区视频在线| 91小视频在线| 午夜视频免费一区二区在线看| 华人在线亚洲欧美精品| 日本国产精品一区久久久| 成人精品免费视频| 香蕉在线视频网站| 国产高潮视频在线观看| 国产精品免费p区| 高清精品美女在线播放| 亚洲天堂高清| 欧美精品v日韩精品v国产精品| 本亚洲精品网站| 美女被操91视频| 国产肉感大码AV无码| 大香网伊人久久综合网2020| 午夜小视频在线|