



摘要:基于故事的新聞視頻事件專題分析方法是利用各個事件之間所具有的相似性,將它們相互聯(lián)系起來,將文本和視覺特征融合起來,將和同一個新聞事件有關(guān)的故事聚合起來進(jìn)行報道。這種方法能夠分析出每個新聞視頻事件所具有的專題結(jié)構(gòu),這樣就能夠有效解決各新聞故事的冗余和內(nèi)容的重復(fù)。
關(guān)鍵詞:新聞視頻;新聞故事;專題分析
隨著數(shù)字媒體和計算機信息技術(shù)的高速發(fā)展,其在新聞行業(yè)中的應(yīng)用也越來越廣,借著這些高科技,獲取新聞視頻的途徑更加便利,來源也越來越廣泛。每時每刻我們都能夠收到來自不同國家、不同電臺以及不同語種的新聞視頻。這些新聞視頻大大滿足了人們的信息需求,但是由于信息中包含了大量的冗余信息,這也給人們收看新聞視頻,快速掌握新聞視頻要傳輸?shù)男畔砹寺闊Mㄟ^用新聞事件專題形式的方式對整個新聞故事進(jìn)行管理和分析是較好解決這些問題的有效手段。
1 新聞視頻故事聚類
新聞視頻事件專題分析方法的首要環(huán)節(jié)就是故事聚類,即把與同一事件有關(guān)的新聞故事聚集起來。在相當(dāng)部分的聚類方法中都是基于文本特征而采取的方法,但是由于視覺信息在新聞視頻中非常豐富,因此在描述新聞故事當(dāng)中,視覺信息具有非常重要的作用,因此在進(jìn)行故事聚類時應(yīng)該綜合考慮視覺特征和文本特征。用新聞故事的關(guān)鍵幀表示視覺特征,通過語音識別新聞故事得到的文本可以找到文本特征。在多源新聞視頻中會出現(xiàn)由于事件相同而出現(xiàn)相似的關(guān)鍵幀(NDK),也就是說兩幅圖像之間在場景上或者表現(xiàn)內(nèi)容上是相似的,而圖像的獲取時間、獲取條件以及編輯圖像的技術(shù)操作有差異。在識別新聞視頻故事單元聚類上,相似關(guān)鍵幀具有重要的作用。在識別新聞故事之間的相似關(guān)鍵幀時,我們可以將故事中包含的關(guān)鍵幀聚類和詞看作一個概念。
2.2 視頻事件的專題結(jié)構(gòu)形成
通常不同頻道的相同新聞故事間會存在大量冗余,而觀眾要的是快速了解新聞故事中的核心,所以對新聞故事的冗余度進(jìn)行評價是非常有必要的,其不僅能夠節(jié)省生成事件專題的開銷,還能夠為事件發(fā)展過程提供指示信息。為了消除用戶對故事冗余的閾值選取和定義的不一致性,我們可以將故事分為以下三類:演化故事、新故事以及冗余故事。其中將包好有部分冗余內(nèi)容和新信息的故事稱為演化故事,它通常能夠?qū)⒄麄€事件的發(fā)展信息傳遞給受眾;將對先前故事的重復(fù)或回顧等的故事稱為冗余故事;而大部分內(nèi)容都是新的故事的則稱為新故事。各個故事之間的聯(lián)系能夠表現(xiàn)出故事的冗余關(guān)系和故事的發(fā)展。通過故事事件之間的關(guān)系能夠?qū)⒐适麻g的相似度和冗余度表示出來。這里采用樹的形式將事件專題結(jié)構(gòu)構(gòu)建起來,故事則對應(yīng)為樹的節(jié)點,樹的邊對應(yīng)為故事相似度。整體來說,新聞視頻事件專題結(jié)構(gòu)的生成過程可以表示為:首先,按照故事發(fā)生的事件作樹,將樹的根節(jié)點選定為發(fā)生時間最早的新聞故事。其次將當(dāng)前故事的相似性度量計算出來,然后從新聞故事中尋找和該故事的相似度最大的故事,然后將二者的依賴關(guān)系設(shè)定出來。再者,按照故事依賴關(guān)系的取值范圍R,當(dāng)當(dāng)前故事的相似度閾值R1小于或等于R時則表明該故事為冗余故事,舍去,如果其大于或等于R時則說明其為新故事,其閾值標(biāo)定為R2。把新故事的依賴關(guān)系直接設(shè)置成為依賴時間,連接在樹中的橫節(jié)點中。如果R2 形成該圖時首先先進(jìn)行初始聚類,然后將得到的43個故事單元進(jìn)行專題化分析處理,最后形成專題樹結(jié)構(gòu)示意圖。為了更加直觀地將事件按照時間的發(fā)展進(jìn)行展示,我們可以利用“事件—時間”坐標(biāo)系,將故事發(fā)生的時間順利作為基礎(chǔ),對專題結(jié)構(gòu)進(jìn)行演化處理。通過處理后的故事,其發(fā)展脈絡(luò)變得非常清晰,有助于人們快速清晰的看到整個新聞故事的發(fā)展順利。 3 應(yīng)用分析 將上述的新聞視頻事件專題分析法進(jìn)行實踐性應(yīng)用,對多個頻道進(jìn)行視頻采集,包括中央一套、四套以及鳳凰衛(wèi)視等,通過對幾個關(guān)注度比較高的新聞事件進(jìn)行驗證得到了該方法的有效性驗證結(jié)果。在實驗中,選用三個沒有經(jīng)過任何培訓(xùn)的研究生對故事進(jìn)行評判,要求他們把瀏覽到的新聞故事中的新故事、演化故事以及冗余故事標(biāo)記出來,并將故事間的依賴關(guān)系也標(biāo)記出來,并將標(biāo)記結(jié)果作為此次實驗的標(biāo)準(zhǔn)結(jié)果。采用上述方法將新聞視頻事件形成故事形式的專題事件結(jié)構(gòu),讓三人進(jìn)行滿意度測評,總分為100分,從得到的測評結(jié)果可以看到,三人對該應(yīng)用實驗中選取的四個新聞故事構(gòu)成的事件專題結(jié)果測評滿意度非常高,分?jǐn)?shù)集中在83~96分之間,這個結(jié)果表明了該方法在實際應(yīng)用中是十分有效的。 參考文獻(xiàn): [1]張鴻雁HYPERLINK\"http:∥social.wanfangdata.com.cn/Locate.ashx?ArticleId=kjcb201219024Name=張鴻雁\".基于故事的新聞視頻事件專題分析方法HYPERLINK\"http:∥d.g.wanfangdata.com.cn/Periodical_kjcb201219024.aspx\"[J].科技傳播,2012,6(19):123124. [2] 文軍HYPERLINK\"http:∥social.wanfangdata.com.cn/Locate.ashx?ArticleId=gfkjdxxb201001022Name=文軍\",吳玲達(dá)HYPERLINK\"http:∥social.wanfangdata.com.cn/Locate.ashx?ArticleId=gfkjdxxb201001022Name=吳玲達(dá)\",曾璞HYPERLINK\"http:∥social.wanfangdata.com.cn/Locate.ashx?ArticleId=gfkjdxxb201001022Name=曾璞\".新聞視頻數(shù)據(jù)庫基于故事單元的“多線程”管理技術(shù)研究HYPERLINK\"http:∥d.g.wanfangdata.com.cn/Periodical_gfkjdxxb201001022.aspx\"[J].國防科技大學(xué)學(xué)報,2010,14(1):6364. [3] 劉海濤HYPERLINK\"http:∥social.wanfangdata.com.cn/Locate.ashx?ArticleId=gfkjdxxb201105018Name=劉海濤\",老松楊HYPERLINK\"http:∥social.wanfangdata.com.cn/Locate.ashx?ArticleId=gfkjdxxb201105018Name=老松楊\",白亮HYPERLINK\"http:∥social.wanfangdata.com.cn/Locate.ashx?ArticleId=gfkjdxxb201105018Name=白亮\".基于故事的新聞視頻事件專題分析方法HYPERLINK\"http:∥d.g.wanfangdata.com.cn/Periodical_gfkjdxxb201105018.aspx\"[J].國防科技大學(xué)學(xué)報,2011,9(5):169170.