□ 覃國孫
據統計,廣播電視對食品藥品安全事件的首次報道比例仍高于網絡媒體,但是,目前國內有關食品藥品安全的輿情監測大多針對網絡媒體,缺少基于廣播電視媒體的輿情監測。本文就如何建立基于廣播電視媒體的食品藥品安全輿情監測系統提供一些設計思路。
采用B/S架構,設計一個基于WEB門戶的食藥輿情監測系統,通過對中央及地方廣播電視臺主流頻道廣播電視欄目中可能涉及食品藥品輿情的內容進行實時采集和爬取,并實現對相關輿情的自動發現、音視頻內容翻譯、內容審核、報表統計等功能,從而快速、及時地發現廣播電視媒體中有關食品藥品的輿情信息,為食品藥品監管部門全面掌握各主流傳播渠道的安全輿情動態以及做出科學監管決策提供有效支撐。
圍繞系統的總體思路和目標,系統總體可分四層架構設計,分別是:支撐功能層、數據處理層、監管功能層、對外服務層。系統總體架構如圖1所示。

圖1 系統總體架構示意圖
支撐功能層主要包含數據庫管理、分布式計算、系統維護。數據庫可選用成熟的數據庫管理系統,如Oracle、SQL server等;分布式計算主要是完成各個子系統內部和子系統之間不同節點上的對象調用,實現分布式處理;系統維護包括對各個子系統進行參數配置,監控系統各個組成部分的運行情況,管理用戶及其權限。
數據處理層主要完成對數據的采集、存儲及管理。數據采集是指對與輿情相關的廣播電視節目進行分布式實時采集;數據存儲包括管理外部存儲系統,實現數據保存、遷移、備份和清洗;數據管理則是對輿情數據的基本信息進行管理,如查詢、修改、添加、刪除等。
監管功能層負責為系統提供承載監管業務所需的內容分析、信息檢索、信息統計等主要功能。內容分析功能主要完成對采集到的廣播電視節目信息音視頻數據進行分析,包括抽取特征、建立索引、內容識別等,最終檢測識別出與食藥安全相關的重點輿情信息;信息檢索功能主要采用基于文本關鍵詞進行輿情內容檢索;信息統計功能完成對采集到的視音頻節目和重點輿情信息等進行歸類和統計。
對外服務層主要包括系統人機界面和系統接口。系統采用B/S架構搭建門戶系統,WEB門戶人機界面提供系統各個功能友好的操作界面,能展示輿情信息檢索、信息統計、識別定位的結果,并能進行數據審核、系統維護等;系統接口則是考慮提供與其他輿情監管系統對接、數據共享的接口服務,便于監管數據之間的互連互通,信息共享。
根據系統架構和業務功能需求,整個系統的構建設計由數據采集、輿情發現及翻譯、輿情審核及展示、報表分析統計和系統配置與管理五個子系統組成。整個系統功能結構如圖2所示。

圖2 系統功能結構圖
(一)數據采集子系統。主要實現從廣播電視節目信號中實時定向采集可能涉及食品藥品安全方面的節目,生成相關的音視頻片段并進行存儲,為輿情監測提供數據基礎。系統所需的音視頻文件需要實時從節目監測前端服務器上按照指定長度采集到指定的中心存儲上。系統對需要采集的音視頻節目采用實時增量采集方式,并將采集到的音視頻文件的相關信息錄入數據庫。另外,為了及時發現輿情,系統采取邊采集邊處理的工作模式,而采集的音視頻片段長度也可以根據實際應用效果進行修改調整。該子系統設計包含以下主要功能:(1)音視頻數據采集:系統按照指定節目(如新聞類、法制類)和指定時長實時定向地采集可能涉及食藥輿情的廣播電視音視頻數據,數據采用多任務分布式采集和集中存儲方式;(2)采集控制和調度:對采集子系統中各個采集任務機進行任務調度,合理分配資源;(3)采集監聽:監測各采集任務機的工作情況,出現問題自動恢復;(4)特定數據采集:根據業務需要,可對非本系統中的其他音視頻文件進行采集上傳和存儲。
(二)輿情發現及翻譯子系統。主要實現從廣播電視節目中發現識別出與食品藥品安全相關的音視頻片段,并將音視頻內容翻譯轉換成文本信息,從而基于文本形式通過關鍵詞識別完成輿情內容的定位和播放,最后生成相關輿情節目。該子系統運用成熟先進的音視頻處理技術和識別引擎來完成對所采集的音視頻數據進行分析處理。該子系統設計包含以下主要功能:(1)數據預處理:對采集到的廣播電視節目音視頻數據統一做提取音頻、生成指紋特征的預處理操作,供進一步檢索識別使用;(2)音視頻播放:對采集到的音視頻文件按照條件進行查詢播放其中可能涉及輿情的音視頻片段,并可快進播放該片段前后指定時長(如前后10分鐘)的音視頻片段,以便全面瀏覽節目內容;(3)內容識別翻譯:系統利用語音識別翻譯引擎自動對音視頻節目數據進行語音轉文本的內容翻譯,并將識別結果入庫;(4)關鍵詞識別:系統利用預先錄入的關鍵詞信息自動對節目對應的文本信息進行比對識別,將匹配到關鍵詞的結果入庫;(5)關鍵詞定位播放:對匹配關鍵詞的結果進行定位播放,即點擊選擇關鍵詞即可同步播放相應的音視頻內容,以便快速定位和查找相關輿情內容;(6)輿情片段截?。簲祿幚砣藛T根據節目瀏覽及查詢定位播放的情況,將與食品藥品輿情相關的音視頻文件按照指定時間范圍重新截取合并保存成一個新的節目文件,從而完成與輿情相關節目片段的完整截取,正式生成食品藥品安全輿情節目數據。
(三)輿情展示及審核子系統。主要實現以輿情門戶的方式將輿情節目音視頻內容結合系統自動對應生成的字幕信息進行集中展示播放,字幕根據音視頻播放進度進行滾動跟進,從而完成對廣播電視輿情的展示和快速瀏覽,監管部門相關工作人員可依據這些生成的輿情數據開展對輿情節目進行內容審核和研判工作。該子系統設計包含以下主要功能:(1)輿情瀏覽:將所有食藥輿情相關且需重點關注的廣播電視節目以及系統截取和上傳的輿情節目與進行展示和播放,方便集中瀏覽,可設定指定時間段、展示范圍或按照分類對輿情節目進行瀏覽;(2)字幕聯動播放:系統根據音視頻節目播放的進度與系統翻譯出的文本字幕實現聯動播放;(3)字幕定位播放:可點擊字幕來定位播放所選字幕所對應的音視頻內容;(4)節目查詢:可根據頻道名稱、欄目名稱、新聞標題、關鍵詞等條件查詢輿情節目數據;(5)輿情審核:提供審核頁面供工作人員對系統生成的各種輿情內容進行審核和信息分類,審核人員可記錄、編輯和上傳針對輿情節目的研判意見或報告;(6)輿情信息編輯:可修改節目數據的輿情信息,包括開始和結束時間、輿情信息、關鍵詞、涉及地區、類型、相關報道等。
(四)報表分析統計子系統。主要實現對系統的各類輿情信息進行查詢分類和分析統計,并以報表的形式展現出來。系統要能根據不斷變化的業務需求,從不同角度和業務層面生成決策數據報表、宏觀分析報表、各種文件格式的統計圖表等,為食品藥品監管部門提供決策依據。該子系統設計包含以下主要功能:(1)輿情信息查詢:針對全庫的輿情節目進行集中查詢展示,展示列表包括頻道名稱、欄目名稱、關鍵詞、輿情信息、時長、主要內容、輿情信息字數等;(2)頻道統計報表:按照頻道分類,可定制頻道統計報表模板并導出統計報表;(3)欄目統計報表:按照欄目類別分類,可定制節目統計報表模板并導出統計報表;(4)輿情動態報表:按照輿情內容分類,可定制輿情動態統計報表模板并導出統計報表;(5)輿情報告上傳:支持將自定義的輿情分析報告上傳至服務器;(6)輿情報告查詢:對系統中生成的或上傳的輿情分析報告查詢。
(五)系統配置與管理子系統。主要完成對系統的運行參數等進行管理和配置。根據實際應用系統運行的需要,該子系統設計包含以下主要功能:(1)頻道配置:提供對頻道信息的配置界面,實現對頻道信息的增加、刪除、修改等配置和管理,系統可靈活配置頻道、欄目、關鍵詞等信息完成對相應系統屬性的管理;(2)欄目配置:在頻道詳細頁可對頻道所屬欄目進行配置,可以增加欄目、刪除欄目和設置無效等管理配置;(3)關鍵詞配置:系統支持動態的對識別關鍵詞進行配置,關鍵詞配置由關鍵詞列表和查詢框兩部分組成,包括新增、編輯、刪除和復合規則的配置。系統支持針對不同頻道使用不同的關鍵詞識別規則,可通過關鍵詞配置復合規則配置實現。復合規則配置可分別對不同的頻道設置不同的關鍵詞,優化關鍵詞匹配搜索;(4)下載管理:對系統中新聞截取的節目和自上傳的節目進行管理,包括信息展示、處理狀態跟進、刪除等操作;(5)用戶及權限管理:可進行添加、編輯、刪除系統用戶信息的配置操作,可以對不同的用戶分配功能和操作權限,方便對系統的使用和管理。
本研究將食品藥品安全輿情的監測范圍從網絡、報紙和雜志等媒體延伸至廣播電視媒體,拓寬了食品藥品安全輿情監測的廣度,對探索實現食品藥品安全輿情的全媒體監測具有重要的現實意義。