劉潔 唐娟娟



摘要:隨著視頻采集、處理、傳榆技術的發展,視頻數據成為重要的數據源,利用智能化視頻分析技術,準確獲取視頻內容中突發事件的發生以及對突發事件進行行為分析,并實時上報到監控中心,這樣可以縮短從突發事件發生到事件處理的時間,提高突發事件的應急能力。本文主要針對這一迫切的行業需求,闡述了現有輿情及視頻智能分析數據技術,并提出以視頻為數據源的面向突發事件的輿情信息智能采集架構的探索。
關鍵詞:突發事件;網絡輿情;視頻數據;智能采集架構
中圖分類號:TP393 文獻標識碼:A
文章編號:1009-3044(2019)33-0005-03
1概述
根據突發事件網絡輿情的定義,突發事件網絡輿情涉及范圍是多種社會群體構成的公眾為受體,通常以互聯網為平臺,借助電子設備等相關輔助溝通工具,圍繞即將發生的或已發生的自然災害、事故災難、公共衛生事件和社會安全事件等突發事件發布的含有多種情緒、態度和意見交錯的總和信息。突發事件網絡輿情是網絡輿情的一種特殊情況,因此,其具有一般網絡輿情所具有的內容龐雜性、現實互動性、聚合擴散性和傳播跨界性等特點,此外,由于其突然性質并受到突發事件的影響,還具有其特殊的一面,主要包括突發性、復雜性強、難以預測性、聚焦效應明顯、公共議題轉換高等特征。為此,必須建立應對突發事件網絡輿情的及時有效治理體制,及時有效地建立行政監管應急方案、實現媒體行業輿情引導自律、利用高科技技術提供輿情傳播的有力保障等多方面相結合的突發事件網絡輿情管理體制。
隨著視頻采集、處理、傳輸技術的發展,視頻數據成了人們生活中占重要分量的數據源,比如,公共安全的視頻監控系統、微視頻等,而以往輿情信息的采集多是從微博、網絡博客、貼吧、論壇中獲取受眾對輿情事件的反饋信息,但是隨著視頻數據量在整體數據結構中的增加,在一些突發事件發生地,第一時間獲取事件發生的方式已經從以微博和貼吧為主,轉變成以視頻數據獲取為主。因此以視頻數據為依托,利用智能化視頻分析技術,準確獲取視頻信息,并實時上報到監控中心,這樣可以縮短從突發事件發生到事件處理的時間,提高突發事件的應急能力。本文主要針對這一需求,闡述了現有輿情及視頻智能分析數據技術,并提出以視頻為數據源的面向突發事件的輿情信息智能采集架構的探索。本文擬提出針對視頻數據分析的行為檢測信息采集系統,利用該系統可以第一時間獲取事件發生的多維信息,根據行為庫的定義,判斷當天發生的突發事件是何種類型,影響程度,然后實時反饋到輿情管理中心,為輿情的良性發展提出了寶貴的技術支撐。
2突發事件網絡輿情相關研究工作
網絡輿情突發事件的預警機制是網絡輿情危機管理的重要組成部分之一。有學者提出一種基于觀點樹的網絡輿情危機預警方法,實現對網絡輿情中網民觀點極性、強度以及屬性的挖掘。通過構建觀點樹,并根據用戶自定義預警閾值或預警指標,對網絡輿情危機事件進行預警。為了明確劃分網絡輿情預警等級,李弼程等人利用威脅估計技術對網絡輿情的威脅程度進行定量估計,做出網絡輿情的預警等級預報。其中,網絡輿情的預警等級被劃分為輕警情、中度警情、重警情和特重警情四個等級。此外,還有一些研究運用事件演變動力學建模、語義隸屬度模糊推理、直覺模糊推理等開展預警評估。
有研究者基于多案例的突發事件分析了網絡輿情演化模式。葉瓊元等人采用系統動力學建模方法,分別從內部因素、外部因素兩大影響網絡民意演化的主要方面進行分析,以突發事件民意熱度為指標,探討突發事件民意演化影響因素及其邏輯關系,并檢驗其中的關鍵性因素,同時考慮網民和政府間的博弈與關聯性。趙蓉英等人采用社會網絡分析方法,結合具有典型代表意義的突發事件案例,試圖挖掘與識別網絡輿情的關鍵節點,并解釋其內在的結構特征與演變規律。
已有的研究在突發事件的網絡輿情監測與預警方面已取得了相當的成果,但針對突發事件中的視頻輿情的研究并不多見。在當今多源媒體時代,視頻信息中負載了大量的輿情符碼不容忽視。因此,本研究擬構建基于視頻邊緣計算的輿情突發行為采集系統架構。
3智能化視頻處理在輿情分析中的應用
視頻數據是當前大數據時代數據領域的主要類型,視頻數據中包含了多種視頻數據信息,如何從視頻數據信息中獲取有關輿情信息是我們系統提到的關鍵所在。尤其是當前多元數據媒體,如自媒體、微信等盛行的時代,當視頻數據終端獲取到突然事件視頻時,期望能在第一時間將這些實時視頻數據進行分析,指導突發事件輿情的良性發展。
本文主要針對包含人的行為類突發事件的視頻數據,構建了基于視頻邊緣計算的輿情突發行為采集系統架構,進行視頻數據內容的人的行為特征的提取,然后根據行為數據庫,進行人體行為數據分析,然后將行為分析的結果發送到已經設定好的行為數據庫,根據行為數據庫內行為類型比對操作,然后將數據實時傳輸到輿情管理系統,輿情管理系統可以根據真實的行為結果,對數據進行分析,在輿情傳播中起到合適的引導作用。在基于視頻數據的行為分析中,利用視頻終端采集設備(如,公路兩側監控攝像頭和用戶手機端攝像頭),獲取視頻數據,對視頻內容進行分析,這對突然事件的跟蹤至關重要。如何能從視頻數據中及時分析,實時獲取行為圖像或數據,并傳輸到附近的服務器,服務器對視頻行為內容進行分析,然后得到分析結果。這些是本項目的關鍵,也是進一步突發事件(以行為特征)的輿情判別的基礎。我們分別從以下幾個方面來介紹本文所提出的系統。
3.1系統架構
1)系統總體架構
本系統主要包括三大體系模塊:面向視頻處理的邊緣計算模塊、云計算模塊、輿情管理服務模塊。圖1描述了系統的總體架構。面向視頻處理的邊緣計算模塊在本項目中即是智能終端設備本身,例如智能手機、智能攝像頭等,它承擔著人的行為檢測。云計算模塊主要是部署再云數據中心,完成計算需求最大的數據處理,負責部分人類行為檢測計算任務和其他系統的計算任務。輿情管理服務模塊是為方便輿情管理中心獲取視頻數據和及時響應突發事件輿情而設計的。
2)視頻邊緣計算模塊
本項目采用云邊協同架構,會在智能終端如智能攝像頭處對視頻流進行預處理,獲取初步信息后,返回狀態值至云中心系統運維中心,之后系統運維中心將云中心視頻處理任務管理節點訓練的神經網絡模型,下放至邊緣單元處進行計算,邊緣計算單元返回計算結果。根據每個邊緣計算單元計算資源的不同,云中心系統運維中心會提供不同的神經網絡模型。這既節省了視頻流的傳輸時間消耗問題,又可以靈活運用邊緣計算單元的計算資源。
3)云計算模塊
云計算模塊主要具備兩個功能:云中心視頻處理任務管理和云中心系統運維管理。
①云中心視頻處理任務管理節點,根據云中心運維管理節點提供的用戶要求訓練相應的模型,利用神經網絡學習算法訓練生成數據圖像模型,同時根據各邊緣節點的計算、存儲和傳輸能力判斷卸載的比例,實現對云中心數據圖像模型的最優化分割,分割后的神經網絡可以合理利用各個邊緣單元的計算資源,完成相應的任務識別。最后由云中心系統運維管理中心將分割好的云數據圖像模型卸載到各個邊緣計算節點。
②云中心系統運維中心收集系統各個節點的狀態的信息,完成對整個系統節點狀態的管理,比如檢查節點是否在線,是否出現故障,實時監控,維護系統的正常運作并將各個狀態存儲以便客戶端收集顯示。同時云中心系統運維管理節點負責獲取客戶端任務要求為云中心視頻處理任務管理節點提供模型訓練依據,收集邊緣計算單元計算資源信息為云中心視頻處理任務管理節點提供任務卸載依據,起到將云中心及其他節點連接在一起的橋梁作用。
4)輿情管理服務模塊
管理服務模塊向輿情管理系統的管理人員提供與人類行為檢測與識別相關的客戶端應用服務,通過調用云計算中心智慧應用層和應用服務接口,實現視頻圖像的查詢和下載、人的行為檢測和可視化分析等客戶端應用功能。輿情管理服務模塊是系統面向用戶的關鍵模塊,提供了用戶友好和功能豐富的客戶端應用程序,是對整個系統的進一步完善。
3.2關鍵技術
基于視頻數據的突發輿情事件中行為判別系統的關鍵,在于對視頻數據中的行為進行判斷,核心的技術點是實現視頻數據中行為分析的判斷,具體而言,主要包括以下關鍵技術。
1)基于深度學習的行為檢測技術
隨著人工智能領域的快速發展,深度學習越來越多的引入到目標檢測領域中。基于深度學習的目標檢測的發展方向大體上可以分為兩類:1)基于區域提名的R-CNN系列;2)無須區域提名的YOLO/SSD系列。第一種算法需要先生成一個可能含有目標物體的預選框,然后再進行物體檢測。第二種則直接在網絡中提取特征識別物體。本項目中將采用第一種算法來進行人體行為的檢測。
原始的R-CNN算法檢測目標物體的主要思路是獲取圖片后,在圖片中提取若干個候選區域,再將這些區域分別輸入CNN(卷積神經網絡)網絡,在CNN網絡中對每個區域抽取一個固定長度的特征向量,再通過向量機(SVN)來辨別目標物體以及位置。這種算法完成目標檢測的過程中需要三千模型,而且輸入到CNN網絡中的若干個候選區域中可能有物體,也可能沒有任何物體,這樣,就會使算法計算量大且效率低下。
Faster R-CNN是R-CNN的優化版本,它實現的主要過程為:
①將圖片輸入到CNN網絡中,生成該圖片的特征映射。
②將特征映射輸入到Region Proposal網絡(RPN),返回目標區域和相應分數。
③通過Rol池化層,將所有目標區域修正為統一尺寸。
④將所有目標區域傳輸到完全連接層,輸出相對應的邊界框。
與R-CNN需要三個模型不同,Faster R-CNN只需用一個模型就可以實現區域的特征提取和分類,大大提高了計算效率,減少了計算時間。在本項目中,為了能夠及時地對輿情進行控制并正確的引導輿情的發展方向,我們需要及時、迅速地獲取輿情事件中的人物行為,所以,我們會采用Faster R-CNN算法來進行人體的行為檢測。
2)云計算與邊緣計算的協同合作技術
按照云計算的特征,云計算模式是一種集中式數據處理的方式,利用網絡互聯,可以根據用戶需求,實現多用戶之間的軟硬件共享。云計算系統主要由云中心平臺,云存儲系統,云終端,以及云安全模塊。此外,對于云計算模式下的資源而言,云計算實現了一種資源的虛擬化,這樣資源在一定程度上可以分時被不同用戶共享,在一定調度策略的設計中,可以讓用戶覺得只有本身在用。而對于用戶本身,其又不需要關系云計算資源內部的細節,而僅僅是直接使用云計算所提供的服務。
相比而言,邊緣計算就是在靠近數據源端的網絡邊緣側,融合網絡、計算、存儲、應用核心能力的一種新型計算模式。在數據源附近提供一種邊緣智能服務,以實現快速連接、實時業務、數據優化、安全與隱私保護等技術需求。邊緣計算系統主要由終端設備(如,移動手機)、邊緣設備(如,路由器、機頂盒、網橋等)、邊緣服務器等構成,這些組件可以具有必要的性能,支持邊緣計算。
邊緣計算著重解決實時、短周期數據的分析層面,邊緣計算能夠實時實現本地化的數據智能化處理。在數據源端,邊緣計算能夠實現數據的本地化數據處理,無須將數據上傳到云端,為此,減少數據從云端到本地傳輸的時間和帶寬開銷。
面對大規模視頻數據量,若都要在服務器端進行云計算處理,這會造成嚴重的時間延遲,無法實現將識別視頻信息實時反饋到用戶需求端。但是,無法在邊緣端處理龐大的視頻流信息,這主要是由于其資源受限特性,此外,邊緣端也不能滿足深度學習模型構建對計算資源的需求。故采用云計算與邊緣計算協同的方法來實現基于視頻內容的分析,既可以完成神經網絡模型構建的計算需求,又可實現輿情分析對實時性信息反饋的需求。
視頻邊緣計算以及云計算所解決的關鍵問題有所不同,云計算主要解決具有全局性的數據負載類型,該類負載對實時要求不高,但是需要實現對大規模連續書的處理與分析,能夠在長周期維護、業務決策支撐等領域發揮優勢。相比而言,邊緣計算更適用局部性、實時、短周期數據的處理與分析,能更好地支撐本地業務的實時智能化決策與執行。
3.3預期目標
實現一種基于視頻邊緣計算的行為識別系統,該系統通過視頻邊緣計算,對視頻數據中人的行為進行快速檢測和識別,根據真實的行為結果,對數據進行分析,提高輿情管理人員應對輿情事件的速度,引導輿情事件的良性發展。
由此可見,利用視頻數據獲取實時突發事件發生情況的機制,可以提供突發事件庫,當探測到突發事件發生,實時跟蹤突發事件的發展,并及時觸發報警功能。
4未來展望
隨著萬物互聯時代的到來,信息傳播和交互的途徑將越來越多,如何實時分析突發事件本身,并引導輿情向正向健康的方向發展,是未來突發事件輿情應對的主要考慮的問題。本文僅從視頻分析的角度來分析突發事件輿情態勢,還缺乏對異構多元數據的分析。例如,通過手機、監控攝像頭、生物感知設備等都可以獲取突發事件中行為信息,為突發事件輿情的全面解析提供更強有力的支撐。這些設想將在后續的研究中逐步實現。