王許文
(國家廣播電視總局二八一臺,昆明 650051)
互聯網的普及性使用引發了數據信息量的暴增,使得大數據技術受到了重點關注與應用。對于廣播電視監測來說,在大數據背景下,需要監測的數據信息量、復雜程度顯著提升。為了保證監測質量,并降低相關從業人員的工作量,在該環節中引入大數據技術是必然選擇,需要依托大數據技術展開廣播電視監測方法的優化。
大數據技術主要指大數據的應用技術,其內容包含著各類大數據平臺、大數據指數體系等大數據應用技術。當前,大數據技術更多的圍繞著智慧城市、交通、醫療、城市規劃等多種領域展開應用,并不斷擴展至其他行業。依托大數據技術,能夠完成海量復雜數據收集整理與深入挖掘,了解數據間的關系,為最終決策的形成提供支持,保證決策科學合理。
廣播電視監測是依托廣播電視傳輸和覆蓋,廣播電視監測事業是伴隨著廣播電視傳輸和覆蓋事業發展而發展。當前,廣播電視監測的主要任務包括:監督檢查廣播、電視電波發射特性;監測廣播電視系統播出質量;收測廣播、電視信號接收效果;查明干擾與查明非法電臺;收測國外電臺對我廣播情況;收測頻譜負荷;與有關國家交換收測資料;觀測電波傳播情況等。為了在保障監測質量的基礎上降低相關從業人員工作量,在工作中引入大數據技術極為必要,也是行業發展的必然趨勢。
在大數據時代背景下,需要存儲的數據量、數據形式更多,原有的數據存儲方式難以滿足現有需求。此時,基于大數據的數據存儲技術發揮出了重要作用,特別是云存儲技術,能夠完成海量復雜數據的長時間存儲。在云存儲技術中,包含著通用云存儲(文件云\集群NAS)和視頻云存儲這兩種常見模式,在當前得到了大范圍的使用[1]。其中,在通用云存儲中,主要引入了集群技術、虛擬化技術、分布式存儲技術,能夠將存儲資源虛擬化;在視頻云存儲中,主要引入了集群應用、負載均衡、虛擬化、云結構化、離散存儲等技術,相比于通用云存儲而言,有著更好的性能以及更高的存儲量。
利用數據清洗技術,能夠提升數據信息的質量,并使得數據更適合挖掘,為后續的大數據挖掘分析提供支持。在實際的操作中,需要對現有數據庫進行整理,并對其中數據信息的真實性、有效性展開檢查。在此基礎上,引入數據清洗技術,對其中包含的重復部分、冗余部門完成剔除,防止由于人為篡改編輯而導致的數據庫真實性降低的問題發生。同時,依托ETRTG等數據清洗程序,能夠限定對數據清洗的訪問權限,進一步保證數據的有效性與可靠性[2]。
通過數據挖掘技術,可以從大量的、不完全的、多形式的數據中提取出隱含信息,實現數據信息的最大化利用。在這一過程中,可以依托統計方法、事例推理、決策樹、規則推理、模糊集、神經網絡、遺傳算法等工具完成數據挖掘與關聯分析。從實踐操作的角度來看,數據挖掘過程反復且循環,具體來說,若是某一步驟未達到預期目標時,則必須要再次返回前期步驟得完成重新調整與執行,直至達到理想目標。
在數據可視化技術的支持下,能夠將數據信息以更加直觀、容易理解的方式呈現出來,方便使用與進一步分析。大前,常用的數據可視化形式包括指示卡、折線圖、柱形圖、條形圖、扇形圖、面積圖、數據透視表、散點圖、氣泡地圖、樹形圖。在操作中,可以使用UDRE等數據可視化軟件完成。
依托大數據技術,能夠完成廣播電視數據監測系統的構建。在系統中,利用大數據分析技術、信息檢索、大數據挖掘技術等技術的融合,能夠對當前多種網絡社交平臺中的數據信息展開分析與管理。其中,系統中的信息監控采集單元能夠通過采集互聯網信息,實現原始數據庫的實時更新;采集監控信息單元通過對網絡存在的多語言信息數據的采集與分析,能夠確定國內外其他勢力或是敵對勢力的動態信息,特別是在當前香港暴動的背景下,該模塊發揮著重要的作用。在廣播電視數據監測系統中,由于引入了大數據技術,因此能夠對不同形式的信息數據(文字、圖片、音頻、視頻等)展開整合分析,并將其保存至數據庫中,為后續決策提供充足參考信息。
結合上文的分析能夠了解到,監測廣播電視系統播出質量等內容也是廣播電視監測工作的重點環節。在大數據技術的支持下,廣播電視監測就能夠更好的完成相應工作,實現對停劣播的分析與原因挖掘,為廣播電視系統播出質量的提升及服務優化提供參考。在這一過程中,需要結合數據庫中有關于節目播出的歷史數據,完成停播事故的次數、頻率、情況等信息的分析,確定不同時段廣播電視播放事故的產生原因。在此基礎上,落實薄弱環節的加強與管理優化,能夠達到提升廣播電視節目播放質量、降低播放事故發生概率的效果。
監測廣播電視節目或是網絡視聽節目的播出內容也是廣播電視監測工作中的重要內容。利用大數據技術展開音頻、數字圖像的處理,以及網絡視聽節目內容的分析,能夠為相關部門的決策判斷提供直觀的、充足的參考信息。以音頻處理分析來說,其流程主要如下:音視頻的輸入;特征提取;人工神經網絡分類;分類結果輸出。其中,在音頻特征的提取中,普遍會使用F0(基頻)和MFCC完成[3]。在人工神經網絡分類中,需要依托基于誤差逆傳播算法訓練的多層前饋網絡分類模型完成。在該環節中,應當引入三層以上的神經網絡,由于其具備精度更高的非線性逼近函數,因此可以對相對復雜的音視頻展開合理分類,進一步保證分類結果輸出的有效性。
結合大數據技術中的數據挖掘技術以及現有媒體技術,能夠完成原始數據信息的過濾與處理。同時,還能夠自動完成監測信息的內碼轉換,推動其迅速變化為智能模式,以此構建起完整的監測信息樹。例如,在實際的廣播電視監測工作中,可以依托自動技術完成關鍵詞的提取,并在此基礎上落實分類處理,最終形成分類模型。
除了自動形成模型外,大數據技術還支持信息數據的人工記錄,能夠保證相關工作人員可以結合實際情況手動編輯、更新數據信息。另外,在大數據技術的支持下,可以實現海量、復雜、多源數據的自動化過濾,避免下載垃圾文件的問題發生。
在廣播電視監測系統中,包含著信息檢測分析單元,主要完成了多源信息的檢索、監督管理。在完成數據的采集后,能夠立即展開數據分析,保證數據信息的質量;依托系統中的信息導航服務單元,可以自動進行監管信息報告的規范性形成,并確定各項信息之間的關系;利用搜索功能,能夠迅速提取系統中保存的違規信息,并完成網絡視聽節目的監管,一旦覺察出違規信息,可以立即反應并展開制止,避免惡性事件及其影響的進一步發展。
結合大數據技術,廣播電視監測還可以實現播放信息的事后查證。例如,依托錄像信息擴大檢索范圍,可以更準確的完成影響區域、用戶數量的確定;根據歷史事故信息以及發射機當前的運行狀態,能夠實現播放事故的預測等等。
綜上所述,為了保證廣播電視監測的與時俱進,在工作中引入大數據技術極為必要。通過在監控信息的采集、停劣播分析、內容監測、監控信息的處理、數據統計分析中引入數據存儲技術、數據清洗技術等面向廣播電視監測的大數據技術,提升了廣播電視監測工作的質量,保證了相應工作模式的先進性,同時也降低了相關從業人員的工作量,推動了廣播電視行業整體服務的升級。