章海軍


關鍵詞:異構冗余;容錯技術;播出系統;方案設計
目前,電視播出系統基本上采用設備級冗余備份的方式,關鍵設備(如視頻服務器、數據庫服務器、數據存儲陣列等)大部分采用雙機互備或三機備份方式,而播出系統層級熱備異構冗余應用比較少,主要為后備模式。如何設計電視播出系統安全防御機制,并使其在個別播出子系統存在安全隱患或發生故障時,仍然可以保障電視播出系統整體運行的安全性和可靠性,是一個值得研究的課題。本文以淮安市廣播電視臺融媒播總控平臺項目建設為例,采用異構冗余架構來組建高可靠性的電視播出系統,旨在為廣電行業的安全播出提供可借鑒的經驗。
1異構冗余的概念
電視播出系統的冗余容錯能力是衡量其安全可靠的指標之-[1]。在傳統數字電視播出系統容錯設計中廣泛應用硬件(設備)級冗余形式。隨著信息量、數據量的劇增,出現了播出系統的異構冗余設計。冗余容錯技術是通過增加一些具備同等功能、協調同步運行的播出子系統,并對它們的運行結果用投票的方式決定輸出,即使其中有一個或少數幾個設備或系統出現故障,也不會影響整個系統輸出的正確性,從而提高播出系統的整體可靠性[2]。但在n模冗余系統中使用完全一致的子系統或硬件設備、軟件模塊等作為并聯組件時,由于結構相同,在某些條件下很可能同日寸出現多個子系統或硬件或軟件同日寸失效,即所謂的“共模失效”。異構冗余模式的出現,極大地降低共模失效的概率[3],其并聯使用多個架構、功能或性能等價的異構組件。
異構冗余架構是保證電視播出系統可靠性的方法之一,并輔以出錯概率越小的表決機制,整個播出系統的安全性較高。
2冗余容錯設計涉及的相關技術
電視播出系統設計時要充分利用先進技術、行業標準及網絡化、IP化、智能監控手段,輔以多重異構冗余設計,有效杜絕系統設備或人工操作失誤導致的安全播出事故。電視播出系統設計時還必須考慮供電系統安全、機房環境安全、系統設備選型、系統智能監控監測、同步授時安全、應急播出措施等。
2.1數據容錯技術
數據容錯技術能夠對數據服務中斷進行有效控制[4],以提升備數據庫服務器接管的可靠性。針對電視播出系統的需要,在數據庫容錯技術上采用了數據復制技術。異構數據庫之間的數據復制使用分布式異構檢查點和日志技術來實現,捕獲數據的凈變化。異構數據庫之間的數據不一致時使用恢復機制進行數據恢復,以確保異構數據庫之間的數據始終保持一致[5]。
2.2容錯備份技術
在播出系統設備、軟件出現故障及其子系統崩潰的情況下,容錯備份手段可以確保整個系統仍能保持正常運行。眾所周知,電視播出系統中不得有單節點出現,即播出鏈路中不得有單節點設備存在。即便如此,如字幕機等出現故障時必須有相應的應急備份手段。同樣,單播出系統運行也是不允許的,播出系統中關鍵節點、唯一崩潰點及子系統的冗余備份是提高整個播出系統可靠性、安全性的有效方法,每個播出頻道必須至少具有兩套冗余播出子系統。有條件的播出機構每個播出頻道可以建設成主備、二備的三模異構冗余播出子系統。當其中某個或2個子系統發生故障時,系統會在無感情況下自動啟用冗余備份子系統,并替代應急播出流程,實現自動容錯備份。
2.3數據庫冗余備份
數據庫冗余備份類型有4種,異構冗余數據庫的構成有:不同類型的數據庫運行在相同或不同操作系統上,以及相同類型的數據庫運行在不同操作系統上三種形式。本項目中,SDI播出子系統中的數據庫采用“主備+二備”的三級異構冗余備份數據庫服務架構,IP播出子系統中的數據庫則采用“主、備虛機+物理機”冗余模式。在主備數據庫上配置雙機熱備軟件,二備及物理機則采用1臺獨立的機架式服務器通過分發訂閱方式做定時數據備份。在不同操作系統(Windows server 2019或Linux)上運行同種類型的數據庫(SQL Server 2017),并采用3個異構的冗余數據庫服務器可以提高系統的可生存性。在系統運行過程中,有必要對各個異構數據庫服務器中的數據進行同步,以免異構服務器間的數據不一致。
2.4文件系統冗余設計
為確保文件數據的安全,必須具備安全穩定的存儲環境。文件系統冗余備份主要包括將各種音視頻文件、文檔、文本等非結構化數據集中儲存在NAS服務器中。電視播出系統中設置有三級存儲:一級存儲(信號采集工作站)存儲的是采集素材;二級存儲(NAS)存儲的是已審核的待播素材(素材中轉與歸檔):三級存儲(播出服務器本地)存儲的是即將播出的素材。本項目中,二級存儲系統采用3節點H3CUniStor X10536 G3存儲陣列,其采用全對稱分布式融合架構,具有分布式全局緩存功能,可以有效提高集群讀寫性能,并具備保護數據能力,冗余組網時,其容災能力可確保文件系統業務正常運行。
2.5媒體數據過濾技術
采用媒體數據過濾技術可使異構冗余播出系統實現安全信息交換和資源共享。SDI與IP兩個異構播出子系統間配置安全網閘和防火墻,使用安全網閘以確保兩個異構播出系統間控制信息的擺渡,通過防火墻來共享待播素材文件。安全網閘的作用是切斷網絡之間的通用協議連接,系統內部通過身份認證機制獲取所需數據。當發現數據包存在安全隱患時會立即粉碎和丟棄。在主備核心交換機上各嵌入一塊防火墻板卡,隔絕SDI與IP兩個異構播出子系統間業務交換帶來的安全風險。媒體數據過濾技術確保了兩個異構播出子系統間數據的安全傳輸,達到了網間物理隔離要求。
2.6數據表決機制
多重異構冗余播出系統的數據表決可分為軟件表決和硬件表決。其硬件設備就是播出系統中常用的二選一、三選一、四選一等自動倒換器,其內部完成的輸入表決屬于軟件表決。以四選一為例,采取三取一表決,即系統選取3個子系統輸出信號中的正常的、選先級高的那一路信號作為表決結果,第4路為應急播出信號(如墊片信號、應急錄像機信號等)。如3個子系統選先級由高到低順序為子系統1、子系統2、子系統3,當檢測到某個子系統工作異常時,四選一會自動拒絕其送來的錯誤數據,啟用其數據表決真值表來選用另外2個中優先級別高的子系統的輸出數據,以確保系統持續運行。
3基于(mSDl+nIP 2的異構冗余電視播出系統方案設計
3.1SDI與IP異構播出子系統設計
3.1.1SDI播出子系統安全設計
淮安市廣播電視臺SDI播出子系統框圖如圖1所示,系統由主備冗余數據庫服務器、上載系統、二級存儲陣列、應急錄像機、視頻服務器、16X4切換器、鍵混、智能化模塊化周邊信號處理板卡及控制計算機等組成。
系統配有4通道GV I/O高清視頻服務器2臺來完成淮安市廣播電視臺3個高標清同播頻道的播出業務,3個SDI播出子系統均配備2臺視頻服務器中的1個通道作為冗余播出通道,2臺視頻服務器的第4個通道均設置為應急上載通道。
SDI播出子系統的控制系統采用VDCP和AMP等控制協議,系統中配置了RS422服務器、主備冗余播出控制工作站和相應的播控狀態監測切換軟件,并采用松耦合播出方式,確保視頻服務器可以在非常時期獨立完成播出業務。
3.1.2IP播出子系統安全設計
IP播出子系統采用目前最先進的SMPTE ST2110標準,擁有獨立的IP信號源、IP信號處理、IP信號調度、控制系統、IP信號采集與播出、系統授時、數據庫及存儲陣列等,與SDI播出子系統完全異構,具有可靠性、安全性和可操作性。IP子系統的引入,使電視播出系統輕量化,同時大幅降低系統建設成本。
如圖2所示,IP子系統配有2臺主備冗余IP播出矩陣,以實現其“聯動”運行。總控IP調度矩陣、2臺主備冗余IP播出矩陣(光纖萬兆交換機)輔以集中控制中心共同構成IP播出子系統的SDN控制平臺,為3套IP子系統的數據分發、控制及SDI Over IP信號的傳輸、調度服務提供支持。采用虛擬化資源平臺,構建出集IP調度、內容匯聚、IP播出、內容遷移與轉碼于一體的完整的播出系統業務鏈。IP子系統采用PTP/BB同步,并配有同步授時冗余系統。
IP子系統使用了10臺通用DELL R740物理服務器,并通過集群作為數據處理和視頻內容處理的資源池,通過虛擬化服務從資源池中虛擬出6臺性能較高的虛擬服務器作為IP播出服務器,單個頻道的主、備IP播出服務部署在不同的服務器上,其他代理服務分配在其他虛擬服務器上,這樣分配可以將每個服務器的物理資源利用率達到最大化的同時,又確保了系統安全運行。IP播出服務虛機負責IP流切換、鍵混及服務代理等節目播出業務,輸出的IP流經IP網關卡封裝成HD-SDI信號,最終送到主備HD-SDI四選一的第3路輸入端。
IP子系統中的數據庫則采用“主、備虛機+物理機”,即“2+1”冗余模式。主備數據庫部署在2臺不同的通用物理服務器的虛機上,并通過“雙機熱備份+Rose HA軟件”實時鏡像,具備故障自動切換、IP地址自動接替的功能,系統中還有1臺獨立的物理服務器通過分發訂閱方式做定時數據備份。
3.2(2SDI+IP)2的三模異構冗余播出系統設
淮安市廣播電視臺每個頻道的播出系統設計采用(2SDI+IP)2的三模異構冗余播出架構,其中三模是2個SDI和1個IP播出子系統,2個SDI子系統是采用主、備獨立播出鏈路。2次方指的是2個SDI子系統和1個IP子系統組合在一起后,其安全防護級別是指數級增加。2個同構的SDI播出子系統與異構的IP播出子系統互為系統級的冗余備份。異構冗余播出系統配有主備SDI四選一自動倒換器,其輸人為2個SDI子系統、IP子系統輸出及應急播出4路HD-SDI信號,主備SDI四選一輸出的主備播出信號送人編碼復用傳輸系統的同時,變換成標清信號,實現高標清同播(如圖2所示)。若2個SDI播出子系統出現系統級崩潰,則IP播出子系統能接管其所有頻道播出業務。
4結束語
淮安市廣播電視臺的(2SDI+IP)2三模異構冗余電視播出系統經過精心設計、規范施工、測試驗收等流程,目前已正式投入運行,實踐證明,異構冗余電視播出系統的設計使用,不僅提高了電視播出系統的可生存性,還避免了系統級崩潰帶來的停播事故,實現了系統設計的預期目標。