路士華,劉 冰
(教育部教育管理信息中心,北京100816)
教育部網絡高清視頻會議系統體系化保障探索
路士華,劉 冰
(教育部教育管理信息中心,北京100816)
教育部網絡高清視頻會議系統覆蓋教育部本級、各教育廳、局(教委)、計劃單列市教育局、兵團教育局及部直屬高校,共計112個接入會場。由于會務頻繁,參會級別較高,再加上整個系統接入點較多,各地保障能力、技術手段千差萬別,帶來了極大的管理與協調難度,使整個運維保障工作面臨極大壓力。視頻會議系統主會場與各分會場運維團隊經過近五年的努力與協同,形成了一套運維保障體系,覆蓋管理制度、人員保障、技術手段等方面。通過實施預備測試、會前準備、會中調度、會后總結的全生命周期會務管理,以及采取定期巡檢與分會場單點聯調測試等日常保障方式,確保了整個系統安全穩定運行。通過本系統召開過多次重要會議,節約了大量的會務成本,取得了比較好的綜合效益。
高清視頻會議;教育部;網絡;會務管理;運維保障
為了嚴格控制會議經費,越來越多的單位開始建設自己的視頻會議系統,采用網絡視頻的方式召開工作會議,有三點明顯的優勢:一是成本節約,極大地節約了直接、間接會務、參會人員的經濟與時間成本,如會務管理時只需預留視頻會議系統、網絡帶寬、會議室等資源,而無需像傳統會務考慮參會人員的各類保障問題;二是覆蓋人員更廣,能夠覆蓋更廣泛的參會人群,理論上分會場只要網絡可達且具備權限即可接入參會而不受場地限制;三是會議隨時可安排,如數萬人參加的會議,傳統會議要耗費數月時間去組織協調,而網絡視頻會議則隨時可以舉辦。
不過采用網絡視頻會議系統也帶來了新問題,主要有:一是穩定性問題,由于網絡、設備設施的故障,存在分會場、主會場掉線,會議全體或部分中斷的情況,影響正常會務進程;二是安全性問題,會面臨網絡黑客入侵竊聽等隱患。由于網絡視頻會議通常參會人員較多,出現問題后帶來的負面后果也會比較嚴重,因此如何確保網絡視頻會議系統安全穩定運行變得十分重要,這也是本文著重討論的問題。
教育部網絡高清視頻會議系統作為教育信息化的重要應用,既是教育系統轉變工作方式、改進會風、提高會議質量和工作效率的重要手段,也是教育系統應急指揮的重要平臺。教育部作為國家主管教育工作的部委,非常重視網絡視頻會議系統的建設,早在2006年便開始使用一套純軟件的網絡視頻會議系統,其優點是建設成本較低,缺點是系統穩定性差,操作繁瑣。隨著技術進步以及老系統故障頻繁,教育部于2010年開始啟動了網絡高清視頻會議系統建設工作,于2011年4月建成并投入使用。
目前投入使用的教育部網絡高清視頻會議系統覆蓋范圍廣,共有112個分會場節點。系統在設計時采用基于H.323協議標準的硬件MCU設備和硬件視頻會議終端設備組網,設計標準是達到1080P的高清視頻效果。
教育部網絡高清視頻會議系統由教育部主會場進行統一集中管理和控制。設備配備方面:主會場配備了兩臺MCU(一主一備)、錄播服務器、會議管理系統、音視頻設備等,每個分會場部署一臺視頻會議終端、音視頻設備等;網絡方面:為確保信息安全,由教育科研網提供邏輯獨立的專網保障,主會場兩條100Mbps雙活接入、所有分會場至少10Mbps接入,每個會場的IP獨立,各會場之間網絡雙向可達,但域外不可達,專網只限于網絡視頻會議系統使用。
教育部網絡高清視頻會議系統拓撲如圖1所示。

圖1 教育部網絡高清視頻會議系統拓撲架構圖
作為備份和應急手段,除高清視頻會議主系統之外,還建立起一套基于WEB的實時錄播/直播系統,稱之為備用系統,每次會議召開時兩套系統同時運轉,當某分會場無法訪問主系統時,可以通過WEB在專網上收聽收看備用系統直播。
自2011年建成到目前運轉已接近五年,在實際運維過程中也發生過多次問題,這些問題集中體現在:
(1)核心設備不穩定。由于分會場較多,對于資源消耗較大,導致在實際運行時MCU設備本身存在運行不穩定、故障率偏高。
(2)會議協同調度難度較大。由于分會場數量龐大,協調與保障難度極大,以會前點名為例,完成上百個單位的會前點名需要耗費數小時。
(3)分會場保障能力不一。分會場保障能力各不相同,有些高校技術力量強,問題較少,有些省廳保障人員薄弱,問題多發;再加上分會場技術保障人員有一點流動性,經常面臨接續的難題。
(4)終端設備返修率較高。每次開會都會有數個分會場視頻會議終端設備出現硬件故障,影響參會。
(5)缺乏完善的監控與定位手段。出現問題之后難以在第一時間定位其產生的原因,一些重大問題發生時,經常出現瞬間主會場技術支持熱線被打爆的局面。
經過認真梳理分析上面的問題,我們認為教育部網絡高清視頻會議系統參會級別較高,規模大,組網方式特殊,各個分會場環境條件多樣,系統運行維護的難度和復雜性都比較大,在運維保障時不能頭疼醫頭、腳疼醫腳,必須形成一套體系化的運維保障模式,依托現有系統與手段,通過體系化去應對問題、緩解問題、解決問題。
整個體系化運維管理包括組織管理、人員保障、網絡環境保障、設備設施保障、系統安全保障等多個方面。
下面具體談一下我們采用的保障思路和工作模式:
(一)組織管理
1.由教育部辦公廳、教育部教育管理信息中心、CERNET網絡中心共同建立運行保障工作小組,對視頻會議召開、系統運行、主干網絡保障等進行統籌協調和管理。
2.建立規章制度,規范操作流程。建立起覆蓋會務全生命周期的分階段保障機制,制訂了相應的應急預案,明確崗位職責并制定了相關管理制度。
主要包括:
(1)預備測試階段,每次正式會議之前進行系統測試,測試工作完全按照第二天開會進行針對性模擬,會安排所有分會場的點名,主備MCU切換、主備鏈路熱切換。
(2)會前準備階段,會議開始前半小時所有單位上線,進行會前各項技術準備工作。
(3)會中調度階段,對分會場進行輪詢,對存在問題的分會場進行針對性記錄、處置與隔離。
(4)會后總結階段,每次會后要求分會場提交電子反饋單,并對反饋單進行統計分析,同時對每次會議的音視頻材料進行及時歸檔。
每次會議后會統計存在的問題,由于組織大型視頻會議需要各方配合,對不配合的分會場也會通過統計數據去進行針對性批評、通報等。
建立起日常巡檢、單點聯調測試工作機制,對于主會場核心設備設施進行例行巡檢,對于分會場單點不定期或者應其要求進行單點聯調測試,每年會定期安排工作人員去各分會場巡檢與調研,協調解決發現的問題。
建立完善的溝通機制,教育部主會場設立了固定電話、移動電話,建立了視頻會議專用即時通訊群,使教育部主會場和各分會場會議管理人員能夠及時交流和溝通。特別是利用即時通訊手段,在會議召開期間,分會場可以隨時向主會場反饋出現的問題,主會場管理人員也會將主會場的情況通報給各分會場。
3.人員保障。運維保障涉及視頻會議系統管理、網絡中心、行政管理等多個部門,涵蓋視頻會議核心設備、網絡設備、音視頻設備等,需要配備不同專業的人員。將視頻會議進行崗位分工、階段分工、工作流程化、標準化,集中體現為重新梳理視頻會議各崗位,如主會場設立了視頻會議操作崗、錄播系統操作崗、音頻操作崗、視頻與攝像操作崗、接線與在線問題處理崗、主會場網絡操作崗、機房保障崗、主干教育科研網協調崗、技術總協調崗,其中技術總協調員采用A、B角,人員崗位相互之間可輪換替補,一人兼多崗,組成一支五至八人保障團隊。根據會議的規模、重要程度,靈活安排工作保障人員,最低五人,最高八人。
團隊內部加強重要的技術文檔管理,對業務技能進行定期培訓;對分會場保障團隊進行電話或網絡指導,并借助于互動交流群,鼓勵分會場之間相互解答、相互協同。
(二)設備設施保障
教育部網絡高清視頻會議系統涉及網絡、視頻會議專用設備、會場音視頻設備等方面,任何一個環節出現問題,都會對視頻會議的召開效果造成嚴重影響。
網絡是視頻會議系統的重要基礎設施之一,網絡的好壞直接影響到視頻會議召開的效果,甚至能決定會議的成敗。網絡環境保障是視頻會議系統保障的重要環節。教育部網絡高清視頻會議系統運行于中國教育和科研計算機網 (CERNET),CERNET主干網通過網絡帶寬預留、優先級服務等措施,為教育部網絡高清視頻會議系統提供網絡通信保障。
各分會場單位就近接入CERNET主干節點。視頻會議會場使用獨立的接入層網絡設備,配置為獨立網段,不與其他應用共享。會場網絡以盡量少的跳數,如果條件允許,最好直接連接到本單位CERNET網絡出口。在單位內部網絡的各個環節采取有效措施,為視頻會議系統預留10Mbps以上的有效網絡帶寬。加強網絡安全管理,防止網絡攻擊,采用安全控制策略,從網絡方面保證系統的整體安全。
對關鍵設備設施采取多重備份措施,包括對視頻會議核心設備、光纜鏈路、網絡設備進行冗余熱備;建設錄播系統、基于PSTN的普通電話會議等備份系統,一旦視頻會議主用設備、主干光纖鏈路出現問題,利用備份系統保障會議的順利進行。
對主系統進行經常性壓力、功能測試,并詳細記錄每一次故障發生的原因以及應對措施,經過多年積累基本掌握主系統的實際能力,避免了系統手冊上認為沒有問題,但實際上會造成不可預見局面的操作。
(三)應急處理
在視頻會議召開期間,時常會遇到突發事件。一旦出現故障,應在第一時間判斷出故障的性質、發生的部位及影響的范圍,分清是網絡問題、視頻會議設備問題,還是會場音視頻設備的問題非常關鍵。
為了智能定位問題,自主研發了覆蓋全體會場的網絡監測系統,通過圖形化方式即時定位問題,如對于一個分會場有可能是終端設備故障,也有可能是出口網關故障,也有可能是終端設備達到出口網關這一段網絡故障,通過研發的監測系統能夠三段式同步監測,通過不同的顏色標識可以定位故障發生的區域,如圖2所示。

圖2 實時監測效果
在制度層面建立了基本的應急保障預案,根據問題的級別進行預案響應。在日常測試時對預案進行定期演練,包括:模擬鏈路中斷,進行熱切換;模擬設備故障,進行主備切換等。
經過上述體系化保障,有效提升了系統的整體穩定性,對轉變作風、提升效益做出一定貢獻,較好地保障了重要會議,取得了非常好的效果。如:部分重要會議突破場地空間限制,參會總人數可達數萬人,能夠將指示精神更準確傳達至具體執行人員;某單位使用本系統進行出國留學行前培訓,傳統方法是分片對上萬學生進行培訓,耗費數月時間及幾十萬經費,采用本系統后,只需一天時間,節省了大量的時間與經濟成本。
不過視頻會議主系統從根子上不穩定的局面并未完全解決,終端設備故障率偏高問題也沒有完全解決,但通過上述體系化運維保障盡量避開有可能帶來不穩定的操作,盡可能提升主系統的穩定性。另外在下一步工作中也將重點考慮對現有系統的升級改造。
[1]張偉,丁朝暉.基于等級保護的高清視頻會議系統保障體系研究[J].信息網絡安全,2012(z1).
[2]李偉.淺談視頻會議的風險管控[J].數字通信世界,2014(7).
[3]李立華.網絡視頻會議保障實施辦法探索[J].中國信息化,2013(6).
[4]余前佳.國土資源視頻會議系統技術保障方法探討[J].國土資源信息化,2011(5):35-37.
(編輯:王天鵬)
TP393
A
1673-8454(2016)09-0012-03