馮玖江,瞿 輝,袁星勇,于興網(wǎng)
(重慶金美通信有限責任公司,重慶 400030)
隨著網(wǎng)絡和多媒體技術的不斷發(fā)展,多媒體業(yè)務逐漸在Internet應用中占據(jù)主導地位,用戶對手持終端的使用要求越來越高,使用方式不局限于簡單的文字消息、電話業(yè)務,更希望能集成視頻、圖片、短語音消息、狀態(tài)顯示、地理位置共享等業(yè)務。于是,融合通信技術應運而生,很好地將上述要求進行了融合統(tǒng)一。語音會議作為它的重要應用,逐漸被提上研究議程,越來越受到關注。
本文通過分析現(xiàn)有語音會議系統(tǒng)架構,提出了在終端側(cè)集中混音的分布式語音會議方法,并利用SIP協(xié)議優(yōu)良的擴展性實現(xiàn)SIP終端多方通話的信令接續(xù),完成語音會議功能。
目前,IP網(wǎng)絡上的語音會議系統(tǒng)主要采用SIP和H.323協(xié)議作為控制信令,采用RTP(RealtimeTransport Protocol,實時傳輸協(xié)議)作為語音流的傳輸協(xié)議,主要架構模型有信令集中式和語音集中式、信令集中式和語音分布式、信令集中式和語音組播式三種模型,拓撲分別如圖1、圖2和圖3所示[1]。

圖1 語音集中式處理模型

圖2 語音分布式處理模型

圖3 語音組播式處理模型
三種會議系統(tǒng)模型都是信令集中式處理,但是語音處理方式不相同,其優(yōu)缺點如下所述。
(1)語音集中處理模型
優(yōu)點:參與語音會議的終端用戶不需要自己進行混音處理,不需要關心其他參與者的語音編解碼類型。
缺點:需要預約會議,靈活性差;需要單獨部署會議服務器對會議進行管理和對語音進行混音,增加了部署成本;如果建立大規(guī)模會議或者會議室很多的情況下,會增加會議服務器的運行壓力。
(2)語音分布式處理模型
優(yōu)點:每個參與終端相當于一個混音服務器,不需要專門的會議服務器進行語音混音,降低了部署成本。
缺點:每一個參與語音會議的終端必須具有混音功能和會議管理功能,從而降低了會議參與的靈活性;每一個終端都會向其他所有參與終端發(fā)送混音后的語音數(shù)據(jù),導致語音數(shù)據(jù)的網(wǎng)絡開銷急劇增加。
(3)語音組播處理模型
優(yōu)點:會議參與終端需向網(wǎng)絡中指定的一個組播IP地址發(fā)送語音數(shù)據(jù),組播設備將收到的語音數(shù)據(jù)向網(wǎng)絡中的終端設備進行傳遞,降低了網(wǎng)絡開銷。
缺點:每一個會議參與終端需要具備混音功能和會議管理功能,從而降低了會議參與的靈活性;需要增加網(wǎng)絡組播設備,同樣增加了部署成本。
本文對語音分布式處理模型進行改進,會議模型中不需要單獨部署會議服務器和媒體服務器,只需要一個SIP信令服務器做信令轉(zhuǎn)發(fā),對語音混音的控制和會議管理都主要由語音會議召集終端執(zhí)行,語音會議拓撲如圖4所示。

圖4 語音會議拓撲
優(yōu)點如下:
(1)不需要預約,可以隨時建立、撤銷語音會議;
(2)對參與成員來說,語音會議只相當于一路普通通話;
(3)只對會議召集終端有混音功能和會議控制功能,對參與語音會議的終端沒有能力要求,一部普通SIP電話即可加入語音會議;
(4)互聯(lián)網(wǎng)中,任意一個具有會議功能的終端都可以發(fā)起一個語音會議,不需要單獨的會議服務器,可以實現(xiàn)多點分布式語音會議。
分布式語音會議拓撲如圖5所示[2-3]:

圖5 分布式語音會議模型
SIP協(xié)議能夠?qū)崿F(xiàn)發(fā)起、終止、修改會話參數(shù)等,但SIP并不提供會議控制服務,可以在其基礎上實現(xiàn)會議控制功能來建立、拆除一個會議[4]。
語音會議的信令采用SIP信令建立通話連接,沒有會議室的概念,所有會議參與方都是一路普通呼叫。當新的參與方接通后,語音會議召集終端將新的通話合并到已經(jīng)存在的通話中,從而完成一個語音會議的建立。會議建立流程如圖6所示。

圖6 會議建立流程
該系統(tǒng)設計不限制成員退出會議。當某一路參與者想退出語音會議時,直接發(fā)送BYE信令掛機,并關閉語音流即可退出。會議召集者如果要移除參與成員,向被移除成員發(fā)送BYE掛機信令,即可將該參與者移除當前會議。當語音會議中沒有參與成員時,語音會議自動拆除。會議拆除流程如圖7所示。

圖7 會議拆除流程
會議管理單元負責協(xié)調(diào)參與會議各成員的信令溝通,維護會話流程的建立和調(diào)度,可以對參與成員進行禁止發(fā)言和恢復發(fā)言的管理,可以邀請新成員或者移除新成員。邀請新成員進入會議,可以采用Dial-in方式,即成員主動呼叫召集者的URI,召集者在回復200OK的contact頭域中加入isfocus標識來表明自己是會議召集者。也可以采用Dial-out方式,會議召集者主動邀請會話參與者進入會議,在發(fā)送的INVITE消息的contact頭域中加入isfocus標識來表明自己是會話召集者。移除成員則直接向成員發(fā)送BYE信令;會議狀態(tài)管理采用SIP的REFER方法,將新加入的成員信息或者剛退出的成員信息通知給其他參與成員,其他參與成員則更新自己的會議狀態(tài)信息。會話管理流程如圖8所示。
媒體策略包括媒體混合單元和媒體控制單元。媒體混合單元是一個對語音媒體處理的部件,其功能是完成對語音的編碼、解碼和混合,目前能夠支持PCMA、PCMU、G.729的編解碼[5];媒體控制單元從網(wǎng)絡中收取RTP語音流,然后將語音載荷送到媒體混合單元進行處理,并根據(jù)會議管理單元的信令將媒體混合單元的語音數(shù)據(jù)通過RTP[6]發(fā)往對應的網(wǎng)絡地址。

圖8 會議管理流程
本文設計的終端側(cè)混音分布式語音會議能滿足基本的語音會議要求,可以實現(xiàn)簡單的會議管理。SIP作為業(yè)務控制信令實現(xiàn)簡單,且對SIP稍作擴展還可以實現(xiàn)更加豐富的功能。終端側(cè)的混音也降低了會議服務器的部署成本,是一個在性能和成本之間折中的較佳方案。