廖偉全,喻林峰,李繼龍,江 圣,周圓圓
(中國移動通信集團廣東有限公司韶關分公司,廣東 韶關 512099)
GPON(Gigabit-Capable PON)主要由 OLT、無源光分配網和ONU組成,是基于ITU-TG.984.x標準的無源光綜合接入標準。GPON具有高帶寬、高效率、大覆蓋范圍、用戶接口豐富等眾多優點,促成OLT承載更多的功能業務[1]。GPON采用單纖雙向傳輸機制,在同一根光纖上使用WDM技術,用不同波長傳輸上下行數據,其中下行數據流采用廣播技術,上行數據流采用TDMA技術。
城域網一般由核心層、匯聚層和接入層構成。以廣東某運營商為例(如圖1所示),城域網設備主要有CR、BNG、SR和SW等,GPON以FTTx形式出現,并主要承載運營商的家寬、專線和IPTV等業務。為實現業務保護,OLT雙上聯城域網被運營商列入備選建設拓撲[2]。因各種業務雙路由承載協議不同,對OLT雙上聯鏈路有效利用提出了挑戰。當雙上聯鏈路出現不均衡時,將影響鏈路數據包時延,嚴重時將影響用戶感知。因此,需要對OLT雙上聯鏈路均衡方案進行研究和分析應用。

圖1 某運營商城域網與GPON拓樸
城域網與GPON組網中,互聯網專線業務流為PC-ONU-OLT-SW/BNG,專線客戶均是公網地址接入。接入方式分為雙上聯城域網SW場景和雙上聯BNG場景。在OLT直聯BNG場景中,通過VRRP+BFD進行OLT雙上聯保護,可提高主鏈路中斷時鏈路切換到備用鏈路的速度和可靠性[3];而在OLT雙上聯SW場景中,雙上聯保護通過在SR/BNG與OLT之間配置單臂BFD+VRRP協議來實現主備保護。當OLT到SR之間多段鏈路中斷后,業務切換到另一條鏈路[4]。如圖1所示,當OLT01-SW01-SR01之間出現斷點,會觸發BFD協議down,從而使SR01下聯端口down,引發VRRP倒換,業務切換到OLT01-SW02-SR02鏈路承載。上述保護中,專線業務在某一時刻只能使用主鏈路承載業務,備用鏈路是空閑,但也可以通過平均分配VRRP網關到兩臺BNG/SR來基本實現雙路由負載分擔[5]。
城域網與GPON承載的寬帶接入業務ADSL主要采用PPPoE協議進行認證上線。PPPoE協議認證的工作流程包含發現和會話兩個階段,如圖2所示。

圖2 PPPOE客戶端認證流程
1.2.1 發現階段
(1)客戶端在本以太網內廣播一個PADI包,包中包含主機想要得到的服務類型信息;
(2)以太網內的所有BRAS/BNG設備(PPPoE接入服務器)在收到初始化包后,將其中請求的服務與自己能提供的服務進行比較,其中可以為此主機提供此服務的寬帶遠程接入服務器發回PADO包;
(3)客戶端可能收到多個BRAS/BNG的PADO包,主機通過PADO的內容,依據一定的條件從發回PADO包的可提供服務的BRAS/BNG中挑選一個(一般選擇最先到達),并向它發回一個會話請求包PADR(非廣播),這個包中再次包含所想得到的服務信息;
(4)被選定的BRAS/BNG收到會話請求包PADR后,開始準備進入PPP會話階段。它會產生一個會話標識,以唯一標識它和主機的這段PPPOE會話,并把這個特定的會話標識包含在會話確認包PADS中發回給主機。如果沒有錯誤發生,就進入到PPP會話階段。而主機在收到會話確認包后,如果沒有錯誤發生,也進入到PPP會話階段。
1.2.2 會話階段
會話階段和數據傳送階段與PPP協議相同。主要是BRAS/BNG將客戶的帳號、密碼、VLAN/邏輯接口信息傳遞給AAA服務器進行認證,通過認證后,BRAS分配地址給客戶,然后就可進行數據通信。
現有通過實時監測OLT下聯口鏈路質量和流量,然后用貪婪算法周期性調整OLT下聯口帶寬占用量,以進行流量均衡[6],但對OLT雙上聯均衡卻停留在基于MAC奇偶地址的負載均衡。當OLT雙上聯兩臺BRAS/BNG時,PPPoE協議在發現階段會選擇最先到達的PADO包進行下步認證通信。通過在BRAS01/BNG01子接口上對偶MAC地址客戶配置接入延時(如延時100 ms),而在BRAS02/BNG02子接口上對奇MAC地址客戶配置接入延時(如延時100 ms)。上述設定將使BRAS01/BNG01的PADO包先于BRAS02/BNG02到達奇MAC地址客戶,并使奇MAC地址客戶選擇BRAS01/BNG01進行后續的認證和通信,即選擇路由OLT到BRAS01/BNG01承載數據流量。反之亦然,偶MAC地址客戶選擇路由OLT到BRAS02/BNG02承載數據流量。上述在BRAS/BNG配置奇偶接入時延,將使奇偶MAC用戶數據在OLT雙上聯鏈路進行負載分擔。
IPTV業務一般包含點播和直播業務。點播和直播實現協議有所區別。點播仍使用單播路由協議,而直播使用組播路由協議。
1.3.1 點播雙上聯保護與承載介紹
視頻點播有多種認證方式。為便于控制,現在運營商一般采用DHCP開機認證接入[7]。廣東某運營商點播客戶端認證流程如圖3所示。

圖3 點播業務認證流程
(1)用戶開機,發出DHCP Request。
(2)BRAS設備收到DHCP Request先緩存下來,將用戶的VLAN、邏輯端口等信息向Radius Server上報。
(3)Radius Server根據BRAS設備送來的邏輯端口、用戶名、密碼進行認證,并將認證結果返回給BRAS設備。
(4)如果認證通過,BRAS完成DHCP Relay功能,并中轉用戶發出的DHCP Request。
(5)DHCP Server下發IP地址給用戶。
(6)用戶獲取地址后,客戶可正常使IPTV平臺進行點播。
通過在BRAS01/BNG01子接口上對偶MAC地址客戶配置接入延時(如延時100 ms),而在BRAS02/BNG02子接口上對奇MAC地址客戶配置接入延時(如延時100 ms)。上述設定將使BRAS01/BNG01分配的地址先于BRAS02/BNG02到達奇MAC地址客戶,并使奇MAC地址客戶選擇BRAS01/BNG01分配的地址進行后續通信,即選擇路由OLT到BRAS01/BNG01承載數據流量。反之,亦然,偶MAC地址客戶選擇路由OLT到BRAS02/BNG02承載數據流量。通過上述配置,將使奇偶MAC點播用戶在OLT雙上聯鏈路進行基于奇偶MAC地址的負載分擔。
1.3.2 直播雙上聯保護與承載介紹
PIM是Protocol Independent Multicast(協議無關組播)的簡稱,可利用單播路由協議生成的單播路由表為IP組播提供路由。組播路由與所采用的單播路由協議無關,只要能夠通過單播路由協議產生相應的組播路由表項即可。PIM借助RPF(Reverse PathForwarding,逆向路徑轉發)機制實現對組播報文的轉發。當組播報文到達本地設備時,首先對其進行RPF檢查。若RPF檢查通過,則創建相應的組播路由表項,從而進行組播報文的轉發。當OLT雙上聯BNG時,將根據BNG組播子接口的PIM優先級選舉一臺BNG復制組播流量到OLT。當一條鏈路故障時,自動切換到另一路由。而在OLT01-SW01-BRAS01場景中,OLT只能邏輯上單上聯一臺SW01。當主鏈路有問題時,采用手工切換方式將鏈路切換到另一條OLT01-SW02-BRAS02路由。因此,直播只能占用一邊鏈路傳輸數據包。
經統計某運營商城域網流量情況,網絡忙時超過90%流量是家寬、點播和直播業務。此三種業務導致OLT雙上聯流量不均因素有:
(1)直播業務只能走OLT單邊鏈路;
(2)不同用戶對應的網絡流量存在差異;
(3)OLT承載的PPPoE和IPoE用戶MAC奇偶數比值不對稱(可達到1:2及以上),使兩臺BRAS/BNG接入用戶數量和流量不對稱。
針對第三點,廣東揭陽某運營商提出優化方案(下面簡稱揭陽方案),分別在配對的兩臺BRAS/BNG中,給OLT的每個外層VLAN配置2個子接口。利用這兩個子接口按100為步進基數,間隔地設置1 000~2 999的內層VLAN,在兩個子接口中分別配置互為交叉的奇偶響應延時策略,盡可能控制用戶使其平均分布到配對BRAS/BNG,使得配對BRAS流量盡可能均衡。此方案需要配置大量數據,因此限制了推廣。
經過對主要業務負載均衡分析,現匯總OLT主要承載的家寬、專線和電視業務對OLT雙上聯鏈路承載情況表,如表1所示。

表1 OLT雙上聯鏈路承載業務情況
經統計某運營商流量情況,網絡的流量忙時為晚上7點到10點。考慮到晚忙時超90%流量是家寬和IPTV業務,本文提出一種實時提取OLT雙上聯BRAS鏈路利用率,并計算兩條鏈路利用率的絕對值。當絕對值超過10%時,通過實時抑制BRAS/BNG下聯OLT的PPPoE與IPoE用戶數來實現OLT雙上聯動態流量均衡的方案。
主要實施流程為:
(1)使用一臺操作系統為CentOS的服務器搭建LNMP環境(Linux系統下Nginx+MySQL+PHP網站服務器架構),同時安裝開源zabbix系統。服務器與城域網設備通過內網對接,zabbix系統使用SNMP協議實時采集OLT雙上聯流量和鏈路利用率,并保存到mysql數據庫。
(2)OLT動態流量均衡系統監控程序實時計算OLT雙上聯兩臺BRAS鏈路利用率的絕對值,同時計算兩條鏈路利用率的平均值,取平均值加上5%為高閾值,取平均值減去5%為低閾值。當絕對值連續9 min(為避免頻繁調整,所以設定9 min穩定時間)超過10%且上聯鏈路利用率超過45%(考慮鏈路利用率低于45%時屬于輕載不調整)時,調用均衡程序。
(3)OLT動態流量均衡系統均衡程序。對鏈路利用率高的鏈路的BRAS接口,增加PPPoE和IPoE用戶認證接入時延,使新增用戶均優先從輕載鏈路上線,從而減少兩條鏈路流量的差值。
(4)OLT動態流量均衡系統監控程序發現連續9 min內原重載鏈路利用率比低閾值小,則恢復PPPoE與IPoE用戶的接入時延。
為驗證OLT雙上聯動態流量均衡方案有效性,下面對廣東某運營商二臺典型的OLT在晚上7點到10點時間段的均衡性能進行測試。
OLT02雙上聯BNG,兩邊帶寬分別為1 GE,現比較現狀均衡方案和動態流量均衡方案效果。從圖4可看到,基于奇偶MAC地址均衡的現雙上聯鏈路利用率相差較大,而用動態流量均衡方案的雙上聯鏈路利用率比較接近。圖5展示了兩種方案雙上聯鏈路利用率絕對值的曲線,可看出新方案的絕對值均小于現方案。另外,現方案絕對值的平均值達到了42.1%,而新動態均衡方案鏈路利用率絕對值的平均值為5.06%,效果明顯。

圖4 OLT02兩種均衡方案的鏈路利用率

圖5 OLT02采用兩均衡方案鏈路利用率絕對值比較
OLT01雙上聯SW,兩邊帶寬為2 GE,現比較揭陽方案(針對家寬和點播)和動態流量均衡方案效果。從圖6可看到,揭陽方案雙上聯鏈路利用率相差較大,而動態流量均衡方案的雙上聯鏈路利用率較接近。圖7展示了兩種方案雙上聯鏈路利用率絕對值的曲線。可以看出,動態均衡方案的絕對值基本小于揭陽方案。另外,動態均衡方案鏈路利用率絕對值的平均為5.27%,而提陽方案鏈路利用率絕對值的平均值達到了14.35%,均衡效果明顯。

圖6 OLT01兩種均衡方案的鏈路利用率

圖7 OLT01采用兩均衡方案鏈路利用率絕對值比較
OLT雙上聯是保障OLT流量安全的一種保護措施。為有效利用雙上聯鏈路,通過部署OLT雙上聯動態流量均衡方案,可有效應對家寬和電視等業務引起的流量不平衡。使用少數服務器部署開源軟件,可實時采集流量數據并進行流量均衡,成本低。OLT雙上聯在大部分地市有部署,可復制性高;現均衡方案在鏈路不均衡時,只能采用手工方式進行均衡,效率低。綜合考慮成本、效率、復制性,認為OLT雙上聯動態流量均衡方案存在推廣應用價值。