于紹晨
(中國移動通信集團設計院有限公司,北京 100080)
隨著3G業務和寬帶接入的高速發展,某國內電信運營商的移動和固網用戶的數量及帶寬增長迅速。如此龐大的用戶需求強烈刺激各類信息業務的發展,從而對IP網絡的結構和容量都提出了很大的挑戰。目前,由于國內的源站服務器(如新浪、網易、騰訊等)大都部署在其他運營商的IDC數據中心機房內,對于國內某運營商來說,這勢必帶來了以下問題:
某通信運營商和其他通信運營商的互聯互通上存在帶寬瓶頸問題,網間內容訪問帶寬受限,內網用戶訪問外網內容質量差,以及外網用戶訪問本網內容質量差,導致用戶體驗下降。
由于國內Internet資源,主要在其他運營商網內,某運營商必須依賴與其他運營商的網間鏈路帶寬,網間鏈路帶寬的擴容需要與其他運營商進行協商,有可能趕不上業務發展的需求。
為了解決以上問題,某運營商引入了Web Cache技術,從而有效減少網間出入流量,降低結算成本,提高用戶上網體驗。本文對某運營商Web Cache系統的全網部署方案進行論述。
Web Cache系統是在網絡中部署緩存系統,存儲互聯網中的熱點或特定內容,并引導用戶的訪問請求轉發到Web Cache系統中,當請求內容訪問命中,Web Cache系統直接將緩存Web數據返回給用戶,從而降低客戶訪問互聯網的時延,有效提升用戶訪問速度和業務質量、解決互聯網出口的擁擠問題,從技術上解決由于網絡帶寬小、用戶訪問量大、網點分布不均等原因所造成的用戶訪問網站響應速度慢的問題。
目前業界傳統的Web Cache系統技術實現方式主要包括策略路由、HTTP重定向和DNS重定向3種方式。
2.1.1 策略路由
策略路由方式指Web Cache系統旁掛在骨干網網間出口路由器上,當用戶請求的數據到達出口路由器時,路由器通過策略路由將用戶請求轉發到Web Cache系統。如果用戶請求的數據已經在Web Cache系統中緩存,即命中,Web Cache系統直接將數據返回給用戶。如果用戶請求的數據未在Web Cache系統中緩存,即未命中,Web Cache系統將主動到互聯網請求數據,將響應數據發送給用戶,同時在Web Cache系統中保留一份數據,從而達到一次緩存多次服務的目的。
2.1.2 HTTP重定向
HTTP重定向方式(HTTP 302重定向)主要針對HTTP GET應用層請求進行解析,在網間出口鏈路處部署深度分組解析(DPI)設備,DPI深度分析旁路復制的數據流量并把HTTP請求報文復制給全局負載均衡(GSLB)設備,全局負載均衡設備對HTTP請求進行判斷。若用戶請求的內容命中,即已經緩存在指定的Web Cache系統中,則將Web Cache系統相應服務器的IP地址返給用戶,用戶重新發起至Web Cache 的HTTP請求,并丟棄正常HTPP請求返回結果(網內速度快于外網返回的正常HTTP請求)。若用戶請求的內容沒有命中,則不對用戶請求進行任何操作,用戶等待正常HTTP請求并按照原來的路徑向外網獲取內容。
2.1.3 DNS重定向
DNS重定向方式指Web Cache系統主動或被動緩存網站的內容,通過配置相關策略劫持DNS解析請求,如果用戶訪問某網站(Web Cache已緩存),直接返回Web Cache系統的IP地址,由Web Cache系統響應客戶請求。DNS重定向的配置策略主要包括兩種途徑:
第一種是在DNS服務器上配置,由DNS服務器判斷用戶的DNS解析請求是否是訪問某網站。若是,則DNS服務器向用戶直接返回Web Cache系統的IP地址;若不是,則返回源服務器的地址。
第二種是通過在網間出口路由器上旁路部署DNS重定向系統,通過DPI設備復制用戶的DNS解析請求,由全局負載均衡(GSLB)設備判斷用戶是不是訪問某網站。如果是,則向用戶返回Web Cache系統的IP地址,如果不是,則不處理,由外網DNS服務器返回源站地址。
綜合考慮到以上幾種Web Cache技術,其中策略路由方式和HTTP重定向方式有以下不足之處:
策略路由方式為靜態路由,不能根據網絡狀態變化動態改變路由策略,將在網絡出現鏈路故障或設備故障時出現路由環路,引起整個網絡的震蕩,導致業務產生故障。
HTTP重定向方式大部分采用對HTTP大文件或HTTP下載進行重定向,很少對Web頁面的小文件(小于1Mbit/s)進行HTTP重定向,且用戶IE瀏覽器地址欄顯示的為Cache系統的IP地址,不為源服務器的域名,有可能會引起用戶投訴。
綜上所述,運營商一般均會采用DNS重定向方式進行Web Cache系統的部署。而對于兩種DNS重定向方式,由于修改全國31省的DNS配置,需要對省DNS進行統一管理和維護,會增加工程的復雜度。所以,運營商一般在全網部署Web Cache系統時,一般會采用在網間出口路由器上旁路部署DNS重定向系統的方式,此種方式對省DNS無改造需求,能夠更快速的部署。
采用DNS重定向方式建設Web Cache系統,根據其功能系統主要由3個部分組成,包括重定向系統(Redirector)、Web Cache系統和管理系統。具體系統架構如圖1所示。
(1)重定向系統:包括深度分組解析模塊和全局負載均衡模塊。
—深度分組解析(DPI)模塊:通過在網間出口鏈路進行無源分光,實現對網間數據流量的精確識別與解析。在識別出報文協議或會話類型后,支持按照指定的配置策略將滿足匹配條件的DNS請求流量轉發至全局負載均衡功能。DPI設備能夠支持配置轉發規則,規則可以是為指定協議類型、IP地址、端口號、流量方向、應用層特征等組合,處理時僅匹配滿足設定規則的IP報文,將滿足匹配條件的原始IP報文從指定接口轉發到全局負載設備。

圖1 具體系統架構圖
全局負載均衡(GSLB)模塊:處理由深度分組解析功能轉發的用戶DNS請求報文,根據資源分布情況、Web Cache系統狀態和IP地址配置,生成用戶的DNS請求響應消息。如果監測到Web Cache系統不可用,則不對用戶DNS請求做出響應;如果Web Cache系統運行正常,則將WebCache系統的IP地址作為DNS響應消息內容發送至最終用戶;
(2)Web Cache系統:包括負載均衡功能和Web Cache服務功能。
負載均衡模塊:對互聯網流量和緩存內容進行管理分配,提供多種負載均衡算法將數據流有效分發至Web Cache服務功能。
Web Cache服務模塊:通過緩存策略存儲互聯網資源,對于命中內容則直接向用戶提供服務,對未命中內容代理用戶向源站請求獲取相關內容,支持對緩存內容進行策略管理。
(3)管理系統:管理系統采用全網統一建設和部署的方式,提供Web Cache系統各功能實體的性能監測和系統配置等功能。
性能監測功能:支持對重定向系統和Web Cache系統的可用性、設備性能、網絡性能等指標進行實時監測。
系統配置功能:支持對需要實施DNS重定向的URL進行配置,例如TOP 100或者重點集團客戶的站點資源,提供熱點管理相關策略等參數的配置,要求配置的策略能夠自動在全網重定向系統和Web Cache系統上生效。
目前某運營商主要通過北京、上海、廣州3個骨干出口節點與其他國內或國外運營商進行互聯。對于Web Cache系統的部署,有兩種設置方式:集中放置和分散放置。
集中放置:在某運營商全網設置一套Web Cache系統,為全網用戶提供服務。
分散設置:在全網設置多套Web Cache系統,每套Web Cache系統分區域或分省為用戶提供服務。
綜合考慮兩種方案,集中建設全網一套系統,會導致全網用戶集中向一點進行訪問,增加Web Cache節點至全國各省的骨干網的帶寬,對現網路由器板卡影響大。而且單點系統故障,會影響全網用戶感知,造成訪問速度慢、質量差的問題。Web Cache系統分散方案系統設置更加靠近用戶,用戶體驗比集中設置較好,且對現網數據流量流向影響較小,若Web Cache系統故障,還可將訪問引流至其他Cache系統。
另外考慮到今后隨著Web Cache系統由獨立建設、獨立調度,向多點建設、跨域調度發展,會逐步形成分布式Cache系統。該系統的分布式理念和CDN是一致的,采用的都是將熱度最高的內容向最靠近用戶的位置存儲,并可跨域向其他節點調度所需資源。和傳統CDN的主要區別在于,Web Cache系統的內容是互聯網內容,通過用戶和第三方不感知的重定向方式將其緩存于系統中,而傳統CDN則是緩存和分發合作方的簽約內容,使用的是直接由第三方的DNS調度方式進行資源定向。
未來,通過對Web Cache的分布式系統建設,可以搭建出和CDN系統框架一致的分布式Cache系統,利用該系統可以支持被動緩存和主動內容分發兩種模式的服務。
所以, Web Cache系統采用分散設置方案,考慮Web Cache為初期建設,可在北京、上海、廣州3個骨干網出口節點設置3套Web Cache系統,在北京、上海和廣州的骨干網出口設置DPI和全局負載均衡設備,將熱點內容重定向到北京、上海和廣州的Web Cache系統中。
對于Web Cache系統,當業務發展迅速、出網流量更快增加時,可以在各省的省網出口部署Web Cache系統,將全網Web Cache系統升級為一級Web Cache系統,形成一級Cache和省級Cache兩級架構。兩級Web Cache系統均由一套全網管控中心進行內容的調度。
一級Cache為省網Cache提供緩存服務,減少省網Cache出網次數,降低出網流量。一級Cache網絡位置高于省網Cache,因此,一級Cache可截獲省網Cache的出網請求,并為其提供服務。同一個一級Cache對應多個省網Cache,因此,一級Cache將熱點內容存儲于本地,可避免多次出網。
對于全網的熱點內容,將TOP N熱點域名分成3組,北京、上海、廣州分別負責第一組、第二組和第三組的出網訪問,也稱為該組域名的出網訪問點。對于第一組的內容,只能由北京一級Cache出網訪問,上海、廣州如果需要訪問第一組的內容,直接向北京一級Cache請求。第二組/第三組的內容類似處理。通過Cache內容管理平臺對TOP N熱點域名進行分組,并以白名單形式下發給各一級Cache。
Web Cache系統在某運營商的部署,有效緩解了某運營商出網擁塞現狀,提高了服務質量,增加用戶滿意度,減少網間結算費用。隨著Web Cache系統的部署和技術的演進,運營商也可以慢慢將Web Cache系統作為CDN系統一部分,所以Web Cache 系統在運營商的部署是相當有意義的。
[1] 中國移動通信集團有限公司. 中國移動Web Cache系統總體技術要求1.0[S]. 2011.
[2] 中國移動通信集團有限公司. 中國移動Web Cache系統設備規范1.0[S]. 2011.