陳紫兒 王洋 李雨泰 柳瑞春 張寧
關鍵詞:數據中心;拓展分布DNS;建設意義;功能分區;設計方案;技術實現
1引言
隨著信息化的飛速發展,許多云服務提供商會贈送一些初始的云存儲資源,從2GB~16GB的云存儲空間不等。對于微型和小型企業而言,這些贈送的云存儲空間已經足夠滿足企業日常的數據存儲所需。但是,對于大中型企業或組織來說,云服務的實際成本必須落在某個地方。換言之,必須以某種方式為云服務付費[1]。從端到端云基礎設施的角度來看,大部分成本(資本支出和運營支出)都在數據中心設施內。數據中心允許數據中心管理員為大量租戶提供數據中心資源的細粒度分配,同時優化數據中心資源利用率。在此背景下,如何在現有數據中心基礎上,提供更加安全的數據存儲、實現數據的統一管理、降低數據中心的建設成本、減少數據中心運行能耗,成為從業人員需面對的難題。本文據此為出發點,探索基于擴展分布DNS的數據中心的建設方案,以期為從業人員的研究和實踐提供一定的參考與建議。
2擴展分布DNS的數據中心建設意義
隨著數據中心規模的擴大,對服務器、存儲和網絡的電力及冷卻要求也越來越高[2]。2001年,世界上超過10MW電力的計算機中心屈指可數:2011年,這樣的數據中心有幾十個,很多大廠商都在規劃60~70MW的數據中心(足夠運行一個小城市的電力);2021年,中國超70MW的數據中心數量已經過百[3]。雖然大部分電力和冷卻都被服務器和存儲消耗,但當數據中心達到這些水平時,所有設備(包括交換機和數據中心網絡)的電源效率都變得至關重要。在此背景下,開發更加高效、能耗更低、服務更全的數據中心迫在眉睫。在這方面,巧妙應用域名系統(DNS)及其安全擴展DNSSec,提供了應對數據中心建設挑戰的關鍵機會。長期以來,DNS在連接Internet上的服務和用戶方面起著至關重要的作用。在其最基本的形式中,它將人類可讀的域名轉換為互聯網協議(IP)地址。例如,域example. com被轉換為93. 184. 216. 34。通常,每次客戶端若要通過域名連接到服務器日寸,都需要將該名稱轉換為IP地址:如果DNS查詢失敗,盡管服務器在線,但客戶端無法訪問該服務器。在數據中心建設中,傳統的DNS面臨四個主要挑戰:(1)DNS查詢的機密性;(2) DNS中存儲和發送信息的完整性;(3)底層DNS基礎設施的可用性;(4)濫用DNS在Internet上攻擊和分發有害內容。隨著時間的推移,針對DNS安全問題,業界提出了DNSSec(Domain Name System Security Extensions, DNS安全擴展)機制,使用密碼學方法解決DNS安全問題,讓客戶端對域名來源身份進行驗證,并且檢查來自DNS域名服務器應答記錄的完整性,以及驗證是否在傳輸過程中被篡改。
3擴展分布DNS的數據中心拓撲結構
在數據中心現有拓撲結構中,包括Fat-Tree拓撲、FiConn拓撲、DCell拓撲、BCube拓和撲SprintNet拓撲[4]。然而,這些拓撲結構都有一些局限性,它們要么擴展得太快(即雙指數增長),要么太慢,而且實施起來成本高昂。例如,對于端口數較少的交換機,BCube中的節點數僅增加n倍。因此,對于大型數據中心,遞歸層的數量可能會非常多。另外,當n=4時,需要6層來構建一個數據中心服務器。一個6層的BCube網絡需要每個服務器有6個接口卡,這使得它在實踐中變得昂貴且難以管理。因此,BCube在使用小端口數交換機時存在可擴展性問題。相比之下,DCell拓撲可以很容易地用一個4度節點來構建。然而,DCell的局限性在于其雙指數可擴展性、高布線復雜性和低效的本地重新路由算法。此外,由于每個網絡層之間的全連接使得一對距離較遠的節點直接連接。因此,雖然DCell減小了整個網絡的直徑,但增加了布線的復雜性,使其部署困難。
相比之下,基于擴展分布DNS的數據中心網絡基礎設施,即LaCoDa(分層連接數據中心),它結合了現有拓撲的優勢,同時避免了它們的局限性。LaCoDa使用小型商用交換機以靈活的方式進行擴展,它在較低層完全連接,在較高層部分連接。在數據中心建設中,LaCoDa使用小度數的節點和小端口數的交換機,將整個網絡擴展到數百萬臺服務器。該算法減少了非連接簇的數量,避免了冗余簇連接的重復。在LaCoDa中,每個服務器都保持其附近服務器的連接狀態,并且可以導出可行的路由路徑。就鏈路和交換機數量而言,LaCoDa的成本大約是BCube成本的一半。例如,僅使用4端口或6端口交換機和4~6個遞歸層,LaCoDa中的節點數量可以達到數百萬臺服務器[5]。此外,LaCoDa的直徑呈線性增加,而DCell的直徑呈指數增加。
4擴展分布DNS的數據中心設計方案
數據中心的規模不斷擴大,并作為云計算、網絡搜索、社交網絡等計算平臺的重要組成部分。人們越來越需要數據中心包含越來越多的服務器,使整體計算效率不會因過多的流量而受到影響。實現數據中心最終性能的一個關鍵因素是數據中心網絡,即數據中心內服務器和交換機的互聯結構。所構建的數據中心由5個基本部分組成,可以將其制定為“3+2"模型。其中,“3”表示空間、動力、制冷三個關鍵功能部件,“2”表示滅火和物理安全兩個輔助部件。因此,所構建的數據中心是由數據中心設施、數據中心電源、配電單元和布線、數據中心冷卻、數據中心的有效空氣分布、冷卻策略、滅火和人身安全構成。
從成本建模的角度來看,這些組件(或資產)的折舊率相同,但它們與IaaS資產(服務器、存儲和網絡)不同。通常,這些資產的使用壽命在7~ 10年。相比之下,安裝在機架中的設備,如服務器、存儲設備、交換機、路由器、負載均衡器等只有3~5年的使用壽命[6]o從戰略上講,在整個數據中心的架構中,需要搭建兩個網絡:其一作為生產網絡(根據實際應用可以劃分多個VLAN);其二作為虛擬中心管理網絡和虛擬機動態遷移VMotion網絡。另外,需要結合實際環境中的要求,將網卡分別設置在不同的網段上。在實際中,由于數據中心的主要目標是滿足網絡信息數據的業務需求,因此,不同的企業需要不同規模的數據中心設施。
由于DCN的傳統設計以交換機為中心,因此路由只能位于交換機之間,而服務器僅充當計算節點。在以交換機為中心的DCN中,沒有直接的服務器到服務器鏈路,只有服務器到交換機和交換機到交換機的鏈接。以交換機為中心的DCN傳統上呈樹狀,服務器位于樹狀結構的“葉子”。這種設計隨著國內最大的Internet接人提供商Chinanet被拆分為北方China Netcom和南方China Telecom之后,南北網絡的互通互聯接點擁塞,造成用戶丟包、延遲較大,從而導致訪問緩慢,甚至對于一些應用根本無法訪問。因此,擴展分布DNS的數據中心設計方案,建議采用一對F5 Link controller設備接在兩個出口鏈路處,實現由向外和由外向的出入站流量負載均衡。由外向的inbound訪問的智能性,通過Link controller提供的智能DNS解析功能,實現對兩條鏈路的負載均衡。
5擴展分布DNS的數據中心部署實現
如上文所述,擴展分布DNS的數據中心是由多個通信虛擬機(VM)組成,每個虛擬機都有單獨的服務器資源要求(如CPU或RAM),以及VM之間對帶寬要求的虛擬網絡。因此,需要進行有效的分配,以滿足整個數據中心基礎設施(包括服務器、架頂式交換機和匯聚交換機)中每個VM的計算、內存和網絡帶寬要求。在這方面,建議遵循以下原則:首先,擴展分布DNS的數據中心在部署建設過程中,需要準備兩套DNS系統,其中一套部署在生產數據中心,而另一套部署在備份中心,在數據中心運行過程中,兩套系統互為備份,要充分考慮數據中心的數據安全性;其次,擴展分布DNS的數據中心在部署建設過程中,DNS系統應遵循內外網單獨部署原則,即外部DNS系統與Internet鏈接,而內部DNS系統與Internet隔離;最后,擴展分布DNS的數據中心的拓撲結構應包含三個物理服務器、兩個架頂式(ToR)交換機和兩個匯聚交換機(AggSw)。其中,從屬虛擬機sl和主虛擬機映射到同一臺物理服務器,而虛擬鏈路分配應用多路徑路由。
眾所周知,兩階段負載平衡方案可以顯著減少數據中心的擁塞。在這些方案中,數據包通過網絡節點按比例路由到與這些節點相關聯的系數,優化平衡系數,使網絡擁塞最小化。ECMP和兩相平衡協議都包括最短路徑的計算。ECMP計算節點之間有多條最短路徑,而兩階段平衡協議使用最短路徑將數據包傳輸到中間節點和從中間節點傳輸數據包。由于擴展分布DNS的數據中心采取了二層網絡部署措施,因此,在建設過程中也需要面對兩種情況。其一,在基于擴展分布DNS的數據中心中,存儲網絡和二層拓展之間互聯質量不高。此時,建議業務訪問由所在數據中心自行處理,同時切換生產數據中心和數據備份中DNS系統。其二,在基于擴展分布DNS的數據中心中,存儲網絡和二層拓展之間互聯質量較高。此時,業務訪問由數據中心系統部署成集群,客戶端訪問請求從某數據中心人口進來后,通過負載均衡設備實現跨中心的負載均衡,所有的服務器都處于負載狀態。
6結束語
基于拓展分布的DNS更適合數據中心網絡,因為它們具有可擴展性和對故障的快速反應,與之相反,集中式DNS限制了網絡的規模和可靠性。換言之,集中式DNS無法計算查找表并將其發送到龐大數據中心網絡中的所有交換機,同時無法快速響應拓撲變化。相比之下,由交換節點執行的拓展分布的DNS能夠自然地并行執行這些任務,并支持更大的網絡。通過使用多個通信虛擬機,可以輕松地將集中式DNS導人拓展分布的DNS.在實踐中,這是通過中間盒的備份路徑、負載平衡和流量重定向假節點來實現。對于數據中心的建設來說,基于拓展分布的DNS比集中式更快,同時提供相同級別的可編程性,值得行業采用。