摘 "要: 在分布式系統中,由于復制能夠增強性能,提供高可用性和容錯能力,因此它是保證分布式系統有效性的一個關鍵技術。為了保證數據安全、可用、可靠、可擴展性和服務的高效、連續性,分布式存儲系統需要完善的數據管理機制。主要討論數據復制的基本原則,用于復制數據管理的基本體系結構模型,副本對象上進行的一個操作通常涉及的5個階段,以及在這個模型下不同的復制數據的方式是如何提供容錯服務的,并在數據量大的情況下,對復制模型提出改進的方式。
關鍵詞: 分布式系統; 數據復制; 副本管理器; 容錯
中圖分類號: TN964?34 " " " " " " " " " 文獻標識碼: A " " " " " " " " " " " " " "文章編號: 1004?373X(2015)02?0035?04
Research on data replication of distributed system
ZHANG Qian, XIN Da?xin
(Xi’An Technological University, Xi’an 710021, China)
Abstract: In a distributed system, the replication can enhance performance, improve the capabilities of high availability and fault tolerance, so it is a key technology to ensure the effectiveness of the distributed system. In order to ensure data security, availability, reliability, scalability, efficiency and continuity of service, the distributed storage system needs a perfect data management mechanism. The basic principles of data replication, basic architecture model of the replicated data management, five stages usually involved in an action on a replica object, and principle how to provide fault tolerance service in different data replication modes with this model are discussed. An improving way of the replication model for dealing with large amount of data is proposed.
Keywords: distributed system; data replication; replica manager; fault tolerance
0 "引 "言
在分布式存儲系統中,對數據的拷貝能夠增強性能,提供高可用性和容錯能力,因此它是保證分布式系統有效性的一個關鍵技術。將創建的多個數據副本合理地分布在多個服務器節點上,用來分擔訪問請求的處理任務,可以在一定程度上降低節點失效率,縮短用戶響應時間[1?2]。本文將討論在數據復制過程中,副本管理器采用何種復制方式能夠更準確高效地完成數據副本的更新工作,分布式系統的復制模型,以及數據拷貝的方式。
1 "復制數據管理
在分布式存儲系統中不僅數據量巨大,而且為了保證系統的可靠性,每份數據對象的副本數量也很多,因此,維護各個節點中副本的一致性就成了一個很重要的問題[3]。在計算機科學領域中,數據的一致性問題已經存在了很長的時間,構成了分布式計算的基礎[4]。……