吳虎 閆金霞

摘? 要:HANA系統是一種內存數據庫系統,承載著大數據運算。因系統運算速度快,吞吐量巨大,造成災備數據實時同步困難。該文主要介紹了一種利用萬兆城域網實現HANA系統同城災備的方式。
關鍵詞:HANA? 大數據? 內存數據庫? 災備
中圖分類號:TP309 ? ?文獻標識碼:A 文章編號:1672-3791(2019)09(a)-0018-02
Abstract: HANA system is a in-memory database system, which carries large data operations. It is difficult to synchronize data in real time because of the fast operation speed and huge throughput of the system. In the paper, a method was introduced to realize disaster recovery of HANA system? in the same city by using 10Gb MAN.
Key Words: HANA; Large data; In-memory database; Disaster recovery
HANA系統災備的實現可通過運算節點之間數據同步或運算節點存儲設備之間的數據同步實現,二者有著不同的實現機制。前者通過10Gb萬兆網連接兩個HANA集群節點,雙活架構,一般同城實現,稱之為系統復制。后者也通過10Gb萬兆網鏈路連接兩側節點的存儲設備,實現數據庫全備份及日志存儲層同步。該文介紹的是后一種實現方式,即對大數據HANA系統的全備份和日志以存儲復制的方式進行同城災備建設。由于數據吞吐量大,對鏈路帶寬要求高,一般進行同城容災建設。
1? HANA概述
HANA內存數據庫系統承載在大容量物理內存上,因此運算速度很快。但數據并不是只在內存里,也會不停寫到硬盤里。HANA一方面通過高速數據總線,以一定時間間隔將數據和日志寫入高速硬盤上(持久層),另一方面,通過較低速數據總線將全庫備份以及增量日志離線備份到存儲設備上。
2? 災備實現
HANA系統從內存寫數據和日志到介質,可分為在線層和離線層。在在線層,多為HANA節點內置高速硬盤,通過常規磁盤陣列進行數據同步變得不太可能;在離線層,實時性要求低,并且數據庫全備份和日志增量備份到了外掛存儲設備上,則具備采用存儲層同步數據庫和日志備份的可能;在災備側,通過恢復全庫備份和應用重做日志使系統得到恢復;HANA節點數據總線速率很高,即使離線層存儲復制,也需要較大帶寬。在生產中心和災備中心間采用萬兆網連接,進行同城災備。
HANA備份時,將備份每一個HANA服務的數據。如果HANA運行在多個節點上,那么數據全備份會包含所有節點上的以服務為單位的備份。用戶可以在操作系統級別使用SAP HANA的命令行工具HDBSQL以及crontab讓數據庫在固定時間固定間隔進行備份。在災備中心,可利用HANA Studio進行恢復。
某企業數據倉庫HANA系統8個節點,每節點內存2TB。目前全庫備份大小為10T,6個小時備份完成,則會對存儲設備造成10×1024×1024/6×60×60≈485MB/S的吞吐量,同城萬兆網吞吐量為:10000×0.9/8=1125MB/S(0.9為帶寬利用率)。因此,同城萬兆網能夠滿足大數據全備份傳輸需求。當生產端全備份完成的同時,在同城災備端也有了一份全備份。日志備份也存放在存儲設備中,持續產生,每5min或滿4G形成一個歸檔,隨備隨傳。
3? 結語
利用萬兆城域網將大數據HANA系統的全備份和日志傳輸到同城災備端來實現容災,技術上容易實現。相對于系統復制,該方式下存儲層復制系統和生產系統運算節點完全解耦,對生產系統的性能和穩定運行均不產生影響。
參考文獻
[1] 高天.SAP HANA技術研究與應用實施[J].信息系統工程,2016(8):117-118.
[2] 張巖松.HANA在某石油銷售決策支持系統的應用[J].石油規劃設計,2017,28(2):43-46.
[3] 周昕.BW遷移HANA平臺應用技術探討[J].科技資訊,2017,15(18):26-27,30.
[4] 劉杰.數據復制技術在資產管理系統應用級災備中的應用[J].電力信息與通信技術,2017(7):36-40.
[5] 張鶴.基于SAN存儲的醫療衛生數據中心異步數據災備設計[J].軟件導刊,2017(3):146-149.
[6] 賈棟.企業級災備中心的建設及技術選型[J].中國信息化,2018(6):64-65.