寧浩宇,李囈瑾,張 敏,陳 超
(云南電網有限責任公司,云南 昆明 650000)
(1)IT運維人員成本高。高效的運維是數據中心成功運行的基礎。數據中心網絡設備和IT資源具有設備數量多、業務應用復雜、新舊技術架構多樣等特點。如何簡化企業數據中心的運維管理,降低人力和人工運維成本,是企業數據中心發展面臨的重要挑戰[1]。
(2)“救火式”IT運維模式。IT操作人員往往會花很多時間和精力在一些簡單且重復的問題的,本身在提高質量上就存在一定難度,加上早期對故障預警機制并不是很完美的情況下,往往是發生故障后報警才處理,不僅產生一個惡性連鎖反應而且還經常徒勞和失敗,IT部門和業務部門對此都不滿意。
(3)簡單的自動化程度起“反作用”。近幾年來,隨著IF運維管理技術的提升,能有效提前預知解決問題,但實際上自動化程度還是偏低。即使技術能夠提取出設備、服務器、數據庫等的預警信息,但當成千上萬的數據堆積在一起時,運維人員仍然難以判斷出主要問題發生的位置。
(4)業務需求增多。隨著行業業務驅動的需求增多,存儲、交換機、云存儲等IT基礎設備種類越來越多,對運維管理人員的知識和技能提出了更高的要求。如何通過多品牌的IT環境,實現對IT運維的可預見性,充分發揮數據中心設備的可用性,是當前形勢所趨。
IT設施的運行能力主要在于單個IT組件實用性和整個IT設施的靈活性。通常指在一定時間內其執行功能的能力,以確保所提供的所有服務的可用性水平,并滿足或超過當前和未來業務可用性要求的能力。
負責將版本轉移到測試和現場環境,包括計劃和控制;確保現場環境的版本以及發布的組件版本;負責將新的或者變更的硬性、軟件、文檔、流程等移動到生產環境的活動。
定期進行業務應用系統備份與恢復。
2.3.1 應用系統備份
按照要求定期核查應用系統備份情況。
2.3.2 應用系統恢復
按照要求參與應用系統恢復和演練工作,包括應用系統恢復操作后,驗證恢復結果;應用系統恢復后的性能與功能檢查;其他必要的操作,如年度應急恢復演練。
2.3.3 數據庫備份操作
由于備份要求納入到備份軟件的統一管理之下。故DM數據庫會定期進行全量備份、增量備份與刪除過期備份的操作(本地文件系統最少保留一個周期的備份文件),中心備份軟件定期從指定的備份目錄下讀取備份文件并傳送到磁帶庫歸檔。
(1)數據庫備份工作流程為:數據庫定期做全量和增量備份,備份文件存放到本地文件系統中; 中心備份軟件從備份文件路徑下獲取備份文件,拷貝或轉移到磁帶庫進行統一管理;達夢數據庫定期清理過期備份數據,防止占用太多磁盤空間。
(2)達夢數據庫開啟歸檔備份功能,備份策略:每周日3點全庫備份,每天2時進行一次增量備份。每天5時刪除超過30天之前的備份。備份文件從生成起到被刪除的30天之內,備份軟件可將其歸檔到磁帶庫。
2.3.4 數據庫備份操作
DM7提供了脫機方式和聯機方式執行備份操作。脫機方式,即數據庫服務器關閉以后所進行的備份,聯機方式則是指數據庫服務器正常運行過程中進行的備份。脫機備份方式需要對數據庫進行關閉,期間用戶如需訪問則會產生一定影響,而且需要重要數據都是全天候訪問形式,所以一般采用聯機備份方式。
2.3.5 手動備份
數據庫的備份還原是系統容災的重要方法,為保證數據的安全穩定,通常采用配置異地容災,使用磁盤陣列,備份與還原等方法。備份主要是通過復制將重要的數據復制到安全的存儲戒指上,同時在必要時將以前備份的數據復制到原始位置,以確保用戶可以訪問這些數據。達夢數據庫常用備份恢復命令舉例:
(1)對名為test數據庫執行一個完全備份。
DMBAC-UPTYPE=FULLINI_PATH=c:dmdatadamengdm.iniNAME=test
增量備份需要指定基備份,然后類型FULL改為INCREMENT。
(2)聯機備份數據庫,并對備份數據壓縮,備份文件存放路徑為C:database_cpr.bak。
BACKUPDATABASE-FULLTOcpr_ bakBAKFILE'C: database_cpr.bak'COMPRESSED;
(3)利用備份文件c:dmdataackup est.bak 還原數據庫。
DMRESTORE-NI_PATH=c:dmdatadamengdm.iniFILE=c:dmdataackup est.bak
(4)利用指定歸檔目錄下歸檔日志還原數據庫test。
DMRESTOREI-NI_PATH=c:dmdatadamengdm.iniFILE=c:dmdataackup est.bak
ARCHIVE_DIR=c:dmdatadamengarch
2.3.6 開啟歸檔
聯機備份,除了備份物理數據文件還需要備份物理日志文件。備份日志文件的目的是保證數據庫的完整性,這里提到的物理日志文件是歸檔日志文件。歸檔文件主要是備份所有用戶對數據庫進行的操作,在還原時,可以通過歸檔日志文件內容將數據庫恢復到備份狀態。
聯機備份時系統需處于歸檔模式下,需要配置data/DAMENG下配置dm.ini和dmarch.ini 2個文件,相關配置如下。
(1)打開dm.ini中的歸檔開關:
ARCH_INI=1
(2)配置dmarch.ini,例如:
[ARCHIVE_LOCAL1]
ARCH_TYPE=LOCAL#歸檔類型LOCAL/REALTIME
ARCH_DEST=#歸檔目標路徑
ARCH_FILE_SIZE=128#單個REDO日志歸檔文件大小,單位Mb,缺省128M。
ARCH_SPACE_LIMIT=具體按照你那邊的磁盤空間和注釋限制設置#REDO日志歸檔空間限制, 單位為Mb,0表示無空間限制,取值范圍(1 024 M ~4 294 967 294 M)。
以上2個修改,需要重啟數據庫服務器或者數據庫處于mount狀態設置后才能生效。
2.3.7 定時備份
DM的作業與調度系統可以對作業調度進行相應的管理,用戶可以通過DM的作業與調度系統進行創建作業,還可以實現對數據庫的操作,將作業執行結果通知反饋給操作員。
(1)創建代理環境。右擊代理,選擇創建代理環境。如圖1所示。

圖1 創建代理環境
(2)新建備份作業。右擊作業,新建作業。如圖2所示。

圖2 新建作業
(3)設置作業步驟。添加作業,步驟類型選擇備份數據庫,設置備份路徑,備份方式選擇全量備份,其他默認即可。如圖3所示。

圖3 新建作業步驟
(4)設置作業調度。添加作業調度,調度類型選擇反復執行,根據需求選擇調度頻率,如每周一凌晨1點執行。最后點擊確定創建成功。如圖4所示。

圖4 新建作業調度
2.3.8 定時刪除過期備份
(1)創建刪除過期備份文件的函數SF_DEL_ DB_BAK_EXPIRED。
(2)新建作業。右鍵點擊“代理”,創建代理環境;右鍵點擊“作業”→“新建作業”,在根據頁面提示輸入作業名、作業描述等信息。如圖5所示。

圖5 新建刪除作業
(3)設置作業。點擊“選擇項”→“作業步驟”→新建,在彈出的頁面中輸入步驟名稱、步驟類型(SQL腳本)、腳本語句(Ca l l"SF_DEL_DB_ BAK_EXPIRED"('DAMENG','路徑',' ',7);這里'DAMENG'指的是數據庫名,7代表刪除7天之前的備份文件),點擊“確定”按鈕。如圖6所示。

圖6 設置作業步驟
(4 )設置調度。點擊“ 選擇項”→ “作業調度”→“新建”,根據彈出的頁面信息輸入名稱、調度類型(反復執行)、發生頻率的類型(根據實際需求,可以選擇周或天)、每日頻率執行一次(根據實際情況設置時間),再點擊“確定”按鈕。如圖7所示。

圖7 設置作業調度
點擊“確定”按鈕,自動定時刪除過期備份的作業就設置成功了。
信息安全管理是指對數據系統的安全管理。保證不因意外或惡意原因破壞計算機硬件、軟件,保護組織資產、信息、數據和IT服務的保密性、完整性和可用性。信息安全管理過程應確保信息安全控制措施能夠保護信息資產,同時,新業務和變化業務的設計和改造應考慮信息安全要求。
事件管理的目的是在最短的時間內從故障中恢復,最大限度地減少故障造成的損害,當緊急故障得到解決時,它會轉移到問題管理級別,以便找到故障的原因,從而改變情況以應對突出的事件。為保證系統在運維階段能夠得到有效的運行、維護和更新,在項目由實施團隊交由運維團隊運維的過程中,實施團隊需要根據項目運維需要進行有針對性的技能培訓,確保運維團隊成員掌握項目相關知識,具備運維能力,能夠獨立解決運維過程中各種系統相關問題。
對于IT系統,在維護、部署、管理等方面經常發生故障而導致業務終端,嚴重影響系統的正常運轉,只有對IT系統進行相應運維服務管理,才能根據各項業務進行統籌安排,降低故障發生率減少損失。