莊 嶺 趙新建 李 維 王 召 籍天明*
1(國網江蘇省電力公司 江蘇 南京 210000)2(南京供電公司 江蘇 南京 210000)3(南京南瑞集團公司 江蘇 南京 210000)
近年來,隨著信息化技術的飛速發展,云計算和大數據技術正在興起,“企業業務云化”[1-2]這一課題正日益受到關注。云不僅僅帶來技術和應用模式上的創新,還可以為商業模式的創新以及為企業自身的業務轉型帶來契機[3]。在此形勢的驅動下,以數據庫云化為目標而推出的軟硬件一體化融合設備應運而生[4-7]。數據庫一體機將數據庫軟件和標準硬件結合[8-10],作為企業級大數據處理平臺使用,具有較好的橫向擴展能力,適合海量數據處理場景[11-12]。數據庫一體機可以縮短用戶系統的上線時間,可滿足海量數據的高性能、高可用性以及復雜查詢快速響應需求[13-15],對于企業的重要性與日俱增。因此,有必要對不同型號的數據庫一體機性能進行研究。本次針對不同型號的數據庫一體機分別進行OLAP[16-18]、即席測試、功能性測試等場景測試,并分析其執行各場景需要的時間與系統資源消耗情況。根據不同場景下的測試數據,構建了一體機的性能評價模型。
1.1 被測設備信息本文選取T2750、Green Plum DCA、FusionCube HANA、Isp和XData等5種代表性型號(為尊重廠商和產品,本文所涉及的型號均為代稱,但各型號產品的參數和數據都是真實測得的)的數據庫一體機進行性能測試,各型號產品的參數如表1所示。
本文的測試統一使用Loadrunner工具錄制標準Java腳本, 模擬并發用戶對各型號數據倉庫一體機進行壓力測試。
1.2 測試指標對于數據庫一體機性能的關注指標主要是:CPU、內存和IO。因此本文測試的主要指標是:測試各型號產品在執行OLAP、混合負載和功能等各場景不同并發用戶壓力下的運行時間,及CPU、內存和IO等系統資源開銷情況。本文測試以某大型公司營銷業務應用系統數據作為ODS數據源,各被測設備首先從ODS數據源進行測試數據的初始化裝載。1.3 測試步驟測試步驟為:Step1 測試前期準備,各測試組(每組對應一個型號的產品)可對測試數據和測試腳本進行優化調試。Step2 采用多臺統一使用Loadrunner錄制的標準JAVA腳本的壓力機,對各型號產品調用優化后的SQL語句,通過JDBC方式連接各數據庫一體機。Step3 進行各測試場景的測試,記錄各場景在不同并發用戶下的執行時間和被測的CPU、內存和IO等系統開銷數據。1.4 測試環境整體測試環境主要分為配套環境和被測設備兩大部分,其中配套環境使用Loadrunner模擬并發用戶對被測設備發起壓力請求。在測試過程中,除被測設備外,將使用統一的配套環境。拓撲圖如圖1所示。
2.1 OLAP場景測試結果聯機分析處理OLAP是在聯機事務處理過程OLTP(On-Line Transaction Processing)已不能滿足終端用戶對數據庫查詢分析的需要以及SQL對大數據庫的簡單查詢也不能滿足用戶分析的需求下出現的新技術。OLAP的目的是決策支持或多維環境特定的查詢和報表需求??梢詫LAP理解成多維數據分析工具的集合,對于支撐OLAP的硬件架構,必須滿足海量數據的實時計算,高吞吐量以及用戶的并發訪問。本文共選取15個OLAP測試場景,由于篇幅所限,僅列舉復雜查詢和大數據輸出場景中具有代表性的測試結果,如表2-表3所示。

表2 OLAP復雜場景測試結果

表3 OLAP大數據輸出場景測試結果
2.2 即席場景測試結果即席測試場景基于即席查詢,用戶可以根據自己的需求靈活地選擇查詢條件,系統則根據用戶的選擇生成相應的統計結果。即席測試場景的測試結果(選取T2750,GREEN PLUM DCA為例)如表4所示。

表4 即席測試場景的測試結果
2.3 功能性測試場景測試結果功能性測試場景測試結果如表5所示。

表5 功能性測試場景測試結果(以GREEN PLUM DCA為例)

續表5
3.1 定性評價分析(1) 在OLAP性能測試場景中,T2750完成了所有的性能測試場景,在15個性能測試場景中,有13個場景測試結果優于其他型號;SAP—HANA基本完成所有測試場景,其中有7個場景優于其他型號;GREEN PLUM DCA完成了14個性能測試場景,其中有6個場景優于其他型號產品;XData大數據一體機完成了13個性能測試場景,其中有2個場景優于其他型號產品;Isp大數據一體機在本次測試中共完成7個性能測試場景, 且各場景結果與其他型號產品存在一定差距。(2) 在2個即席查詢場景中,T2750完成了全部即席查詢測試場景,且性能優于其他型號產品;GREEN PLUM DCA完成其中一個即席查詢;其他型號產品均未完成。(3) 在功能測試場景中,T2750和GREEN PLUM DCA完成了大部分功能測試;XData有2個場景未測試;Isp和HANA大部分功能未進行測試。
3.2 定量評價分析
3.2.1 指標體系及權重針對本次測試,測試結果的評價綜合考慮了性能測試、功能性測試和即席測試3個部分。(1) 性能指標:簡單查詢、復雜查詢、全表掃描、大數據量輸出等功能共計15項。(2) 功能指標:數據裝載、擴展性、高可用、系統管理等功能共計8項。(3) 即席查詢:即席查詢功能共計2項。測試評價指標體系及其權重如表6所示。

表6 測試評價指標體系及其權重
3.2.2 評價方法及細則(1) 評價方法如下:各型號產品每類參測產品的滿分為100分,性能部分占60%、功能部分占32%,即席查詢占8%,總得分計算公式為:
W總分=W性能+W功能+W即席
(1)
式中:W性能=∑Ci×Xii=1,2,…,15
W功能=∑Cj×Xjj=1,2,…,8

(2)


圖2 幾種型號數據庫一體機設備綜合得分
(3)
式中:Xk為該型號產品在第k項指標的得分值,Mk為該型號產品在該項指標上的實際測試值,Mmin為所有型號產品在該項指標上的最小測試值,Kk為該項的權重分,Pε為所有型號產品在該項指標上的并發測試數。根據上述數據,得出各型號數據庫一體機設備綜合得分,如圖2所示。從圖2可看出,T2750的綜合性能表現最佳,Green Plum DCA次之。
本文對5種不同型號的數據庫一體機產品進行OLAP、即席測試、功能性測試等場景進行測試,對執行各場景需要的時間與系統資源消耗情況進行了分析。綜合考慮各測試場景下的各個測試指標,構建了數據庫一體機的性能評價模型。測試和計算結果表明,T2750數據庫一體機在本文評價體系下的綜合得分最高,綜合性能表現最佳。本文測試結果及評價模型為企業數據庫一體機的選型工作提供了科學依據。
參考文獻
[1] 陳春凱. 云計算環境下基于拓撲感知的虛擬網絡映射研究[J]. 計算機應用與軟件, 2014,31(12):156-160.
[2] 王德政, 申山宏, 周寧寧. 云計算環境下的數據存儲[J]. 計算機技術與發展, 2011, 21(4):81-84.
[3] 戴炳榮, 宋俊典, 錢俊玲. 云計算環境下海量分布式數據處理協同機制的研究[J]. 計算機應用與軟件, 2013, 30(1):107-110.
[4] 吳正學, 戴牡紅. 云計算中基于否定規則的訪問控制技術的研究[J]. 計算機應用與軟件, 2014,31(1):30-33.
[5] 王玲, 宋斌, 王平立,等. 基于數據倉庫三層架構的決策支持系統應用研究[J]. 計算機應用與軟件, 2007, 24(2):69-71.
[6] 劉宇. 虛擬化環境下的數據庫集群系統構建與性能分析[J]. 計算機與現代化, 2011, 1(8):153-156.
[7] 喬宏明, 姚文勝, 高儒振,等. 電信行業數據庫云化部署思路探討[J]. 移動通信, 2012, 36(20):82-87.
[8] 隋合軾. 基于一體機架構的海量數據集中與處理[J]. 東北電力技術, 2015, 36(9):12-15.
[9] 徐建民, 劉進坡. 基于數據庫技術的遠程監控系統的開發與實現[J]. 計算機與現代化, 2005(1):80-83.
[10] 儲浩, 呂萬里. 云橋數據庫一體機在移動業務系統中的應用[J]. 移動通信, 2014, 38(13) :33-37.
[11] 張光亞. 云計算中的數據庫關鍵性技術分析[J]. 信息通信, 2015(5):109-109.
[12] 賀超波, 陳啟買, 劉海. 數據倉庫與OLAP在高校教學決策中的應用研究[J]. 計算機應用與軟件, 2009, 26(6):93-95.
[13] 楊彬彬, 鄭曉薇. 基于MS Analysis Services 的OLAP分析系統模型設計及應用[J]. 計算機應用與軟件, 2007, 24(8):216-218.
[14] 蔡亞杰, 趙政文, 白松,等. 并行數據庫基于多連接的查詢優化算法的研究[J]. 計算機應用與軟件, 2012, 29(12):182-185.
[15] 壽志勤, 劉波. 數據倉庫和OLAP技術在政府網站評估中的應用[J]. 計算機技術與發展, 2011, 21(10):133-136.
[16] 曹曉靜, 張航. 決策支持系統的發展及其關鍵技術分析[J]. 計算機技術與發展, 2006, 16(11):94-96.
[17] 彭璐. 基于數據倉庫的OLAP中的索引技術研究[J]. 計算機與數字工程, 2014,42(12):2325-2330.
[18] 劉宇. 虛擬化環境下的數據庫集群系統構建與性能分析[J]. 計算機與現代化, 2011(8):153-156.