企業(yè)數(shù)據(jù)呈幾何式增長,超大規(guī)模、動(dòng)態(tài)可伸縮以及快速的并行分析能力對數(shù)據(jù)庫提出了更高要求。
隨著企業(yè)數(shù)據(jù)的呈幾何指數(shù)增加,數(shù)據(jù)存儲(chǔ)、管理和在線分析能力要求越來越高; 尤其是面對激烈的市場,企業(yè)只有更好地使用數(shù)據(jù)才能面對日益激烈的競爭。
近日,GreenPlum公司推出了最新的GreenPlum Database 4.0數(shù)據(jù)庫和首個(gè)商用企業(yè)數(shù)據(jù)庫云端運(yùn)算平臺(tái)GreenPlum Chorus。GreenPlum的數(shù)據(jù)庫倉庫產(chǎn)品采用了MPP(Massively Parallel Processing)并行處理的架構(gòu),數(shù)據(jù)庫引擎是基于軟件的引擎,不依賴一些專有硬件平臺(tái),同各種硬件和操作系統(tǒng)平臺(tái)有很強(qiáng)的兼容性,可以很輕易地使用10G的以太網(wǎng)絡(luò)、SSD存儲(chǔ)還有虛擬化技術(shù)來服務(wù)于數(shù)據(jù)分析。同時(shí)該架構(gòu)具有很強(qiáng)的伸縮性,支持從幾個(gè)TB的數(shù)據(jù)到幾個(gè)PB(1PB=1000TB)的數(shù)據(jù)。
MPP中所使用的MapReduce是一種新的處理技術(shù)或者說是一種新的處理的框架,是谷歌發(fā)明的一種主要用于文本的分析檢索功能,使用這種技術(shù),只需要增加節(jié)點(diǎn)就可以線性地提高系統(tǒng)的存儲(chǔ)容量和處理能力。Luke Lonergan說,為了充分發(fā)揮MapReduce這種特性,在GreenPlum數(shù)據(jù)庫系統(tǒng)中提供相應(yīng)的API可供不同的編程語言調(diào)用。
除此之外,新產(chǎn)品在工作負(fù)載管理、自我恢復(fù)容錯(cuò)和數(shù)據(jù)分析方面有了重大的突破。工作負(fù)載管理就是既要保證工作負(fù)載的全部完成,又要保證處理的優(yōu)先級(jí)。Luke Lonergan說,工作負(fù)載管理利用資源隊(duì)列管理實(shí)現(xiàn)按用戶組的進(jìn)行資源分配,比如: 保證公司的高層管理人員早晨一到辦公室就能夠拿到數(shù)據(jù),同時(shí)保證其他被分配的任務(wù)全部順利完成,而且還有防止低質(zhì)量的SQL對系統(tǒng)資源消耗的管理。
在數(shù)據(jù)分析方面,GreenPlum Database 4.0增加了更快的單行操作(選取、更新、插入和刪除)等的優(yōu)化,加強(qiáng)了深度分析功能,引入新的分析方法。更為突出的是,是對在混合工作環(huán)境下的服務(wù)級(jí)別協(xié)議和請求的優(yōu)化,Luke Lonergan說,當(dāng)前越來越多的客戶在做數(shù)據(jù)分析處理的同時(shí),也在做在線交易的處理,即OLTP(在線事務(wù)處理)和OLAP(在線分析處理)同時(shí)進(jìn)行,GreenPlum數(shù)據(jù)庫能夠進(jìn)行不同的分類和重新導(dǎo)向以便有效地加速交易處理的速度。
對于云端數(shù)據(jù)庫平臺(tái)Chorus,Luke Lonergan說,Chorus是一個(gè)具有數(shù)據(jù)庫能力虛擬化的云平臺(tái),企業(yè)用戶可通過GreenPlum的數(shù)據(jù)庫和Chorus,建設(shè)強(qiáng)大的企業(yè)級(jí)的數(shù)據(jù)“云”系統(tǒng): Chorus包括了三個(gè)主要的功能,自助服務(wù)供應(yīng)、數(shù)據(jù)庫實(shí)例(DataBase Instance)、數(shù)據(jù)集市管理。