

如果要總結2013年的IT熱詞,大數據、云計算、移動互聯網肯定會榜上有名。雖然都是上榜熱詞,但是用戶對這三大領域依然具有自己不同的認識,相比云計算和移動互聯網,用戶對大數據的接受程度依然不夠成熟。而且,縱覽IT業界,不管是新興行業,還是傳統行業都在考慮大數據對于自己所在行業到底意味著什么。其實,大數據對于各個行業都有不同的意義,而且它完全超越了數據本身的含義。
談到大數據,首先想到的是數據管理,在數據管理方面,人們想到的是Hadoop和MapReduce等新興技術,但是這些新興技術并不能解決所有的數據管理問題。數據倉庫作為一種傳統的數據技術在大數據時代依然煥發著自己的活力。
數據倉庫:從技術角度看問題
說到數據倉庫,就要從數據倉庫的概念提出說起。數據倉庫概念最早誕生于1983年,然后就出現了商務智能,直到20世紀90年代開始成熟,并出現了提取、轉換和加載(ETL),ETL的出現大大促進了商務智能(BI)的發展。以后,數據倉庫出現了各種擴展,出現了多維的聯機分析處理(OLAP)、數據集市、探查型數據倉庫和ODS。
有了ODS即便更新和業務處理遇到集成數據問題,系統還是能夠進行處理。其后,星型模型和事實表等都有了容身之地。有了探索型數據倉庫,統計學家有了一個數據基礎,可以支撐從數據管理員到統計分析員等不同角色的數據挖掘分析需求。一直到后來,數據倉庫變成了企業的信息工廠,進而數據倉庫也被稱為企業數據倉庫(EDW)。……