韓麗佳

杜甫有詩云“昔聞洞庭水”“乾坤日夜浮”,說那洞庭湖水乾坤日月都可包容映照,此種混沌宏大的意境之美在今天的AWS“數據湖”理念上也可窺知一二。
“在當今的企業里面,企業的信息和數據流,就是企業的血液。以數字化轉型為例,我們要知道雖然數字化轉型包含很多方面的內容,但其中很重要的一個內容就是企業的數據化資產。”AWS首席云計算企業戰略顧問張俠一針見血地指出,“從數據到信息再到知識,進而產生洞察力,再指導我們行動,這是數據的意義所在。”
讓數據產生其應有的洞察力,是大多數數據解決方案的目標。AWS數據湖方案由何產生?又是如何實現這一目標的?
應和了混沌哲學的數據湖理論
混沌的原意是指先于一切事物而存在的廣袤虛無的空間。
我國著名物理學家、混沌學理論創始人之一、中科院院士郝柏林曾指出:“混沌研究的進展,無疑是非線性科學最重要的成就之一。它使復雜系統的理論開始建立在‘有限性這個更符合客觀實現的基礎之上。”并且,世界各民族幾乎都有過從混沌創世到有序再回歸到混沌的古老信念。
所以,是不是可以這樣認為,我們所處的世界就是一個由無限數據組成的混沌體,其中蘊含的真理、信息包羅萬象,我們的數據科學其實就是從這個物質世界混沌體中剝繭抽絲,從無序中尋找有序再回歸到數字世界混沌無序的過程。
過去的數據倉庫就像一個個分類整理好的倉儲小格子,它是把原始數據分類、提煉、整理之后才進行存儲的。……