編者按:本刊2013年第7期推出《大數據問題》一文,受到讀者廣泛好評。為推進計算機前沿技術的傳播,我刊特開辟“前瞻技術”專欄,邀請陳明教授主持并撰文,后續將推出《NoSQL數據庫》《大數據處理的利器Hadoop》《分布計算中的CAP理論》等文章。期望本欄目能以精練的文字為廣大讀者展現相關領域的最新技術和研究成果。
專欄作家:陳明,男,中國石油大學教授,博士生導師,特聘教授,研究方向為分布式并行計算、計算智能、軟件工程、大數據計算等,chenming@cup.edu.cn。
摘要:由于數據爆炸式增長,為了解決數據密集型知識發現,出現了科學研究的第四范式。文章介紹第四范式的產生背景、核心內容、格雷法則、范式轉變和第四范式時代等內容。
關鍵詞:數據密集;知識發現;第四范式
1.背景
萬物之靈的人類對外部世界的認識已達到令人驚嘆的高度,在宏觀上放眼億萬光年的宇宙,在微觀上已深入層子、夸克世界。隨著科學的發展,人們發現蘊藏著科學理論的科學數據經常被掩埋在零散的實驗記錄中,很容易丟失,只有少數大項目的數據被存儲在磁介質中。如何獲取、管理與分布保存科研群體數據成為科學發展面臨的巨大挑戰。
1962年美國著名科學哲學家托馬斯·庫恩(Thomas Samuel Kuhn)在《科學革命的結構》一書中闡述了范式的概念與理論,認為范式就是一種公認的模型和模式,是常規科學的理論基礎和實踐規范,是研究者在從事科學研究時共同遵守的世界觀和行為方式,是共同接受的一組假說、理論、準則和方法的總和。……