李迅雷
雖然大數據比個案更有說服力,但大數據同樣存在失真、變異、滯后甚至被操縱的可能性
在17世紀之前,歐洲人都認為天鵝都是白的,因為他們所見到的各大洲(歐洲、亞洲、非洲)及各個地方的天鵝,無一例外地都是白色的——這就是用歸納法對大數據處理所得出的結論。一直到人們在澳洲發現第一只黑天鵝之后,天鵝都是白色的結論就被推翻。
從此之后。人們就把意想不到事件的發生,稱之為黑天鵝事件。這說明大數據的缺陷所在——樣本不能被窮盡,因此,大數據可以用來“證偽”,卻不能用采證明。
例如,外星球究竟有沒有生命的問題,大部分科學家都認為肯定有生命'其邏輯就是概率分布,因為茫茫宇宙中的星球不計其數,難道只有唯一一個地球上有生命?但概率只是代表可能性,觀察的樣本數量再大,也無法找到一個例證來證明外星球上確有生命。
而大數據的運用,大部分采用歸納法——人類思維中90%以上的幾率都在使用歸納法,因為歸納法不需要運用太多的知識;不像演繹法。先要掌握不少知識或定理,然后再據此去推理。
事實上,西方在基礎研究領域的巨大成就,大部分都是在17世紀之后取得的,遠沒有跨入大數據時代,且大部分沒有采取實驗室研究的方式,但至今大部分成果都被廣泛應用到社會經濟、科技生產的各個領域。也就是說。17世紀之后。西方抽象思維得到極大發展,建立了數學、物理的科學體系,進而又推動了科技進步,從而拉大了中西方在科技領域的差距。
相比之下,從中國歷史上所取得的科學成果看,能體現抽象思維的東西比較少,形式邏輯在中國沒有充分發展。春秋戰國時代,形式邏輯也曾有過發展,但最終卻演變成了“詭辯術”,如公孫龍就提出了“白馬非馬”之說。因此,中國歷朝歷代的思維還是見長于歸納法和辯證法。
南宋數學家楊輝在1261年所著的《詳解九章算法》一書中,展現了二項式系數在三角形中的一種幾何排列,因此,“楊輝三角”實質上是把二項式系數圖形化,把組合數內在的一些代數直觀地從圖形中體現出來。但他并沒有在其著作中給出具體推導過程,所以,我們只能認為“楊輝三角”是通過歸納總結發現的,未能把它進一步抽象為“二項式定理”。而牛頓就給出了二項式定理的一般公式和推導過程。
形式邏輯、演繹法在中國五千年的漫長歷史中沒有得到充分發展.這才是導致我國近代科技發展遲緩的根本原因,而不是所謂的制度因素。為什么哲學、宗教、文化乃至醫學等都有中西方之分,但數理化就沒有“中國數理化”而是照搬西方的呢?因為這些學科都不能通過經驗(或稱大數據歸納)、傳承或辯證法來創設。
3年前,我提出要相信邏輯,不要相信奇跡(個案)。如今進入了大數據時代,我仍然提倡:在大數據面前,更要相信邏輯。雖然大數據比個案更有說服力,但大數據同樣存在失真、變異、滯后甚至被操縱的可能性。
社會經濟的發展,看似千姿百態。但也有其共性。比如,二戰之后的今天,市場經濟最終成為全球幾乎所有國家的共同體制,說明這個體制合乎經濟可持續增長的邏輯。這正如價值投資成為全球絕大部分資本市場的共同理念一樣,唯有如此,才能獲得較大的回報。
邏輯產生的作用可能會遲到,但不會缺席。