老喻
“你生命中最大的挑戰是什么?”
在某個論壇上,“鋼鐵俠”埃隆·馬斯克面對這個問題時,想了30秒后給出了一個非常精彩的回答:“確保你有一個可糾錯的反饋閉環?!?/p>
“可糾錯的反饋閉環”幾乎是創業、投資、成長等問題的核心答案。但如果不能將其與貝葉斯公式的計算結合起來,那它就和所有解釋性概念一樣,只能作為一篇熱銷文章或圖書的標題而已。
貝葉斯主義是一種關于概率和統計的哲學觀點,它強調信念的主觀性和更新。在該觀點中,貝葉斯公式是核心工具,用于處理不確定性、更新信念,并指導決策。
本文將從“可糾錯的反饋閉環”和“貝葉斯公式”出發,給出貝葉斯主義者的9個策略和行動框架。該9個要點,可協助讀者了解貝葉斯主義的現實模型,并探索“真正的高手”的秘密。
大約在3年前,有一位年輕老師想在抖音和微信視頻號上做自己的IP(知識產權),但又擔心:萬一自己辛苦一番,抖音和視頻號又不火了呢?
“確保成功”似乎是很多人做決定的前提,但并沒有什么事情是確定的。
殘酷的是,越是追求“確保成功”的人,反而越脆弱,越容易掉入決策的陷阱。例如,市面上的種種騙術都是以“確保成功”為吸引點,甚至主流文化也因為實用主義的偏好,而形成了“要么成功,要么失敗”的黑白分明價值觀。
于是,面對不確定性,許多人容易產生兩種極端的行為:“不見兔子不撒鷹”,追求不存在的“確保成功”;“人生就是賭一把”,見一個熱點就All in(全部押進)一個。

對于貝葉斯主義者來說,世界是灰度的:
1. 沒有人能給這個復雜的世界算命;
2. 隨著時間的變化,一切都在變化;
3. 即使存在不確定性,世界也很難精確預測,但仍然可以用概率來描述世界;
4. 從世俗成敗的角度看,贏家只需要在局部獲得相對優勢,就能夠領先于對手;
5. 基于概率的認知和判斷,是一個不斷逼近、不斷進化的過程。
由此可見,貝葉斯思維的核心是:接受事物的不確定性,并利用概率來描述和理解它。
展開說就是,對于不確定性,貝葉斯思維鼓勵我們基于概率來做決策,不怕犯錯誤,嘗試新的事物,從失敗中學習,調整策略;
對于概率,我們可以將其用于量化現實世界的不確定性,也可以用于評估我們自己的決策質量。
比如,橋水基金就使用了一種稱為“貝葉斯加權”的決策過程。具體操作是:該公司對于每一個決策,都會將決策者的可靠性、專業知識等因素考慮進來,然后根據這些因素分配權重,最終做出決策。
貝葉斯主義認為,概率是一個假設的信念。例如:“我認為這只股票上漲的概率是30%”就是一種主觀的信念,并且會根據更多的信息隨時更新的信念。
所以,面對不確定性,你大概都會有一個評估。舉個例子:一個公司在其網站上運行了2種廣告(廣告A和B),目標是找出哪種廣告的點擊率更高。
初始時,公司并不知道哪種廣告的效果更好,因此假設2種廣告的點擊率都是50%。隨后,公司開始在網站上隨機展示這2種廣告,并收到用戶每次點擊廣告的反饋。根據反饋,公司就可以更新他們對廣告點擊率的估計,而具體的更新過程通過貝葉斯公式來完成。
當一個用戶點擊了廣告A,那么公司就會提高對廣告A點擊率的估計,反之就降低對廣告A點擊率的估計。隨著不斷的實驗和更新,公司最終會找出哪種廣告的效果更好。
可以看出,“貝葉斯更新”是使用貝葉斯公式來更新我們對某個假設的信念。具體如下:
首先,我們會有假設的“先驗信念”,這個信念通常表示為一個概率。
其次,我們會收集新的數據,這些數據可能會影響我們對假設的信念。在貝葉斯統計中,可使用貝葉斯公式將新的數據與先驗信念結合起來,得到一個更新的信念,這個更新的信念被稱為“后驗信念”。
貝葉斯更新的關鍵思想是:我們的信念不是固定不變的,而是可以根據新的數據進行更新的。而貝葉斯公式提供了一個理論框架,指導我們如何根據新的數據更新我們的信念。
貝葉斯思想強調快速迭代、快速行動,即只有通過實踐,我們才能得到反饋。這與“知行合一”的哲學理論吻合。
不過,貝葉斯公式還給出了“知行”的動力學模型。
從數學的角度來看,貝葉斯公式是:
P(H|E)=[ P(E|H)*P(H)]/P(E)。
其中:P(H|E)是后驗概率,即在觀察到新的數據E后,假設H成立的概率;
P(E|H)是似然度,即在假設H成立的情況下,觀察到數據E的概率;
P(H)是先驗概率,即在沒有觀察到新的數據前,假設H成立的概率;
P(E)是證據或邊緣概率,即無論假設是否成立,觀察到數據E的總概率。
在這個公式中,決策者(或智能體)通過計算后驗概率,將新的觀察數據(E)和原有的信念(H)整合在一起,而后驗概率可以用于指導智能體的后續行動。
下面我將舉例,讓貝葉斯公式的計算,來解答智能體是如何學習經驗的。
題目:黑盒子里有2個骰子,一個是正常骰子,扔出數字6的概率是1/6;一個是作弊骰子,扔出數字6的概率是1/2。這時,你從中摸出一個骰子,扔了一次,得到一個6。請問:你再扔一次得到6的概率是多大?

在沒有觀察到新的數據前,這個骰子可能是正常骰子,也可能是作弊骰子,概率各為1/2,這是先驗概率。
現在,根據信息“扔出數字6”,來計算這個骰子是正常骰子和作弊骰子的概率分別是多大:
是正常骰子的概率為:1/6÷(1/6+1/2)=1/4;
是作弊骰子的概率為:1/2÷(1/6+1/2)=3/4。
通過貝葉斯更新,更新這個骰子的信息:原來的先驗概率是各1/2,但現在后驗概率分別是1/4(正常骰子)和3/4(作弊骰子)。
那么,再扔一次,得到6的概率是多大呢?這里的關鍵是:將上面得到的后驗概率變成新的一輪計算的先驗概率。
再得到一個6的概率計算,相當于在更新之后的先驗概率基礎之上做預測,計算如下:1/4×1/6+3/4×1/2=5/12。
兩次扔骰子都是獨立事件,為什么第一次扔骰子得到6的概率和第二次的概率不一樣?貝葉斯概率的解釋是,以第一次扔骰子得到6的這一結果作為信息,更新了我們對第二次扔骰子得到6的概率的判斷。
骰子沒有記憶,為什么第一次的結果會“改變”第二次結果呢?答案是:沒有改變結果,只是改變了“信念”。
即使扔了兩次骰子,我們依然不知道這個骰子是正常的還是作弊的,但我們可以帶著這種不確定性向前走,為此需要“猜”這個骰子是正常的還是作弊的概率。這個概率,就是信念。
根據信息的變化,快速更新,似乎體現了某種達爾文式的進化。
從這個角度看,貝葉斯推理起初或許弱小含混,但卻有主動適應性,即從經驗中不斷學習,并快速演化。同時,這個過程還可以不斷重復,從而產生決策和智能的杠桿效應。

總而言之,貝葉斯公式可以將新的數據(或觀察)與我們現有的信念結合起來,從而得到更新的信念。同時,貝葉斯公式通過提供一種系統化的方法來更新信念,使智能體可以從每一次的觀察和交互中學習,并不斷地改進模型和策略,從而變得更加“聰明”。
貝葉斯主義者需要有自己的模型,并基于一個系統,通過不斷重復的連續性策略,產生復利效應。
如何理解貝葉斯主義的復利,我們可以用一個可計算的例子來示范。
密歇根大學曾經設計過一個有趣的概率實驗(以下案例來自《思維的發現》,本文略作調整):兩口袋籌碼放在被試面前,每只口袋里都有紅白2種顏色的籌碼。其中一只口袋里,75%的籌碼是白色,25%的籌碼是紅色;另一只口袋里,75%是紅色,25%是白色。被試隨機挑選一只口袋,然后把籌碼一個接一個往外拿(以上實驗,每次都要把拿出的球放回原處),其間不得向袋子里面看。每拿出一個籌碼,他都需向研究人員匯報他的猜測:他手中的袋子究竟是白色籌碼居多,還是紅色籌碼居多?
假如你第1次拿出的是紅色的籌碼,那么根據貝葉斯公式計算,你肯定會猜手中的袋子來自紅色籌碼多的袋子的可能性更大。
那問題來了:假如連續3次都拿出了紅色的籌碼,你認為來自紅色籌碼居多的袋子的概率是另一種的多少倍?
在實驗中,被試者認為來自紅色籌碼居多袋子的概率是白色籌碼居多的概率的3倍。
但根據貝葉斯公式計算,該概率是27倍。
該案例,直觀地呈現出了貝葉斯計算的指數式增長的復利效應。
不得不提的是,除了“系統、內核、大規模重復、復利”是貝葉斯公式的關鍵詞外,還有“自動化”。
而自動化主要是計算機和人工智能的出現對貝葉斯公式的應用產生了重大影響,包括:計算能力的提升,數據的增長,算法的進步,實現自動化等。
基礎概率是老生常談的話題。而基礎概率,大約包含“空間、時間、可能性”這3種。
其中,空間的基礎概率可以舉例理解:中國首富是鐘睒睒(農夫山泉公司董事長)的一個重要的原因是:2022年中國飲料市場規模約為12 478億元,其中包裝飲用水占比約為62.7%?;鶖祲虼螅铘~大。
時間的基礎概率,舉一個反面例子:投資者經?;谶^去的走勢來預測股票的未來表現,但忽視了基礎概率。

要知道,過去的走勢并不能保證未來的表現,每一次的市場表現都是獨立的。人們經常因為局部時間的漲跌概率,而忽視了更長時間的基礎概率(漲或跌)。
有句話說:近處很難預測,遠處反而容易預測。這里所說的遠期預測,更像是相對穩定的基礎概率。
而可能性的基礎概率常常被人們忽視。例如,賭場的游戲中,每種游戲的勝率都對賭場有利,這是基礎概率。但是許多賭博者可能因為贏了幾次而過度自信,認為自己有戰勝賭場的策略或運氣—明顯忽視了賭博的基礎概率。
一般來說,當我們獲得新的證據時,我們會利用貝葉斯定理更新我們的先驗概率,從而得到后驗概率。基礎概率可以被看作是一種特殊的先驗概率,即沒有任何特定證據的先驗概率。
所以,我們在做決策時,要眼觀全局,基于整體資產來選擇,并以整體資產的增長率來評判決策與行動的質量。
貝葉斯公式告訴我們,要對新信息保持“敏感”,又要考慮基礎概率和先驗概率,保持獨立判斷的“鈍感”。如何理解?
其中,對新信息保持“敏感”是,當新信息(證據)到來時,我們應該更新我們的信念(概率)。這種對新信息的“敏感”表現在我們如何根據新的證據來修正看法。
例如,你是一個產品經理,當你得到用戶反饋說你的產品有某些問題時,你應該更新你對產品質量的評估。
保持獨立判斷的“鈍感”則是,我們不能盲目地只考慮新信息,還需考慮基礎概率和先驗概率。這意味著我們需要結合初始信念和新的證據來更新看法。
例如,我們的產品在測試階段已經表現得非常好(先驗概率),那即使我們收到了一些負面的用戶反饋,也不能立即得出產品質量差的結論。我們需要權衡我們的初步信念(產品質量好)和新的證據(負面反饋)。
這樣的平衡使我們既對新信息保持敏感,又能保持對我們初步信念的忠實。我們要有獨立的判斷能力,避免被一些偶然事件或者噪音所誤導。
在實踐中,我們不能僅僅根據一次或幾次的失敗就對自己的能力或者一個項目的可能性產生懷疑。我們需要考慮我們的長期經驗(先驗概率),同時也要對新的反饋保持開放。
可以說,想成為高手,需要學會使用數據來支持他們的決策系統,而不僅僅依賴于直覺。
貝葉斯推理和波普爾的證偽主義看似截然不同,但在某種程度上是相似的。
貝葉斯推理:在這個框架中,我們不斷地在模型或理論中添加新的信息,并基于這些信息調整預測。最關鍵的是,我們會根據新的證據進行調整,但不會徹底拋棄舊的信念。
波普爾的證偽主義:在這個框架中,我們設立假設,并試圖找到證據來反駁這個假設。如果找到了這樣的證據,我們就會徹底放棄這個假設,反之則繼續保持這個假設,但仍然要持續尋找可能反駁這個假設的證據。
這兩種思想的一個共同點是,都強調了試錯過程和持續學習的重要性:在貝葉斯推理中,通過觀察和學習來改進我們的預測;在波普爾的證偽主義中,通過證偽假設來改進我們的理論。
然而,這兩種思想的一個關鍵區別是,貝葉斯推理允許我們結合新舊信息,而證偽主義則更傾向于拋棄被證偽的理論。
換句話說,貝葉斯推理傾向于逐步改進我們的模型,而證偽主義傾向于尋找突破性的改變。
這兩種方法在實際應用中往往會結合使用。以簡化版的垃圾郵件過濾貝葉斯模型為例:我們想知道一封包含“賺錢”和“優惠”這兩個詞的郵件是否是垃圾郵件。
訓練數據如下:
1. 有100封郵件是垃圾郵件,其中“賺錢”這個詞出現在90封郵件中,“優惠”這個詞出現在60封郵件中。
2. 有100封郵件是正常郵件,其中“賺錢”這個詞出現在10封郵件中,“優惠”這個詞出現在30封郵件中。
首先計算單詞“賺錢”和“優惠”在垃圾郵件和正常郵件中的概率:
P(賺錢|垃圾郵件)=90/100=0.9;
P(優惠|垃圾郵件)=60/100=0.6;
P(賺錢|正常郵件)=10/100=0.1;
P(優惠|正常郵件)=30/100=0.3。
另外,假設垃圾郵件和正常郵件的先驗概率是相同的,都是0.5,因此:
P(垃圾郵件)=P(正常郵件)=0.5。
現在,使用貝葉斯公式來計算一封包含“賺錢”和“優惠”兩個詞的郵件是垃圾郵件的概率:
P(垃圾郵件|賺錢,優惠)=P(賺錢,優惠|垃圾郵件)×P(垃圾郵件)/P(賺錢,優惠)。
假設“賺錢”和“優惠”是獨立的,因此:
P(賺錢,優惠|垃圾郵件)=P(賺錢|垃圾郵件)×P(優惠|垃圾郵件)=0.9×0.6=0.54;
P(賺錢,優惠|正常郵件)=P(賺錢|正常郵件)×P(優惠|正常郵件)=0.1×0.3=0.03;
P(賺錢,優惠)=P(賺錢,優惠|垃圾郵件)×P(垃圾郵件)+P(賺錢,優惠|正常郵件)×P(正常郵件)=0.54×0.5+0.03×0.5=0.285。
代入貝葉斯公式,可得到:
P(垃圾郵件|賺錢,優惠)=P(賺錢,優惠|垃圾郵件)×P(垃圾郵件)/P(賺錢,優惠)=0.54×0.5/0.285=0.95。
這個結果表明,一封包含“賺錢”和“優惠”兩個詞的郵件有95%的概率是垃圾郵件?!百嶅X”和“優惠”證偽了“該郵件是一封正常郵件”。
但根據上面的計算得出,還是有5%的概率不是垃圾郵件。如果非常重要的郵件因此被歸為垃圾郵件,那后果是很嚴重的。
這正是貝葉斯垃圾郵件過濾器面臨的一個常見問題:誤報。
解決這個問題的一種方法是調整過濾器的閾值。比如,我們可以設定一個規則,即只有當一封郵件被判定為垃圾郵件的概率超過99%時,才將其歸為垃圾郵件。

這樣可以顯著降低誤報的概率,但代價是可能會有更多的垃圾郵件漏過過濾器。
另一種方法是使用更復雜的模型,例如包含更多特征的模型,或者使用深度學習等方法。這些模型可能會提供更好的性能,但同時也會更復雜,需要更多的計算資源。
總之,通過貝葉斯公式,我們可以看到證偽或否定證據的重要性。批判性思維和證偽思維是科學研究的核心,也是保持思維開放、防止陷入偏見和過度確定的重要工具。
對于高手而言,證實和證偽同樣重要。只有如此,才能形成“可糾錯的反饋閉環”。
貝葉斯公式的原理和哲學與適應性及進化理性有深度的關聯。我們可以從以下幾個方面來進行理解:
1. 學習和適應性:貝葉斯公式是基于新的數據更新我們的觀念和信念,這種動態調整和學習的過程與生物的適應性有很強的相似性。
2. 不確定性和進化理性:貝葉斯方法是一種處理不確定性的方法,它接受并積極地使用不確定性,而不是嘗試消除它,同時能夠提供最優或至少是足夠好的決策。這種對不確定性的認識與進化理性的概念相吻合。
3. 動態更新和適應環境:生物在自然界中要生存,需要根據環境變化作出適應性變化。而貝葉斯公式則提供了一種思維模式,讓我們能夠根據新的信息動態更新我們的觀點和決策,以最好的方式適應我們所在的環境。
4. 淘汰錯誤的假設:貝葉斯公式中,一種假設(或模型)的概率會根據觀察到的數據進行更新。如果一個假設持續得到的數據支持較少,它的概率就會變小,這就像自然選擇過程中適應度較低的物種被淘汰一樣。
綜上所述,貝葉斯公式的原理和哲學與適應性及進化理性之間存在緊密的聯系,它們都強調了對新信息的接收、動態更新和在不確定性中做出最優決策的重要性。
在貝葉斯決策過程中,我們需要在探索未知和利用已知之間進行權衡。
比如多臂賭博機(賭場里的老虎機)問題就是一個典型的決策理論問題:你面前有n臺賭博機,每臺賭博機的贏錢概率都不同,但你不知道每臺機器的具體贏錢概率。而你的目標是,通過一定次數的嘗試,找出贏錢概率最高的那臺機器,然后將剩下的押注全部放在這臺機器上,以此實現最大化收益。
這個問題中的挑戰在于找到一個合適的策略,這個策略要在探索(嘗試新的機器以了解它們的贏錢概率)和利用(利用已知的信息,押注贏錢概率高的機器)之間找到平衡。
貝葉斯思維在這個問題中特別有用。因為每次你嘗試一個機器,你就獲取了一些新的信息,這個信息可以用來更新你對這臺機器贏錢概率的信念,并使用這個信念來指導決策,找到一個較好的探索和利用的平衡,從而最大化你的收益。
假設你面前有2臺賭博機,你先試了第一臺幾次,發現贏錢的概率不高,然后就轉向第二臺機器。在第二臺機器的幾次試玩,你都贏了,于是你就對這臺機器有了信心,決定將更多的押注放在這臺機器上。
但同時,你還會保留一些押注嘗試第一臺機器,以防第二臺的贏錢概率有所改變。
這就是在多臂賭博機問題中利用貝葉斯思維的例子,也是生活中“探索與開發(exploitation)”權衡的一個模型。這在我們的決策制定、選擇策略以及資源分配上都有重要的啟示。
概括而言,我們需要一個攻守兼備的靈活人生。我們應有一些自由探索,一些隨機漫步,以及一些閑暇時光。
當“貝葉斯”遇見“黑天鵝”,會發生什么?
貝葉斯推理是根據新的證據更新信念,而不是推翻舊有的信念。但舊有的信念是“全世界的天鵝都是白的”,而這時候觀察到一只天鵝是黑色的,那么我們難道不應該徹底推翻這一信念嗎?
你也許可以說,貝葉斯推理將你原先的信念調整為“天鵝可以是白的,也可以是黑的”或“大多數天鵝是白色的,但也有一些天鵝是黑色的”。
從這個角度來看,你是在用新的證據來調整,而不是完全放棄你的舊信念。然而,特定的信念可以在遇到反例時被徹底推翻。
如果我們的決策、我們的下注,建立在類似于“所有的天鵝都是白的”這類信念之上,那么新信息可能就不只是“更新原有信念”,而是徹底摧毀原有信念了。
這就是為什么在科學實踐中,證偽主義的觀點是非常重要的。
由此,我們可以看到,貝葉斯理論雖然強大且實用,但也有其局限性和缺點:
1. 依賴于先驗知識:貝葉斯理論的一個主要缺點是它依賴于先驗知識。在許多情況下,這些先驗信息可能不準確或者難以獲得。
例如,一位投資者可能基于錯誤的信息,或者對市場的錯誤理解,形成了一個錯誤的先驗信念,這可能導致他們的投資決策出錯。
2. 過于理想化的假設:貝葉斯方法往往假設各個特征是獨立的,這在現實中往往不成立。
例如,當我們在評估一家公司的股票時,我們可能會考慮這家公司的許多特征,如財務健康狀況、市場定位、管理團隊等。這些特征之間可能存在著復雜的相互影響關系,而不能簡單地將其視為獨立的。
3. 計算復雜性高:對于復雜的問題,貝葉斯更新可能涉及到大量的計算。如果參數很多或者模型很復雜,那么計算后驗概率可能會非常復雜和計算密集。
4. 結果可能過于保守:貝葉斯更新融合了先驗信念和新的觀察,如果先驗信念過于強烈,那么新的觀察可能不足以顯著改變結果,這可能導致決策過于保守。
例如,一個堅定的理想主義者,即使面對新的證據,也可能仍然堅持他的信念,這可能導致他錯過新的機會或者持續走在錯誤的道路上。
可見,貝葉斯公式和任何概率模型一樣,有其局限性,特別是面對預測罕見的“黑天鵝”事件時。但也有一些可以嘗試的方法,以緩解或避免這些局限性:
1. 合理選擇和更新先驗概率:先驗概率是貝葉斯推理的關鍵組成部分,一定要盡可能準確和有信息量。如果先驗概率選擇不當,可能會導致結果偏離實際。此外,我們必須時刻準備根據新的數據來更新我們的先驗概率。
2. 采用蒙特卡洛模擬法:蒙特卡洛模擬能夠幫助我們更好地理解概率分布的全貌,包括那些罕見的事件。通過模擬大量可能的情況,我們可以獲得更全面的視角,以期望在遇到“黑天鵝”時,能作出更有準備的響應。
3. 壓力測試和情景分析:盡管貝葉斯推理能夠給出一個可能的結果,但我們還需要進行壓力測試和情景分析,以確定系統或決策是否能夠抵御極端事件的影響。
4. 注意模型的假設和局限性:任何模型都是基于某些假設的,貝葉斯模型也不例外。我們必須清楚這些假設,并了解在什么情況下,這些假設可能不再適用。當我們注意到模型可能不再適用時,我們就需要尋找其他的方法。
5. 維持謙遜和開放的心態:面對不確定性,尤其是在面對可能會改變我們的知識或觀念的新信息時,保持謙遜和開放的態度是至關重要的。我們的知識和理解都是有限的,永遠有學習和改進的空間。
這些方法都需要我們理解和接受,無論我們使用什么模型或方法,都不能完全消除不確定性。我們的目標應該是:
管理和減輕不確定性,而不是試圖消除它。這個世界上不存在一個萬能的公式,能提供出所謂100%的確定性。
可糾錯的反饋閉環,其底層是一種貝葉斯更新的哲學,對個人而言是非常重要的關鍵思想。
反饋閉環基本上是一種連續的過程,包括步驟:執行一個動作、觀察結果、理解反饋、更新策略、再執行新的動作。
在這個過程中,“理解反饋”和“更新策略”的步驟,就是在進行貝葉斯更新。
由于時間的推進,在我們的人生當中,每個反饋閉環并不是原地打轉的,而是猶如鏈條般串起來。
所謂有算法的人生,就是以“可糾錯的反饋閉環”為珍珠,串起不斷更新、有復利效應的一生。