徐英瑾

列寧有一句名言,“如果幾何學公理觸犯了人們的階級利益的話,那也一定會遭到反駁的”。乍一聽有點奇怪,因為按照常識,數學公理本身的有效性應當是不受到使用者的階級利益影響的。但是可以通過這種詮釋而變得極具說服力:雖然純粹的數量關系未必是與階級利益相關的,但是對于這些數量關系的經驗運用卻會導致對于事實的不同呈報方式,由此與不同集團的利益產生密切的關聯。因此,不同的利益集團就會根據自己的需要雇傭不同的統計學家、會計、甚至是人工智能編程師,以便對世界進行一種對他們有利的數量刻畫方式。想想《金牌制作人》里的橋段吧:以洗錢為目的某劇組準備了兩個賬本,一本封面上寫著“給國稅局看的”,另一本則寫著“永遠不要給國稅局看的”。
現實往往比電影精彩。列寧的格言在眼下牽動天下人神經的美國總統大選中得到了更充分的驗證。11月3日總統大選開票后,雙方的真實得票數據如羅生門一般風云變幻,川普指責民主黨陣營大量竊票,民主黨陣營則堅持自己的得票數的正當性。在相關的爭議中,有一條統計學規律也進入了公眾的視野,這就是所謂的“本福特法則”。根據該法則,一堆從實際生活得出的數據中,以1為首位數字的十進制數(如11、189、18976等)的出現概率約為總數的三成,而越大的數(譬如9),以它為首的數(如99、987、99341)出現的概率就越低。換言之,如果你看到的一組數據不滿足該法則(比如,以 “5”打頭的數字竟然有三成,而以“1”打頭的數字卻只有一成),這就說明這組數據有很大的偽造嫌疑?!?br>