在后真相時代,還有“真相”嗎?事實是什么?知識的陣營還牢固嗎?
前段時間看過瑞典教授奧薩·維克福什的《另類事實》,書中對知識是這樣定義的——知識就是那些你信以為真的東西(一種信念),并且它需要與事實相符,而你需要求得證據(jù)來保持信念。顯然,在獲取和更新知識這個方面,批判性思維的能力特別重要。批判性思維意味著不僅僅思維邏輯本身是重要的,我們還需要具備一定的認知心理學(xué)方面的知識,要對人類常見的非理性思維模式保持警惕。
在大數(shù)據(jù)時代,很多知識以“大數(shù)據(jù)”的形式出現(xiàn),如何認識數(shù)據(jù)背后的“真相”也就成為考驗思維成熟度的重要標志。桑內(nèi)·布勞的這本《數(shù)據(jù)如何誤導(dǎo)了我們》可以幫助我們在“大數(shù)據(jù)”時代更加審慎地捍衛(wèi)自己的知識領(lǐng)域。
作者桑內(nèi)·布勞是荷蘭的一名計量經(jīng)濟學(xué)家和數(shù)據(jù)統(tǒng)計記者。布勞從兒時起就特別擅長于數(shù)字有關(guān)的東西,數(shù)學(xué)是她中學(xué)時最喜歡的一門課,后來她在拉斯謨經(jīng)濟學(xué)院(Erasmus School of Economics)攻讀計量經(jīng)濟學(xué)博士學(xué)位。作為荷蘭知名新聞平臺“通訊員網(wǎng)”(De Correspondent)的通訊記者,布勞長期致力于數(shù)據(jù)新聞的深度報道。讀罷這本書,以下這幾個書中案例給我留下了非常深刻的印象。
書中最開始講述的一個南丁格爾的例子,一下子就吸引了我。19世紀南丁格爾通過可視化圖表推動了英國的醫(yī)療改革的故事,彰顯了數(shù)據(jù)的積極力量。
南丁格爾1820年出生在一個富裕的英國家庭,在那個時代相比于其他女孩,她接受了非常良好的教育,系統(tǒng)學(xué)習(xí)過意大利語、哲學(xué)、物理、化學(xué)還有數(shù)學(xué)。擁有良好的教育背景的她,在從事隨后的軍中護理工作時,發(fā)現(xiàn)當(dāng)?shù)赜④姷年囃雎侍吡恕Υ耍隽艘粋€非常直觀的圖表——東部軍隊死亡原因統(tǒng)計圖,這個統(tǒng)計圖用餅圖的方式非常直觀地顯示了士兵的死亡原因。據(jù)此,該報告成功說服了當(dāng)局。到1880年時,之前的許多問題得到了妥善解決:傷兵們吃得更好了,能洗澡的地方變多了,他們的營房也更干凈了。
歷史學(xué)家斯蒂芬·斯蒂格勒將1890年至1940年稱為“統(tǒng)計學(xué)的啟蒙時代”,但在這之前的1858年,南丁格爾已經(jīng)使用統(tǒng)計圖表來解釋現(xiàn)狀和闡述事實了。數(shù)字的積極作用彰顯無遺,它可以用來挽救生命。
我平時在學(xué)校講授財務(wù)分析課程,對此頗有體會。財務(wù)分析也是這樣,用圖表的方式直觀展示一家企業(yè)的經(jīng)營業(yè)績是非常合適的。當(dāng)然,圖表在列示時也是有講究的。比較公司的選擇、圖表量綱的選擇,都有可能影響到讀者的感官和判斷。例如,我想分析A公司的營業(yè)收入,但這家公司營業(yè)收入的增長趨勢并不好看;于是我選擇了另一家經(jīng)營更加差勁的企業(yè)進行比較,這樣A公司顯得還不錯。又例如,我想看一下資產(chǎn)負債率的變動趨勢,這家企業(yè)的資產(chǎn)負債表其實增長非常快速,但是我不想給讀者造成負債率飆升、財務(wù)風(fēng)險增加的印象,于是我將原本縱軸5%的單位調(diào)整為100%,顯示出來的資產(chǎn)負債率立刻就不那么陡峭了。所以,當(dāng)我們再去看一些數(shù)據(jù)分析和結(jié)論時,要對比較對象和量綱保持敏感,以免被誤導(dǎo)。
數(shù)據(jù)在標準化、采集和分析這三個環(huán)節(jié),都可能摻雜主觀意志。有時候,個人的主觀臆斷和價值傾向可能通過所謂“客觀”數(shù)據(jù)的包裝,成為所謂的“事實”。
首先,來討論一下數(shù)據(jù)如何標準化的問題。
數(shù)據(jù)的標準化就是指如何測度這個想要測度的對象。例如,關(guān)于膚色和智商的有關(guān)統(tǒng)計問題上,膚色的測度相對較容易(但事實上,可能也不是那么容易),關(guān)于智商的測度則顯然有不同的測度方法,不同的方法測度的面向可能會有較大差異。2014年,《紐約時報》的記者尼古拉斯·韋德撰寫了一本暢銷書,《天生的煩惱》。他在書中指出,世界上不同種族的形成是人類進化的結(jié)果,而種族之間的差異就反映在他們的智力水平上。
果真如此嗎?
智商這個概念是人為創(chuàng)造出來了,我們?yōu)榱藴y度它,設(shè)計了很多不同的題目。例如,韋氏智力測試中,題目涉及詞匯量、數(shù)字序列和空間洞察力等,這些內(nèi)容多與抽象思維相關(guān)。隨著時代發(fā)展,智商測度中抽象思維越來越占據(jù)智力測試題目的主導(dǎo)地位。但側(cè)重測度抽象思維僅僅是人類目前選擇測度智商的一種價值判斷而已。
所以,我們一定要意識到數(shù)據(jù)的“客觀性”本質(zhì)上是人為建構(gòu)的產(chǎn)物。很多數(shù)據(jù)的取得可能都有類似問題,例如問卷設(shè)計時的架構(gòu)帶來的隱含選擇傾向問題、問卷本身設(shè)計合理性問題等等,都會影響到數(shù)據(jù)的測度。
其次,在數(shù)據(jù)的采集階段。
由于我們很難獲得全樣本的數(shù)據(jù),所以一般數(shù)據(jù)采集會選取一定范圍的樣本。那么這個樣本的普遍性和代表性就會影響到我們對這個數(shù)據(jù)的理解。
《數(shù)據(jù)如何誤導(dǎo)了我們》提到一個非常有名的美國生物學(xué)家阿爾弗雷德·金賽的案例。在這個案例中,由于研究者個人被一種打破舊有的性行為規(guī)則的使命感驅(qū)動,導(dǎo)致他在選擇調(diào)查對象時人為排除了“保守人群”,從而得出了一些頗為驚世駭俗的研究結(jié)論,在上世紀50年代引發(fā)了很大的爭議。正如作者布勞評價的那樣——“金賽的研究實際上是一種披著各式圖表和表格的科學(xué)外衣下的行動主義”。
在財務(wù)分析領(lǐng)域,數(shù)據(jù)采集的錯誤也有可能會帶來決策上的失誤。例如,某化妝品品牌在第一季度時采用滿減方式大規(guī)模促銷,帶來了一季度營業(yè)收入的快速增長。如果單單基于此,管理層就做出繼續(xù)加大促銷的決策,很有可能由于數(shù)據(jù)采集不完整、分析不全面而造成重大經(jīng)營虧損。理性的做法是,在采用滿減方式大規(guī)模促銷后,管理層應(yīng)當(dāng)審慎觀察后續(xù)客戶復(fù)購率、退貨率等情況,并仔細核算相關(guān)成本來綜合評價促銷效果。
財務(wù)分析中,還有可能由于數(shù)據(jù)顆粒度不夠或者指標設(shè)計不當(dāng),造成無法取得決策相關(guān)數(shù)據(jù)。例如,某些財務(wù)分析系統(tǒng)中僅僅針對營業(yè)收入設(shè)計了營業(yè)收入增長率,但對于導(dǎo)致營業(yè)收入增長的原因沒有設(shè)計指標而無法進一步仔細分析。對于營業(yè)收入的變動,應(yīng)當(dāng)區(qū)分價格和銷量等因素,來分析導(dǎo)致營業(yè)收入變化的原因。
第三,在數(shù)據(jù)的分析階段。
《數(shù)據(jù)如何誤導(dǎo)了我們》一書中,作者使用了煙草公司的經(jīng)典案例。這個案例非常清晰地展示了具有利益沖突的研究者是如何利用自己的專業(yè)知識為煙草公司進行辯護的。
統(tǒng)計學(xué)家達萊爾·哈夫于1954年出版了一本非常有名的專著《統(tǒng)計數(shù)字會說謊》。在這本書中,哈夫指出數(shù)據(jù)分析階段存在三種類型的“偽因果關(guān)系”。第一種,偶然事件——數(shù)據(jù)呈現(xiàn)的只是偶然情況;第二種,因素缺失——數(shù)據(jù)呈現(xiàn)的相關(guān)性僅僅是相關(guān)性,其實中間缺失了一個真正的因素;第三種,反向關(guān)聯(lián)——因果關(guān)系也可能是相反的。這本書非常經(jīng)典,今天也仍然值得大家研讀。哈夫作為統(tǒng)計專家,在1965年3月美國國會一場有關(guān)香煙廣告及包裝的聽證會上發(fā)言,他認為吸煙和不健康這二者之間的相關(guān)性不應(yīng)與因果關(guān)系混為一談。但隨后更多的不同領(lǐng)域的科學(xué)證據(jù)都表明,吸煙的確與肺癌發(fā)生有非常直接的因果關(guān)系,目前這已經(jīng)成為了“科學(xué)共識”,也迫使煙草行業(yè)在包裝上做出了明確提示。布勞在《數(shù)據(jù)如何誤導(dǎo)了我們》中介紹,哈夫收到過煙草業(yè)的贊助,這對他的分析的獨立性造成了影響。
在財務(wù)分析中,哈夫著作中列示的三種偽因果關(guān)系同樣是適用的。例如,某高科技企業(yè)某期的利潤率得到了改善,這是否意味著該公司的研發(fā)能力突出,是前期高額研發(fā)帶來的正面效果呢?第一,觀察利潤表,如果利潤率的改善來自一次性的“非經(jīng)常性損益”,是偶然事件帶來的,那么就無法說明是公司前期研發(fā)帶來的效果;第二、觀察后發(fā)現(xiàn),由于研發(fā)支出占用了公司大量資金,使得公司更加審慎地利用資金,成本費用的控制更加高效,從而帶來了利潤率的改善,并不是前期研發(fā)支出帶來的效果;第三,還有一種可能是,由于公司利潤率不斷的改善,使得公司有余力進行大額的研發(fā)投入,因果關(guān)系其實是倒置的。
我這里描述的三種情境對應(yīng)了哈夫所述的三種偽因果關(guān)系。因此,我們進行數(shù)據(jù)分析時,一定要熟悉統(tǒng)計語言和套路。
我們正處在4V(volume,velocity,variety,veracity)的大數(shù)據(jù)時代,上文中描述的數(shù)據(jù)在標準化、采集和分析階段可能面臨的問題還存在嗎?作者認為仍然是存在的。
同樣地,很多抽象概念被不得不量化了;大數(shù)據(jù)的來源可能不符合倫理要求(黑客問題和隱私數(shù)據(jù));以及相關(guān)性仍然不等同于因果關(guān)系。
事實上,當(dāng)數(shù)據(jù)足夠大的時候,你總會發(fā)現(xiàn)越來越多的變量間存在顯著關(guān)聯(lián)。作者提醒我們注意“算法”的背后是什么?正如作者所說——“這些算法想要達成什么目的?是尋求真理還是追逐利潤?是民眾的安全還是自由?是正義還是效率?這些均是道德上的困境,而我們是無法用統(tǒng)計數(shù)據(jù)解決的”。
布勞提供了一個六步清單,幫助我們來解讀一份數(shù)據(jù)及其結(jié)果。一,這個數(shù)字是由誰提供的?數(shù)據(jù)一定程度上是人類價值判斷和立場選擇的呈現(xiàn)。二,我對這個數(shù)字有什么感覺?評估自己的直覺,我們也有自己的價值判斷和取向。三,人們是如何將它標準化的?數(shù)據(jù)是如何測度的?四,數(shù)據(jù)是如何被采集的?了解采集方式和樣本代表性。五,數(shù)據(jù)是如何被分析的?是否可能是偶然事件、因素缺失和反向關(guān)聯(lián)?六,數(shù)據(jù)是如何呈現(xiàn)的?數(shù)據(jù)的呈現(xiàn)方式對于我們理解它也是至關(guān)重要的。
當(dāng)然,一個擁有智識的人是會根據(jù)新的數(shù)據(jù)和證據(jù)來選擇是否更新自己的知識的。我們要擁抱不確定性,不然你相信的就是“偽科學(xué)”。
桑內(nèi)·布勞的《數(shù)據(jù)如何誤導(dǎo)了我們》教會我們對數(shù)據(jù)的主觀性保持警覺,只有當(dāng)我們學(xué)會以懷疑之眼審視數(shù)據(jù),方能真正駕馭數(shù)據(jù)。科學(xué)就是一些還沒有被推翻的假設(shè),是一些可以被證偽的假說。這是科學(xué)的本質(zhì),懷疑是所有科學(xué)家和哲學(xué)家的精神內(nèi)核。當(dāng)然,這不是說我們要懷疑一切。我們可以選擇去相信(非自己熟悉領(lǐng)域的)專家,畢竟我們沒有精力去驗證所有的事情。但在我們自己的專業(yè)領(lǐng)域內(nèi),保持對數(shù)據(jù)的警惕和審慎是應(yīng)當(dāng)做到的。
(作者任職于對外經(jīng)濟貿(mào)易大學(xué)國際商學(xué)院)

批判性思維意味著不僅僅思維邏輯本身是重要的,我們還需要具備一定的認知心理學(xué)方面的知識,要對人類常見的非理性思維模式保持警惕。
數(shù)據(jù)在標準化、采集和分析這三個環(huán)節(jié),都可能摻雜主觀意志。有時候,個人的主觀臆斷和價值傾向可能通過所謂“客觀”數(shù)據(jù)的包裝,成為所謂的“事實”。
桑內(nèi)· 布勞的《數(shù)據(jù)如何誤導(dǎo)了我們》教會我們對數(shù)據(jù)的主觀性保持警覺,只有當(dāng)我們學(xué)會以懷疑之眼審視數(shù)據(jù),方能真正駕馭數(shù)據(jù)。