魏忠
十幾年前,我剛進高校工作,一件事情讓我決定從此在我所在的交通運輸規劃領域不再發表學術論文——我去聽取學校一位權威教授的碩士答辯,該學生以一年前的8月25日和一年后的8月25日兩天進行交通規劃研究,證明了一個非常復雜嚴肅的論證,我打開電腦查了一下,發現這兩天一個是周五,一個是周三,而上海的周三和周五是交通流量完全相反的,于是我便說:“你表面是非常嚴肅的證明,而事實上不關心真相,不就成了扯淡嗎?”事后,我被人嚴肅地提醒要注意言語分寸。
又過了一年,我帶著一位經濟學家去佘山旅游,由于封路避行恰巧發現我們的學生正在佘山進行交通測試,帶頭的又是某位知名教授的學生,我記得非常清楚,那天是5月19日,由于特殊活動佘山封路,學生們說這樣非常方便他們測量日常的交通流量。然而,封路與正常流量又完全不同,做交通課題卻找封路時候去做流量測試,狗P。
今天我可以說我為什么不寫“學術論文”了:我是搞信息的,至少在我研究的領域“扯淡”“狗P”是很嚴肅的學術詞匯,并不是罵人。他們都是英文的一個詞“Bullshit”,看起來是有些憤怒和粗魯,但確實是指那些“公然罔顧事實和邏輯的語言、統計數據、圖表,以及其他呈現方式”,它們的目的是讓受眾留下深刻印象并且讓人難以抗拒,而反扯淡和駁斥狗P指的是“公開批駁有問題的東西”。駁斥的對象其實比狗P更廣,還可以包括謊言、背叛、詭計和不公。這個詞匯,是由時任普林斯頓大學哲學系主任、全球最具影響力的哲學家之一的G·法蘭克福發掘的,2005年他發表了On Bullshit一書,該書成為亞馬遜十大暢銷書之一,法蘭克福認為:扯淡不完全是撒謊,掩蓋真相,而是根本不關心真相,扯淡不僅是反真相的,而且更嚴重的是它是反價值的,扯淡會消磨掉人類嚴肅說出的各種價值,進而解構各種具有價值的事情和生活,這才是扯淡的最大危害。法蘭克福的On Bullshit的中文譯名就是《論扯淡》,這個名字還是比較含糊的,而英文如果直譯,就是“狗P、牛糞、狗屎”。
2015年,我女兒所在的華盛頓大學的兩位教授(一位生物學教授、一位信息學教授)在網絡上相繼開了一門課,就叫“大數據時代如何辨別狗P”,幾年后這門課成為大學的正式課程。從該課的宗旨和目標來看,實際上它就是在大數據時代,如何提高學生的“信息素養”。
一個粗俗的詞匯成為了一個學術詞匯,甚至成為一所大學的正式課程廣受歡迎,并有越來越多的人認識到它的重要性,那是因為,隨著大數據和人工智能的發展,“扯淡”和“狗P”已經泛濫成災且走向越來越專業,“狗P們在專業地造假,統計和信息學家以及科學家們在業余地辟謠”,即使一些有科學素養的人其信息素養也未必高到哪里去。好了,現在有了一項專項的課程來提醒不專業的信息時代的螺絲釘:謹防狗P。
其實,“大數據時代辨別狗P”并不難,卻也不簡單。舉個例子來說,傳統的教師的很多信息素養是通過類似“2/8定律”“250定律”“溫水煮青蛙實驗”“鯰魚效應”“霍桑實驗”來建立的。華盛頓大學的這門課程基本上也采用類似的“大數據時代的統計故事”,通過12周的課程(華大采用3季3學期制),就能建立起學生的信息素養。下面,我簡要介紹一下12周都講些什么。
第1周:扯淡概論。作者發現TED上的精彩演講往往采用的是扯淡的藝術。扯淡和反扯淡最大的問題在于成本不對稱。例如,最近國內的幾件扯淡的事情:“港珠澳大橋左行右行嚴重的設計錯誤”“醫生罷工造成死亡率急劇下降”。扯淡者并不一定是數學不好或者邏輯有問題,而是因為偏激情緒降低了他們的思考能力;被扯淡者去傳播也未必智商低下,他們并不關心真相而歡迎結論。一個眾所周知的觀點是人一旦進入群體中,智商就會嚴重降低,這也是為什么傳銷的洗腦課總是能成功地引人而入的主要原因。而更為吊詭的是,人們往往不容易輕信小謊言,卻很容易相信大謊言,19世紀英國作家科爾頓說:“有些騙局布設得如此巧妙,只有傻子才不受騙上當?!蹦切┎荚O巧妙的往往是大謊言。長期接受和依賴謊言的人們當中甚至還有在謊言破滅后,自己也加入到維持謊言之中的。
第2周:發現扯淡。真理和自由一樣,需要永遠保持警惕。那么如何發現自己在并不專業的領域中的扯淡呢?課程中通過一些簡單而有趣的統計學驗證來提高學生的信息素養。例如,本福德定律,通過對造假數據的第一個有效數字的分布,識別科學研究中的數據質量。
1945年7月16日上午,世界上第一顆原子彈在美國新墨西哥州沙漠地區爆炸。意大利裔美國物理學家恩利克·費米把筆記本里的一頁紙撕碎了,一感到震波,他即把舉過頭頂的抓著小紙片的手松開。碎紙飄揚而下,在費米身后2.5m處落地,心算之后費米宣布,原子彈能量相當于10000tTNT當量。費米可以這么做,當然學生也可以這么做。
第3周:扯淡分布和扯淡生態。扯淡經常出現的場合是媒體、社交網絡、政治、道德、宗教場所、新聞發布和官方宣傳領域,即難以辨別真偽、辨別真偽又有麻煩的場合。例如,轉基因的技術討論,往往演變發展到道德討論、國家陰謀、民族種族等扯淡領域,即使國家也不得不遷就輿情,智者遠離又使得扯淡的力量空前強大。
第4周:因果關系。這一周的課程內容為相關與因果、充分與必要、中位數與平均數、虛假關聯關系??傮w來講就是,統計學不嚴格的因果關系很容易變成人的邏輯的推論扯淡。例如,最有名的膽固醇與心血管病的關系問題。最近科學發現,正是由于心血管損傷造成大量膽固醇修復血管,而“壞膽固醇”又堆積在血管造成問題。然而,如果減少攝入或者分泌“壞膽固醇”,可能連心血管堵塞的機會都沒有了。統計學上的因果倒置需要領域專家,統計學家貿然進入專業領域會有很多災難性的后果。
第5周:統計陷阱和欺騙。近年來,統計陷阱有很多的慘痛教訓,這些案例讓人記憶深刻的同時也普及了統計學的進展。例如,兒科大夫用不嚴密的一連串統計學概率推斷一位死了兩個孩子的母親殺嬰;維爾羅杰斯效應用來發現兩個地域的GDP增長率平均值只要一個人移民就可以……通過這些典型的案例,學生們可以不必為高大上的貝葉斯類的統計術語嚇破膽,即使統計學家也要明白貝葉斯規則,也要明白質與量不等價。
第6周:數據可視化。利用圖形和人眼誤區可以產生圖像和圖形誤解,這是所有網民都知道的事實,這門課的可貴之處在于教學生使用一些典型的工具去制作這些“扯淡圖形”。利用數據可視化造假,我們要知道眼睛對什么敏感,對什么不敏感,并不是什么時候都是眼見為實的,這些工具包括比例油墨、字符垃圾、誤導軸、夸大比例。
第7周:大數據。我在上大學的時候,學過菲利普斯曲線,說的是失業率與勞動生產率的關系,這是一個經典的經濟學理論,然而近些年它卻不準了,這是由于政府都知道了這個秘密,當一個秘密被知道并作為調整的目標的時候,就再也不準了,這就是古德哈特定律。在大數據領域最扯淡的案例是“啤酒和尿布的故事”。這件事真偽無從考究,據說是從沃爾瑪來的,但是無論是中國的沃爾瑪還是美國的沃爾瑪,我都沒有發現啤酒和尿布放在一起。一位超市專家告訴我,即使啤酒尿布成立,也不會放在一起,那是因為那樣既不衛生,也不經濟(若成立,超市會故意放得遠遠的),更不合理(跟超市收銀臺放在一起的是體積小、利潤高的)。很多大數據講師也愿意講啤酒和尿布,統計陷阱和欺騙的目的并不是欺騙,而是這個故事精彩,而精彩的故事往往會誤導聽眾。
第8周:出版偏見。如果期刊喜歡發表積極的結果而不是負面的結果,那么即使是一個盡職盡責的科學家群體,也會產生誤導性的學術記錄——就像目前出版環境中的情況一樣。絕大多數工程和科技使用的是成熟的技術,而成熟的技術“科技創新可能很少或者不被人注意”,從傳播學的角度講,新的技術和熱點技術容易引起轟動。然而,美國科學家發現,“絕大多數科學論文都是錯的”。錯的科學發現不一定是科學家有意為之,很可能某些條件較為苛刻,更重要的原因在于出版偏見。
第9周:掠奪性出版和科學不端行為。這一周延續上周的學習內容,如果有人故意造假,或者出版社靠收取版面費為生,后果會更為嚴重。例如,哈佛大學醫學院一位教授在2018年10月被辭退,他是著名的心臟權威,過去15年偽造15篇論文,被幾萬名學者追蹤研究,學術造假手段太隱蔽了,這也是在大數據時代才被發現。
第10周:所謂胡說八道的道德規范。這一周主要講騷擾和質疑的界限以及道德。學術領域的事情,盡量用行業評價,但如果行業內形成“均衡”了呢?總體上來講,質疑是就事論事,用科學的方法,不牽涉到道德、宗教、政治、民族。
第11周:假新聞。這一周是上一周內容的延續,包括如何判別假新聞、假新聞及其特征。
第12周:駁斥扯淡。從這門課的目標就能看到這一周的主要內容:①對你的信息食譜中出現的狗P保持警惕;②無論何時何地遇到狗P,都能夠識別出來;③能夠準確說明為什么一則狗P是狗P;④能夠在統計學或科學專業的人面前給出對狗P的技術分析;⑤能夠在迷信的阿姨和不自覺間表露出種族主義的叔叔面前分析狗P,讓他們能聽懂,并且有說服力。
大數據時代,專業領域越來越細,個人不知道的東西越來越多,與此同時,人工智能、社交網絡發展迅速,處于數據洪流中的人,不可能不把自己一部分思維“外包給外腦”,即10年前提出的“人機協同時代”。然而,這個時代除了人腦要處理機器不能處理的每個人的專業領域或者人文領域之外,具備對抗“狗P的一般素養”是異常重要的,而這就是這門課的重要目的,為這門課點贊。
2018年在上海的人工智能大會上,馬云說:“我不擔心人工智能時代機器會取代人,而擔心人類思維不再進步?!笔堑?,反扯淡、反狗P就是第一步,用文明一點的詞匯說,就是“核心信息素養”。