999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx

人人都該知道的統(tǒng)計相關性知識

2015-04-12 12:04:08蔡立英編譯
世界科學 2015年2期
關鍵詞:實驗研究

蔡立英/編譯

●一個尋常的分析錯誤會阻礙生物醫(yī)學研究并誤導公眾。

2012年,《新英格蘭醫(yī)學雜志》刊登了一篇論文,聲稱吃巧克力可以提高認知功能。得出這一結論的根據(jù)是每個國家的諾貝爾獎得主數(shù)量與該國巧克力人均消費量具有強相關性。當我讀到這篇論文時,我詫異于它竟然通過了同行評審,因為對我而言很顯然作者犯了兩個常見錯誤,這是我在生物醫(yī)學文獻中看到研究者進行相關分析時經(jīng)常犯的錯誤。

相關性描述了兩個觀察現(xiàn)象之間的線性關系強度(為了簡化說明,這里我著重闡述最常用的線性關系——皮爾森相關)。例如,一個變量值的增加,比如巧克力消費量,可能會跟隨著另一個變量值的增加而增加,比如諾貝爾獎得主。或者可能是負相關:一個變量的增加會伴隨另一個變量的減少。因為有可能兩個數(shù)值不能用相同單位表示的變量關聯(lián)起來——例如,人均收入和霍亂發(fā)病率——它們的關系是用一個無單位的數(shù)值來計算的,那就是相關系數(shù)。相關系數(shù)的數(shù)值范圍是從-1到+1,絕對值越接近1,則表示相關性越強。

相關系數(shù)鮮明的簡潔性隱藏了解釋其意義時面臨的相當大的復雜性。《新英格蘭醫(yī)學雜志》那篇論文的一個錯誤是,作者在群體數(shù)據(jù)的基礎上得出關于個體的結論時,陷入了生態(tài)學謬誤中。這個案例中,作者計算了集合層面(國家)的相關系數(shù),然后錯誤地把這個數(shù)值用于得出關于個體層面的結論(吃巧克力提高認知功能)。實際上,個體層面的準確數(shù)據(jù)完全是未知的:沒有人收集過諾貝爾獎得主吃過多少巧克力的數(shù)據(jù),甚至于他們到底是否吃過。我并不是唯一一個注意到這個錯誤的人。化學家阿舒托什·喬伽萊卡(Ashutosh Jogalekar)在他的《科學美國人》博客《好奇的波函數(shù)》中寫了一篇徹底的批判文章。加利福尼亞大學圣迭戈分校的比阿特麗斯·戈隆布(Beatrice A.Golomb)甚至與一個團隊的合作者一起檢驗了這個假設,指出兩個變量之間不存在相關性。

許多新聞機構不顧科學界的批評,報道了這篇論文的研究結果。論文從未被撤回,至今已經(jīng)被引用23次。即使當錯誤的論文被撤回時,相關的新聞報道還保留在互聯(lián)網(wǎng)上,還能繼續(xù)傳播錯誤信息。如果這些反映出對統(tǒng)計有所誤解的錯誤結論甚至能出現(xiàn)在《新英格蘭醫(yī)學雜志》這樣的著名期刊,那么我很好奇,這樣的錯誤出現(xiàn)在生物醫(yī)學文獻中的總體頻率有多大?

巧克力消費量和諾貝爾獎得主的例子把我引到了另一個更常見的曲解相關性分析的例子:即認為相關性就意味著因果關系的想法。計算出一個相關系數(shù)并不能解釋一個數(shù)量一致性關系的性質,而只能評估這種一致性的強度。兩個因素之間表現(xiàn)出一種關系,可能不是意味著它們之間相互影響,而是意味它們都被同一個隱藏的因素影響——在這個例子中,可能是一個國家的富裕程度影響了巧克力的消費量和高等教育的可獲取性。相關性可以很肯定地指出一個可能存在的因果關系,但是并不足以證明存在這樣的因果關系。

杰出的統(tǒng)計學家喬治·博克斯(George E.P.Box),在他的著作《實證模型的建立與響應面》中寫道:“本質上而言,所有統(tǒng)計模型都是錯誤的,但是其中有一些是有用的。”所有統(tǒng)計模型都是使用數(shù)學概念對一個真實世界中的現(xiàn)象的描述,所以只是現(xiàn)實的一種簡化。如果統(tǒng)計分析是精心設計的,與目前好的實踐方針相一致,并且對所用方法的局限性有徹底的理解,那么,它們會非常有用。但是如果模型并不是按照上述兩條原則設計的,那么它們不僅會不準確、毫無用處,而且還具有潛在的危險性——誤導醫(yī)生和公眾。

我經(jīng)常使用和設計數(shù)學模型來探究公共健康問題,尤其在健康技術評估中使用數(shù)學模型。為了這一目的,我使用已經(jīng)發(fā)表的研究成果中的數(shù)據(jù)。不加批判地使用發(fā)表的數(shù)據(jù)來設計這些數(shù)學模型,可能會導致得出關于公共健康的不準確、完全無用,甚至更糟的是不安全的結論。

開始認識數(shù)據(jù)

在精心設計的實驗中,相關性可以證實因果關系的存在。但是,在從非實驗數(shù)據(jù)中得出因果推斷之前,必須小心謹慎地使用統(tǒng)計模型。例如,加利福尼亞大學舊金山分校流行病學家史蒂芬·赫利(Stephen Hulley)及其同事發(fā)表的一個隨機控制實驗確定,激素替代療法會導致心臟冠狀動脈疾病的風險增加,盡管以前發(fā)表的非實驗研究的結論是,激素替代療法會降低心臟冠狀動脈疾病的風險。這個精心設計的實驗表明,非實驗研究中低于心臟冠狀動脈疾病平均概率的結果,是由那些使用激素治療的人具有更高的平均社會經(jīng)濟地位帶來的好處導致的,而不是由療法本身導致。對非實驗研究的重新分析,包括社會經(jīng)濟地位對收入的影響分析,得出了與隨機控制實驗相同的結果。但是損害已經(jīng)造成:美國食品藥品管理局顧問委員會已經(jīng)批準激素替代療法更換標簽,允許把預防心臟疾病列為一個指示,這幾乎是在上述實驗十年之前。

即使科學家很清楚“相關性不等于因果關系”的真言,但是把相關性和因果關系混為一談的研究在頂級期刊中還是太普遍。一篇被廣泛討論的1999年發(fā)表在《自然》雜志上的論文發(fā)現(xiàn),兩歲以下兒童的近視和睡眠期間夜間環(huán)境光曝光度這兩者之間存在強相關。但是,2000年同樣是發(fā)表在《自然》雜志上的另一項研究結果駁斥了上述發(fā)現(xiàn),報告說兒童近視的原因是遺傳性的,而不是環(huán)境因素造成的。這個新的研究發(fā)現(xiàn)父母近視與兒童近視之間存在強相關,指出近視的父母為孩子的臥室夜間開燈的可能性會更大。在這個例子中,作者基于假想的關聯(lián)得出了一個結論,而沒有檢查其他可能的解釋。但是正如下面的數(shù)據(jù)所顯示的,完全無關的現(xiàn)象也可能會可笑地呈現(xiàn)出相關性。

除了相關性意味著因果關系這個錯誤的觀念之外,我還看到了第三種相反類型的相關錯誤:認為相關性為零就意味著兩個變量相互獨立的想法。如果兩個變量之間相互獨立,例如,過去一個月我從早飯中攝入的熱量與相同時期月亮表面的溫度,那么我會預期這兩個變量之間的線性相關系數(shù)為零。然而,反之則不一定總是如此。線性相關系數(shù)為零不一定意味著這兩個變量之間是相互獨立的。

盡管這個原則可以應用在很多例子中,仍然還是存在非單調的關系(想想一個上下波動的折線圖),在這個例子中,相關系數(shù)的值為零并不意味著兩個變量是相互獨立的。為了更好地想象這個抽象概念,請想象一下按照下面的規(guī)則拋一枚不做假的硬幣以確定投注金額:若第一次是正面朝上、第二次是反面朝上,則你輸?shù)?0美元;如果第一次是反面朝上、第二次是正面朝上,則你贏得20美元。如果我們定義X為投注金額、Y為凈獲勝金額,那么X和Y可能會是零相關,但是它們不是相互獨立的——實際上,如果你知道X的值,那么你就知道Y的值。然而,這兩個變量之間的關系可能是非線性的,因此無法通過一個線性相關檢驗來發(fā)現(xiàn)。

理想的情況是,科學家首先把數(shù)據(jù)繪制成圖表以確定它是單調的(單調地上升或下降),但是從我在生物醫(yī)學文獻中看到的例子來判斷,一些人正在偷工減料,并沒有這么做。兩個變量之間U型曲線的關系可能會有一個數(shù)值為零的線性相關系數(shù),但是在這個例子中,并不意味著這兩個變量是相互獨立的。

1973年,英國統(tǒng)計學家弗蘭克·安斯庫姆(Frank Anscombe)發(fā)現(xiàn)了用圖形展示這種誤解的理想化的數(shù)據(jù)集,稱為安斯庫姆四重奏(Anscombe’squartet),這個演示展示了統(tǒng)計特性非常相似的四組數(shù)據(jù),每組數(shù)據(jù)的相關系數(shù)都是0.816。乍一看,每個例子中的變量看起來好像都是強相關。但是,只要觀察一下這四組數(shù)據(jù)的圖表,就足以意識到這個結論是錯誤的(參見上圖)。只有第一個圖表明顯地顯示出線性關系,對此做出強相關的闡釋是合適的。第二個和第四個圖表顯示出兩個變量之間的關系是非線性的,所以即使相關系數(shù)為0.816,這兩個變量之間也不是相關的。第三個圖表描述了幾乎完美的線性關系,相關系數(shù)幾乎為1,但是一個離群值把線性相關系數(shù)的值降低到了0.816。

安斯庫姆四重奏是4幅一組的數(shù)據(jù)圖表,顯示了相關系數(shù)為0.816的具有強相關性的數(shù)據(jù)。盡管統(tǒng)計上貌似顯示出很強的線性相關關系,這樣的結論卻只適用于左上圖,另外三幅圖表都違反了統(tǒng)計分析的假設,由此強調了選擇一個合適的數(shù)據(jù)分析之前首先繪制數(shù)據(jù)圖表的重要性

所有類型的不相關現(xiàn)象都可能具有相關性,包括莫扎里拉奶酪人均消費量與美國土木工程博士學位授予數(shù)量這兩個風馬牛不相及的現(xiàn)象之間。對偽相關性的錯誤闡釋使得這種論文頻繁地通過同行評審。

這種誤解會對人類健康和政策產生重大影響。在對一種新物質進行安全性測試的時候,毒理學家通常以為高劑量的測試會比長周期、低劑量的測試更快、更不含糊地揭示低劑量效應。但是柏林夏洛特大學醫(yī)學院的安德森·安德拉德(Anderson Andrade)及其同事的研究表明并非如此。他們在兩種曝光程度相差很遠的情況下,測試了一種名為鄰苯二甲酸二辛酯(DEHP)的塑料成分和內分泌干擾物對老鼠的影響。在這個實驗中,研究者監(jiān)測了一種叫做芳香酶的關鍵的酶,它會誘導大腦的雄性化。他們表明低劑量的DEHP抑制了芳香酶,但是高劑量的DEHP確實增強了芳香酶的活性。

在安德拉德的研究中,這個劑量反應曲線遵循了非單調的模式,通常的高劑量測試預測不出這些低劑量效應。2010年,美國消費品安全委員會宣布可以認為含有DEHP的產品是有毒和危險的。像安德拉德這樣的研究導致公眾對用來設計激素活性化合物的毒理試驗的基本假設產生了質疑,這個例子再一次證明了對數(shù)據(jù)的草率分析或是粗劣膚淺的闡釋,一定不是一個良性現(xiàn)象。

避免錯誤

對相關性的所有三類錯誤闡釋都可以避免。流行病學家和統(tǒng)計學家奧斯汀·布拉德福德·希爾(Austin Bradford Hill)在1965年表明,要得出因果關系的結論,就必須滿足一定的判定標準。那些判定標準依然有效,但是科學家還研究出了從觀察到的數(shù)據(jù)得出因果推論的更新的方法。還有一些方法正在研究中——例如,朱迪亞·珀爾(Judea Pearl)和詹姆斯·羅賓斯(James Robins)各自獨立地介紹了一種從非實驗研究中得出因果推論的新框架。羅賓斯研究出了一種統(tǒng)計解決方法,能把非實驗數(shù)據(jù)轉化為如同從一個隨機控制實驗中得出的數(shù)據(jù)。

為了避免生態(tài)學推論謬誤,希爾建議那些缺乏個體層面的數(shù)據(jù)的研究者應該進行認真的多層面的數(shù)據(jù)建模。這種謬誤通常會在流行病學研究中發(fā)生,當研究者只能獲得集合數(shù)據(jù)時。在其1997年的著作《生態(tài)學推理問題的一種解決方法》中,哈佛大學的加里·金(Gary King)描述了導致這種錯誤的統(tǒng)計困難。正如金所解釋的,用于生態(tài)學推論的數(shù)據(jù)往往具有龐大級別的異方差,這意味著一個數(shù)據(jù)集內部不同部分的差異性在很大的數(shù)值范圍內波動。

集合數(shù)據(jù)通常比個體數(shù)據(jù)更容易得到,而且正確分析的話,會提供關于個體特性的寶貴線索,但是這還需要個體層面的數(shù)據(jù)。那么,就必須進行個體層面的建模,才有可能確定個體層面和集體層面數(shù)據(jù)之間的關聯(lián)。只有到那時,才有可能得出集體層面的相關性是否適用于個體層面的結論。僅憑生態(tài)學數(shù)據(jù),科學家是無法確定這類數(shù)據(jù)中是否可能存在生態(tài)學偏見;唯一的解決辦法就是在生態(tài)學數(shù)據(jù)的基礎上補充個體層面的數(shù)據(jù)。這種類型的建模通常涉及混合或多層次的統(tǒng)計模型,允許把個體數(shù)據(jù)嵌套到集合數(shù)據(jù)中。

為了避免因為相關系數(shù)為零就假定這兩個變量是相互獨立的,必須對數(shù)據(jù)進行繪圖以確定數(shù)據(jù)是單調的。如果數(shù)據(jù)不單調,可以把其中一個變量或者兩個變量都轉換成單調的變量。在數(shù)據(jù)變換中,每一個變量的所有數(shù)值都使用同一個等式重新計算,這樣能保持兩個變量之間的關系,但是它們的分布改變了。不同的數(shù)據(jù)分布使用不同類型的數(shù)據(jù)變換。例如,對數(shù)變換壓縮了大數(shù)值的間隔,擴大了小數(shù)值的間隔,當數(shù)組的平均值更大、變動也更大的情況下,這種數(shù)據(jù)變換是合適的。不獲得原始數(shù)據(jù),是不可能知道有沒有犯這種錯誤的。

相關性錯誤和統(tǒng)計學本身一樣古老,但是隨著發(fā)表的論文和新期刊的數(shù)量不斷增長,這樣的錯誤也在倍增。盡管期望所有研究人員都對統(tǒng)計學方法有深入理解是不現(xiàn)實的,但是研究人員必須持續(xù)關注并不斷擴展基本的統(tǒng)計學方法知識。不知道或是不加批判地評估所使用的統(tǒng)計學方法的充分性和局限性,通常是學術論文中所犯錯誤的根源。在一個研究團隊中有生物統(tǒng)計學家和數(shù)學家的參與不再是一個優(yōu)勢而是必需。一些大學為研究者提供了選擇,在把論文提交給出版機構評審之前,先讓學校的統(tǒng)計學系檢查他們的數(shù)據(jù)分析結果。盡管這個解決辦法會對一些研究者起作用,但是讓研究人員花費額外的時間這樣做的激勵幾乎沒有。

科學研究的過程要求足夠的生物統(tǒng)計學知識,而這是一個不斷變化的領域。為了達到這個目的,生物統(tǒng)計學家應該在一開始就參與課題研究,而不是等到測量、觀察或是實驗完成以后。另一方面,在批判性地評價發(fā)表的科學論文時,生物統(tǒng)計學的基本知識也是必需的。一個批判性的方法必須存在,不管論文發(fā)表在什么期刊上。在生物學研究中更謹慎地使用統(tǒng)計學,也有助于在其他領域設定更嚴格的標準。

為了避免這些問題,科學家必須清楚地表明他們理解了一個統(tǒng)計學分析背后的假設,并且用他們的方法解釋:為了確定他們的數(shù)據(jù)集滿足那些假設,他們做了哪些工作。如果一篇論文沒有遵循這些最好的實踐,那么就不應該讓它通過評審。為了讓論文評審者檢驗和重復論文中的數(shù)據(jù)分析,下面三個原則必須成為所有打算發(fā)表研究結果的作者的強制性規(guī)定:和論文一起附上原始數(shù)據(jù)作為補充信息,讓評審者能充分獲取用來分析數(shù)據(jù)的軟件代碼,并且在公開的在線數(shù)據(jù)庫上登記研究結果、清晰地陳述開始研究之前設定的目標,強制提交總結結果以避免偏向于發(fā)表正面結果。即使當評審者有所疏漏的情況下,采取這些步驟也能加快發(fā)現(xiàn)錯誤的過程,增加了透明度,支撐了公眾對科學的信心,最重要的是,避免了由于無心的錯誤而對公眾健康造成損害的情況。

猜你喜歡
實驗研究
記一次有趣的實驗
FMS與YBT相關性的實證研究
微型實驗里看“燃燒”
2020年國內翻譯研究述評
遼代千人邑研究述論
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
做個怪怪長實驗
EMA伺服控制系統(tǒng)研究
新版C-NCAP側面碰撞假人損傷研究
NO與NO2相互轉化實驗的改進
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
主站蜘蛛池模板: 国产国产人免费视频成18| 天天操精品| 永久免费AⅤ无码网站在线观看| 中文字幕亚洲电影| 中文字幕人成人乱码亚洲电影| 久久亚洲国产一区二区| 欧美午夜性视频| 久久大香伊蕉在人线观看热2| 国产成人免费| 九九免费观看全部免费视频| lhav亚洲精品| 97人妻精品专区久久久久| 国产成人免费高清AⅤ| 亚洲综合久久成人AV| 国产成在线观看免费视频| 日韩AV手机在线观看蜜芽| 色婷婷在线播放| 国产97公开成人免费视频| 国产成人啪视频一区二区三区 | 国产农村1级毛片| 日本成人不卡视频| 伊人蕉久影院| 91色老久久精品偷偷蜜臀| 伊人精品视频免费在线| 美女亚洲一区| 亚洲欧美一区在线| 嫩草国产在线| 欧美a网站| 自拍偷拍一区| 成人在线不卡| 亚洲欧洲一区二区三区| 亚洲日韩在线满18点击进入| 2020精品极品国产色在线观看| 色AV色 综合网站| 日韩欧美91| 日韩 欧美 国产 精品 综合| 精品欧美视频| 国产福利免费在线观看| 9啪在线视频| 2024av在线无码中文最新| 国产aⅴ无码专区亚洲av综合网| 精品无码国产自产野外拍在线| 自拍中文字幕| 欧美日韩国产综合视频在线观看| 激情六月丁香婷婷四房播| 伊人久综合| 99国产精品国产| 色九九视频| 视频二区亚洲精品| 国产精品美女网站| 99久久精品视香蕉蕉| 亚洲精品在线影院| 囯产av无码片毛片一级| 免费高清a毛片| 国产不卡网| 99视频在线观看免费| 操国产美女| 丰满少妇αⅴ无码区| 亚洲码一区二区三区| 91蝌蚪视频在线观看| 久久免费观看视频| 免费人成视频在线观看网站| 亚洲成人高清无码| 欧美一级视频免费| 欧美精品1区| 国产乱人乱偷精品视频a人人澡| 最新国产你懂的在线网址| 无码精品国产dvd在线观看9久| 亚洲无码视频一区二区三区| 91丝袜美腿高跟国产极品老师| 秋霞一区二区三区| 天天色综合4| 黄色a一级视频| 久久久久亚洲精品成人网| 人妻一本久道久久综合久久鬼色| 国产精选小视频在线观看| 91av成人日本不卡三区| 国产精品自在在线午夜区app| 国产96在线 | 日韩欧美国产三级| 一级在线毛片| 国产精品福利在线观看无码卡|