日韩av在线勉费观看-亚洲资源在线观看资源av-亚洲欧美一区二区激情文学-欧美日韩乱码一区二区三区

為什么統(tǒng)計數(shù)據(jù)有時會“撒謊”

作者: ${content.author} 時間:2017-01-17 瀏覽量:2,474

  收集統(tǒng)計數(shù)據(jù)是一項復(fù)雜而又精細的工作,每一步都有出錯的可能。即使所有的細節(jié)都萬無一失,最終得到的數(shù)據(jù)里也會隱藏大量的陷阱。如果盲目地對統(tǒng)計數(shù)據(jù)進行分析,有時會得出一些甚為荒謬的結(jié)論。

  統(tǒng)計學(xué)家曾經(jīng)調(diào)查過鈾礦工人的壽命,其結(jié)果讓人大跌眼鏡:在鈾礦工作的工人居然與普通人的壽命相當(dāng),有時甚至更長!難道統(tǒng)計結(jié)果表明在鈾礦工作對身體無害甚至有益嗎?當(dāng)然不是!事實上,只有那些身強體壯的人才會去鈾礦工作,他們的壽命本來就可能長一些;正是因為去了鈾礦工作,才把他們的壽命拉低到了平均水平,造成了數(shù)據(jù)的偽獨立性。這種現(xiàn)象常常被稱為健康工人效應(yīng)。

  類似地,有數(shù)據(jù)表明打太極拳的人和不打太極拳的人平均壽命相當(dāng)。事實上,打太極拳確實可以強身健體,延長壽命,但打太極拳的人往往體弱多病,這一事實也給統(tǒng)計數(shù)據(jù)帶來了虛假的獨立性。

  有虛假的獨立性數(shù)據(jù),就有虛假的相關(guān)性數(shù)據(jù)。統(tǒng)計數(shù)據(jù)顯示,去救火的消防員越多,火災(zāi)損失越大。初次聽到這樣的結(jié)論,想必大家的反應(yīng)都一樣:這怎么可能呢?仔細想想你就明白了:正是因為火災(zāi)災(zāi)情越嚴(yán)重,損失會越大,所以才會有更多消防員去救火。這里的因果關(guān)系弄顛倒了。數(shù)據(jù)只能顯示兩個事情有相關(guān)性,但并不能告訴你它們內(nèi)部的邏輯關(guān)系。

  數(shù)據(jù)統(tǒng)計中的各種圖示方法

  事實上,兩個在統(tǒng)計數(shù)據(jù)上呈現(xiàn)相關(guān)性的事件,甚至有可能根本就沒有因果關(guān)系。統(tǒng)計數(shù)據(jù)表明,冰激凌銷量增加,鯊魚食人事件也會同時增加。但這并不意味著,把冰激凌銷售點全部取締了,就能減小人被鯊魚吃掉的概率。真實的情況是,這兩個變量同時增加只不過是因為夏天到了。又如,統(tǒng)計數(shù)據(jù)顯示,籃球隊的獲勝率,竟然與隊員的球襪長度成正比。難道把隊員的球襪都換長一些,就能增加球隊實力嗎?顯然不是。數(shù)據(jù)背后真正的因果關(guān)系是,球隊的獲勝概率和隊員的球襪長度同時受第三個因素——隊員身高——的影響,這導(dǎo)致了獲勝概率與球襪長度之間表現(xiàn)出虛假的相關(guān)性。

  類似的例子還有很多。如果觀察大氣層二氧化碳的含量變化和肥胖癥人口的數(shù)量變化,會發(fā)現(xiàn)一個非常有趣的現(xiàn)象:在1950年左右,兩者都出現(xiàn)了一次非常劇烈的增長。但科學(xué)研究并沒有發(fā)現(xiàn),二氧化碳含量的增加會導(dǎo)致人類出現(xiàn)過度肥胖的趨勢。事實上,這個數(shù)據(jù)背后的真實原因是,20世紀(jì)50年代,汽車產(chǎn)業(yè)形成了一定的規(guī)模,尾氣排放導(dǎo)致大氣中的二氧化碳含量陡然增加;同時,人們也更多地用汽車代步,活動的時間越來越少,自然就越來越胖了。

  可見,要想從統(tǒng)計數(shù)據(jù)中挖掘出正確的結(jié)論,并不是一件容易的事。如果只從表面上觀察數(shù)據(jù),往往會得到一些錯誤的信息。正如著名作家馬克·吐溫所言:“世上一共有三種謊言:謊言,糟糕的謊言,還有統(tǒng)計數(shù)據(jù)?!?/p>


掃一掃

關(guān)注科技館微信

x

掃一掃

關(guān)注科普濱州

x