马克·吐温(Mark Twain)曾经说过:“ 有谎言,该死的谎言和统计数据。通过真实数据。
您也不必相信我的话,因为一个名为Spurious Correlations的网站完美地展示了如何调整和调整统计数据以适应特定偏见。事实证明,统计数据实际上是没有用的。
网站
虚假相关性是哈佛法学院犯罪学学生泰勒·维根(Tyler Vigen)的创意。 Vigen着迷于实证研究,因此他创建了一个简单的网站,专门用于比较变量以及变量之间的相关性。
每天都有一个新的虚假相关性发布到该站点,迄今已发布24,000多个。除了自动生成的数据外,访问者还可以通过选择两个不同的数据集进行比较来发现自己的数据集。
尝试一下,您会为全部数据上瘾而感到惊讶。
以下是随机选择的五个虚假关联的示例,尽管尼古拉斯·凯奇总是注定要露面。因为他是尼古拉斯·凯奇(Nicolas Cage)。
请记住,除了可以使用统计数据得出不存在的结论这一事实之外,这些示例都无法证明任何其他事情。但是,想出这些统计数据匹配的原因很有趣。
在美国养宠物所花的钱与加利福尼亚州律师的数量有关。宠爱的宠物会起诉他们的有钱人吗?还是纯粹的巧合?
因掉进游泳池而溺水的人数与尼古拉斯·凯奇(Nicolas Cage)出演的电影数量有关。笼子里有一些疯狂的表演技巧,但肯定不会导致溺水。
在美国商场中产生的总收入与在美国获得的计算机科学博士学位的数量有关。链接,但很可能这两件事一起变得越来越流行。
在美国销售的德国乘用车数量与在美国撞车导致的自杀人数相关。驾驶德国汽车会导致沮丧和自杀吗?我们怀疑没有。
缅因州的离婚率与美国人造黄油的人均消费量相关。也许杂货店购物负责人应该买黄油。
表面上,教训
虚假关联是一个不错的小型网站,能够让您分心几分钟。不仅如此。这也提醒您,不应该接受基于面值的统计信息。相反,应该更仔细地检查它们,以确保它们确实重叠。
我们可能都已经在报纸上看到头条新闻,它们宣称一种随机趋势与另一种随机趋势之间存在联系。小报记者和编辑喜欢这些东西,因为它们是保证出售报纸的廉价头。但是它们常常是无辜的误导,或者是完全有意的虚假。换句话说,公牛** t。
现在,由于虚假关联,我们知道为什么会这样。
结论
花一些时间在Spurious Correlations上,查看可以匹配的两个完全未连接的数据集。然后回到这里,告诉我们您的发现。不要为传播错误信息而感到内;;小报报纸在每周的每一天都会这样做。
标签: