统计数据、相关性与因果关系

Matrix67那里看到了这篇文章,很精彩故转载一下

在去年10月份的数学文化节期间,我去听了好几次讲座,其中有一些讲的相当精彩。时间过得好快,转眼间又是一年了,如果不是Wind牛发短信问我去不去听讲座,我估计今年数学文化节过了都还想不起这档子事。于是和Wind牛跑去二教309,听了一场叫做《从数据中挖掘因果关系》的讲座。这个题目是很有趣的:数据本身并不说谎,难就难在我们如何从中挖掘出正确的信息。当我们讨论数据时,我们讲的最多的是数据的相关性,而我们希望得到的则是事件之间的因果联系;但事实往往是复杂的,统计数据有相关性并不意味着两个事件具有因果联系,而具有因果联系的两件事从统计数据上看有时也并不相关。

    对于前者,最简单的例子就是公鸡打鸣与太阳升起:公鸡打鸣与太阳升起总是同时发生,但这并不表示把全世界所有的公鸡都杀光了后太阳就升不起来了。统计发现,手指头越黄的人,得肺癌的比例越大。但事实上,手指的颜色和得肺癌的几率之间显然没有直接的因果联系。那么为什么统计数据会显示出相关性呢?这是因为手指黄和肺癌都是由吸烟造成的,由此造成了这两者之间产生了虚假的相关性。我们还可以质疑:根据同样的道理,我们又如何能从统计数据中得出吸烟会致癌的结论呢?要想知道吸烟与癌症之间究竟是否有因果联系的话,方法很简单:找一群人随机分成两组,规定一组抽烟一组不抽烟,过它十几年再把这一拨人找回来,数一数看是不是抽烟的那一组人患肺癌的更多一些。这个实验方法本身是无可挑剔的,但它太不道德了,因此我们只能考虑用自然观察法:选择一些本来都不吸烟的健康人进行跟踪观察,然后呢,过段时间这一拨人里总会出现一些失意了堕落了犯上烟瘾的人,于是随着时间的流逝这帮人自然而然地分成了可供统计观察的两组人。注意,这里“是否吸烟”这一变量并不是随机化得来的,它并没有经过人为的干预,而是自然区分出来的。这是一个致命的缺陷!统计结果表明,犯上烟瘾的那些人得肺癌的几率远远高于其他人。这真的能够说明吸烟致癌吗?仔细想想你会发现这当然不能!原因恰似黄手指与肺癌一例:完全有可能是某个第三方变量同时对“爱吸烟”和“患肺癌”产生影响。1957年,Fisher提出了两个备选理论:癌症引起吸烟(烟瘾是癌症早期的一个症状),或者存在某种基因能够同时引起癌症和烟瘾。 Read the rest of this entry »

高中最后的运动会

在盼望与烦躁中高中的最后一次运动会终于在昨天召开了,这是高中最爽也是最不爽的一次运动会。

在运动会前的整整一个星期,运动会献歌、运动会稿件、入场式方队训练、班歌等等一系列一堆乱七八糟的事就纷纷到来,弄得我烦躁不堪。班里同学都太爱学习了,每次下去练队都极其不情愿,估计我们班练队的时间是全校最少的班级吧。方案在不断修改,直到运动会前一天晚上才敲定了最后的方案,而这最终方案我们还没完整的练过一次呢。

就这样我们就上场了,每个人都有种感觉入场式没什么戏了。不过在排队等待入场时,我们看到前面的一班做了最后一次演练,顿时士气暴涨:原来还有比我们弄得更烂的班,心理直接就踏实了……

在真正入场的时候,貌似出了点差错,人浪做的有点乱了,不知道上面主席台上的人能不能看得出来我们是在做人浪…退场的时候没算计好跑道,结果有一行被挤到跑到外面去了…这入场式弄得确实不怎么样。后来看成绩,我们班也就比一班高了……

说一说我的运动项目吧。 Read the rest of this entry »

2008诺贝尔物理学奖

10月7日,2008年诺贝尔物理学奖揭晓,获奖的是三位日本人——南部阳一郎小林誠益川敏英。日本人已经多次荣膺这一科学界最高荣誉了,而我们仍然没有一位在中国受教育在中国搞科研的拥有中国国籍的人获得诺贝尔奖,确实很可悲。

他们三位的获奖原因,是关于对称性破缺的机制和起因。诺贝尔奖评委拉斯·布林克用一只普通的橘子深入浅出地解释了这三位科学家的重要成就:世界万物并不存在完美的对称,就像看上去对称的橘子在显微镜下会呈现出对称性的偏离。实际上这个问题涉及到了宇宙运作的根本,不是三言两语能说明白的,也难怪找老师在班里说他们的主要贡献时班里一片大惑不解的声音。他们的理论还渗透到了标准例子模型中,预言了另外三种夸克的存在(貌似当初盖尔曼提出夸克模型是认为只有三种夸克),这一点在近几年得到了证实。关于物理学中的对称性,建议大家看看阿热写的《可怕的对称》(Fearful Symmetry)——一本比较通俗的,文采较好的科普书。

这里有一份此次诺贝尔物理学奖的科学背景资料,pdf格式的,可惜是英文版。

高中物理竞赛生涯

随着这梦幻般的三天匆匆逝去,我高中三年的物理竞赛生涯算是画上了句号,这一切都已尘埃落定。这是一段坎坷的路途,却又是一段美好的回忆。趁着记忆还没有被时间风化,我赶紧写下这篇回忆录。

  Read the rest of this entry »

我发现的幻方小性质

正在看马丁•加德纳的书,忽然间想到了幻方,摆弄了一下居然发现了一个我以前没有看到过的性质,写下来和大家分享一下。

最著名的三阶幻方长这个模样:

3 5 7
8 1 6

现在用小键盘输入这9个数,顺序按照492357816这样。在小键盘的对应位置上写上每一个数字是第几个输入的,比如4是第1个输入的,就在小键盘4的位置写下1,9是第二个,在9的位置上应该写上2……这样一来小键盘上就写出了如下阵列:

1 5 9
8 3 4

这居然还是一个幻方,其实就是把上面那种幻方翻转了一下。

我又验证了一种四阶幻方,原幻方如下:

1 15 14 
12 6 7 9
8 10  11  15 
13 3 2 16

然后想象有一个4×4的小键盘,上面有1~16,现在同样把小键盘的对应位置上写上每一个数是第几个输入的,仍然得到一个幻方:

13 3 2 16
8 10 11 5
12 6 7 9
1 15 14 4

我又验证了一个最普遍的五阶幻方: Read the rest of this entry »

旋转格子错觉

Matrix67那里看来了一个神奇的视觉错觉图片(Firefox下看更佳):

一个大的匀速旋转的格子看起来像是几个独立旋转的小格子:

Read the rest of this entry »

Posted in Others. Tags: , , . 2 Comments »