http://www.sciencehuman.com 科学人 网站 2010-02-02
【万物皆数】
每个人都有生日,偶尔会遇到与自己同一天过生日的人,但在生活中,这种缘分似乎并不常有。我们猜猜看,在50个人当中,出现这种缘分的概率有多大,是10%,20%,还是50%?
有人告诉我,在文章开头插入公式十分倒胃口,所以就不写计算过程了(除了传统的排列组合方法外,美国数学家保罗·哈尔莫斯还给出了一个巧妙的解法),直接给出结果吧。在50个人中有相同生日的概率,高达97%,这个数字,恐怕远远超出了绝大多数人的意料。
相信我,错的不是计算过程,而是直觉。在这个地方,科学又跟我们的日常经验开了个玩笑。正因为计算结果与日常经验产生了如此明显的矛盾,该问题被称为“生日悖论”(Birthday Paradox)。它体现的是理性计算与感性认识的矛盾,并不引起逻辑矛盾,所以倒也算不上严格意义上的悖论。“生日悖论”的原始表述是:在23个人当中出现相同生日的概率大于50%。为了让矛盾更突出,我特地把人数换成了50。如果事先不知道答案,光看问题,你猜测的结果肯定远远小于97%吧?说到这里,也许会有人质疑,我们在计算时,假定人们的生日均匀而随机地分布,但生活中却未必如此———别担心,数学家们早就考虑到了这个因素,不平均分布的情形也已解决,而且更进一步的证明是,不平均分布时,概率只会更高。此外,美国计算机科学家高德纳(D. E. Knuth)还计算过这样一个问题:平均在多少人中才能找到一对相同生日?答案是25人。这看起来实在是不可思议吧?
对于为何出现这种矛盾?其实问题并不复杂。首先,当只有1个人时,出现“相同生日”的概率为0%。如果不考虑闰年的因素,当人数大于365时,出现“相同生日”概率是100%。于是,在1到365这个区间内,我们通常会自然而然地认为,对应的概率是线性地从0%增长到100%,哪怕不线性,也不会陡峭得太离谱,所以对于50人来说,该概率应该在50/365,即13.7%左右。但事实上,这条曲线的增长劲头却是十分可怕:从一开始就直线上升,到50人时,几率已经接近100%,与我们幻想的线性曲线有天壤之别。那么问题就是:为啥我们会误以为它是线性的?别急,我们把问题稍作改动,就能得到启发。新的问题是,在一群人当中,有人与你同一天生日,这个概率有多大?同样地,我们把概率曲线描出来,可以看到,它是十分平缓的:人数为350时,这个几率不过略高于 50%。
现在,我们大致可以发现前述那种错误的直觉产生的原因了:当我们看到“有人生日相同”时,下意识地用“与我生日相同”去推测,以至于把火箭发射当成了平稳增长,这才造成了“生日悖论”。
□苏椰(江苏 人工智能专业)
[新京报]