打开网易新闻 查看更多图片

就其新颖度和其强大的实用性而言, 再加上其较大的难度, 这一定理因其分量和价值已经成为这一学说之最。——伯努利

如果投掷一枚均匀的硬币五次, 产生三次正面和两次反面的概率是多少呢?在《猜度术》中, 雅各布·伯努利给出了一般规则:如果我们重复操作 n + m 次独立试验(即 n + m 次伯努利试验), 其中任意一次试验成功的概率是 p, 而失败的概率是 1 − p, 那么正好得到 n 次成功和m 次失败的概率由下面的公式给出。

为了化简上面这个公式, 数学家引入了阶乘的记法:

例如, 3! = 3 × 2 × 1 = 6, 5! = 5 × 4 × 3 × 2 × 1 = 120。(注意, 阶乘中的感叹号不是要求我们大点声说话。)由于有了这样便利的记法, 伯努利结果则化简成:

打开网易新闻 查看更多图片

因此, 在投掷一枚均匀的硬币五次之后, 得到三个正面的概率就是设 n = 3, m = 2, p = Prob(投出一个正面)=1/2。于是有

同样, 为了求投掷一枚骰子 15 次, 正好得到五个 4 的概率, 我们声明得到一个 4 是“成功”, 且指定值:

于是经过 15 次独立的投掷, 得到 5 个 4 的概率是

打开网易新闻 查看更多图片

这是几乎不可能发生的事情。

回到早前的一个问题, 投掷一枚硬币 500 次, 得到 247 次正面和253 次反面的概率是

这个结果尽管正确, 但这个概率太复杂, 无法手算得到, 而且即使有一个高级的袖珍计算器也无法实现计算 500! 这样大的数的愿望(对此怀疑的人不妨试一试)。但是, 即使无法这样直接计算, 这个公式在理论上也还是很完美的。它是求任意一系列独立伯努利试验概率的关键技术。

遗憾的是, 日常生活中的大多数事件实际上比投掷硬币复杂得多,这几乎是太纯粹的概率状况。确定一个 25 岁的人能活到 70 岁以上的概率, 或者确定下一个星期二的降雨量超过一英寸(25.4 毫米)的概率, 或者确定一辆正驶入交叉口的汽车要右转弯的概率, 求解这些问题绝不是一件容易的事。这些事件因为现实世界的纷繁复杂而使人一筹莫展, 正如雅各布说的那样:

我要问, 列举所有可能的情况, 能够确定在人身体不同部位、不同年龄段折磨他的致命疾病的数量吗?或者说, 假如能够确定一种疾病比另外一种疾病更具有致命性, 如瘟疫比水肿更能致人死亡, 或水肿比发烧更能致人死亡, 那么基于这样的认识就能够预测未来一代人的生存与死亡之间的关系吗?

这样的概率超出数学的范畴了吗?概率论只能被归类于模拟博弈游戏吗?

伯努利在那本也许是他最伟大的遗产《猜度术》中, 针对这个问题给出了非常有力的回答。事实上, 他把这个问题称为他的“黄金定理”,并写道:“就其新颖度和其强大的实用性而言, 再加上其较大的难度, 这一定理因其分量和价值已经成为这一学说之最。”今天所谓的伯努利定理就是通常所说的大数定律, 它被认为是概率论的中流砥柱之一。

为了对它的性质有所了解, 再次假设我们正在进行独立的伯努利试验, 其中每一次试验的成功概率为 p。我们知道操作的总试验次数,称其为 N, 而且还知道结果成功的试验次数, 称其为 x。于是分数 x/N就是我们观察到的成功的次数比例。

例如, 如果投掷一枚均匀的硬币 100 次, 产生 47 次正面, 则观察到的正面比例是 47/100=0.47。如果再将这枚硬币投掷 100 次, 又产生55 次正面, 则总的成功比例是

没有什么理由阻止他人再把这枚硬币投掷 100 次, 或者投掷 1 亿次, 只要掷硬币的人不厌其烦。关键的问题是经过长时间的操作, 成功的比例x/N 会发生什么变化呢?

当试验的次数增加时, 应该没有人对发现这个比例接近 0.5 而感到惊讶。一般来说, 当 N 变大时, 我们会看到 x/N 的值趋向一个固定的数 p, 这是任何一次单次试验的成功的真概率。所以, 这里就显示出这个定理的威力, 当成功的概率 p 未知 时, 在较大次数的试验当中, 成功的比例应该是 p 的一个较好的估计值。用符号表示, 我们应该写成

加上少数几个重要条件, 这就成了大数定律。伯努利定理之所以如此著名, 并不是因为它道出了一个真理, 而是因为很难用严格的论据加以证明。雅各布自己也以他那极具代表性的尖刻语言承认“即使是最笨的人也应该可以本能地理解(大数定律)”。然而, 为了给出这个定律的正确的证明, 他付出了二十年的努力, 给出的证明占据了《猜度术》好几页。事实证明, 他的评论“这一原理的科学证明并不是那样简单”是有意轻描淡写的陈述。

关于伯努利定理的“重要条件”,因为它本质上是一个概率陈述, 所以它应该是随时可能发生的不确定性。我们不能绝对确定投掷一枚硬币 1000 次产生正面的比例将比仅投掷 100次产生正面的比例更接近 0.5。完全有可能投掷 100 次时产生 51 次正面, 而且有可能投掷 1000 次时只产生 486 次正面。因此这个“小样本”估测 x/N = 51/100 = 0.51 实际上应该比“大样本”估测 x/N =486/1000 = 0.486 更接近投掷正面的真实概率。完全有可能发生这样的事情。

这样说来, 如果我们再投掷 1000 次, 那么每一次投掷都产生正面也不是完全没有可能的。有可能产生一个惊人的结果, 2000 次投掷产生 1486 次正面, 于是估测概率是 1486/2000=0.743。在这样的情况下,大数定律似乎已经不好使了。

但事实并非如此。因为雅各布·伯努利证明的是, 对于任意给定的小容差, 比如说 0.000 001, 估测概率 x/N 与真实概率 p 的差是这个小容差或者比它更小的可能性可以接近于 1, 条件仅仅是增加试验次数。只要做足够多的试验, 我们几乎可以肯定, 或者使用伯努利曾经使用的词语道义上肯定, 我们的估测值 x/N 与真实概率 p 之差一定在0.000 001 以内。当然, 我们不能百分之百确定 p 与 x/N 之差小于 0.000 001, 但是大量的试验可以让我们充分肯定这种推断不至于太离谱。

打开网易新闻 查看更多图片

上述情况, 即投掷均匀硬币 2000 次而掷出正面的概率被估测为0.743, 其可能性有可能小于一个人在看本章时遇到流星的概率。另外,即使出现了这样一个不可能的估测值, 伯努利仍然非常自信地声称, 通过做大量的试验, 比如 2000 次、200 万次或更多, 这个比例 x/N 肯定趋向于 0.5。

要强调的是, 即使对于这样少的限制条件, 大数定律仍然是可证明的, 这一点很重要。这不同于我们在生活中遇到的其他著名定律, 如墨菲定律和万有引力定律。它们要么是被普遍认可的陈词滥调(如墨菲定律), 要么是被高度赞誉的物理模型(如万有引力定律), 都要随时根据证据而被修正。但是大数定律是一个数学定理, 而且已经证明在必须遵守的逻辑限制之下, 它永远成立。

上文节选自人邮图灵《数学那些事》,【遇见数学】已获转发许可。

作者:[美] 威廉·邓纳姆(William Dunham)

译者:冯速

一览数学世界不可不谈的伟大定理、难题和争论

勾勒数学的全景,让课堂上的知识变得更清晰、更好懂

数学科普巨匠邓纳姆献给钟情数学以及单纯好奇“数学到底是什么”的读者