天才一秒记住【做客中文网】地址:https://www.zk01.net
只要事件本质上是随机发生的——暴风雨中的闪电、细胞复制中的自发突变、顾客来到邮局——在固定的时间段内这样的事件发生的数目倾向于遵循泊松分布,那么一对事件之间的等待时间的概率分布就具有这种指数形式。
最重要的连续分布是我们已经提到过的高斯分布。
就像图7展示的那样,这个分布家族中的成员关于单独的一个峰对称,并且在两边快速下降,然而永远不会达到0。
两个数字就可以告诉我们任意一个分布实例在这个家族中的归属:一个数字表示峰的位置,另一个数字描述散布程度——较小的散布值导致像图7a那样的高且窄的图形,较大的散布值给出像图7c那样的矮且宽的图形。
这个家族成员的任何位置的概率都可以借由这两个数字来与图7b的分布相关联而得到,这个分布的峰在0,标准散布值为单位1。
棣莫弗创制了对应数表之后,这些对应关系就很容易得到了。
图7 高斯分布
一个问题的再解决
你也许已经注意到了一个问题。
已知期望的结果组成的集合是有限的,或者是一个像{1,2,3,…}这样的无尽的集合,那么即使这个集合中的一些成员的概率是0,任何概率是0的事件也不会发生。
然而,对于连续分布,即使每个单独的点的概率是0,它们其中的一个在试验进行过程中也是会发生的!我们不再能够认为“不会发生”
与“概率为0”
具有相同的意义。
为了解决这个问题,我们来考虑从装有100万块完全相同的大理石的盒子中随机选取一块。
只有在提前猜对了结果的情况下,我们才会感到惊讶,因为猜对的概率只有一百万分之一。
但是,无论抽中了哪块大理石,虽然的确出现了某个概率只有百万分之一的结果,但我们也不会感到惊讶。
把盒子做大一点——10亿块或100000亿块大理石——实际产生结果对应的概率可以无限接近0——但是它的确发生了。
这与在一条连续的线上选取一个点的过程并没太大区别:对于任意的点来说,它的概率是0,但是它们其中的一个的确将会发生。
我们接下来开始说明,在一个可重复试验中,如果猜对结果的概率是16,我们可以期望按顺序进行的6次试验中有1次猜对。
将事件发生的概率除以100万,我们预期等待正确结果出现的次数就被乘上了100万。
具有极小概率的结果的确会发生,但是越来越罕见。
如果概率下降到0,我们可以预期要等待比任意有限长都要长的时间——那它就是不会发生!在提前指定的情况下,认为任何概率为0的事件都不会发生是合理的。
平均值
已知一个概率试验中结果的分布,我们就可以计算我们想要的任何概率。
但是有些时候,所有的这些细节都成了障碍——只见树木,不见森林[1]:所以我们想要提取出分布的主要特征。
举例说明,假设可能出现的结果只有2、3和7,分别对应概率60%、10%、30%。
我们预期在100次重复试验中,2这个值会出现大约60次,3出现大约10次,7为剩下的30次。
所有这些数值的和是120+30+210=360,所以所有这100个结果的平均值是360100=3.6。
这个值就是数值2、3和7的加权和(weightedsum),权重就是它们的概率。
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!