做客中文网

04 概率试验 Chance Experiments(第6页)

天才一秒记住【做客中文网】地址:https://www.zk01.net

如果分布集中在平均值的附近,那么方差就会比较小;当有合理的原因使一些值距离平均值比较远的时候,方差就会变得很大。

当考虑以美元计收入的分布的时候,平方值的单位就是“平方美元”

,不管它究竟是什么意思。

将方差取算术平方根就可以得到原始计量中的单位,这就得到了标准差(staion)。

平均值和标准差合在一起,经常能给我们理解一个概率分布的快速且有用的方式。

在高斯分布中,仅用这两个数字就足够计算所有的概率!就像点金石一样,当分布为高斯分布的时候,在大约68%的试验中,结果在平均值周围1个标准差范围内;在超过95%的试验中,结果在平均值周围2个标准差范围内;而400次中大约有一次结果是在3个标准差之外。

这些数字就是在第1章中给出的,我们能够有理由地期望事件发生的概率和事件发生的实际频率有多么接近的相关参考的基础:关键就是中心极限定理,它说明了作为大量随机成分的和而出现的数量预期接近遵循高斯分布。

在图7中,展示了3个高斯分布的概率密度函数,这几张图的平均值分别是2、0和2,标准差分别是12、1和2。

但是注意:虽然和的平均值总是平均值的和,但是对方差和标准差来说可不是这样。

如果和的组成部分恰好是独立的——比如说在拉斯维加斯一家赌场7天分别的收益——那么和的方差就的确是分别的方差的和,否则就会偏高或者偏低。

直接将标准差相加几乎不会给出任何有意义的结果。

极端值分布

在概率的某些应用场景中,我们关注的重点在于随机数量的最大值或者最小值。

例如,线或者电缆的强度依赖于最弱的纤维;洪水防护设施要考虑的是下一个一百年中预期发生的最大规模的洪水;生存分析(survivalanalysis)这个学科调查一段给定时间后的剩余人口。

极端事件可能很少发生,但是当它们发生了的时候,结果就变得很重要了。

最简单的看似可信的模型假定存在一些独立的随机变量,每个都分别遵循一个特定的分布。

例如每一年中,对一家保险公司的索赔。

对接下来的50年中它可能会收到的最大的总索赔额有多大,保险公司有一个经历了漫长的数学推导的可用结果:无论在每一年中索赔额如何变化,在很大的年代跨度中,最大索赔额一共只有三个可能的种类,它们被称为极端值分布,具体的名字是弗雷歇(Fréchet)、冈贝尔(Gumbel)、韦布尔(Weibull)。

有一个合理的数学原理,如果有一个关于最大值的理论,就一定有一个相对应的关于最小值的结果。

所以如果感兴趣的东西是最小值,也存在相似的结论。

能够对这三种分布进行一些限制是非常有帮助的。

通过估计极端值的平均值和方差,从三种分布中选择一种最接近于实际数据的,就能计算分布中的另一些概率的合理估计,比如真实情况中极端和破坏性事件的概率。

[1] 原文为“wetseethewoodforthetrees”

本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!

如遇章节错误,请点击报错(无需登陆)

新书推荐

天医出狱不计其庶神算小奶团驾到玄灵界都知道我柔弱可怜但能打末日之最终战争我缔造上古天庭的那些年玄学崽崽五岁半,这家没我都得散通灵王妃每天都想和离三界独尊我靠赚差价暴富了神兽召唤师盛世妖娆:邪帝宠狂妻重回1980:请再爱我一次战耀星空凶猛道侣也重生了无限邮差修罗天帝大魏霸主我有五十四张英雄牌修真世界的家生子和亲糙汉可汗后,我在草原忙种田武动之武祖再临霸天战神大龙挂了开局一条猴,然后它杀疯了