天才一秒记住【做客中文网】地址:https://www.zk01.net
无论我们有什么样的分布,相似的计算都会得出大量重复试验结果的集中趋势。
“集中趋势”
是一个宽泛的词,对于这类计算的结果,我们更喜欢使用平均值(mean)这个术语。
可能有一些捷径:如果值在一个范围内均匀地分布,平均值就在两个端点的正中间;在一系列伯努利试验中事件发生的次数的平均值就是试验次数和事件发生概率相乘。
掷一个公正的色子,得到4的概率是16。
所以在600次投掷过程中,我们应该可以得到大约100个4:简单计算表明,连续出现的4之间的平均间隔是6。
大小为16的概率导致平均间隔是6,这不是一个巧合。
任何间隔的长度就是下一个事件发生的等待长度,所以在一系列伯努利试验中,我们就有了令人愉快的结果:
等待一个事件发生所需的平均时间是事件发生的概率的倒数。
在连续分布中,想法是类似的,但是加权和是由一种名为积分(iion)的数学方法来得出的。
对于高斯分布,峰处就是平均值。
按照整体特定的频率发生的随机事件发生的平均时间是一个指数分布:平均时间就是频率的倒数,这并不奇怪。
除了“平均”
和“平均值”
,术语“期望”
和“期望值”
也会被使用。
掷一个公正的硬币12次,“期望”
正面朝上的数目为6;掷一个公正的普通色子,“期望”
得到的分数是3.5。
当然正是因为一次投掷中反面朝上的期待值是0.5,我们实际上不能期望得到一半的反面朝上!文字都很是奇妙。
平均值非常友好:和的平均值通常是平均值的和,无论不同的和是不是独立出现的。
大数定律告诉我们,从长远看,平均值占据主导:如果你买一张彩票花费1英镑,其中一半的钱都进入奖池中,那么,无论奖金的分配结构如何,你的平均收益都是50便士,从(非常)长远看,这就是你能得到的。
离散程度
用一种简洁的方式描述一个分布的离散程度通常是有用的。
我们可以计算每一个值和平均值的差值,然后得到这些差值的(适当地加权的)平均值。
但是,就像所有计算上努力展示的那样,这种方法是不成功的:负的差值不可避免地抵消了正的差值,最终结果总是0。
但是无论一个差值是正是负,我们都可以在将它平方之后得到一个正的值。
所以我们可以通过将这些平方值加权来得到离散程度。
得到的这个值就叫作方差(variance)。
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!