乔山办公网我们一直在努力
您的位置:乔山办公网 > excel表格制作 > 相关系数excel-Excel数据分析——指数分布

相关系数excel-Excel数据分析——指数分布

作者:乔山办公网日期:

返回目录:excel表格制作

指数分布公式:=EXPONDIST(x,平均值,FALSE)


提到这个分布往往就必须联系泊松分布,这两者之间关系还挺大的


泊松分布公式:=POISSON(X,平均值,FALSE)


公式里的参数看起来是不是好像的说?但实际上,它们是有一点区别的


之前解释二项分布时,参数中的第一项X,通常都被解释成一件事情发生的次数,也就说它一般是个整数,而到了泊松分布时,虽然X的取值不再有总实验次数N的上限,但为了方便和二项分布比较,这里的X我依然还是解释成了事情发生的次数


但是就更一般的情况来说,其实它还可以解释为时间,为什么呢?因为时间这个概念,其实是个人为创造的刻度,你可以使用通常意义上的一分钟、一小时乃至一天作为时间的单位,但也可以用一件以固定频率不断重复发生的事情每出现一次(或一个周期)作为一个时间间隔,这样的话,泊松分布便成为了一种适用于推广到时间序列的计算方式


所以此处泊松分布里的参数"平均值",其实也可以解释为,在一个单位周期里,某件事情的平均发生次数


那指数分布和泊松分布有什么联系呢?首先就概念上来说,它们公式参数中的"平均值",指的其实是同一个意思,都是单位周期里事情的发生次数,而主要的区别,是参数X的取值


可以做个小小的实验,比如取同样的平均值5,并计算一系列的X,可以看到两种分布的计算结果:


表格有点长,可以直接看图:


是不是觉得泊松分布那条线有点奇怪?


细心点的亲有可能注意到了,泊松分布的计算结果只有整数的X值,当X取小数时自动向下取整,以致于这条线变成了一截一截的,但指数分布的X是不受带小数点的影响的,因为它的主要功能是计算距离事情下次发生的周期时长


套用之前看的网剧天才J中某集的概念(第一季,具体哪集忘记了),我个人是这么理解的,泊松分布表示是是一件事情的通用规律,是整个事情的整数部分,而指数分布则表示这件事情的偶然性,相当于这件事情的小数部分,但这两个公式的本质是一样的,而且它们的确都属于同一个族,这个族名叫伽马分布


对上面这个观点有疑惑的可以查下它们的数学公式形式,不过我本人作为应用型(俗称数学没学好),一向碰到数学推导就跳过,所以在这里仅用我自己的习惯来证明观点:


上面的数据用Excel算一下还是很容易验证的


最后提一个在很多讲指数分布的资料上都会重点强调的地方,这个分布有个重要的特征叫做无记忆性,关于这个特征的解释,我在某个论坛的帖子里看到了一个很牛的例子,自认不会比他解释的好,所以直接上图了:


这个例子很准确的说明了一个问题,那就是我们提到的从二项分布到泊松分布再到今天的指数分布,其实都是具备同一个条件,那就是独立随机,什么意思呢?就是说不管是扔硬币猜拳还是掷骰子,当整个环境规则(先验概率)确定后,事情的结果是不确定的,而且每一次事件的发生都与之前已经发生的事情没有联系,我们费那么多事算出来的东西,终究是对未知世界的一种猜测罢了


本文标签:相关系数excel(54)

相关阅读

关键词不能为空
极力推荐

ppt怎么做_excel表格制作_office365_word文档_365办公网