平均数中位数众数方差的求法

平均数、中位数、众数和方差是统计学中常用的四个基本指标,它们各自代表了数据的不同特征。
先说最重要的,平均数是所有数据加起来除以数据的个数。比如,去年我们跑的那个项目,收集了100个用户的年龄数据,总和是200岁,那么平均年龄就是200除以100,等于2岁。
另外一点,中位数是将所有数据按大小顺序排列后位于中间的数。如果数据量是奇数,那么中位数就是中间那个数;如果是偶数,则取中间两个数的平均值。比如,一个班级有10个学生的成绩,按顺序排列后,第5和第6个学生的成绩的平均值就是中位数。
还有个细节挺关键的,众数是数据中出现次数最多的数值。比如,在某个地区,最常见的家庭年收入是10万元,那么10万元就是众数。
我一开始也以为方差只是用来衡量数据的离散程度,但其实它也反映了数据与平均数的偏差。简单来说,方差是每个数值与平均数差的平方的平均值。去年我们统计的用户年龄方差大概在4岁左右,说明年龄分布比较集中。
等等,还有个事,方差有开方操作,得到的值叫标准差,它更容易理解,因为标准差是以一个容易感知的单位来衡量的。
最后提醒一个容易踩的坑,计算这些统计量时,要注意数据是否准确,以及样本量是否足够大,否则结果可能不够准确。
我觉得值得试试,在处理数据前,先了解一下这些统计量的概念和计算方法,这样在分析数据时能更加得心应手。
咱们聊聊平均数、中位数、众数和方差这四个家伙吧。说实话,刚开始的时候,我当时也没想明白它们之间到底有啥区别。
先说平均数吧。这玩意儿就像是我们小时候算平均分一样,把所有数值加起来,然后除以数值的个数。比如说,2005年,我在深圳的一家公司,他们每个月的销售额分别是5万、8万、12万、15万,那平均销售额就是(5+8+12+15)除以4,等于10万。
中位数嘛,它有点像中间那个孩子。你把所有数值排好队,然后看看中间的是谁。比如,还是那家深圳公司,2006年他们销售额的排名是5万、8万、12万、15万,那中位数就是12万,因为它正好是中间的那个数值。
众数嘛,就是出现次数最多的那个。举个例子,2007年,北京一家餐厅的顾客满意度调查,结果是满意的有100人,一般的有80人,不满意的有20人,那众数就是满意,因为满意的人数最多。
最后是方差,这玩意儿是衡量数值之间差异的一个指标。简单来说,就是每个数值和平均数的差的平方的平均数。还是拿深圳那家公司2008年的销售额来说,假设平均销售额是12万,销售额分别是5万、8万、12万、15万,那每个数值和平均数的差分别是7万、4万、0万、3万,然后把这些差的平方加起来,再除以数值的个数,就能得到方差。
总之,这四个家伙各有各的特点,用大白话来说,平均数就是平均分,中位数就是中间的那个,众数就是最受欢迎的,方差就是看看数值之间差异大不大。

相关推荐