平均数
平均数(average),统计学中反映一组观测数据的集中趋势或中心位置的度量。也称平均值,简称平均。在医学研究中有广泛的应用。常用的平均数有均数、中位数和几何平均数。
均数
即算术平均数,为最常用的平均数。一组观测值X1,X2,X3,…,Xn的和除以观测值的个数n所得的商称为这组观测值的均数,以塣表示。计算均数的目的是找出一个可以概括一组数据的代表数。例如通常说的一组人的平均年龄就是全组人诸年龄的一个均数。当要比较两组人的年龄时,最简便的方法就是比较这两组人年龄的均数。均数有着与原观测值一致的计量单位,上例中全组平均年龄和每个人的年龄的计数单位均为岁。
当观测值较多(也即n较大)时,往往先将数据整理成频数分布的形式(见表)。此时,表中各组数据都以该组的组中值为其代表数,而不追求原来精切的观测值。例如在表中,“118.0~”组有1人,其身高为该组的组中值,即
“120.0~”组有3人,其身高为等等。
对于此100名男孩身高求均数,就不必用100个精确数据相加,而只要将各组的组中值乘以频数,然后相加求得。100名男孩身高的总和为
1×119.0+3×121.0+7×123.0+…+1×141.0
=12940.0故得100名男孩身高的均数为129.4(cm)。对按频数分布的数据求均数的计算公式为
式中Xi为第i组组中值,ƒi为第i组频数,在本例中即为第i组人数;i=1,2,3,…,n,n为分组的组数。
中位数
一组按大小次序排列的观测值中居中的数值,称为这组观测值的中位数。换言之,中位数将全组数据划分为两等分,比它小的和比它大的数据各占一半。当数据的个数为偶数时,则居中的有两个数值,可取它们的均值为中位数,如3,5,7,9四个数的中位数为。由于中位数是由数据按大小次序排列后求得的,所以不受两端少数过小或过大数据的影响。当观测数据分布很偏时,用中位数表示中心位置比均数更合理些。
几何平均数
一组观测值X1,X2,X3,…Xn的乘积的几次根称为这组观测值的几何平均数,常用G表示。计算G时,可先求观测值的对数的算术平均数,再求其反对数,即按下式计算:
几何平均数常用于某些呈等比关系的数据,如医学上某种抗体的滴度,这种数据分布呈偏态,分布曲线的高峰偏于过大或过小。如果此时再用均数来表示数据的集中趋势或中心位置,就有较大的偏离。对数据作对数转换能使分布曲线变得对称,因此取对数转换后的均数的反对数值(即几何平均数)来描述数据的集中趋势是较为合理的。