显著性检验
显著性检验(significance testing),根据样本的观测值推断总体的统计学方法,又称假设检验或统计假设检验。假设检验不同于统计推断中的参数估计,参数估计要对总体的分布类型或参数作出估计,而假设检验是对所讨论的具体问题预先提出一个统计假设(关于总体分布的一个命题),然后根据试验或观测数据,在某种可靠程度上判定接受还是拒绝这一假设。显著性检验在医学研究中有特殊重要的意义,广泛应用于对药物疗效、医疗预防措施效果的评价。
可用显著性检验解决的问题、类型和提法多种多样,但显著性检验的基本思想很简单:从样本的观测值出发,去判断一种“看法”是否成立。这种“看法”就是假设。因为这种假设总是同一些带有随机性的数据的统计特性有关(如某统计量服从某种分布或以某已知值为分布参数等),所以称作统计假设。
以下通过一个具体例子(中草药青木香是否有降低血压的作用)来阐明有关显著性检验的一些基本概念和方法。
没有统计学知识的人,一看下表会立刻得出结论:青木香有降低血压的显著疗效。但这样的结论过于草率,也缺乏令人信服的科学依据,因为这些数据的差异很可能是偶然的,在不经治疗的情况下对病人作两次测量也完全可能产生这样的结果。显著性检验在处理这类问题时是先提出一个假设:青木香无降低血压的疗效。这个假设在统计学上称为原假设,常以H0记之。在这假设下差量X 服从正态分布。且其均值μ 为零。因此在原假设H0成立的条件下,观测数据Xi在零附近的波动应视为受随机性因素的影响,可以按统计学的理论在一定可靠程度上估算出来。如果实际观察到的样本数据同理论数据偏离很远,就有足够的理由来怀疑原假设的正确性,并可以认为这种数据之所以出现“出乎意料”的差异,原因不是随机性的,而是实质性的,在本例中就是青木香的降血压作用。
做显著性检验时必须在取得数据后,对接受或拒绝原假设作出抉择,在统计学上通常指定一个很小的正数α 作为临界概率,如果在H0成立的条件下出现所观察到的事件(即实际数据偏离理论值很远)的概率 P小于等于α,就作出拒绝 H0的决定。因为可以认为这样的“小概率事件”基本上是不会发生的,如果它竟然发生了,那么原假设就有问题。这个小正数α 在统计学上称为检验水平或显著性水平。为了查表方便,通常取α=0.05,若查表后 P≤0.05,则称样本观测数据与原假设的偏离为“显著的”;若取α =0.01,则称偏离为“非常显著的”。检验水平α 的值取得很小,这是为了对否定原假设采取慎重态度,对一个科学结论、假设在证据不够充分的情况下不要轻易否定。在统计学上不否定一个假设并不意味着这假设一定成立,它只说明,通过检验这假设不成立的概率是很小的。检验水平α 也可理解为原假设成立而遭到拒绝的临界概率。
由于原假设的类型不同,显著性检验采取的方法也不同。最常用的检验方法有t检验、F检验、x2检验,这些检验法中所采用的统计量分别服从t分布、F分布、x2分布。在一般统计学著作中都附录t分布、F分布、x2分布的数值表,以备查用,这样在进行显著性检验时可避免许多冗繁的计算。例如上述例子可采用 t检验方法。先计算统计量,式中n=13,塢为样本均值,μ 按原假设为零, S2为样本方差,将观测数据代入,算得T=4.885;然后查t值表,当检验水平α 取0.01,自由度为12时,临界值T0=3.055(T0的意义如前所述:统计量T大于或等于T0这样的事件,大概只能在100次中观察到1次)。现在T=4.885远大于T0,因此可以有99%的把握说,实际观测数据与原假设的差异是显著的,也可以说青木香在降低血压方面是有非常显著疗效的。