一、t 检验的适用条件
数据要求:
数据应近似服从正态分布。当样本量较大时,根据中心极限定理,即使总体分布不是正态分布,样本均值也会近似服从正态分布,此时 t 检验可以使用。
对于两独立样本 t 检验,要求两组数据的方差具有齐性,即方差相差不大。
样本特征:
主要适用于连续型数据。对于离散型数据,尤其是取值有限且不连续的数据,t 检验的适用性受到限制。
样本量适中或较大时效果较好,一般认为当样本量小于 10 时,t 检验的结果可能不太可靠。
二、秩和检验的适用条件
数据分布:
不依赖特定的数据分布假设,适用于非正态分布、偏态分布、未知分布的数据。
对存在异常值的数据相对不敏感,因为它主要基于数据的秩次进行计算,异常值对秩次的影响相对较小。
数据类型:
适用于各种类型的数据,包括连续型数据、离散型数据和有序分类数据。对于有序分类数据,可以将其转换为秩次后进行秩和检验。
样本量:
在小样本情况下相对稳健,对于难以获取大量样本的研究场景适用。在大样本情况下也可以使用,但计算可能相对复杂一些。