秩和检验和 t 检验的适用范围主要有以下不同:
一、数据分布方面
秩和检验:
不依赖特定的数据分布假设,适用于非正态分布、偏态分布、未知分布的数据。例如在一些生物学、医学领域,数据往往呈现非正态分布,秩和检验在这种情况下可以发挥作用。
对含有异常值的数据相对不敏感,因为它主要基于数据的秩次进行计算,异常值对秩次的影响相对较小。
t 检验:
要求数据近似服从正态分布,对于方差齐性的数据效果较好。当样本量较大时,根据中心极限定理,即使总体分布不是正态分布,样本均值也会近似服从正态分布,此时 t 检验可以使用。
如果数据不满足正态分布或方差不齐,t 检验的结果可能不准确。
二、数据类型方面
秩和检验:
可用于连续型数据、离散型数据和有序分类数据。对于有序分类数据,可以将其转换为秩次后进行秩和检验。
例如在医学研究中,疾病的严重程度分为轻度、中度、重度等有序分类,秩和检验可以比较不同治疗方法对疾病严重程度的影响。
t 检验:
主要适用于连续型数据。对于离散型数据,尤其是取值有限且不连续的数据,t 检验的适用性受到限制。
例如比较两组学生的考试成绩(连续型数据)时,如果满足正态分布假设,可以使用 t 检验。
三、样本量方面
秩和检验:
在小样本情况下相对稳健,对于难以获取大量样本的研究场景具有优势。例如罕见病研究、特定环境下的小规模实验等。
在大样本情况下也可以使用,但计算可能相对复杂一些。
t 检验:
在样本量适中或较大时效果较好。随着样本量的增加,t 检验的结果更加稳定,检验效能也会提高。
当样本量非常小(如小于 10)时,t 检验的结果可能不太可靠。
四、研究目的方面
秩和检验:
更侧重于比较数据的整体排序关系,适用于关注数据的相对大小、顺序的研究问题。例如比较不同品牌产品的用户满意度排名等。
t 检验:
通常用于比较两组数据的均值差异,适用于需要精确估计差异大小的研究问题。例如比较两种药物的疗效差异,通过 t 检验可以得到均值差异的估计值和置信区间。