如何用非参数检验,分析多个相关样本数据?

如题所述

    Friedman检验(弗里德曼检验),用于检测多个(相关)样本是否具有显著性差异的统计检验,它是一种非参数检验方法。

    当数据为多相关时,会涉及到多种检验方法,包括Friedman检验,Kendall协调系数,Cochran检验等,下表格详细列出区别:

如果是多相关样本,并且目的在于研究差异性,则有Friedman检验和Cochran's Q 检验两项可用,但特别提示一点,Cochran's Q 检验涉及的数据一定是二分类(即1和0这样的数据);如果是研究多相关样本的一致性情况,则可使用Kendall协调系数。

针对一致性研究,除Kendall协调系数外,Kappa系数也用于测量一致性。从分析角度上看,二者无法通用,因为二者的数据格式不一样,但二者功能上一致而且容易混淆,它们间的联系和区别如下(共3点):

    Kendall协调系数是针对多样本一致性情况,而Kappa系数只针对配对数据一致性情况;

    Kappa系数更加强调一致性情况,而Kendall协调系数相对更强调关联关系程度(关联性越强,也可理解为一致性越强);

    使用场景上,Kappa系数在医学相关领域使用相对较多,而Kendall在其它社会科学研究中使用较多,尤其是用于评价一致性时。

SPSSAU操作如下:

SPSSAU的操作如下:

上表格中p 值为0.867>0.05,即说明3次测量结果上并不会呈现出显著性差异,而且具体对比中位数可以看出,整体上看第一次测量身高中位数为1.710,第二次也是1.710,第三次还是1.710,因而说明三次测量结果并没有显著性差异。上表格中的样本量为15代表有15个样本。统计量中间过程值,其目的在于计算得到p 值。

温馨提示:答案为网友推荐,仅供参考
第1个回答  2022-07-16
在之前的文章中,我们介绍过检验数据一致性的多种方法。其实,差异性与一致性可以看作是一体两面的分析,如果一组数据具有很强的差异性,那就表示数据的一致性很差。相反,如果一致性很强,那么数据间的差异性就很小。

不同的方法有不同的要求和侧重,因此才出现这么多的检验方法,分别针对不同的应用场景。下面就介绍几种侧重于检验多组相关数据的非参数检验方法。

Friedman检验,是研究多相关样本差异性的方法,属于非参数检验的一种。如果研究数据为多组且为配对样本,可使用Friedman检验方法。

相关样本的意思几组样本的数据之间有对应关系,比如同一组学生进行两次相同试卷考试,前后两次的成绩都是同一个学生的对同一份试卷作答的成绩,如果第一次结果改变那么第二组结果也应该会改变。与之相对应的另一种样本类型,是独立样本,即几组数据之间没有必要的关联性。

1、背景

当前新出一款激光测量身高的仪器,现希望测试仪器的差异性情况。找好15个身高基本都均是1.7米左右的学生进行测试,并且让仪器分别测量3次,最终得到15行3列的数据。由于3次数据具有相关性,因而需要使用多样本Friedman检验进行分析差异关系。

2、操作

*特别提示: 如果检验显示具有差异性,可继续用Nemenyi两两比较进行研究,选中“Nemenyi两两比较”即可。

3、结果分析

首先看分析结果是否呈现显著性,即P值情况。(P值小于0.05或0.01代表呈现出显著性)由于是非参数检验,平均值受极端值的影响较大,所以如果P值呈现出显著性,可进一步通过中位数对比分析。

从上表看,三次测量的并不没有呈现出显著性(P=0.867>0.05),意味着数据之间没有统计意义上的差异性。

同时还可同箱线图对比,图中中部较粗的横线代表中位数,可以看到三次测量的中位数大小是一致的。

因而总结可知:3次测量身高的结果没有明显的差异,进而说明测量身高仪器结果准确无误。

如果说Friedman检验更多用于分析定量数据,那么当数据来自于多相关样本,且为二分类数据时,则应该选择用 CochranQ检验 。

Cochran's Q检验用于研究多组相关样本的差异性认知。比如10个评委对于4名选手的评定结果是否有差异。CochranQ检验时评分上只能为0和1,通常0代表不认可,1代表认可。

1、背景

共有10位顾客参与对4种不同品牌的奶茶是否满意的评价调查,1分表示满意,0分表示不满意。整理后的数据如下图所示:

2、操作步骤

3、结果分析

上图可知,上表格中P值为0.767>0.05,代表10位顾客的打分不具有差异性,即说明顾客对4种品牌的奶茶满意程度并无差异。

除了上面介绍的两种方法外,Kendall协调系数检验也可用于研究多相关样本的比较分析。Kendall协调系数检验的举例在之前的文章已有介绍,这里不再赘述。有需要请戳此链接阅读: 一致性检验

其中具体区别在于Kendall偏向研究一致性关系,而Friedman检验则是研究差异关系。

总的来说,当数据为多相关样本时,可使用包括Friedeman检验,Kendall协调系数,Cochran检验等方法分析。三者具体差异,整理如下:

如果是多相关样本,并且目的在于研究差异性,则有Friedeman检验和CochranQ检验两项可用,但CochranQ检验涉及的数据一定是二分类(即1和0这样的数据);如果是研究多相关样本的一致性情况,则可使用Kendall协调系数。

更多干货内容可登录 SPSSAU官网 查看