有一道数学题,要不同年级的学生去做。结果各种方法采用的人数分布如下:
请问,每行右侧的卡方值是如何得到的呢?
每行的卡方值达到显著性条件,那么就说明各年级同学在采用这种方法上是有显著差的吗?
假设有两个分类变量X和Y,它们的值域分别为{x1, x2}和{y1, y2},
若要推断的论述为H1:“X与Y有关系”,可以利用独立性检验来考察两个变量是否有关系,并且能较精确地给出这种判断的可靠程度。
具体的做法是,由表中的数据算出随机变量K^2的值(即K的平方)
K^2 = n (ad - bc) ^ 2 / [(a+b)(c+d)(a+c)(b+d)] 其中n=a+b+c+d为样本容量。
K^2的值越大,说明“X与Y有关系”成立的可能性越大。
扩展资料:
n个相互独立的服从标准正态分布的随机变量的平方和的分布。由此可知,卡方是没有负数的,卡方值越大P值就越小,越显著。(ad-bc)2n/(a+b)(c+d)(a+c)(b+d)这个公式里面abcd均是计数数据,均大于等于0,而(ad-bc)2由于有平方,所以也不会为负数,所以这个公式也没有负值。
若四格表资料四个格子的频数分别为a,b,c,d,则四格表资料卡方检验的卡方值=n(ad-bc)^2/(a+b)(c+d)(a+c)(b+d),(或者使用拟合度公式)
自由度v=(行数-1)(列数-1)=1
要求样本含量应大于40且每个格子中的理论频数不应小于5。当样本含量大于40但有1=<理论频数<5时,卡方值需要校正,当样本含量小于40或理论频数小于1时只能用确切概率法计算概率。
参考资料来源:百度百科--卡方检验
参考资料来源:百度百科--卡方值
假设有两个分类变量X和Y,它们的值域分别为{x1, x2}和{y1, y2},其样本频数列联表为:
若要推断的论述为H1:“X与Y有关系”,可以利用独立性检验来考察两个变量是否有关系,并且能较精确地给出这种判断的可靠程度。
具体的做法是,由表中的数据算出随机变量K^2的值(即K的平方)
K^2 = n (ad - bc) ^ 2 / [(a+b)(c+d)(a+c)(b+d)] 其中n=a+b+c+d为样本容量
K^2的值越大,说明“X与Y有关系”成立的可能性越大。
当表中数据a,b,c,d都不小于5时,可以查阅下表来确定结论“X与Y有关系”的可信程度:
例如,当“X与Y有关系”的K^2变量的值为6.109,根据表格,因为5.024≤6.109<6.635,所以“X与Y有关系”成立的概率为1-0.025=0.975,即97.5%。
四格表资料检验:
四格表资料的卡方检验用于进行两个率或两个构成比的比较。
1. 专用公式:
若四格表资料四个格子的频数分别为a,b,c,d,则四格表资料卡方检验的卡方值=n(ad-bc)^2/(a+b)(c+d)(a+c)(b+d),
自由度v=(行数-1)(列数-1)
2. 应用条件:
要求样本含量应大于40且每个格子中的理论频数不应小于5。当样本含量大于40但有1=<理论频数<5时,卡方值需要校正,当样本含量小于40或理论频数小于1时只能用确切概率法计算概率。
行×列表资料检验:
行×列表资料的卡方检验用于多个率或多个构成比的比较。
1. 专用公式:
r行c列表资料卡方检验的卡方值=n[(A11/n1n1+A12/n1n2+...+Arc/nrnc)-1]
2. 应用条件:
要求每个格子中的理论频数T均大于5或1<T<5的格子数不超过总格子数的1/5。当有T<1或1<T<5的格子较多时,可采用并行并列、删行删列、增大样本含量的办法使其符合行×列表资料卡方检验的应用条件。而多个率的两两比较可采用行X列表分割的办法。
卡方值计算《数理统计学》范畴,手工计算比较麻烦,一般用电脑小软件计算。
卡方值达到显著性条件,那么就说明各年级同学在采用这种方法上是有显著差异。
现在一般都不用手工计算的,可以用SPSS。只是不清楚,每一行的卡方值,他是如何得到的。你知道吗?
追答图片不清楚,上传个清楚的看一下。
本回答被网友采纳