分类数据分析

如题所述

第1个回答  2022-07-04

χ 2 可以用来测定两个分类变量之间的相关程度。设分类的观测频数为f o ,分类的期望频数为f e ,则χ2统计量可以用下式表示:

拟合优度检验是用χ 2 统计量进行显著性检验的内容。它是依据总体分布状况,计算出分类变量各类别的期望频数,并于各类别的观察频数进行对比,判断是否有差异,从而达到对分类变量进行分析的目的。

拟合优度检验是对一个分类变量的检验,如果要判断两个分类变量相关性,需要利用列联表(contingency table)进行χ 2 统计量的独立性检验。

1)样本量必须足够大,每个单元中的期望频数不能过小。
2)如果只有两个单元,每个单元的期望频数必须是5或5以上
3)如果是两个单元格以上,其中有20%以上的单元格期望频数小于5,则不能使用χ 2 分布检验。可以考虑合并某些单元格。