主成分分析提取的主成分是原来的自变量么

例如5个自变量提取出两个主成分,这两个主成分与因变量进行了回归。但是能说这5个变量中谁的贡献率最大么或者说谁最能代表?标定的贡献率不是因子的贡献率么?

而且 5个主成分的原始变量算多么?需要降维么?能不能直接回归?

主成分之间应该相互是独立的,不存在包含不包含的关系。取前两个作为内自变量,y作为因变容量。

第一个的贡献率是66.052,第二个是29.518(第三列),第四列是累计贡献度,第三列第n个是第二列第n-1个之前所有贡献率的汇总。从第三个以后的主成分包含的信息小于5%已经很少,应该舍去。

如果进行主成分分析之后又要进行回归分析,应该是用提取出来的主因子作为自变量进行计算的,回归是只能有一个自变量,一个因变量才算回归的,如果不是的话,建议你使用多项式属分析。

扩展资料:

主成分分析作为基础的数学分析方法,其实际应用十分广泛,比如人口统计学、数量地理学、分子动力学模拟、数学建模、数理分析等学科中均有应用,是一种常用的多变量分析方法。

主成分分析的原理是设法将原来变量重新组合成一组新的相互无关的几个综合变量,同时根据实际需要从中可以取出几个较少的总和变量尽可能多地反映原来变量的信息的统计方法叫做主成分分析或称主分量分析,也是数学上处理降维的一种方法。

主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。

参考资料来源:百度百科-主成分分析

温馨提示:答案为网友推荐,仅供参考
第1个回答  2018-12-18
主成分之间应该相互是独立的,不存在包含不包含的关系。取前两个作为自变量,y作为因变量。第一个的贡献率是66.052,第二个是29.518(第三列),第四列是累计贡献度,第三列第n个是第二列第n-1个之前所有贡献率的汇总。从第三个以后的主成分包含的信息小于5%已经很少了,应该舍去。本回答被网友采纳