说明
- 给出1成分、2成分、...、n成分的计算结果。
- “CV”是交叉验证估计值。
- “adjCV”(对于RMSEP和MSEP)是经偏差校正的交叉验证估计值。
- R^2等同于拟合值与响应之间的平方相关。训练中所示的R^2为未调整的R^2,而CV中所示的R^2为调整后的R^2。
- 建议使用高R^2和低MSEP/RSMEP的成分数量。
10倍交叉验证每次都将数据随机拆分成10倍,所以一次刷新后结果不会完全一样。
R^2
预测的均方误差 (MSEP)
预测的均方根误差 (RMSEP)
结果表明,随着A的增加,训练效果更好(R ^ 2较高,MSEP和RMSEP较低)。
然而,CV结果是不同的。 训练集的效果很好,CV很差,可能发生过拟合并且预测性较差。
在此示例中,我们决定根据MSEP和RMSEP选择三个成分(A = 3)。
说明
- 此图描绘了两个得分的成分关系,可使用得分图来评估数据结构并检测群集、离群值和趋势。
- 如果数据遵循正态分布并且不存在离群值,则点在零附近随机分布。
当A >= 2时,选择2个成分显示成分和载荷2D图
在此图中,我绘制了component1和component2的散点图,发现327和332是离群值。
说明
- 此图显示变量对成分的影响(选择左面板中的成分)。
- 红色表示负面影响,蓝色表示正面影响。
- 使用方差累积比例(在方差表中)测定因子解释的方差量。
- 出于描述的目的,可能只需要解释80%(0.8)的差异。
- 如果想对数据执行其他分析,可能至少要有90%的方差通过因子解释。