准备数据

1. 功能

  • 上传数据文件时,预览数据集,并检查数据输入的正确性
  • 构建模型时,(根据需要)对一些变量进行预处理
  • 计算基本描述性统计量,绘制变量图

2. 关于数据

  • 数据的行数必须多于列数。
  • 数据需要全部为数值数据

示例1: 小鼠基因表达数据

这一数据测得20只小鼠在一次饮食实验中的基因表达。部分小鼠表现出相同的基因型,部分基因变量存在相关性。从基因表达数据中计算出线性不相关的主成分。

示例2: 化学数据

假设在一项研究中,已测得7类药物的9种化学属性。有些化学物质有潜在的联系。探索化学变量之间潜在的关系结构,并缩小到较少数量的变量。

请按照以下步骤输出实时分析结果。准备好数据后,请在接下来的选项卡中找出模型。


Output 1. 数据确认

数据确认

1. 数值变量表


              

2. 分类变量表


              

Output 2. 描述性结果


1. 数值变量

2. 分类变量


                    
                      
                      下载结果 (分类变量)
                    
                  


线性拟合图:粗略表示任意两个数值变量之间的线性关系。 灰色区域为95%置信区间。


3. 更改X轴和Y轴标签


直方图:通过描述某一数值范围内出现的观察值频率,粗略显示一个变量的概率分布。

密度图:显示变量的分布。


直方图

当分箱数为0时,绘图将使用默认分箱数

密度图






                  

主成分分析(PCA)

主成分分析(PCA)是一种数据简化技术,其将大量的相关变量转换为一组小很多的不相关变量,即主成分。

1. 功能

  • 平行分析估计成分数
  • 获得相关矩阵并绘制图
  • 获得主成分和载荷结果表
  • 获得2D和3D主成分和载荷分布图

2. 关于数据

  • 所有的分析数据都是数值数据
  • 样本量大于自变量数,即行数大于列数

请按照步骤建模,然后单击输出获取分析结果。


Output 1. 数据确认

数据(一部分)

请在“数据”选项卡中编辑修改数据


Output 2. 模型的结果


说明
  • 此图描绘了两个成分的成分关系,可使用得分图来评估数据结构并检测群集、离群值和趋势。
  • 图上的数据分组可表示数据中的两个或多个单独分布。
  • 如果数据遵循正态分布并且不存在离群值,则点在零附近随机分布。

2. 当A >= 2时,选择2个成分显示成分和载荷2D图

在PC1和PC2(无组圈)图中,我们能够找到一些离群值,例如11和23。 如果选择饮食,并在欧几里得距离上添加一个组圆,则将看到饮食类型的圆与其他圆分开。


说明
  • 此图显示变量对主成分的影响(选择左面板中的主成分)。
  • 红色表示负面影响,蓝色表示正面影响。
  • 使用方差累积比例(在方差表中)测定因子解释的方差量。
  • 出于描述的目的,可能只需要解释80%(0.8)的差异。
  • 如果想对数据执行其他分析,可能至少要有90%的方差通过因子解释。

Loadings

Variance table


说明
  • 此图叠加了主成分和载荷量(选择左面板中的主成分)。
  • 如果数据遵循正态分布并且不存在离群值,则点在零附近随机分布.
  • 载荷测定哪些成分对每个成分的影响最大。
  • 载荷范围从-1到1。接近-1或1的载荷表示变量对成分的影响很大。接近0的载荷表示变量对成分的影响很小。

• 当A >= 2时,选择2个成分显示成分和载荷2D图

PC1和PC2图显示,ACAT2对PC1具有相对较强的负面影响,而PKD4对PC1具有较强的正面影响。 对于PC2,THIOL具有很强的积极作用,而VDR具有很强的消极作用。 结果与载荷图相对应。


说明
  • 这是2D图的扩展。此图覆盖了3个主成分和载荷(在左面板中选择主成分和线段长度)。
  • 可找到图中的离群值。
  • 如果数据遵循正态分布并且不存在离群值,则点在零附近随机分布。
  • 载荷测定哪些成分对每个成分的影响最大。
  • 载荷范围从-1到1。接近-1或1的载荷表示变量对成分的影响很大。接近0的载荷表示变量对成分的影响很小。

本图首次加载需要一些时间

当A >= 3时,选择3个成分显示成分和载荷3D图

默认情况下,在3D绘图中显示前3个PC

跟踪图例


                  

探索性因子分析(EFA)

探索性因子分析(EFA)是一种统计方法,用于根据潜在少数未观察到的变量描述观察到的、相关的变量之间的变异性,即称为因子。

1. 功能

  • 平行分析估计成分数
  • 获得相关矩阵和绘图
  • 获得因子和载荷结果表和载荷结果表
  • 获得2D和3D的因子和载荷分布图

2. 关于数据

  • 所有的分析数据都是数值数据
  • 样本量大于自变量数,即行数大于列数

请按照步骤建模,然后单击输出获取分析结果。


Output 1. 数据确认

数据(一部分)

请在“数据”选项卡中编辑修改数据


Output 2. 模型的结果


说明
  • 该图显示了因子与变量之间的关系。
  • 窗口中的结果显示对因子充分性的统计检验。


                  


说明
  • 该图描绘了两个因子之间的关系,可使用得分图评估数据结构并检测群集、离群值和趋势。
  • 图上的数据分组可表示数据中的两个或多个单独分布。
  • 如果数据遵循正态分布并且不存在离群值,则点在零附近随机分布。

2. 当A >= 2时,选择2个因子显示成分和载荷2D图

在ML1和ML2图中,我们可以找到169和208等异常值。 这些点可以在“数据”选项卡上删除。 当我选择类型并在欧几里得距离上加上一个圆组时,我发现B组稍有不同。 并非所有组都有圈子,因为积分太少。


说明
  • 此图显示变量对因子的影响(选择左面板中的因子)。
  • 红色表示负面影响,蓝色表示正面影响。
  • 使用方差比例(在方差表中)测定因子解释的方差量。
  • 出于描述的目的,可能只需要解释80%(0.8)的差异。
  • 如果想对数据执行其他分析,可能至少要有90%的方差通过因子解释。

Loadings

Variance table


说明
  • 此图(双线图)覆盖因子和载荷(选择左面板中的因子)。
  • 如果数据遵循正态分布并且不存在离群值,则点在零附近随机分布。
  • 载荷测定哪些成分对每个成分的影响最大。。
  • 载荷范围从-1到1。接近-1或1的载荷表示变量对成分的影响很大。接近0的载荷表示变量对成分的影响很小。

当A >= 2时,选择2个成分显示成分和载荷2D图

在删除点169和208之后,发现chem2与ML2有着相对较强的关系。


説明
  • 这是2D图的扩展。此图覆盖了3个因子和载荷(在左面板中选择因子和线段长度)。
  • 可找到图中的离群值。
  • 如果数据遵循正态分布并且不存在离群值,则点在零附近随机分布。
  • 载荷测定哪些成分对每个成分的影响最大。
  • 载荷范围从-1到1。接近-1或1的载荷表示变量对成分的影响很大。接近0的载荷表示变量对成分的影响很小。

本图首次加载需要一些时间。

当A >= 3时,选择3个成分显示成分和载荷3D图

默认情况下,在3D绘图中显示前3个因子。

跟踪图例