比较多组样本的单因素方差分析(One-Way ANOVA)和多重比较

1. 功能

  • 测定各因子群之间的均值是否有显著差异
  • 假设单向方差分析发现各因子群间存在显著差异,测定配对的均值是否存在显著差异

2. 关于数据

  • 数据包含以2个向量显示的若干单独因子群
  • 一个向量是观测值;一个向量是在不同的因子群中标记的值
  • 各因子群是独立的且近似正态分布
  • 因子群的各个均值遵循具有相同方差的正态分布,并且可以比较

示例

假设想发现被动吸烟对癌症的发病率是否有影响。 在一项研究中,研究了6组吸烟者:非吸烟者 (NS)、被动吸烟者 (PS)、非吸入吸烟者 (NI)、轻度吸烟者 (LS)、中度吸烟者(MS) 及重度吸烟者 (HS); 并测量了強制呼气流量(FEF)。 想了解6组间FEF的差异。

请参考以下步骤,输出分析结果。


Output 1. 描述性统计结果



因子组类别



组别描述统计量




说明
  • 框内的条带为中位数
  • 方框测量第75和第25个百分位数之间的差值
  • 显示的点为可能的离群点(outlier)



Output 2 方差分析表



说明
  • DF因子 = 因子组的类别数 -1
  • DF残差 = 样本值的个数 - 因子组的类别数
  • MS = SS/DF
  • F = MS因子 / MS残留误差
  • P值 < 0.05,则因子的总体均值间存在有意差。(接受备择假设)
  • P值 >= 0.05,则因子的总体均值间内没有意差。(接受零假设)


在此示例中,统计学有差异,因此我们可以得出结论,六组之间的FEF显着不同。


P值 < 0.05时,如果想知道哪些成对因素组明显不同,请使用多重比较


Output 3. 多重比较的结果


成对P值表



説明
  • 在矩阵中,P值<0.05表示因子对具有统计学意义
  • 在矩阵中,P值>=0.05表示在因子对无显著统计学差异


在本示例中,我们使用Bonferroni-Holm方法研究了P <0.05的可能因子对。 HS与其他组有统计学上的明显差异。 LS与MS和NS有统计学上的差异。 MS与NI和PS有统计学上的差异。 NI与NS有统计学上的差异。


比较多组样本的双因素方差分析(Two-Way ANOVA)和多重比较

1. 功能

  • 测定在控制因子2之后因子1之间的均值是否显著不同
  • 测定在控制因子1之后因子2之间的均值是否显著不同
  • 测定因子1和因子2是否具有影响结果的相互作用
  • 双向方差分析分析各组的组间差异,可以测定因子的哪个对的均值存在显著差异

2. 关于数据

  • 数据包含几个独立的因子群(或2个向量)
  • 各因子群/集是独立的且等同近似正态分布
  • 因子群的各个均值遵循具有相同方差的正态分布,并且可以比较

示例

假设侧重性别和3个饮食组对收缩压的影响。3个饮食组包括严格素食者(SV)、蛋奶素食者(LV)和正常人(NOR); 并测量了收缩压。 性别和饮食组的影响可能是相互关联(作用)的。 想了解饮食组和性别对收缩压的影响,以及两者之间是否相互联系。

请参考以下步骤,输出分析结果。


Output 1. 描述性统计结果


第一组因子的类别

第二组因子的类别





Output 2. 方差分析表



说明
  • DF因子 = 因子组的类别数 -1
  • DF相互作用 = DF因子1 x DF因子2
  • DF残差 = 样本值的个数 - 因子组1的类别数 x 因子组2的类别数
  • MS = SS/DF
  • F = MS因子 / MS残留误差
  • P值 < 0.05,则因子的总体均值间存在有意差。(接受备择假设)
  • P值 >= 0.05,则因子的总体均值间内没有意差。(接受零假设)

在本例中,饮食类型和性别都会影响SBP(P值<0.001),饮食类型也与性别有显著的相关(P值<0.001)。


P值 < 0.05时、 如果想知道哪些成对因素组明显不同,请使用多重比较


Output 2. 多重比较的结果


因子别成对P值表



说明
  • 在矩阵中,P值<0.05表示因子对具有统计学意义
  • 在矩阵中,P值>=0.05表示在因子对无显著统计学差异


在本示例中,在正常和LV,SV和LV,SV和正常以及男性和女性SBP的所有配对中均存在显著差异。


多样本比较的Kruskal-Wallis非参数检验和多重比较

这种方法比较的是观测数据的秩,而不是均值和标准差。是单因素方差分析的替代,此方法无需假设数据分布。

1. 功能

  • 测定各因子组之间的均值是否有显著差异
  • 测定因子组的均值是否存在显著差异,假设单向方差分析发现各组间存在显著差异

2. 关于数据

  • 数据包含以两个向量显示的几个单独的因子群
  • 一个向量是观测值,一个向量是在不同的因子群中标记的值
  • 各个因子群是独立的,不需要假设分布

示例

假设想发现被动吸烟对癌症的发病率是否有影响。 在一项研究中,研究了6组吸烟者:非吸烟者 (NS)、被动吸烟者 (PS)、非吸入吸烟者 (NI)、轻度吸烟者 (LS)、中度吸烟者(MS) 及重度吸烟者 (HS); 并测量了強制呼气流量(FEF)。 想了解6组间FEF的差异。

请参考以下步骤,输出分析结果。


Output 1. 描述性统计结果



因子组类别



组别描述统计量




说明
  • 框内的条带为中位数
  • 方框测量第75和第25个百分位数之间的差值
  • 显示的点为可能的离群点(outlier)

Output 2. 检验结果



在此示例中,有统计学差异,因此我们可以得出结论,六组之间的FEF的Kruskal-Wallis秩有显着不同。


P值 < 0.05时, 如果想知道哪些成对因素组明显不同,请使用多重比较


Output 2. 检验结果


如果P值 <= 0.025,则拒绝零假设。


在此示例中,吸烟组统计学有意,因此我们可以得出结论,在LS-NI,LS-PS和NI-PS组中,FEF没有显着差异。 对于其他组,P值 <0.025。