一个比例的卡方检验和精确二项式方法(Exact Binomial Method)

1. 功能

  • 测定数据的总体比率/比例(proportion/rate)是否与指定的比率/比例有显著差异
  • 测定抽样率/例与总体比率/比例的兼容性
  • 测定伯努利实验成功的概率

2. 关于数据

  • 数据来自二项分布
  • 知道整个样本和指定事件的数量
  • 需要指定一个比例值 (p0)

示例

假设在一般人群中有20%的不孕妇女,一种治疗可能会影响不孕。200名尝试怀孕的妇女接受了这种治疗。在40名接受治疗的妇女中,仍有10人不孕。想知道接受治疗妇女的不孕率与一般不孕率的20%相比是否有显著性差异。

请参考以下步骤,输出分析结果。


Output 1. 比率图



Output 2. 检验结果


1. np0(1-p0) >= 5时,使用耶茨连续性校正(Yates' Continuity Correction)的正态理论方法



2. np0(1-p0) < 5时,使用精确二项方法(Exact Binomial Method)


说明
  • P 值 < 0.05, 则全体比例/比率和指定比例/比率相比有统计学差异。(接受备择假设)
  • P 值 >= 0.05, 则全体比例/比率和指定比例/比率相比无统计学差异。(接受零假设)


根据初始设置,我们可以得到治疗女性的不孕率和一般的20%相比是没有统计学差异的(P值= 0.55)。 在这个示例里,np0(1-p0)=40*0.2*0.8 > 5。 因此,适用 正态理论方法(Normal Theory Method)

两个独立比例的卡方检验

1. 功能

  • 测定2组数据背后的总体比率/比例是否有显著差异。

2. 关于数据

  • 2组数据来自二项分布(成功比例)
  • 知道2组整体样本和指定事件的数量(子组比例)
  • 2个组是独立观察值。

示例

假设研究中的所有女性至少生育过一次。 以3220例乳腺癌妇女为研究对象。 其中,30岁以后至少生育过一次的有683人。 同时调查了10245例无乳腺癌妇女作为对照。 其中,30岁以后至少生育过一次的有1498人。 假设想知道30岁以上生育第一胎的潜在概率在乳腺癌组和非乳腺癌组中是否不同。

请参考以下步骤,输出分析结果。


Output 1. 数据确认


数据表



百分比图

1. 病例组



2. 控制组



Output 2. 检验结果


说明
  • P值 < 0.05, 则两组的总比例/比率有统计学显著差异。(接受备择假设)
  • P值 >= 0.05, 则两组的总比例/比率无统计学显著差异。(接受零假设)


根据默认设置,我们得出结论,与没有乳腺癌的女性相比,患有乳腺癌的女性在30岁以后生下第一个孩子的可能性要大得多。有统计学差异。(P<0.001)

三个以上独立比例的卡方检验

1. 功能

  • 测定多组数据背后的总体比率/比例是否有显著差异。

2. 关于数据

  • 组数据来自二项分布(成功比例)
  • 知道各组的整个样本和指定事件的数量(子组比例)
  • 多组为独立观察值。

示例

假设想研究第一次生育年龄与乳腺癌发展之间的关系, 因此调查了3220例乳腺癌患者和10254例非乳腺癌患者, 然后将妇女分为不同的年龄组。 假设想知道不同年龄组患癌症的概率是否不同;或者她们的年龄是否与乳腺癌有关。

请参考以下步骤,输出分析结果。


Output 1. 数据确认



Output 2. 检验结果


说明
  • P值 < 0.05, 则总比例/比率有统计学显著差异。(接受备择假设)
  • P值 >= 0.05, 则总比例/比率无统计学显著差异。(接受零假设)

在此默认设置下,我们得出结论,不同年龄组患癌的可能性显着不同。(P值 < 0.001)


多个独立样本趋势的卡方检验

1. 功能

  • 测定多组数据背后的总体比率/比例是否不同

2. 关于数据

  • 组数据来自二项分布(成功比例)
  • 知道各组的整个样本和指定事件的数量(子组比例)
  • 多组为独立观察值

示例

假设想研究第一次生育年龄与乳腺癌发展之间的关系。 因此,调查了3220例乳腺癌患者和10254例非乳腺癌患者, 然后将妇女分为不同的年龄组。 假设想知道癌症的发病率是否有年龄趋势。

请参考以下步骤,输出分析结果。


Output 1. 数据确认



数据表

单元格/列和百分比



Output 2. 检验结果


说明
  • P 值 < 0.05, 则病例对照(行)与因素分组(列)显著相关。(接受备择假设)
  • P 值 >= 0.05, 则病例控制(行)与分组的因子(列)不关联。(接受零假设)

在此默认设置下,我们得出的结论是癌症的比例在不同年龄之间有所不同。(P值 = 0.01)