一个比例的卡方检验和精确二项式方法(Exact Binomial Method)
1. 功能
- 测定数据的总体比率/比例(proportion/rate)是否与指定的比率/比例有显著差异
- 测定抽样率/例与总体比率/比例的兼容性
- 测定伯努利实验成功的概率
2. 关于数据
- 数据来自二项分布
- 知道整个样本和指定事件的数量
- 需要指定一个比例值 (p0)
示例
假设在一般人群中有20%的不孕妇女,一种治疗可能会影响不孕。200名尝试怀孕的妇女接受了这种治疗。在40名接受治疗的妇女中,仍有10人不孕。想知道接受治疗妇女的不孕率与一般不孕率的20%相比是否有显著性差异。
请参考以下步骤,输出分析结果。
Output 1. 比率图
Output 2. 检验结果
1. np0(1-p0) >= 5时,使用耶茨连续性校正(Yates' Continuity Correction)的正态理论方法
2. np0(1-p0) < 5时,使用精确二项方法(Exact Binomial Method)
说明
- P 值 < 0.05, 则全体比例/比率和指定比例/比率相比有统计学差异。(接受备择假设)
- P 值 >= 0.05, 则全体比例/比率和指定比例/比率相比无统计学差异。(接受零假设)
根据初始设置,我们可以得到治疗女性的不孕率和一般的20%相比是没有统计学差异的(P值= 0.55)。
在这个示例里,np0(1-p0)=40*0.2*0.8 > 5。
因此,适用 正态理论方法(Normal Theory Method) 。
两个独立比例的卡方检验
1. 功能
2. 关于数据
- 2组数据来自二项分布(成功比例)
- 知道2组整体样本和指定事件的数量(子组比例)
- 2个组是独立观察值。
示例
假设研究中的所有女性至少生育过一次。
以3220例乳腺癌妇女为研究对象。
其中,30岁以后至少生育过一次的有683人。
同时调查了10245例无乳腺癌妇女作为对照。
其中,30岁以后至少生育过一次的有1498人。
假设想知道30岁以上生育第一胎的潜在概率在乳腺癌组和非乳腺癌组中是否不同。
请参考以下步骤,输出分析结果。
Output 1. 数据确认
数据表
百分比图
1. 病例组
2. 控制组
Output 2. 检验结果
说明
- P值 < 0.05, 则两组的总比例/比率有统计学显著差异。(接受备择假设)
- P值 >= 0.05, 则两组的总比例/比率无统计学显著差异。(接受零假设)
根据默认设置,我们得出结论,与没有乳腺癌的女性相比,患有乳腺癌的女性在30岁以后生下第一个孩子的可能性要大得多。有统计学差异。(P<0.001)
三个以上独立比例的卡方检验
1. 功能
2. 关于数据
- 组数据来自二项分布(成功比例)
- 知道各组的整个样本和指定事件的数量(子组比例)
- 多组为独立观察值。
示例
假设想研究第一次生育年龄与乳腺癌发展之间的关系,
因此调查了3220例乳腺癌患者和10254例非乳腺癌患者,
然后将妇女分为不同的年龄组。
假设想知道不同年龄组患癌症的概率是否不同;或者她们的年龄是否与乳腺癌有关。
请参考以下步骤,输出分析结果。
Output 1. 数据确认
Output 2. 检验结果
说明
- P值 < 0.05, 则总比例/比率有统计学显著差异。(接受备择假设)
- P值 >= 0.05, 则总比例/比率无统计学显著差异。(接受零假设)
在此默认设置下,我们得出结论,不同年龄组患癌的可能性显着不同。(P值 < 0.001)
多个独立样本趋势的卡方检验
1. 功能
2. 关于数据
- 组数据来自二项分布(成功比例)
- 知道各组的整个样本和指定事件的数量(子组比例)
- 多组为独立观察值
示例
假设想研究第一次生育年龄与乳腺癌发展之间的关系。
因此,调查了3220例乳腺癌患者和10254例非乳腺癌患者,
然后将妇女分为不同的年龄组。
假设想知道癌症的发病率是否有年龄趋势。
请参考以下步骤,输出分析结果。
Output 1. 数据确认
Output 2. 检验结果
说明
- P 值 < 0.05, 则病例对照(行)与因素分组(列)显著相关。(接受备择假设)
- P 值 >= 0.05, 则病例控制(行)与分组的因子(列)不关联。(接受零假设)
在此默认设置下,我们得出的结论是癌症的比例在不同年龄之间有所不同。(P值 = 0.01)