病例对照状态2类因子的卡方检验

1. 功能

  • 测定病例对照状态(行)和因子类别(列)之间是否存在关联
  • 测定2个独立样本中的比例是否相同
  • 测定比例是否均质
  • 获取百分比表和图表以及每个单元格的期望值

2. 计数数据为4单元2×2列联表

  • 病案对照状态有2个类别(行名)
  • 因子状态有2个类别(列名)
  • 每个单元格独立,有较多的计数

示例

假设想知道经口避孕药(OC)使用者和心肌梗塞(MI)之间的关系。 在一项研究中,调查了5000名OC使用者和10000名OC非使用者的数据, 并将他们分为MI和非MI患者组。 5000名OC使用者中,13人出现MI;10000名OC非使用者中,7人发生MI。 想要测定OC的使用是否与较高的MI发生率显著相关。

请参考以下步骤,输出分析结果。


Output 1. 描述性统计结果



含有合计的2x2列联表



期望值



单元格/行的合计的百分比(单位:100%)



单元格/列的合计的百分比(单位:100%)



单元格/合计的百分比(单位:100%)



列分组

行分组


Output 2. 检验结果



说明
  • P值 < 0.05,则病例对照(行)与分组因子(列)有统计学相关性。 (接受备择假设)
  • P值 > = 0.05,则病例对照(行)与分组因子(列)没有统计学相关性。 (接受零假设)


根据初始设置, 我们可以得到心肌梗塞发生率和口服避孕药的使用是有统计学的关联的结论 (P值 = 0.01)。 这里最小期望值为6.67,我们使用了耶茨校正。


病例对照条件下2类小期望计数因子的费雪精确检验

1. 功能

  • 测定病例对照状态(行)和因子状态(列)之间是否存在关联
  • 测定 2 个相依样本中的比例是否相同
  • 测定比例是否均质
  • 获取百分比表和图表以及每个单元格的期望值

2. 计数数据为2×2列联表

  • 病案对照状态有2个类别(行名)
  • 因子状态有2个类别(列名)
  • 每个单元格独立
  • 数据的期望值很小

示例

假设想知道心血管疾病(CVD)和高盐饮食之间的关系。 在一项研究中,调查了35例CVD患者和25例非CVD患者的数据,并将他们分为高盐饮食组和低盐饮食组。 35例CVD患者中,5例为高盐饮食;25例非CVD患者中,2例为高盐饮食。想要测定CVD是否与高盐饮食显著相关。

请参考以下步骤,输出分析结果。


Output 1. 描述性统计结果



含有合计的2x2列联表



期望值



单元格/行的合计的百分比(单位:100%)



单元格/列的合计的百分比(单位:100%)



单元格/合计的百分比(单位:100%)



列分组

行分组


Output 2. 检验结果



说明
  • P值 < 0.05,则病例对照(行)与分组因子(列)有统计学相关性。 (接受备择假设)
  • P值 >= 0.05,则病例对照(行)与分组因子(列)没有统计学相关性。 (接受零假设)


根据初始设置, 我们使用费雪精确检验(Fisher Exact Test), 因为我们有两个期望值<5。 根据检验结果,我们得出结论,死亡原因与高盐饮食之间没有显着关联。


病例对照条件下2类因子配对计数的McNemar检验

1. 功能

  • 测定匹配样本的两个因子是否有显著差异
  • 获取百分比表和图表以及每个单元格的期望值

2. 计数数据为2×2列联表和配对计数

  • 病例对照结果有2个类别(在行名和列名中)
  • 因子状态有2个类别(在行名和列名中)
  • 数据样本为匹配/配对数据
  • 知道一致对,即匹配对组成的结果均相同
  • 知道不一致对,即匹配对组成的结果均不同

3. 2×2列联表中的配对计数

  • 两对患者配对,年龄和临床情况相似。一组接受治疗A,另一组接受治疗B,记录有多少人好转,有多少人恶化。
  • 对于一致对,匹配对组成均改善或恶化
  • 对于不一致对,匹配对的一个组成改善或恶化

示例

假设想比较两种治疗方法的疗效。 调查了两组患者,一组患者接受A治疗,另一组患者接受B治疗。 两组患者配对,共组成621对。 每一配对中,一个患者接受A治疗,另一个接受B治疗。 在621对中,有510对经过A、B治疗后均好转;90对经过A、B治疗后无变化。 16对中,接受A治疗的患者好转;5组中,接受B治疗的患者好转。

请参考以下步骤,输出分析结果。


Output 1. 描述性统计结果



含有合计的2x2列联表



期望值



单元格/行的合计的百分比(单位:100%)



单元格/列的合计的百分比(单位:100%)



单元格/合计的百分比(单位:100%)




Output 2. 检验结果



说明
  • P值 < 0.05,则因子在配对样本间存在有意差。 (接受备择假设)
  • P值 >= 0.05,则因子没有统计学相关性。 (接受零假设)


根据初始设置, 我们得出两个治疗会导致配对患者间有统计学意义的不同效果的结论。(P值 = 0.03)


病例对照条件下3个以上类别因子的卡方检验

1. 功能

  • 测定病例对照状态(行)和因子状态(列)之间是否存在关联
  • 测定多组数据背后的总体比率/比例是否有显著差异
  • 获取百分比表和图表以及每个单元格的期望值

2. 计数数据为2×C列联表

  • 病例对照结果有2个类别(在行名和列名中)
  • 因子状态超过2个类别(在行名和列名中)
  • 组数据来自二项分布(成功比例)
  • 知道各组的整个样本和指定事件的数量(子组比例)
  • 多组为独立观察值

示例

假设我们想研究第一次生育年龄与乳腺癌发展之间的关系。 因此,我们调查了3220例乳腺癌患者和10254例非乳腺癌患者。 然后,我们将参加者分为不同的年龄组。 我们想知道不同年龄组患癌症的概率是否不同;或者她们的年龄是否与乳腺癌有关。

请参考以下步骤,输出分析结果。


Output 1. 描述性统计结果



含有合计的2xC列联表



期望值



单元格/行的合计的百分比(单位:100%)



单元格/列的合计的百分比(单位:100%)



单元格/合计的百分比(单位:100%)



Output 2. 检验结果



说明
  • P值 < 0.05,则病例/对照(行)与分组因素(列)显着相关。(接受备择假设)
  • P值 >= 0.05,则病例/对照(行)与分组因素(列)间没有统计学相关性。 (接受零假设)


此默认设置得出结论:癌症与年龄之间存在显着关系。(P值 < 0.001)


3个以上状态中因子的3个以上因子类别的卡方检验

1. 功能

  • 测定病例对照状态(行)和因子状态(列)之间是否存在关联
  • 测定多组数据背后的总体比率/比例是否有显著差异
  • 获取百分比表和图表以及每个单元格的期望值

2. 计数数据为R×C列联表

  • 组数据来自二项分布(成功比例)
  • 知道各组的整个样本和指定事件的数量(子组比例)
  • 多组为独立观察值

示例

假设想知道 3 种治疗方式(青霉素、低剂量大观霉素和高剂量大观霉素)与患者反应的关系。 在一项研究中,登记了400名患者,200名患者使用青霉素,100名患者使用低剂量大观霉素,100名患者使用高剂量大观霉素。 200例青霉素使用者中,40例涂片+,30例涂片培养+,130例涂片培养-。100例低剂量大观霉素使用者中,10例涂片+,20例涂片培养+, 70例涂片培养-。在100例高剂量大观霉素使用者中,15例涂片+,40例涂片培养+,45例涂片培养-。想知道治疗是否与反应有显著联系。

请参考以下步骤,输出分析结果。


Output 1. 描述性统计结果



含有合计的RxC列联表



期望值



单元格/行的合计的百分比(单位:100%)



单元格/列的合计的百分比(单位:100%)



单元格/合计的百分比(单位:100%)




Output 2. 检验结果



说明
  • P值 < 0.05,则病例/对照(行)与分组因素(列)显着相关。(接受备择假设)
  • P值 >= 0.05,则病例/对照(行)与分组因素(列)间没有统计学相关性。 (接受零假设)


此默认设置得出结论:药物治疗和反应之间存在统计学显著的关系。(P值 < 0.001)


两个评分器可重复性/一致性的Kappa统计量

1. 功能

  • 从两个评分器或两个排名中量化一致性
  • 获取百分比表及每个单元格的期望值

2. 计数数据为2×K列联表

  • 两个评分器的结果或两个测量值(例如,Y/N 答案、排名、类别)

示例

假设想检查来自两个调查的答案一致性。 在一项调查中,评分从1到9,而在另一项调查中,使用别种评分。 想检查这两个答案是否可复制,或者这两个调查是否一致。

请参考以下步骤,输出分析结果。


Output 1. 描述性统计结果



含有合计的2xK列联表





Output 2. 检验结果



Kappa评价和说明
  • Cohen's Kappa 统计系数>0.75;b>出色的可重复性
  • 0.4<=Cohen's Kappa 统计系数<=0.75良好的可重复性
  • 0 <=Cohen's Kappa 统计系数<0.4较低的可重复性
  • Cohen’s kappa 考虑了两个评分器之间的偏差,但没有考虑偏差度
  • 加权 kappa 通过预定义权重表进行计算,该权重表权衡两个评分器之间的偏差度。偏差越大,加权越高


此默认设置得出结论;调查1和调查2的答复的可重复性不是很高。


重复/相关测量重复性的Kappa统计量

此方法使用不同类型的数据。它使用K×K列联表中所示的一致和不一致计数。

1. 功能

  • 对多次测量的同一变量的可重复性进行量化
  • 量化具有相同结果的2项测量值之间的关联
  • 获取百分比表及每个单元格的期望值

2. 计数数据为K×K列联表

  • 知道结果的一致性、即重复测量中测量结果均相同
  • 知道结果的不一致、即重复测量中测量结果不同

示例

假设在一项研究中,对一组患者做了同样问题的两次调查。 想知道在两次调查中一致性的百分比。最终结果是136名患者对两次调查的回答均为是,240名患者对两次调查的回答均为否。 69人在第一次调查中回答“否”,在第二次调查中回答“是”,92人在第一次调查中回答“是”,在第二次调查中回答“否”。 想知道调查的一致性是否良好。

请参考以下步骤,输出分析结果。


Output 1. 描述性统计结果



含有合计的KxK列联表





Output 2. 检验结果



Kappa评价和说明
  • Cohen's Kappa 统计系数>0.75;b>出色的可重复性
  • 0.4<=Cohen's Kappa 统计系数<=0.75良好的可重复性
  • 0 <=Cohen's Kappa 统计系数<0.4较低的可重复性
  • Cohen’s kappa 考虑了两个评分器之间的偏差,但没有考虑偏差度
  • 加权 kappa 通过预定义权重表进行计算,该权重表权衡两个评分器之间的偏差度。偏差越大,加权越高


此默认设置得出结论:调查1和调查2的答复的可重复性偏低,有较低的可重复性。


K混杂层病例对照条件下2类因子的Mantel-Haenszel检验

1. 功能

  • 通过控制分层/混杂测定病例对照状态(行)和因子状态(列)之间是否存在关联
  • K层中的两个标称变量具有条件独立性
  • 获取百分比表和图表以及每个单元格的期望值

2. 计数数据为K层下的2×2列联表

  • 若干 2×2 列联表的计数
  • 每个2×2列联表在单因子分层中

示例

假设想看看被动吸烟对癌症风险的影响。一个潜在的混杂因素是参与者自己吸烟。 因为个人吸烟既与癌症风险有关,也与配偶吸烟有关。 因此,在研究被动吸烟与癌症风险之间的关系之前,我们控制了个人主动吸烟。 绘制了两张2×2 表格,一张为主动吸烟组,有466人,另一张为非主动吸烟组,有532人。 如输入数据所示。想知道在控制主动吸烟后,被动吸烟是否与癌症风险显著相关;或者,优势比(OR值)是否有显著差异。

请参考以下步骤,输出分析结果。


Output 1. 描述性统计结果


K层2x2列联表

前两行显示第一层的2x2列联表,然后显示第二层的2x2列联表。



Output 2. 检验结果



说明
  • P值 < 0.05,则在个人吸烟得到控制的情况下,二手烟与患癌症的风险之间存在显着的关系,优势比(OR值)有显著不同。(接受备择假设)
  • P值 > = 0.05,则在控制个人吸烟的情况下,二手烟与癌症风险之间没有显着关系。(接受零假设)


此默认设置的结论是:在控制个人主动吸烟的情况下,癌症风险与二手烟之间存在显着的关系。(P值 < 0.001)


K分层中3个以上状态中因子的3个以上因子类别的Cochran-Mantel-Haenszel

1. 功能

  • 通过控制分层/混杂测定病例对照状态(行)和因子状态(列)之间是否存在关联
  • K层中的两个标称变量具有条件独立性
  • 获取百分比表和图表以及每个单元格的期望值

2. 计数数据为 K层下的R×C列联表

  • 若干 R×C 表的计数
  • 每个 R×C 列联表在单因子分层中

示例

假设想知道打鼾和年龄之间的关系。对3513名30-60岁的人进行了调查,其中女性1843人,男性1670人。 考虑到性别可能是本研究中的混杂变量,编制了女性和男性层的3×2表。想知道在控制性别后,年龄是否与打鼾显著相关。

请参考以下步骤,输出分析结果。


Output 1. 描述性统计结果


K层RxC列联表

前R行显示第一层的RxC列联表,然后显示第二层的RxC列联表。


Output 2. 检验结果



説明
  • P值 < 0.05,则在控制性别的情况下,习惯性打鼾的患病率与年龄显著相关,优势比(OR值)也存在显著差异。(接受备择假设)
  • P值 > = 0.05,则在控制性别的情况下,习惯性打鼾的患病率与年龄没有显著关系。(接受零假设)


此默认设置的结论是:在控制性别的情况下,习惯性打鼾的患病率与年龄显著相关.(P值 < 0.001)