单样本的T检验

1. 功能

  • 检验一个正态分布的总体的均值是否在满足零假设的值之内
  • 有关数据的基本描述性统计信息
  • 数据的描述性统计图,如箱形图、均值-标准差图、QQ图、分布直方图及密度分布图,以测定数据是否接近正态分布

2. 关于数据

  • 已知一个总体均数
  • 样本数据包含1组连续型观测值,可得到一个样本均数及该样本标准差
  • 样本来自正态或近似正态总体

示例

假设收集了50位患有淋巴结阳性患者的年龄,并想知道淋巴结阳性患者的一般年龄是否为50岁。

请参考以下步骤,输出分析结果。


Output 1. 描述性统计结果





说明
  • 框内的条带为中位数
  • 方框测量第75和第25个百分位数之间的差值
  • 显示的点为可能的离群点(outlier)



正态QQ图


直方图


当分箱数为0时,绘图将使用默认分箱数。


概率密度函数图


说明
  • 正态QQ图:将垂直轴上随机生成的独立标准正态数据与水平轴上的标准正态总体进行比较,点的线性表明数据呈正态分布
  • 直方图:通过描述某一数值范围内出现的观察值频率,粗略评估给定变量的概率分布
  • 密度图:估计数据的概率密度函数

Output 2. 检验结果



说明
  • P值 < 0.05,则数据总体与指定均值有显著差异。(接受备择假设)
  • P值 >= 0.05,则数据总体与指定均值无显著差异。(接受零假设)


因为P值 < 0.05,我们可以得到患有淋巴结阳性患者的年龄和50岁有显著性不同的结论。 也就是说,一般的淋巴结阳性患者群体的年龄不是50岁。如果指定平均设定为44岁的话,我们可以得到 P > 0.05。


独立双样本的T检验

1. 功能

  • 两个正态分布的总体的均值是否相等,或之差是否为某实数
  • 了解有关数据的基本描述性统计信息
  • 了解数据的描述性统计图,如箱形图、均值-标准差图、QQ图、分布直方图及密度分布图,以测定数据是否接近正态分布

2. 关于数据

  • 数据包含2个独立组,每组是连续观测值
  • 这2个独立组的数据独立同分布,近似正态分布

示例

假设收集了50位仅患有淋巴结阳性患者的年龄。 其中雌激素受体 (ER) 阳性 25 例,ER 阴性 25 例。 想知道ER阳性患者的年龄是否与ER阴性患者的年龄有显著性差异;或者,ER是否与年龄有关。

请参考以下步骤,输出分析结果。


Output 1. 描述性统计结果





说明
  • 框内的条带为中位数
  • 方框测量第75和第25个百分位数之间的差值
  • 显示的点为可能的离群点(outlier)



正态QQ图


直方图


当分箱数为0时,绘图将使用默认分箱数。


概率密度函数图


说明
  • 正态QQ图:将垂直轴上随机生成的独立标准正态数据与水平轴上的标准正态总体进行比较,点的线性表明数据呈正态分布
  • 直方图:通过描述某一数值范围内出现的观察值频率,粗略评估给定变量的概率分布
  • 密度图:估计数据的概率密度函数

Output 2. 检验结果 1


两组方差等价性的确认



说明
  • 当P值 < 0.05时,请使用韦尔奇t检验(Welch Two-Sample t-test)的结果
  • 当P >= 0.05时,请使用两样本t检验(Two-Sample t-test)的结果


在这个例子里,因为F检验的P値大约为0.15(> 0.05),数据的方差具有等价性,所以我们使用“独立双样本t检验”的结果


Output 3. 检验结果 2


选择 T 检验



说明
  • P值 < 0.05,则2组数据的总体均值有显著差异。(接受备择假设)
  • P值 >= 0.05,则2组数据的总体均值无显著差异。(接受零假设)


在这个例子里,我们可以得到ER阳性患者和阴性患者的总体年龄没有统计学差异(P = 0.55,“独立双样本t检验”的结果)


配对样本的T检验

配对情况下,比较2组的差异为零。因此,成为一个单样本检验问题。

1. 功能

  • 检定自同一总体抽出的成对样本间差异是否为零
  • 了解有关数据的基本描述性统计信息
  • 了解数据的描述性统计图,如箱形图、均值-标准差图、QQ图、分布直方图及密度分布图,以测定数据是否接近正态分布

2. 关于数据

  • 数据包含2个已匹配或配对的两个样本
  • 配对样本的差值近似正态分布

3. 匹配或配对数据示例

  • 一个人的前测和后测评分
  • 有两个样本已经匹配或配对时

示例

假设想要知道某种药物是否对人们的睡眠时间有影响。我们找了10个人作为样本,收集了服药前后的睡眠时间数据。 这是一个配对案例。 如果想知道服药前后的睡眠时间是否会有显著差异;或者治疗前后的差是否与0有显著性差异,可用这个方法。

请参考以下步骤,输出分析结果。


Output 1. 描述性统计结果



差的描述性统计




说明
  • 框内的条带为中位数
  • 方框测量第75和第25个百分位数之间的差值
  • 显示的点为可能的离群点(outlier)



正态QQ图


直方图


当分箱数为0时,绘图将使用默认分箱数。


概率密度函数图


说明
  • 正态QQ图:将垂直轴上随机生成的独立标准正态数据与水平轴上的标准正态总体进行比较,点的线性表明数据呈正态分布
  • 直方图:通过描述某一数值范围内出现的观察值频率,粗略评估给定变量的概率分布
  • 密度图:估计数据的概率密度函数

Output 2. 检验结果



说明
  • P值 < 0.05,则第1组(服用前)和第2组(服用后)存在统计学差异。(接受备择假设)
  • P值 >= 0.05,则2组数据没有统计学差异。(接受零假设)


根据初始设定,结果为该药物对睡眠时间不具有影响。(P值= 0.2)