单样本 T 检验

1. 功能

  • 测定数据是否与 T 检验结果的指定均值在统计学上有显著差异
  • 了解有关数据的基本描述性统计信息
  • 了解数据的描述性统计图,如箱形图、均值-sd图、QQ图、分布直方图及密度分布图,以测定数据是否接近正态分布

2. 关于你的数据

  • 数据仅包含1组值(或一个数字向量)
  • 该组值是独立观察值,近似正态分布

示例

假设收集了50位仅患有淋巴结阳性患者的年龄,并想知道淋巴结阳性患者的一般年龄是否为50岁

请按照以下步骤输出实时分析结果。


第1步 准备数据

1. 命名数据(必填)


2. 数据输入


144例リンパ節陽性患者の年齢を入力してあります

请参考示例格式上传数据

数据点可以用 逗号(,) 分号(;) 回车(/Enter) 制表符(/Tab) 空格(/Space)分隔

从CSV(一列)复制数据并粘贴到框中

缺失值输入NA


上传示例数据。

2. 是否将第1行用作列名?

3. 是否将第1列(无重复项)用作行名?

正确的分隔符和引号确保数据输入成功

从此处可以下载示例数据

第2步 指定参数

指定的参数为一般年龄50岁


第3步 选择假设

虚假设

μ = μ₀: 数据的总体均值 (μ) 为 μ₀

想知道年龄是不是50岁,所以选择第一个备择假设

Output 1. 描述性统计结果




说明
  • 框内的条带为中位数
  • 方框测量了第75和第25个百分位数之间的差值
  • 如果存在离群值,将显示为红色



说明
  • 正态Q-Q图:将垂直轴上随机生成的独立标准正态数据与水平轴上的标准正态总体进行比较。点的线性表明数据呈正态分布。
  • 直方图:通过描述某一数值范围内出现的观察值频率,粗略评估给定变量的概率分布
  • 密度图:估计数据的概率密度函数

正态Q-Q图

直方图

当分箱数为0时,绘图将使用默认分箱数

密度图


Output 2. 检验结果


说明
  • P值 < 0.05,则数据总体与指定均值有显著差异。(接受备择假设)
  • P值 >= 0.05,则数据总体与指定均值无显著差异。(接受虚假设)

因为P < 0.05,我们可以得到患有淋巴结阳性患者的年龄和50岁有显著性不同的结论。 也就是说,一般的淋巴结阳性患者群体的年龄不是50岁。如果指定平均设定为44岁的话,我们可以得到 P > 0.05。


独立双样本 T 检验

1. 功能

  • 测定两组数据的均值是否分别与 T 检验结果的有显著差异
  • 了解有关数据的基本描述性统计信息
  • 了解数据的描述性统计图,如箱形图、均值-sd图、QQ图、分布直方图及密度分布图,以测定数据是否接近正态分布

2. 关于你的数据

  • 数据包含2个独立组/集(或2个数字向量)
  • 这2个独立组/集独立且等同近似正态分布

示例

假设收集了50位仅患有淋巴结阳性患者的年龄。其中雌激素受体 (ER) 阳性 25 例,ER 阴性 25 例。想知道ER阳性患者的年龄是否与ER阴性患者的年龄有显著性差异。或者,ER是否与年龄有关。

请按照以下步骤输出实时分析结果。


第1步 准备数据

1. 命名数据(必填)


2. 数据输入


在这个例子里,雌激素受体 (ER) 阳性患者27人的年龄为(Group.1-Age.positive),ER 阴性患者117人的年龄为(Group.2-Age.negative)。

请参考示例格式上传数据

数据点可以用 逗号(,) 分号(;) 回车(/Enter) 制表符(/Tab) 空格(/Space)分隔

从CSV(一列)复制数据并粘贴到框中

组 1

组 2

缺失值输入NA,保证2个集长度相等;否则会出错


上传示例数据。

2. 是否将第1行用作列名?

3. 是否将第1列(无重复项)用作行名?

正确的分隔符和引号确保数据输入成功

从此处可以下载示例数据

选择假设

第2步 方差等价性

进行T检验前,需要检查方差的等价性,然后决定使用哪种T检验。

虚假设

v1 = v2: 第1组和第2组总体方差相等


第3步 T 检验

虚假设

μ₁ = μ₂: 第1组和第2组的总体平均相等

这里的初始设定为:我们想知道ER阳性患者和ER阴性患者的平均年龄是否存在统计学差异。

Output 1. 描述性统计结果





说明
  • 框内的条带为中位数
  • 方框测量了第75和第25个百分位数之间的差值
  • 如果存在离群值,将显示为红色



说明
  • 正态Q-Q图:将垂直轴上随机生成的独立标准正态数据与水平轴上的标准正态总体进行比较。点的线性表明数据呈正态分布。
  • 直方图:通过描述某一数值范围内出现的观察值频率,粗略评估给定变量的概率分布
  • 密度图:估计数据的概率密度函数

正态Q-Q图

直方图

当分箱数为0时,绘图将使用默认分箱数

密度图


Output 2. 检验结果 1

两组方差等价性的确认
说明
  • 当P < 0.05时,请使用韦尔奇两样本t检验(Welch Two-Sample t-test)的结果
  • 当P >= 0.05时,请使用两样本t检验(Two-Sample t-test)的结果

在这个例子里,因为F检验的P値大约为0.15(> 0.05),数据的方差具有等价性,所以我们使用「两样本t检验」的结果


Output 3. 检验结果 2

选择 T 检验


说明
  • P值 < 0.05,则2组数据的总体均值有显著差异。(接受备择假设)
  • P值 >= 0.05,则2组数据的总体均值无显著差异。(接受虚假设)

在这个例子里,我们可以得到ER阳性患者和阴性患者的总体年龄没有统计学差异(P = 0.55、「两样本t检验」的结果)


配对样本的配对 T 检验

配对情况下,比较2组的差异为零。因此,成为一个单样本检验问题。

1. 功能

  • 测定配对的2个样本的差值是否等于0
  • 了解有关数据的基本描述性统计信息
  • 了解数据的描述性统计图,如箱形图、均值-sd图、QQ图、分布直方图及密度分布图,以测定数据是否接近正态分布

2. 关于你的数据

  • 数据包含2个独立组/集(或2个数字向量)
  • 已匹配或配对的两个样本
  • 配对样本的差值近似正态分布

3. 匹配或配对数据示例

  • 一个人的前测和后测评分
  • 有两个样本已经匹配或配对时

示例

假设,收集样本并想要知道某种药物是否对人们的睡眠时间有影响。我们找了10个人,收集了服药前后的睡眠时间数据。这是一个配对案例。我们想知道服药前后的睡眠时间是否会有显著差异;治疗前后的差异是否与0有显著性差异

请按照以下步骤输出实时分析结果。


第1步 准备数据

1. 命名数据(必填)


2. 数据输入


在这个例子里,我们研究某种药物是否影响睡眠时间。 这里输入的是药物服用前后的睡眠时间的记录。

请参考示例格式上传数据

数据点可以用 逗号(,) 分号(;) 回车(/Enter) 制表符(/Tab) 空格(/Space)分隔

从CSV(一列)复制数据并粘贴到框中

组 1 (服用前)

组 2 (服用后)

缺失值输入NA,保证2个集长度相等;否则会出错


上传示例数据。

2. 是否将第1行用作列名?

3. 是否将第1列(无重复项)用作行名?

正确的分隔符和引号确保数据输入成功

从此处可以下载示例数据

第2步 选择假设

虚假设

Δ = 0: 第1组(前)和第2组(后)等效

这里的初期设定为我们想知道药物是否有效果。也就是说,我们想要检验药物服用后,睡眠时间是否会有变化。

Output 1. 描述性统计结果



差的描述性统计


说明
  • 框内的条带为中位数
  • 方框测量了第75和第25个百分位数之间的差值
  • 如果存在离群值,将显示为红色



说明
  • 正态Q-Q图:将垂直轴上随机生成的独立标准正态数据与水平轴上的标准正态总体进行比较。点的线性表明数据呈正态分布。
  • 直方图:通过描述某一数值范围内出现的观察值频率,粗略评估给定变量的概率分布
  • 密度图:估计数据的概率密度函数

正态Q-Q图

直方图

当分箱数为0时,绘图将使用默认分箱数

密度图


Output 2. 检验结果



说明
  • P值 < 0.05,则第1组(服用前)和第二组(服用后)存在统计学差异.(接受备择假设)
  • P >= 0.05,则2组数据没有统计学差异.(接受虚假设)

根据初始设定,结果为该药物对睡眠时间不具有影响。 (P = 0.2)