1標本T検定

1. 使用できる機能

  • T検定の結果から、データの平均値と指定された平均値との間に統計的有意差があるかを調べる
  • データの基本記述統計量を把握する
  • データの箱ひげ図、平均sdプロット、QQプロット、分布ヒストグラム、密度分布プロットなどの記述統計プロットを把握し、データが正規分布に近いかを調べる

2. 使用するデータについて

  • データは1種類の値 (または1つの数ベクトル) のみ
  • 値は独立した観察であり、ほぼ正規分布である

使用例

リンパ節陽性患者 (独立した観察) 50例の年齢データを収集し、リンパ節陽性患者の一般的な年齢が50歳であったかを調べたいとします。

手順にしたがって進むと、アウトプット に解析結果がリアルタイムで出力されます。


Step 1. データの準備

1. データに名前を付ける (必須)


2. データの入力


144例リンパ節陽性患者の年齢を入力してあります

例のようにデータを入力してください

データは , ; /Enter /Tab /Spaceで区切ることができます

データはCSV(1列)からコピーされ、ボックスに貼り付けられます

欠損値はNAとして入力されます


サンプルデータをアップロードします

2. 最初の行を列名として使用?

3. 最初の列を行名として使用? (重複なし)

正しい区切りと引用符を選ばないとデータがうまく入力されません。

ここからサンプルデータをダウンロードできます

Step 2. パラメータを指定する

指定されたパラメータは一般年齢50歳です


Step 3. 仮説を選択する

帰無仮説

μ = μ₀: データの母平均 (μ) は μ₀

年齢が50歳かどうかを知りたかったので、1番目の対立仮説を選択します

Output 1. 記述統計の結果




説明
  • 箱の中の線は中央値を表しています
  • 箱の上辺は75パーセンタイル、下辺は25パーセンタイルを表しています
  • 外れ値がある場合は赤色で示されます



説明
  • 正規Q–Qプロット:無作為に発生させた独立した標準正規データを縦軸上にプロットし、横軸上の正規分布と比較します。点が線形の場合、データは正規分布していることが示唆されます
  • ヒストグラム:ある範囲の値について各観察の頻度を描き、変数の確率分布を大まかに評価する図です
  • 密度プロット:データの確率密度関数を推定するプロットです

正規Q–Qプロット

ヒストグラム

ビンの数が0の場合、プロットはデフォルトのビンの数を使用します

密度プロット


Output 2. 検定結果


説明
  • P < 0.05の場合、データの母平均と指定された平均との間に有意差があります。(対立仮説が採択されます)
  • P >= 0.05の場合、データの母平均と指定された平均との間に有意差はありません。(帰無仮説が採択されます)

P <0.05であるため、リンパ節陽性集団の年齢は50歳とは有意に異なると結論付けました。 したがって、一般的なリンパ節陽性集団の年齢は50歳ではありませんでした。指定された平均を44にリセットすると、P> 0.05を得ることができます。


独立2標本T検定

1. 使用できる機能

  • T検定の結果から、2組のデータの間で平均値に有意差があるかを調べる
  • データの基本記述統計量を把握する
  • データの箱ひげ図、平均sdプロット、QQプロット、分布ヒストグラム、密度分布プロットなどの記述統計プロットを把握し、データが正規分布に近いかを調べる

2. 使用するデータについて

  • データは2つの別々の群/セット (または2つの数ベクトル)
  • 2つの別々の群/セットは独立しており、ほぼ正規分布となっている

使用例

リンパ節陽性患者 (独立した観察) 50例の年齢データを収集し、そのうち25例はエストロゲン受容体 (ER) 陽性、25例はER陰性であったとして一般的にER陽性患者の年齢はER陰性患者と有意差があるのか、あるいはERが年齢と関連するのかを調べたいとします。

手順にしたがって進むと、アウトプットに解析結果がリアルタイムで出力されます。


Step 1. データの準備

1. データに名前を付ける (必須)


2. データの入力


この例は、27人のエストロゲン受容体(ER)陽性のリンパ節陽性患者(Group.1-Age.positive)と117人のER陰性患者(Group.2-Age.negative)の年齢です。

例のようにデータを入力してください

データは , ; /Enter /Tab /Spaceで区切ることができます

データはCSV(1列)からコピーされ、ボックスに貼り付けられます

群 1

群 2

欠測値はNAと入力し、2つのセットのデータの長さが同じになるようにします。長さが異なるとエラーになります。


サンプルデータをアップロードします

2. 最初の行を列名として使用?

3. 最初の列を行名として使用? (重複なし)

正しい区切りと引用符を選ばないとデータがうまく入力されません。

ここからサンプルデータをダウンロードできます

仮説を選択する

Step 2. 分散の等価性

T検定を行う前に、分散が等しいかを確認し、使用するT検定の種類を決める必要があります。

帰無仮説

v1 = v2: 群1と群2の母分散は等しい


Step 3. T検定

帰無仮説

μ₁ = μ₂: 群1と群2の母平均は等しい

このデフォルト設定では、ER陽性の患者の年齢がER陰性の患者と有意に異なるかどうかを知りたいです

Output 1. 記述統計の結果





説明
  • 箱の中の線は中央値を表しています
  • 箱の上辺は75パーセンタイル、下辺は25パーセンタイルを表しています
  • 外れ値がある場合は赤色で示されます



説明
  • 正規Q–Qプロット:無作為に発生させた独立した標準正規データを縦軸上にプロットし、横軸上の正規分布と比較します。点が線形の場合、データは正規分布していることが示唆されます
  • ヒストグラム:ある範囲の値について各観察の頻度を描き、変数の確率分布を大まかに評価する図です
  • 密度プロット:データの確率密度関数を推定するプロットです

正規Q–Qプロット

ヒストグラム

ビンの数が0の場合、プロットはデフォルトのビンの数を使用します

密度プロット


Output 2. 検定結果 1

2つの分散の等価性を確認
説明
  • P < 0.05の場合、 ウェルチ2標本t検定(Welch Two-Sample t-test)の結果を使って下さい
  • P >= 0.05の場合、 2標本t検定(Two-Sample t-test)の結果を使って下さい

この例では、F検定のP値は約0.15(> 0.05)であり、データの分散が等しいことを示しています。 したがって、「2標本t検定」の結果を使います


Output 3. 検定結果 2

T検定を選択


説明
  • P < 0.05の場合、2群のデータの母平均の間に有意差があります。(対立仮説が採択されます)
  • P >= 0.05の場合、2群のデータの母平均の間に有意差はありません。(帰無仮説が採択されます)

この例では、ER陽性のリンパ節陽性集団の年齢はER陰性と有意差がないと結論付けました(P = 0.55、「2標本t検定」から)


対応のあるT検定

対応のある場合、2群の差を0と比較します。したがってこれは1標本の検定となります。

1. 使用できる機能

  • 対応のある2標本の差が0に等しいかを調べる
  • データの基本記述統計量を把握する
  • データの箱ひげ図、平均sdプロット、QQプロット、分布ヒストグラム、密度分布プロットなどの記述統計プロットを把握し、データが正規分布に近いかを調べる

2. 使用するデータについて

  • データは2つの別々の群/セット (または2つの数ベクトル))
  • マッチした、あるいは対応のある2標本
  • 対応のある標本の差がほぼ正規分布となっている

3. マッチした、あるいは対応のあるデータの例

  • 検査前と検査後のスコア
  • マッチさせた、あるいは対応させた2標本がある場合

使用例

ある薬剤が睡眠時間に影響を及ぼすかを知るためにデータを収集したと仮定します。その薬剤の服用前と服用後の睡眠時間のデータを10例から収集しました。これが「対応のある」例です。この薬剤の服用前と服用後で睡眠時間に有意差があるか、または服用前と服用後の差が0と有意差があるかを知りたいとします。

手順にしたがって進むと、アウトプットに解析結果がリアルタイムで出力されます。


Step 1. データの準備

1. データに名前を付ける (必須)


2. データの入力


ここでの例は、ある薬の影響を受けた睡眠時間です。 薬を服用する前後の睡眠時間を記録した

例のようにデータを入力してください

データは , ; /Enter /Tab /Spaceで区切ることができます

データはCSV(1列)からコピーされ、ボックスに貼り付けられます

群1 (服用前)

群2 (服用後)

欠測値はNAと入力し、2つのセットのデータの長さが同じになるようにします。長さが異なるとエラーになります。


サンプルデータをアップロードします

2. 最初の行を列名として使用?

3. 最初の列を行名として使用? (重複なし)

正しい区切りと引用符を選ばないとデータがうまく入力されません。

ここからサンプルデータをダウンロードできます

Step 2. 仮説を選択する

帰無仮説

Δ = 0: 群1 (服用前) と群2 (服用後) に差がない

このデフォルト設定では、薬が効果があるかどうかを知りたいです。 つまり、薬を服用した後で睡眠時間が変わったかどうかを検定したいです。

Output 1. 記述統計の結果



差の記述統計


説明
  • 箱の中の線は中央値を表しています
  • 箱の上辺は75パーセンタイル、下辺は25パーセンタイルを表しています
  • 外れ値がある場合は赤色で示されます



説明
  • 正規Q–Qプロット:無作為に発生させた独立した標準正規データを縦軸上にプロットし、横軸上の正規分布と比較します。点が線形の場合、データは正規分布していることが示唆されます
  • ヒストグラム:ある範囲の値について各観察の頻度を描き、変数の確率分布を大まかに評価する図です
  • 密度プロット:データの確率密度関数を推定するプロットです

正規Q–Qプロット

ヒストグラム

ビンの数が0の場合、プロットはデフォルトのビンの数を使用します

密度プロット


Output 2. 検定結果



説明
  • P < 0.05の場合、 群1 (服用前) と群2 (服用後)は有意に等しくなりません. (対立仮説が採択されます)
  • P >= 0.05の場合、 2群のデータに有意差がありません. (帰無仮説が採択されます)

デフォルト設定から、この薬は睡眠時間に有意な影響を及ぼさないと結論付けました。 (P = 0.2)