標本の比率のカイ二乗検定および正確二項検定

1. 使用できる機能

  • データのもとである母集団における率/割合と、指定した率/割合との間に有意差があるかを調べる
  • 標本の率/割合と、母集団の率/割合の一致性を調べる
  • ベルヌーイ試行での成功確率を調べる

2. 使用するデータについて

  • データは二項分布 (成功の割合) である
  • 全標本と、指定した事象が生じた数 (サブグループの割合) がわかっている
  • 割合が指定されている (p0)

使用例

一般母集団で20%の女性が不妊であり、これに対する治療があるとします。妊娠を希望する女性200例がこの治療を受けました。治療を受けた女性40例のうち、10例は妊娠しませんでした。治療を受けた女性における不妊率と、一般の不妊率である20%の間に有意差があるかを調べたいとします。

手順にしたがって進むと、アウトプット に解析結果がリアルタイムで出力されます。


Output 1. 検定結果



Output 2. 検定結果


1. イェーツの連続補正を伴う正規理論方法 (Normal Theory Method with Yates' Continuity Correction), np0(1-p0) >= 5


2. 正確二項検定 (Exact Binomial Method), np0(1-p0) < 5


説明
  • P < 0.05の場合、 データの母確率/割合と指定された確率/割合との間に有意差があります。(対立仮説が採択されます)
  • P >= 0.05の場合、データの母確率/割合と指定された確率/割合との間に有意差はありません。(帰無仮説が採択されます)
デフォルト設定から、一般的な不妊率と比較して、治療を受けた女性との間で不妊率に有意差はないと結論付けました(P = 0.55)。 この場合、 np0(1-p0)=40*0.2*0.8 > 5であるため、正規理論方法(Normal Theory Method)が推奨されました。

独立した2標本の比率のカイ二乗検定

1. 使用できる機能

  • 2群のデータのもとである母集団で、率/割合に有意差があるかを調べる

2. 使用するデータについて

  • 2群のデータのもとである母集団は二項分布 (成功の割合) である
  • 全標本と、2群において指定した事象が生じた数 (サブグループの割合) がわかっている
  • 2群は独立した観察である

使用例

試験に参加したすべての女性に少なくとも1回の出産経験があるとします。乳がん患者3220例を症例としてデータを収集しました。このうち683例は30歳以降に少なくとも1回の出産経験がありました。また、対照として乳がんのない女性10245例のデータも収集しました。このうち1498例は30歳以降に少なくとも1回の出産経験がありました。初産年齢が30歳超となる確率が、乳がん患者群と非乳がん患者群で差があるかを調べたいとします。

手順にしたがって進むと、アウトプット に解析結果がリアルタイムで出力されます。


Output 1. データの確認


データ表

比例プロット

1. ケース(Case)群

2. コントロール(Control)群


Output 2. 検定結果


Explanations
  • P < 0.05の場合、 2群は母集団の確率/割合に有意差があります. (対立仮説が採択されます)
  • P Value >= 0.05の場合、2群は母集団の確率/割合に有意差はありません。(帰無仮説が採択されます)
デフォルト設定から、乳がんの女性は、乳がんのない女性と比較して、30歳以降に最初の子供を産む可能性が非常に高いと結論付けています。 (P <0.001)

独立した3つ以上の標本の比率のカイ二乗検定

1. 使用できる機能

  • 複数の群のデータのもとである母集団で、率/割合に有意差があるかを調べる

2. 使用するデータについて

  • 群のデータのもとである母集団は二項分布 (成功の割合) である
  • 全標本と、各群で指定した事象が生じた数 (サブグループの割合) がわかっている
  • 各群は独立した観察である

使用例

初産の年齢と乳がん発症の関係を調べたいとします。このため、乳がん患者3220例、乳がんのない被験者10254例のデータを収集し、被験者を各年齢群に分けました。乳がん発症の確率が、各年齢群で異なるか、または年齢が乳がんと関係があるかを調べたいと思っています。

手順にしたがって進むと、アウトプット に解析結果がリアルタイムで出力されます。


Output 1. データの確認



データ表



Output 2. 検定結果


説明
  • P < 0.05の場合、母集団の確率/割合は有意差があります (対立仮説が採択されます)
  • P >= 0.05の場合、母集団の確率/割合に有意差はありません。(帰無仮説が採択されます)

このデフォルト設定では、がんになる確率は年齢層によって大きく異なると結論付けました。 (P <0.001)


複数の独立標本における傾向のカイ二乗検定

1. 使用できる機能

  • 複数の群のデータのもとである母集団で、率/割合に違いがあるかを調べる

2. 使用するデータについて

  • 群のデータのもとである母集団は二項分布 (成功の割合) である
  • 全標本と、各群で指定した事象が生じた数 (サブグループの割合) がわかっている
  • 各群は独立した観察である

使用例

初産の年齢と乳がん発症の関係を調べたいとします。このため、乳がん患者3220例、乳がんのない被験者10254例のデータを収集し、被験者を各年齢群に分けました。がんの発現率が年齢とともに高くなるのかを調べたいとします。

手順にしたがって進むと、アウトプット に解析結果がリアルタイムで出力されます。


Output 1. データの確認



データ表

パーセンテージ%



Output 2. 検定結果


説明
  • P < 0.05の場合、 割合/率/確率が有意に変動しています (対立仮説が採択されます)
  • P >= 0.05の場合、標本の割合に変動がありません. (帰無仮説が採択されます)

このデフォルト設定では、がんの割合は年齢によって異なると結論付けました。 (P = 0.01)