症例/対照を用いた2カテゴリの因子のカイ二乗検定
1. 使用できる機能
- 症例/対照 (行) と因子のカテゴリ (列) の間に関連があるかを調べる
- 2つの独立した標本の間で割合が同じであるかを調べる
- 割合が同質であるかを調べる
- 百分率表とプロット、および各セルについて期待値を得る
2. カウントデータについて:4セル (2×2) の分割表
- 症例/対照として2つのカテゴリがある (列名として表示)
- 因子として2つのカテゴリがある (列名として表示)
- 各セルは独立しており、比較的多数のカウントがある
使用例
経口避妊薬 (OC) の使用と心筋梗塞 (MI) の関係を調べたいとします。ある試験で、OC使用者5000例、非OC使用者10000例のデータを収集し、これらの被験者をMI群と非MI群に分けました。MIを発症した人数はOC使用者5000例のうち13例、非OC使用者のうち7例でした。OCの使用とMIの発症との間に有意な関連があるかを調べたいとします。
手順にしたがって進むと、アウトプットに解析結果がリアルタイムで出力されます。
Output 1. データの確認
各セル/総数 %
セル/行の合計 %
セル/列の合計 %
Output 2. 検定結果
説明
- P < 0.05の場合、 ケース/コントロール(行)はグループ化された因子(列)と有意に関連しています。 (対立仮説が採択されます)
- P > = 0.05の場合、ケース/コントロール(行)はグループ化された因子(列)に関連付けられません。 (帰無仮説が採択されます)
このデフォルト設定では、MIの発病とOCを使用することには有意に関連があると結論付けました (P = 0.01)。最小期待値が6.67であったため、イェイツのP値の修正が行われました。
小標本の症例/対照に対する2カテゴリ因子のフィッシャーの正確検定
1. 使用できる機能
- 症例/対照 (行) と因子 (列) の間で関連があるかを調べる
- 2つの従属した標本の間で割合が同じであるかを調べる
- 割合が同質であるかを調べる
- 百分率表とプロット、および各セルについて期待値を得る
2. カウントデータについて:2×2の分割表
- 症例/対照として2つのカテゴリがある (列名として表示)
- 因子として2つのカテゴリがある (列名として表示)
- 各セルは独立している
- データの期待値が小さい
使用例
心血管疾患 (CVD) と塩分過多の食事の関係を調べたいとします。ある試験で、CVD患者35例と非CVD患者25例のデータを収集し、これらの被験者を塩分過多群と低塩分群に分類しました。塩分過多の食事をとっていた被験者は、CVD患者35例中5例、非CVD患者25例中2例でした。CVDと塩分過多の食事の間に有意な関係があるかを調べたいとします。
手順にしたがって進むと、アウトプットに解析結果がリアルタイムで出力されます。
Output 1. データの確認
各セル/総数 %
セル/行の合計 %
セル/列の合計 %
Output 2. 検定結果
説明
- P < 0.05の場合、 ケース/コントロール(行)はグループ化された因子(列)と有意に関連しています (対立仮説が採択されます)
- P > = 0.05の場合、ケース/コントロール(行)はグループ化された因子(列)に関連付けられません。 (帰無仮説が採択されます)
このデフォルト設定では、2つの期待値<5であるため、フィッシャーの正確確率検定を使用しました。 検定結果から、死因と高食塩食との間に有意な関連は見られなかったと結論付けました。
症例/対照とマッチさせた標本の2カテゴリ因子のマクネマー検定(McNemar Test)
1. 使用できる機能
- マッチした標本において2つの因子の間に有意差があるかを調べる
- 百分率表とプロット、および各セルについて期待値を得る
2. カウントデータについて:対応のあるカウントの2×2分割表
- 症例/対照のアウトカムについて2つのカテゴリがある (行名と列名で表示)
- 因子として2つのカテゴリがある (行名と列名で表示)
- 標本はマッチしている/ペアになっているデータである
- 各ペアについて、アウトカムが同じである一致したペアが分かっている
- 各ペアについて、アウトカムが異なる一致していないペが分かっている
3. 2×2の分割表におけるペアのカウント
- 年齢および臨床状態が同程度の患者2例をペアにしたとします。1群に対しては治療A、もう1群に対しては治療Bを行い、病状が改善した患者の数と悪化した患者の数を記録しました。
- 一致したペアは、ペアの2例とも改善または悪化したペアです。
- 一致していないペアは、片方のみが改善または悪化したペアです。
使用例
2つの治療の効果を比較したいとします。治療Aを受けた患者群、治療Bを受けた患者群という2群のデータを収集しました。この2群の患者をペアにし、621ペアを作成しました。各ペアは、治療Aを受けた患者1例と治療Bを受けた患者1例から成ります。これらの621ペアのうち、510ペアで治療AでもBでも病状が改善し、90ペアで治療AでもBでも病状は変わりませんでした。16ペアで治療Aを受けた患者のみが改善し、5ペアで治療Bを受けた患者のみが改善しました。
手順にしたがって進むと、アウトプットに解析結果がリアルタイムで出力されます。
Output 1. データの確認
各セル/総数 %
セル/行の合計 %
セル/列の合計 %
Output 2. 検定結果
説明
- P < 0.05の場合、 因子はペアのサンプルで有意差があります。 (対立仮説が採択されます)
- P > = 0.05の場合、因子に有意差はありません。 (帰無仮説が採択されます)
このデフォルト設定では、2つの治療がペアの患者に有意に異なる効果をもたらしたと結論付けました。 (P = 0.03)
症例/対照を用いた場合の3つ以上のカテゴリ因子のカイ二乗検定
1. 使用できる機能
- 症例/対照 (行) と因子 (列) の間で関連があるかを調べる
- 複数の群のデータのもとである母集団で、率/割合に有意差があるかを調べる
- 百分率表とプロット、および各セルについて期待値を得る
2. カウントデータについて:2×Cの分割表
- 症例/対照のアウトカムについて2つのカテゴリがある (行名と列名で表示)
- 因子について3つ以上のカテゴリがある (行名と列名で表示)
- 群のデータのもとである母集団は二項分布 (成功の割合) である
- 全標本と、各群で指定した事象が生じた数 (サブグループの割合) がわかっている
- 各群は独立した観察である
使用例
初産の年齢と乳がん発症の関係を調べたいとします。このため、乳がん患者3220例、乳がんのない被験者10254例のデータを収集し、被験者を各年齢群に分けました。
乳がん発症の確率が、各年齢群で異なるか、または年齢が乳がんと関係があるかを調べたいです。
手順にしたがって進むと、アウトプットに解析結果がリアルタイムで出力されます。
Output 1. データの確認
各セル/総数 %
セル/行の合計 %
セル/列の合計 %
Output 2. 検定結果
説明
- P < 0.05の場合、 ケース/コントロール(行)はグループ化された因子(列)と有意に関連しています。 (対立仮説が採択されます)
- P > = 0.05の場合、ケース/コントロール(行)はグループ化された因子(列)に関連付けられません。 (帰無仮説が採択されます)
このデフォルト設定では、癌と年齢の間に有意な関係があったと結論付けています。 (P <0.001)
3種類以上の状態について、3種類以上のカテゴリ因子がある場合のカイ二乗検定
1. 使用できる機能
- 症例/対照 (行) と因子 (列) の間で関連があるかを調べる
- 複数の群のデータのもとである母集団で、率/割合に有意差があるかを調べる
- 百分率表とプロット、および各セルについて期待値を得る
2. カウントデータについて:R×Cの分割表
- 群のデータのもとである母集団は二項分布 (成功の割合) である
- 全標本と、各群で指定した事象が生じた数 (サブグループの割合) がわかっている
- 各群は独立した観察である
使用例
3種類の治療薬 (ペニシリン、低用量スペクチノマイシン、および高用量スペクチノマイシン) と、患者の反応の関係を調べたいとします。ある試験で患者400例を登録し、
200例に対してはペニシリン、100例に対しては低用量スペクチノマイシン、100例に対しては高用量スペクチノマイシンを投与しました。ペニシリンを投与した200例のうち、
スメア+、スメア培養+、スメア培養-になった被験者の割合は、それぞれ40例、30例、130例でした。低用量スペクチノマイシンを投与した100例のうち、
スメア+、スメア培養+、スメア培養-になった被験者の割合は、それぞれ10例、20例、70例でした。高用量スペクチノマイシンを投与した100例のうち、
スメア+、スメア培養+、スメア培養-になった被験者の割合は、それぞれ15例、40例、45例でした。治療と反応の間に有意な関係があるかを調べたいとします。
手順にしたがって進むと、アウトプットに解析結果がリアルタイムで出力されます。
Output 1. データの確認
各セル/総数 %
セル/行の合計 %
セル/列の合計 %
Output 2. 検定結果
説明
- P < 0.05の場合、 ケース/コントロール(行)はグループ化された因子(列)と有意に関連しています。 (対立仮説が採択されます)
- P > = 0.05の場合、ケース/コントロール(行)はグループ化された因子(列)に関連付けられません。 (帰無仮説が採択されます)
このデフォルト設定では、薬物治療と反応の間に有意な関係があったと結論付けています。 (P <0.001)
2観察者間の再現性/一致に関するカッパ統計量
1. 使用できる機能
- 2観察者間または2つのランキングの間の一致度を定量化する
- 百分率表および各セルについて期待値を得る
2. カウントデータについて:2×Kの分割表
- 観察者2名または2つの測定から得たアウトカム (はい/いいえの答え、ランキング、カテゴリなど)
使用例
2件の調査で得た答えが一致しているかを調べたいとします。1つの調査ではランキングスコアが1~9の点数で表されていますが、もう1つの調査は別のスコア方法を使っています。
これらの回答に再現性はあるか、または結果が一致しているかを調べたいとします。
手順にしたがって進むと、アウトプットに解析結果がリアルタイムで出力されます。
Output 1. データの確認
Output 2. 検定結果
カッパを用いた評価に関する説明とガイドライン
- コーエンのカッパ係数 > 0.75: 優れた 再現性
- 0.4 <= コーエンのカッパ係数 <= 0.75: 良好な 再現性
- 0 <= コーエンのカッパ係数 < 0.4: 低い 再現性
- コーエンのカッパ係数は、観察者2名の間が不一致であることを示しているだけであり、その程度は示していません。
- 重み付きカッパ係数は、2人の評価者間の不一致の程度を測定する事前定義された重み表を使用して計算されます。 不一致が大きいほど、重みが大きくなります。
このデフォルト設定では、Survey1とSurvey2からの応答の再現性はそれほど高くないと結論付けました。
反復または関連する測定の再現性に関するカッパ統計
この方法では種類の異なるデータを使用します。K×Kテーブルで示す一致と不一致のカウントを使用します。
1. 使用できる機能
- 同じ変数を複数回測定したときの再現性を定量化する
- アウトカムが同じ2測定の間の関連を定量化するv
- 百分率表および各セルについて期待値を得る
2. カウントデータについて:K×Kの分割表
- 一致応答、つまり測定ごとのアウトカムが同じ反復測定の応答が分かっている
- b>不一致応答、つまり測定ごとのアウトカムが異なる反復測定の応答が分かっている
使用例
ある試験で、患者1群に対し同じ質問について2回の調査を行いました。この2つの調査における一致応答の割合を調べたいとします。
最終的な結果では、両方の調査で「はい」と答えた人は136例、「いいえ」と答えた人は240例でした。
調査1で「いいえ」と答え調査2で「はい」と答えた人は69例、調査1で「はい」と答え調査2で「いいえ」と答えた人は92例でした。
これらの調査での一致応答が良好かを調べたいとします。
手順にしたがって進むと、アウトプットに解析結果がリアルタイムで出力されます。
Output 1. データの確認
Output 2. 検定結果
カッパを用いた評価に関する説明とガイドライン
- コーエンのカッパ係数 > 0.75: 優れた 再現性
- 0.4 <= コーエンのカッパ係数 <= 0.75: 良好な 再現性
- 0 <= コーエンのカッパ係数 < 0.4: 低い 再現性
- コーエンのカッパ係数は、観察者2名の間が不一致であることを示しているだけであり、その程度は示していません。
- 重み付きカッパ係数は、2人の評価者間の不一致の程度を測定する事前定義された重み表を使用して計算されます。 不一致が大きいほど、重みが大きくなります。
このデフォルト設定では、Survey1とSurvey2からの応答は再現性が低く、わずかに再現性があると結論付けました。
K交絡を層別化した症例/対照における2カテゴリ因子のマンテル・ヘンツェル検定
1. 使用できる機能
- 層/交絡を制御し、症例/対照 (行) と因子 (列) に関連があるかを調べる
- K層で2つの名義変数は条件付きで独立している
- 百分率表とプロット、および各セルについて期待値を得る
2. カウントデータについて:K層の2×2分割表
- 複数の2×2分割表についてカウントがある
- 各2×2分割表は、1因子層の下にある
使用例
受動喫煙ががんのリスクに及ぼす影響を調べたいとします。潜在的な交絡因子は、参加者自身の喫煙です。
これは、参加者自身の喫煙ががんのリスクと配偶者の喫煙の両方に関連しているためです。
そのため、受動喫煙とがんのリスクの関係を調べる前に、参加者自身の喫煙について制御しました。
2×2表を2つ作成しました。1つは、能動喫煙者群466例の表、もう1つは非能動喫煙者群532例の表です。
内容を入力データで見ることができます。能動喫煙について制御した後、受動喫煙とがんのリスクの間に有意な関係があるか、
またはオッズ比に有意差があるかを調べたいとします。
手順にしたがって進むと、アウトプットに解析結果がリアルタイムで出力されます。
Output 1. データの確認
K層の2x2分割表
最初の2行は、最初の階層の2 x 2分割表を示し、その後に2番目の階層の2 x2分割表が続きます。
Output 2. 検定結果
説明
- P < 0.05の場合、個人喫煙を制御している状況で、受動喫煙と癌のリスクには有意な関係はあり、オッズ比は有意に異なります。 (対立仮説が採択されます)
- P > = 0.05の場合、個人喫煙を制御している状況で、受動喫煙と癌のリスクには、有意な関係はありません。 (帰無仮説が採択されます)
このデフォルト設定では、個人の能動喫煙を制御している状況では、がんリスクと受動喫煙の間に有意な関係があったと結論付けています。 (P <0.001)
K層の下で3種類以上の状態について、3種類以上のカテゴリ因子がある場合のコクラン・マンテル・ヘンツェル検定
1. 使用できる機能
- 層/交絡を制御し、症例/対照 (行) と因子 (列) に関連があるかを調べる
- K層で2つの名義変数は条件付きで独立している
- 百分率表とプロット、および各セルについて期待値を得る
2. カウントデータについて:K層のR×C分割表
- いくつかのR×C表についてカウントがある
- 各R×C分割表は、1因子層の下にある
使用例
いびきと年齢の関係を調べたいとします。30歳から60歳の個人3513例を対象として調査を行いました。このうち、女性は1843例、男性は1670例でした。
この試験では性別が交絡因子となる可能性を考慮して、性別で層化した3×2の分割表を作成しました。性別を制御した上で、年齢といびきの間に有意な関係があるかを調べたいとします。
手順にしたがって進むと、アウトプットに解析結果がリアルタイムで出力されます。
Output 1. データの確認
K層のRxC分割表
最初のR行は、最初の階層のR x C分割表を示し、その後に2番目の階層のR xC分割表が続きます。
Output 2. 検定結果
説明
- P < 0.05の場合、習慣的ないびきの有病率は性別を制御している状況で年齢と有意な関係があり、オッズ比は大幅に異なります。 (対立仮説が採択されます)
- P Value >= 0.05, 習慣的ないびきの有病率は性別を制御している状況で年齢と有意な関係があります。 (帰無仮説が採択されます)
このデフォルト設定では、性別を制御している状況では、習慣的ないびきの有病率と年齢の間に有意な関係があったと結論付けています。 (P <0.001)