サンプルサイズの決め方(2群の比較)

統計学

実験を行う際のサンプルサイズ(サンプル数、実験回数、n数…)はどのように決めていますか?
2つのサンプル群の比較を行う際のサンプルサイズの計算方法について解説します。

サンプルサイズの計算式

2つのサンプル群を比較する際に必要なサンプルサイズ\(n\)は以下の式で計算することができます。

サンプルサイズの計算式

\[ n = \left( \frac{1.96+1.28}{\Delta} \right)^2 + \frac{1.96^2}{2} \]

ただし…

  • \( \Delta \)| パラメータ
  • 母分散が未知である場合を仮定
  • 有意水準\( \alpha=0.05 \)、検出力\( 1-\beta=0.90 \)

パラメータ\( \Delta \)の設定方法

サンプルサイズを決めるために必要なパラメータ\( \Delta \)は以下の式で設定する必要があります。

\[ \Delta=\frac{|\mu-\mu_0|}{\sigma} \]

\( |\mu-\mu_0| \) 検出したい差

実験で示したい差の大きさを代入します。

値にどの程度の差がある場合に”差がある”と判断するのでしょうか?それは状況によって異なります。
例えば製品の長さの場合、0.1 mmの違いでも困る!という場合もあれば、1 mmの違いは誤差!という場合もありますよね。

\( \sigma \) バラつき(標準偏差)

サンプル群の標準偏差を代入します。

事前の実験でサンプル群の標準偏差が分かっていれば、その値を代入すればOKです。情報がない場合は、全く同じ条件で3回程度実験を実施しましょう。その実験結果の標準偏差を計算し\( \sigma \)に代入すればOKです。

計算式の根拠

今回紹介した計算式はt検定てぃーけんていを用いて2つのサンプル群の比較を行うことを前提に算出されています。

サンプル群の母分散が不明の際に使用する統計手法であるt検定を前提としているため、「母分散が未知である場合を仮定」する必要があります。ただし、ほとんどのケースで母分散は不明なのでこの式を用いればOKです。(母集団の情報を知りたいから実験してデータを得るわけですしね)
※母分散がわかる場合は計算式が異なり、もう少しサンプルサイズが小さくて済みます

t検定のような統計的な検定を行う際には有意水準ゆういすいじゅん\( \alpha \)検出力けんしゅつりょく \( 1-\beta \)を設定する必要があります。一般的に有意水準は0.05、検出力0.9に設定されることがほとんどです。これらの値から標準正規分布ひょうじゅんせいきぶんぷに従って算出した係数が計算式中の1.96と1.28です。有意水準と検出力を別の値に変更したい場合はこれらの値を変更することとなります。

\[ \begin{align}
u_{0.025} &= 1.96 \\[12pt]
u_{0.10} &= 1.28
\end{align} \]

練習問題

例題

既存製品Aと新規グレードBの特性Xを比較する。新規グレードBの特性Xが製品Aと比較し
 ①1.0以上 ②2.0以上 ③4.0以上
となる場合に必要なサンプルサイズをそれぞれ求めよ。
ただし、既存製品Aと新規グレードBの標準偏差を\( \sigma =2.0 \)とし、有意水準\( \alpha=0.05 \)、検出力\( 1-\beta=0.90 \)とする。

有意水準\( \alpha=0.05 \)、検出力\( 1-\beta=0.90 \)なので、そのまま上の式が使えます。①〜③の場合における\( \Delta \)はそれぞれ…

\[ \Delta=\frac{|\mu-\mu_0|}{\sigma}=\frac{1.0}{2.0}, \frac{2.0}{2.0}, \frac{4.0}{2.0}= 0.5, 1.0, 2.0 \]

であるから、必要なサンプルサイズは

\[ \left(\frac{1.96+1.28}{\Delta}\right)^2=42, 11, 3 \]

となります。バラツキ\( \sigma \)に対する検出したい差\( |\mu-\mu_0| \)の大きさによって、必要なサンプルサイズが変化することがわかりますね。

まとめ

今回は実験を行う際によくある2つのサンプル群を比較する際のサンプルサイズについて説明しました。
計算式をつかってどの程度のサンプルサイズが必要となるのか見積もってから実験に臨みましょう!

更新履歴

2025/02/28 公開

コメント

タイトルとURLをコピーしました