1から始める研究〜標準誤差と信頼区間との関係〜

お気に入り数 0
小島 一範 岡山医療専門職大学 助教

前回までに、標準偏差と標準誤差について説明をしてきました。今回は、研究をする上で避けては通れない「信頼区間」です。よく研究論文の結果で、「95%信頼区間は〇〇-□□であった」などと記載されている、あれです。ここが理解できると、普段なんとなく使っているt検定などの意味がよく分かるようになります。いよいよ研究をする上で身近かつ必要な知識を理解する時が来ました。今回は、完璧に理解してもらうため、前回までに説明した標準偏差や標準誤差と絡めて説明していきます。是非、これを機に過去のコラムにも目を通してみてくださいね。

【関連記事】 1から始める研究〜標準誤差の話、母集団と標本の話〜 1から始める研究〜標準偏差と標準誤差の違い、イメージで理解しよう!〜

信頼区間とは

信頼区間は英語で「Confidence interval」であり、「CI」と略されることもあります。論文などでは「95%信頼区間」と書かれているものが多く、これを例に説明すると定義は次のようになります。

「95%信頼区間とは、あるサンプル(標本)のデータを用いて母集団の平均値を予測(推定)したいときに、95%の確率で、その区間の中に母集団の平均値が含まれていることを予測する区間のこと」

つまり、母集団の平均値がよく分かっていないときにサンプルのデータを使って、母集団の平均値を予測すると95%(すなわち100回のうち95回)の割合でズバリ当てることができるその範囲のこと、です。

これまでの記事で挙げた例で説明すると、「サンプル=A〜Gさんの7人のテストの点数」であり、「母集団の平均値=学年全体(400名)のテストの点数の平均点」のことです。

母集団の平均値はよく分かっていないんです。それをサンプルから予測しましょ! ってな感じです。

統計学的には、この予測のことを、「区間推定」と言います。

信頼区間と標準誤差との関係

今回の「信頼区間」の導き方ですが、標準誤差ととても密接な繋がりがあります。

実は、標準誤差を用いて信頼区間を出すことができるんです。

例えば正規分布しているサンプルデータの標準誤差を「SE」、母集団の平均値を「μ(ミュー)」とおくと、95%信頼区間は下記の式で示されます。

いきなり難しそうな不等式がでてきましたが、一つひとつ見ていくと理解できます。

Xに上線を引いたもの(エックスバー)は、サンプルの平均値を表しています。

ここで「1.96」という数字…どこかで見覚えがありませんか⁈そうです。正規分布の記事や標準偏差の記事で出てきた数字です!

思い出してみて下さい。

「一般的に正規分布の場合、平均である中心から±1σ(σは標準偏差)の範囲内に全体の68.3%が含まれている。そして、全体の95%を含む範囲としては平均から±1.96σの範囲内となる。」でしたね。

今回の不等式はパッと見ると難しそうですが、これを日本語に翻訳すると「サンプルの平均値から母平均を引いた値を標準誤差(SE)で割ったものは±1.96の範囲内にある」という意味になります。

この「サンプルの平均値から母平均を引いた値を標準誤差で割ったもの」を言い換えると、「抽出したサンプルの平均値は母平均からどのぐらい離れているのか?標準誤差の何倍なのか?」というバラつき具合を表したものだと分かります。

考えてみると、標準誤差「SE」は以前の記事で書いた通り、サンプルの「平均値のバラつき」のようなもの、すなわちサンプルの「平均値の標準偏差」を表したものでしたね。

そして標準誤差「SE」は下記の式で示されるものでしたよね。

ちなみにσやμなどのよくわからないギリシャ文字などが使われています。「どうして簡単なABCなどの文字にしないの?」という疑問が湧くかもしれません。これは昔からの統計学でのしきたりのようなので、共通言語としてこれらの文字を用いていたほうが後々分かりやすいという理由があると思います。なので、私のコラムでもこの記号をそのまま用いることにします。

95%信頼区間を導いてみよう

さて、話は戻りますが、標準誤差(SE)を置き換えると、上の不等式は下記のようになります。

そして我々が知りたいのは母集団の平均値つまり「μ」なので、上の不等号の式を変形し整理して、μの範囲を出すようにします。すると、次のように変形できます。

計算が苦手な方は、「まぁこのように変形できるんだな」ぐらいに思っておいてください。

さて、このように変形できたとすると、「σ」や「n」などμ以外の値は既に分かっているので、μの範囲が例えば下記のように数字で表すことが出来ます。これが、母平均を95%の確率で推定する範囲となるわけです。

このようにして推定された信頼区間を用いて、いよいよt検定などの検定を行ったりするわけですが、実はこの検定にもいろんな種類があります。

また今回は、信頼区間を求めるときに「母集団の」標準偏差(σ)を使っていましたが、母集団の標準偏差がわからない場合もあり、「標本の」標準偏差を使って推定するやり方もあります。

これらについてはまた次回以降書いていきたいと思います。

主催者への質問

この機能を利用するには、ログインが必要です。未登録の方は会員登録の上、ログインしてご利用ください。

この記事に関連するタグ

興味のあるタグをフォローしておくことで、自身のフィードに関連するセミナーやコラムを優先的に表示させることができます。 (無料会員機能。 登録はこちら )

執筆者の他のコラム

人気のセミナー

最強の東洋医学講座〜基礎編〜(プロコース)
36
オンライン
全11回

最強の東洋医学講座〜基礎編〜(プロコース)

3,000 ~ 30,000

主催:株式会社ケアクル

船水 隆広

鍼灸師

船水 隆広

01.23 (日) 21:00 - 23:00

オンライン

最強の東洋医学講座〜基礎編〜(学生コース)
30
オンライン
全11回

最強の東洋医学講座〜基礎編〜(学生コース)

1,000 ~ 10,000

主催:株式会社ケアクル

船水 隆広

鍼灸師

船水 隆広

01.23 (日) 21:00 - 23:00

オンライン