1. ホーム
  2. コラム
  3. 1から始める研究〜標準誤差の話、母集団と標本の話〜

1から始める研究〜標準誤差の話、母集団と標本の話〜

お気に入り数1
小島 一範 岡山医療専門職大学 助教

突然ですが、今回のテーマである「標準誤差(ひょうじゅんごさ)」を聞いた事はあるでしょうか?

パッと見ると標準偏差(ひょうじゅんへんさ)と見間違えるかもしれません。しかし、標準誤差と標準偏差は似ているようで異なるものです。まずは、標準偏差について以前のコラムで復習してみてくださいね。今回のコラムでは、標準誤差を丁寧に解説します。これは「95%信頼区間」や「t検定」など統計の検定で必要であり、それらの理解をぐんと深めるものです。

ということで、はじめていきましょう。

目次

    【参考記事】
    1から始める研究 〜これで分かる!平均値・中央値・分散・標準偏差について〜
    1から始める研究~偏差値やIQ値やz値の意味とは?標準偏差や正規分布との関係~

    標準偏差の性質を確認しておく

    標準誤差を考える前に、似てるようで異なる「標準偏差」をおさらいしましょう。

    「ある集団の中において、その集団の平均から1人1人がどれだけ離れているのか」

    この「平均値からの距離」のようなものを「偏差」というのですが、この「1人1人の偏差の平均のようなもの」を「標準偏差(Standard Deviation, SD)」と呼ぶという話でしたね。つまり、標準偏差はバラつき度合いの1人当たりで換算した平均みたいなものです。

    そのため、サンプルサイズ(ここでは人数)が増えても減っても、サンプルの性質が同じであれば、標準偏差の値についてはあまり変わらない結果になります。

    このことをイメージしやすくするために、ここで、これまでに何回か出てきた、A〜Gさんまでの7名のテスト結果を再び登場させましょう。

    ここで得られた標準偏差は「15.62」と計算されました。

    では、これをA〜Gさんの7名だけでなく、さらにHさん、Iさんなど多くの人の結果も含めた総勢20名のテスト結果で考えてみましょう。

    A〜Gさんの7名は、学年の中で特にデキる7名を引っぱり出してきたわけではなく、ランダムに選ばれた7名だとするならば、その人数を7名から20名に増やしても、「平均値」はそんなに変わらないことが直感的にも理解できるのではないでしょうか?

    では、この20名の標準偏差は、7名の標準偏差「15.62」とあまり変わらないこともイメージできるでしょうか?

    「標準偏差」というものが、「バラつき度合いの1人当たりで換算した平均みたいなもの」ですよね。バラつきの大きい集団は、人数を増やしてもバラつきが大きいままになりますね。

    母集団と標本、標準誤差の正体

    さて、ここでいよいよ「標準誤差」の解説に入ります。

    そのまえに、「母集団」や「標本」という言葉を説明します。

    これまでに登場している7名のテスト結果というものは、実は学年全体(400名)のうちからA〜Gさんまでの7名だけを抽出して得られた結果だったと仮定しましょう。7名の結果というのは、その背景にある学年全体の400名の結果の代表のようなものです。

    このときの学年全体(400名)の集団のことを統計では「母集団」といい、そのなかで得られた7名のデータのことを「標本(サンプル)」と呼びます。

    さて、この7名の標本の平均値は、以前の記事で計算した通り「57点」ですが、この「57点」という点数、学年全体(400名)の平均値といってもよいでしょうか?

    実は、断言できません。

    もともとの400名の母集団の点数にバラつきがあるため、抽出した7名の標本の平均値(「標本平均」という)も、母集団の平均値(「母平均」という)と少しズレている可能性があります。

    例えば、今回抽出した7名とは別の7名の標本のデータをとってみると、標本平均は55点などになっているかもしれません。

    このように、抽出した標本ごとに標本平均のバラつきが存在します。よって、母平均とそれぞれの標本平均との間にもズレがあります。

    このそれぞれの標本平均の母平均からのバラつき度合(偏り具合)を表したものが、「標準誤差」です。ようやく出てきました…お待たせしました!

    標準誤差(Standard Error, SE)は、次の式によって表されます。

    ここで注目したいのは、分母がサンプルサイズの平方根(ルート)となっていることです。これは「サンプルサイズが大きいほど、標準誤差は小さくなる」ことを意味します。

    上記の標準偏差とは性質が違いますよね。

    でも、これも直感的に理解できるはずです。

    サンプルサイズが増えるほど、そのサンプルの平均値は母集団の平均値に近くなる、すなわち偏りが少なくなりますよね。精度が上がるわけです。

    言い換えると標準誤差は下記のようになります。

    「ある集団をサンプルとしたときに、そのサンプルの平均値が他のサンプルも含んだ母集団の平均値からどれだけ離れているのか、その偏りの精度」

    これで、標準偏差との違いが理解できたと思います。

    95%信頼区間やt検定とのつながり

    ここまで標準誤差について説明しました。

    この標準誤差は、統計の検定で結果によく記載される「95%信頼区間」の算出に使われます。母平均を推定するための95%信頼区間は、正規分布だと仮定すると、『【標本平均】±【1.96×標準誤差】』という定義になります。

    以前に解説した正規分布での話の応用です。

    そしてさらには、標準誤差はサンプルサイズが少ないときの統計の検定で代表的な「t検定」と密接な関係にあります。というのは、t検定のベースとなる「t分布」におけるt値に反映されるからです。

    t検定などは、普段統計ソフトなどでなんとなく使用しているかもしれませんが、その意味が理解できれば、検定結果の解釈にも幅が広がります。

    これらの信頼区間やt検定について、詳しくは次回以降に解説しますね。

    この記事に関連するタグ

    興味のあるタグをフォローしておくことで、自身のフィードに関連するセミナーやコラムを優先的に表示させることができます。(無料会員機能。登録はこちら)

    人気コラム

    もっと見る

    コラムで人気のタグ

    タグをフォローしておくことで、自身のフィードに興味のあるセミナーやコラムを優先的に表示させることができます。(無料会員機能。登録はこちら)

    注目執筆者

    もっと見る

    コラムカテゴリ