1. ホーム
  2. コラム
  3. 1から始める研究〜標準偏差と標準誤差の違い、イメージで理解しよう!~

1から始める研究〜標準偏差と標準誤差の違い、イメージで理解しよう!~

お気に入り数0
小島 一範 岡山医療専門職大学 助教

前回までに、標準偏差(SD)や標準誤差(SE)について説明をしてきました。しかし、まだなんとなくの理解でしかない方もいらっしゃると思います。
そこで今回は、標準偏差と標準誤差の違いを、イメージを膨らませながらもう少し詳しく説明していきます。

目次

    【参考記事】
    1から始める研究 〜これで分かる!平均値・中央値・分散・標準偏差について〜
    1から始める研究〜標準誤差の話、母集団と標本の話〜

    標準偏差のイメージとは?

    これまで何回も登場した、A〜Gさんの7人のテスト結果を例に考えていきましょう。

    これは、結果に対する度数分布図(ヒストグラム)を示しています。サンプルサイズが増えるにしたがって、このヒストグラムの形はなめらかな曲線に近づいていきます。正規分布であれば、以前に示した通りにベル型となりますよね。

    そして「標準偏差」をざっくりとしたイメージで捉えると、このテスト結果のばらつきを表す曲線の「幅」といえます。

    「え?このグラフの幅って「分散」を表すんじゃないの?」と思われる人もいるかもしれません。それもそのはずで、「分散=標準偏差の2乗」で表されるので、いずれにしても分布曲線の幅と言って差し支えないのです。

    標準誤差のイメージとは?

    さて、7人の例を使って話を元に戻すと、「標準偏差」のイメージは「テスト結果の分布を示すグラフの幅」でしたね。

    それに対して、「標準誤差」のイメージは「今回の7人のテスト結果の平均点が、学年全体(400人)の平均点をどれだけ近くに予想できているかを表したもの」です。

    これだけでは、まだ何を言っているかイメージが湧きにくいかと思いますので、図を使って考えていきましょう。

    400人の学年全体が受けたこのテストですが、仮にこの400人の学年全体の平均点が分からなかったと仮定しましょう。

    そこで、サンプルとして登場したのがAさんからGさんの7人です。

    この7人の平均点である57点をそのまま学年全体の平均点と決めても良いものなのでしょうか?良くありませんでしたよね。やはり7人の平均とはいえ、学年全体の平均点から幾分か偏りがあるはずなのです。

    試しにHさんからNさんという別の7人のテスト結果を見てみると、平均点はAさんらの平均点とは違う点数となりました。

    つまり、学年全体という1つの母集団の中から7人ごと(別に7人でなく何人でもよいのですが)のサンプルを何回か取り出して(抽出と呼ぶ)調べてみると、それぞれのサンプルの平均点は、少しずつバラついていることが分かります。

    このバラつきを考慮したうえで、「A〜Gさんの7人の平均点(標本平均)が学年平均点(母平均)にどれだけ近いかを算出する」のが標準誤差です。つまり、それぞれのサンプルの平均点の集まりの標準偏差のことを「標準誤差」といいます。

    言い換えると、「A〜Gさんの7人の平均点57点はどれぐらいの精度で学年平均を予想しているのか」という感じです。

    これだけでも、「標準偏差」と「標準誤差」は意味合いの異なるものであることがつかめたかと思います。

    しかしながら、これだけざっくりとしたイメージを聞いても「ふーんそういうものなのかー」ぐらいの肌感覚かもしれません。

    では実際に本当に理解して使えるところまでに落とし込むにはどうすれば良いか?

    それは、やはり「計算式を見てみること」です。

    式から理解を深めよう

    計算式には意味が詰まっています。

    最初は抵抗があるかもしれませんが、慣れると意味が理解できるはずです。

    標準誤差(Standard Error, SE)は、次の式によって表されます。

    ここで、右側(右辺)の分子(上側)を見ると、「母集団の標準偏差」となっています。

    標準偏差とは、上で書いたように、イメージとしては「グラフの幅」を表しますが、計算式としては、「平均値からどれぐらいズレ(偏差)があるのかを1人当たりで換算したもの」すなわち「1人当たりの平均値からの偏り」を示したものでした。

    標準誤差(SE)は、この標準偏差をさらに分母(下側)である「サンプルの人数分の平方根(ルート)」で割っています。そうすることで、標準偏差というバラつきをサンプルの人数分で割って精度を高めているわけです。

    仮に、抽出したサンプルがたったの1人だったとしたら、その人の点数が学年の平均だと予測するためは、その点数の前後にかなりの予測幅(1人当たりのバラつき分、つまり標準偏差分)が必要ですが、サンプルの人数が増えれば増えるほど、その予測の幅は狭まることはイメージできると思います。

    なので、サンプルサイズが大きければ大きいほど、標準誤差は小さくなる、つまり予測の幅は狭くなる、というわけです。

    ここで、なぜ分母がサンプルサイズの平方根なのか、という疑問が起こるかもしれません。

    これは、実は元々両辺を2乗して「分散」として計算されたものだから、という背景があります。細かく突っ込むとややこしくなりそうなので、ここではこのくらいにしておきます。しかし、ある程度の理解が定着していくと、ここの理解も可能になってきます。

    そしてもう一つ、「不偏推定量」の概念についても、ややこしくなると思ってこれまであえて取り上げてきませんでした。しかし、これは母集団を標本により推定していく上で理解が欠かせないものです。

    たとえば上の式では、「母集団の標準偏差(σ)」となっていますが、通常母集団の標準偏差を計算することができません。

    ではどうするのかというと、標本のデータを使って母集団の分散や標準偏差を割り出す作業をします。これを「不偏分散」や「不偏標準偏差」といいますが、これらのことについても次回以降に詳しく説明していきたいと思います。

    この記事に関連するタグ

    興味のあるタグをフォローしておくことで、自身のフィードに関連するセミナーやコラムを優先的に表示させることができます。(無料会員機能。登録はこちら)

    人気コラム

    もっと見る

    コラムで人気のタグ

    タグをフォローしておくことで、自身のフィードに興味のあるセミナーやコラムを優先的に表示させることができます。(無料会員機能。登録はこちら)

    注目執筆者

    もっと見る

    コラムカテゴリ