1から始める研究 〜確率変数・期待値とは⁈ 統計との関係〜

お気に入り数 0
小島 一範 岡山医療専門職大学 助教

臨床研究などの研究を行ううえで必要な統計学。実は「確率」の概念と深いつながりがあります。今回は確率のなかでも確率変数やその期待値、そして統計でおなじみの「分散」との関係についても説明し、最終的には普段行っている統計とつながっていくような話をしたいと思います。

確率変数とは

さて、今回は「確率」というものに焦点を当てるわけですが、確率の話によく出てくる例がサイコロの話ですね。

例えばサイコロを1回投げたとしましょう。この時に出る目は「1」から「6」までの6通りですよね。結論から言うと、この「1」から「6」までの数字のことを数学的には「確率変数」と呼びます。

もう一つ例を挙げてみましょう。例えば1つの硬貨を1回投げてみたときに、表が出るか裏が出るかはそれぞれ確率は2分の1だということが分かるかと思います。このとき、例えば表が出たときに「1点」加算され、裏が出たときは「0点」と加算されないとしたならば、「1点」や「0点」の数字のことを「確率変数」と呼ぶわけです。あくまで「変数」なので、「表」や「裏」という言葉の代わりに何かの数字で置き換えてやる必要があります。そうすることで、その後の計算処理などの演算が行えます。

これである程度「確率変数」の大まかな意味がわかったところで、もう少し数学的に示していきたいと思います。

上記のサイコロの例で、1の目が出る確率のことを

P(X = 1)

と表されます。当然1の目が出る確率は1/6なので、

P(X = 1) = 1/6

となります。もしくは

P(1) = 1/6

と表記することもあります。この式をもう一度日本語に翻訳したとすると、

「確率変数Xが1のときの確率は1/6だ」

となります。この表記に慣れましょう。

確率分布との関係

さて、ここで『1から始める研究〜正規分布とは?!有意水準5%との関係は?〜』でも示した「確率分布」というものについて触れておきましょう。

「確率分布」とは、何らかの確率を示す分布のことでしたね。例えば先ほどのサイコロの例でいくと、次のような確率分布をとります。

そしてくどいようですが、このときの「X」が確率変数です。

確率分布を図で表すとこうですね。

この場合は全ての確率が同じ「一様分布」というものに属するのでした。確率分布については、一様分布の他にも自然界には「ポアソン分布」や「正規分布」など色々当てはまるものが違ったりします。

期待値とは⁈

次に「期待値」について説明します。

ここでまたまた先ほどのサイコロの例を引っ張り出してみます。そしてそのサイコロで双六(すごろく)をすることを考えてみましょう

まずはこのサイコロを1回だけ振ったときにどの目が出るでしょう?

…って、分かりませんよね笑。

どの目も等しく確率1/6となるので、どの目が出てもおかしくありません。

では、このサイコロを2回振ったときに出る目を足したときの数字はいくらでしょう?

これも色々な数字が考えられますよね。❶の目が2回出ると「2」だし、❻ の目が2回出ると「12」となります。❷の目と❸の目が出ると「5」です。

ただこの足した数字については、出やすい数字と出にくい数字があります。

次の表を見てみましょう。

1回目に出た目を横にとり、2回目に出た目を縦にとると、1回目と2回目を足した数字の組み合わせは6マス×6マスの36通りあることが分かります。この中で1番多い数字はなんでしょう!?

はい、「7」ですよね。

つまりサイコロを2回振ったときに出る目の合計は確率的に「7」となりやすいことがいえます。双六でいうと、7マス進む確率が最も高いということです。そしてこの数字を2で割ると、3.5です。つまりサイコロを2回振ったときに平均すると、1回あたりに3.5マスだけ進みやすいことがいえます。そしてこのサイコロの振る数を増やせば増やすほど、出る目の数字は平均化され、1回あたりに3.5マスだけ進みやすい確率がより高くなってきます。

この傾向のことを「大数の法則」と呼びます。この大数の法則については『1から始める研究 〜中心極限定理のイメージをつかもう~』でも解説しています。この話とつながったでしょうか。

そして、この1回あたりに出やすい値「3.5」という数字がサイコロ1回あたりの「期待値」ということになります。そしてさらにいうと、この「期待値」はイコール「平均値」でもあることがわかります。

そうなんです!言葉は違えど、意味は一緒のことを言っているんです。ただ確率の考えを使って導いたときの平均値を「期待値」と言っているに過ぎないわけです。

期待値の計算方法

さて改めて確率を使った期待値の一般的な計算方法を紹介します。 まずサイコロを1回振ったときの期待値は、

となります。1から6までのそれぞれの目の出る確率が全て6分の1なので、それぞれの目の数をそれぞれ6分の1ずつかけて足していくと期待値が出てきます。

このように期待値は、一般的にあるn個の確率変数x1、x2、・・・xn (サイコロの目でいう1、2、・・・6)のそれぞれの確率p1、p2、・・・pn (サイコロの確率でいうと1/6、1/6、・・・1/6)を使って、

このような式に表されます。E(X)のEは「期待値(Expected value)」の意味です。 さらにこの式を簡単に数学の記号で表すと

となることも、このコラムをこれまで読んでいただいている方にはスッと理解できるかと思います。
【参照】
1から始める研究〜数式記号「Σ」を理解する〜

さて、一般的な期待値の計算方法がわかったところで、この期待値と「分散」とを結びつけてさらに確率と実用的な統計とをリンクさせていく話を次回にさせていただければと思います。

主催者への質問

この機能を利用するには、ログインが必要です。未登録の方は会員登録の上、ログインしてご利用ください。

この記事に関連するタグ

興味のあるタグをフォローしておくことで、自身のフィードに関連するセミナーやコラムを優先的に表示させることができます。 (無料会員機能。 登録はこちら )

    コラムで人気のタグ

    タグをフォローしておくことで、自身のフィードに興味のあるセミナーやコラムを優先的に表示させることができます。(無料会員機能。 登録はこちら )