1から始める研究 〜相関係数の導き方とその意味(②スピアマンの順位相関係数)~

お気に入り数 0
小島 一範 岡山医療専門職大学 助教

研究において2変数の相関関係を示す手法として、前回は基本とも考えられるピアソンの積率相関係数についてその意味と導き方まで解説しました。
今回は、同様に多くの研究で用いられているスピアマンの順位相関係数について解説し、その使いかたや導き方、そしてピアソンの相関係数との違いについてイメージをつかんでもらおうと思います。

【参考記事】 1から始める研究〜相関係数の導き方とその意味(①ピアソンの積率相関係数)~

どのような時に使うのか?

まず、どの手法をどのようなときに使うのか、という使いどころについてです。まずはおさらいとして2変数間の相関を調べたいときにどの手法を用いたらよいか、という以前の記事で解説したときの表を再び載せてみます。

前回のピアソン(Peason)の積率相関係数は比べたい2つのデータが間隔尺度か比例尺度で、とくにパラメトリックである場合に使用するものでしたね。

そして、今回のスピアマン(Speaman)の順位相関係数は、順序尺度もしくは間隔尺度・比例尺度でもノンパラメトリックな場合に適応されることとなっています。

スピアマンの順位相関係数の求め方

以前にも出てきたA~Gさんの7名によるテスト結果で考えていきましょう。

前回に例に挙げた「数学」と「理科」のテスト結果において、ピアソンの積率相関係数を計算したところ、「r = 0.78」という数字となり、「強い正の相関がある」としました。 ※実際には相関があるかどうかは有意確率Pというものも考慮したうえで判断するのですが、簡略的に「相関がある」と書いています。

今回は、このテスト結果のデータがノンパラメトリックだと仮定して、今度は同じデータを使ってスピアマンの順位相関係数を求めてみましょう。 ※本コラムでは、手法の違いを比較するために、同じデータで2つの手法を用いて比べています。実際の研究では、同じデータで異なる検定をいくつもかけることは結果の解釈に影響をあたえる可能性があるとされています。「多重性」というキーワードがありますが、別のところで書きたいと思います。

さて、スピアマンの順位相関係数の求め方ですが、やり方は簡単です。

まず、7名において数学と理科の点数がありますが、この点数の高い順に数学と理科それぞれ1~7位まで順位をつけましょう。そして表の数字をこの順位に置き換えてみましょう。

では、その順位付けされた番号をそのまま数字としてグラフにプロットしてみましょう。

前回、ピアソンの相関係数のときにプロットした点数のグラフと見比べてみるとわかるのですが、少し形が違いますよね。なんというか、前回では点数の幅に「狭い」とか「広い」とかのばらつきがあったものが、等間隔になっています。要するに、この順位としての数字のまま前回の相関係数の式にあてはめたものが、「スピアマンの順位相関係数」になるのです。

前回の相関係数の式がこちら

計算の仕方も前回と一緒です。分母であるXとYの共分散を出すためにまず順位としての数字の「平均値」やそれぞれの人の「偏差」を出します。

まず数学の順位の平均はこちら

そして数学の順位の偏差としては次のようになります。

理科の場合も同様に平均や偏差を算出します。

こうして得られた偏差の値を使って「共分散」を導きます。分母の標準偏差の導き方も同様に順位の数字を用います。このようにして得られた「相関係数(r)」をスピアマンの順位相関係数と呼びます。

相関係数(r)の強さの基準はピアソンの積率相関係数のときと同様です。

計算をしてみると、数学と理科との順位相関係数は「r = 0.82」となりました。ピアソンの積率相関係数のときと同様、強い相関が得られる結果となりました。

ちなみにこのスピアマンの順位相関係数の上記以外の導き方として、X(数学)とY(理科)の差をとって導く計算方法もあります。今回は省略しますが、計算の過程が違うように見えて、実は同じことを計算しているので、結果は同じ値になります。

ピアソンの積率相関係数との違い

さて、ここまでスピアマンの順位相関係数について解説してきましたが、いま一度ピアソンの積率相関係数との違いについて着目してみましょう。

先ほどの数学と理科の例の結果を、それぞれの手法でプロットしたグラフをもう一度示します。

これを見ると、ピアソンの手法ではそれぞれの点同士の間隔の大きさが異なっているのに対して、スピアマンの手法では間隔は一定に保たれています。

仮に、データの集団の中で飛びぬけて大きな値のデータがあった場合は、どうなるでしょうか?

ピアソンの手法の場合では、その飛びぬけたデータに相関係数の結果が影響されやすくなります。一方、スピアマンの手法ではそのような飛びぬけたデータも一定間隔のデータとして扱われるので、相関係数の結果もさほど左右されにくい、ということになります。

もちろん、どちらの相関係数の手法を用いるのかはパラメトリックかノンパラメトリックかを正規分布の検定などによって判断して行うのが基本ではありますが、同時にその検定に表れにくい外れ値の存在なども気にしながら手法を選択することも真理を知るためには大事なことかもしれません。

このようなことも考慮に入れながらよりよい研究を行っていきましょう!

【参考文献】 1)C. Spearman. The Proof and Measurement of Association between Two Things: The American Journal of Psychology. 15(1). 72-101. 2)関屋曻. 真に役立つ研究のデザインと統計処理. 三輪書店, 2010.

主催者への質問

この機能を利用するには、ログインが必要です。未登録の方は会員登録の上、ログインしてご利用ください。

この記事に関連するタグ

興味のあるタグをフォローしておくことで、自身のフィードに関連するセミナーやコラムを優先的に表示させることができます。 (無料会員機能。 登録はこちら )

    コラムで人気のタグ

    タグをフォローしておくことで、自身のフィードに興味のあるセミナーやコラムを優先的に表示させることができます。(無料会員機能。 登録はこちら )