1. ホーム
  2. コラム
  3. 1から始める研究〜データの種類、尺度について〜

前回のコラムでは、関節可動域を例に『指標』について解説しました。データのバラつきを少なくするため、測定する際に考えられる条件を可能な限り揃えるようにするという話でしたね。関節可動域は測定された角度計の数字をそのまま尺度として使用する方法が一般的だと思います。しかし、それ以外にも「大・中・小」の3種類の尺度での分類や「痛みの有無」で分類することもできます。この『結果をどのような形(尺度)で表すか』というアウトプット方法はとても重要であり、データの解析などに大きな影響を与えます。

そこで、今回はデータの種類において大切な『尺度』について、医療・リハビリテーション分野での例を挙げながら解説していきます。

目次

    前回記事「1から始める研究〜評価は客観的に示せる指標を用いよう〜

    尺度について

    尺度は心理学者のStanley Smith Stevens¹⁾によって以下の4種類に分類されたものがあります。

    ①名義(めいぎ)尺度:nominal scale
    ②順序(じゅんじょ)尺度:ordinal scale
    ③間隔(かんかく)尺度:interval scale
    ④比例(ひれい)尺度:ratio scale

    これらについて、それぞれ順番に解説していきます。

    ①名義尺度(nominal scal)
    「名義尺度」とは、「男性・女性(性別)」や「赤・白・黄(色)」といった、種類を区別するためだけのデータを指します。
    医療やリハビリテーション領域では、下記のようなものが名義尺度になります。

    ・ロンベルグ試験の「−」「+」
    ・アンケートでの「はい」「いいえ」「どちらでもない」
    ・喫煙歴の「あり」「なし」
    ・転倒歴の「あり」「なし」
    ・クラス分けの「1組」「2組」「3組」
    ・「長野県」「大阪府」「岡山県」といった都道府県
    ・疲労感の「あり」「なし」

    名義尺度を統計学的に処理するときには、男性は「0」女性は「1」と数字などに置き換えます。この数字の順序や大きさなどには意味はなく、ただ単に「0」の種類と「1」の種類とを区別しているに過ぎません。

    ②順序尺度(ordinal scale)
    「順序尺度」とは「1等賞・2等賞・3等賞」や「大・中・小」など、種類の区別だけでなく、その順序に意味がある場合のデータを指します。「序数尺度」とも呼ばれます。

    身近な例として下記のようなものがあります。

    ・Barthel Index(BI)
    ・徒手筋力テスト(MMT)
    ・ブルンストロームステージ(BRS)
    ・ヤールの重症度分類
    ・Modified Ashworth Scale(MAS)
    ・ジャパン・コーマ・スケール(JCS)
    ・改訂版長谷川式簡易知能評価スケール(HDS-R)
    ・要介護度
    ・転倒歴「なし」「1回〜5回」「5回以上」
    ・関節可動域「0〜50°」「51°〜100°」「100°以上」の区分
    ・timed up & go test (TUG)のカットラインより「上」か「下」かの区別
    ・腱反射「-」、「+」、「++」
    ・身長「140 cm未満」「140 cm以上160 cm未満」「160 cm以上」

    統計学的処理を行うときには「大は1、中は2、小は3」というように置き換えます。名義尺度と異なる点は、数値自体には意味がないものの、その順序には意味があることです。

    リハビリテーションの分野では日常生活動作(ADL)を評価する指標としてFunctional Independence Measure (FIM)がよく使用されますが、「6点(修正自立)」と「3点(中等度介助)」は2倍の意味があるわけではありません。また、2つの点数の差をとることも意味がありません。すなわち、数字で表される評価でも、その数字の差などで議論できないようなものが順序尺度に当てはまります。

    ③間隔尺度(interval scale)
    「平成25年」や「27℃」など数字で表す尺度で、その数字の差をとることに意味はあるものの(例えば、「平成15年から平成20年までの5年間」と「平成23年から平成28年までの5年間」は同じ間隔)、その数字の比率には意味がない(例えば、「平成30年は平成2年の15倍」というわけではない)データを指します。「距離尺度」と呼ばれることもあります。

    その他の例として、日付「5月15日」等があります。医療・福祉・リハビリテーション領域の評価ではあまり使わない尺度かと思います。ただ、アンケートでの回答法で「満足(5点)・ほぼ満足(4点)・普通(3点)・やや不満(2点)・不満(1点)」もしくは「とても良い・良い・普通・悪い・とても悪い」という5項目以上の順番に並んだ回答(リッカート尺度という)の場合、間隔尺度とみなす場合もあります。

    ④比例尺度(ratio scale)
    「体重55 kg」や「610 kcal」など数字で表し、③の間隔尺度と同様に数字の差をとることも出来て、なおかつ、その比率にも意味があるデータを指します。例えば、「体重65kgの人と体重55 kgの人との差」は「体重45 kgの人と体重55 kgの人との差」と等しく10 kgであることがいえます。さらに「体重110 kgの人は体重55 kgの人の2倍の体重」ということがいえます。

    例としては以下が挙げられます。

    ・身長「166 cm」
    ・胸囲「95 cm」
    ・歩行速度「2.1 m/s」
    ・筋力計での値「23.2 kg」
    ・片脚立位保持時間「23秒」
    ・timed up & go test (TUG)の「20秒」
    ・年齢「76歳」
    ・酸素飽和度(SpO2)「98%」
    ・転倒の回数「2回」

    「どの尺度にするか?」の選択が難しい場合も

    このように、研究で得られたデータをそれぞれの尺度に当てはめていくわけですが、実際にはどの尺度を使うべきか悩む場合があります。

    例えば、先ほどのFIMは順序尺度で扱うことが基本だと述べました。しかし、FIM得点の合計点を多人数で比べるときは、正規分布に近づくことがあります。そのような場合には、点数を数値データとして扱い、間隔尺度や比例尺度とみなして、より幅広い解析が適応させるといった手法を取ることがあります。そうすることで平均点や標準偏差を算出し、重回帰分析にも使用でき、推定などより進んだ分析により理解しやすいということがあるためです。
    (※「正規分布」「標準偏差」「重回帰分析」などについては今後説明します)

    また先ほど触れたように、アンケート調査における「満足(5点)・ほぼ満足(4点)・普通(3点)・やや不満(2点)・不満(1点)」というデータは順序尺度として扱われることもありますが、満足度の間隔が等間隔であることを前提とする場合には、間隔尺度として扱うこともあり、選択に悩むこともあります。

    この他にも、「連続データ」か「離散データ」かということも考慮する必要があります。「離散データ」とは、「人数」や「回数」などの飛び飛びの値を持つものをいいます。「1.4人」とか「0.5回」など小数で細かく連続しているわけではないような値です。この離散データは連続データとは異なるために、厳密には④比例尺度ではないとされています。とはいえ、この場合も正規分布などを考慮に入れることで連続データとして扱った方が望ましいことも多いです。

    尺度について考えていくと「やっぱり難しいな」と感じられるかもしれません。いずれにしてもデータを扱ううえで大事なことは、「都合よく自分の出したい結果に近づけること」ではなく「いかに真実に忠実に近づけるように反映できるか」を考えることです。私は、客観性・中立性を持ってデータと向き合えるかが研究をするうえで大事だと考えています。

    【参考文献】
    1) S. S. Stevens, et al. Science: 103, 2684, 677-680, 1946.
    https://psychology.okstate.edu/faculty/jgrice/psyc3214/Stevens_FourScales_1946.pdf
    2)小林宣泰 編. 研究方法入門.協同医書.2006
    3)涌井貞美 編. 意味がわかる統計解析 第6版. ベレ出版, 2018.

    この記事に関連するタグ

    興味のあるタグをフォローしておくことで、自身のフィードに関連するセミナーやコラムを優先的に表示させることができます。(無料会員機能。登録はこちら)

    人気コラム

    もっと見る

    コラムで人気のタグ

    タグをフォローしておくことで、自身のフィードに興味のあるセミナーやコラムを優先的に表示させることができます。(無料会員機能。登録はこちら)

    注目執筆者

    もっと見る

    コラムカテゴリ