たまりば

  地域と私・始めの一歩塾 地域と私・始めの一歩塾  三鷹市 三鷹市

2018年01月10日

データの分析。相対度数とは何か。


今回は、「データの分析」です。
「データを読み取れないから日本人は経済において世界の中で云々かんぬん」
と上から言われて加えられ、新課程に変わる度に強化されている
この単元。
データは読めないよりは読めたほうがいいので、張り切って指導していますが、これを勉強する高校生の表情は、多くの場合、埴輪のようにポカンとしています。
必要性が実感できないのかもしれません。

今回は、まず中学の復習。
度数分布表の作り方と、それをヒストグラムに直す方法を学習しましょう。
これは中学1年で学ぶ内容ですので、わりと簡単です。

度数分布表。
身近な例で言えば、ある学年100人の期末テストの得点を度数分布表に表すとします。

0点以上10点未満   2人
10点以上20点未満  4人
20点以上30点未満  6人
30点以上40点未満 10人
40点以上50点未満 32人
50点以上60点未満  5人
60点以上70点未満  7人
70点以上80点未満 23人
80点以上90点未満  7人
90点以上100点以下 4人
合計           100人

上のように、範囲を区切ってその範囲にデータがいくつあるかを示した表が度数分布表です。
「20点以上30点未満」のような範囲の1つ1つを「階級」と言います。
データの個数を「度数」と言います。
上の例で言えば、20点以上30点未満の階級の度数は、6人です。

上のように合計がちょうど100人ならわかりやすいですが、実際のデータは、79人とか、83人とか、合計が半端な数であるため、データがどのように分布しているのか、パッと見ただではわかりにくいことがあります。
そのために「相対度数」という数値を利用します。
相対度数というのは、割合です。
全体の中で、その階級にどういう割合でデータが分布しているか。
合計を1.00とし、各階級の度数を小数で表します。
各階級の度数÷全体の数=相対度数
ということです。
小数で表すからピンとこない子がたまにいるのですが、パーセントで読み直せば、何ということもありません。
全体が100%。
上の例で言えば、「20点以上30点未満」の階級の相対度数は、0.06。
すなわち、全体の6%の人がその階級にいるということです。

小学生の頃から「割合」が苦手な子は、この段階で「わかんない」と文句を言い始めるのですが、データを読み取りやすくするための数字が相対度数です。
敵視せず、「この数字は自分の味方」と思ってほしいです。
1.00=100% を理解するだけで楽になりますから。

そして、度数分布表をそのままグラフにしたのが、ヒストグラム。
柱状グラフ、とも言います。
分布の様子がひと目でわかるので、便利です。

さて、ここで話が終われば簡単なのですが、ここから少し面倒くさい話になってきます。
データは、1つのデータだけを見て判断することはほとんどありません。
他のデータと比較して分析するから、データには意味があります。
では、どのように比較するのか。

ここで、「代表値」という概念が登場します。
1つのデータを1つの数値で代表させたい。
代表値には色々なものがあり、一番知られているのが、「平均値」です。

上の例で言えば、1人1人の点数を全部足していって、人数で割れば、平均点が出ます。
あれ?
でも、上の表だと、個々の点数がわからない。
「20点以上30点未満 6人」
ということしかわからない。
実際は、1人1人、21点だったり、29点だったりするだろうに、そのデータが手元にない。
そんなとき、どうやって平均値を出すか?

ここで使えるのが、「階級値」。
すなわちその階級の中央の値です。
「20点以上30点未満」という階級の階級値は、25点です。
その25点×6人で、その階級の合計とする。
全ての階級の合計を足して、度数(100人)で割る。
それを「平均値」としても、まあいいでしょう。
おそらく、個々の得点を全部足して100で割ったものとは少し違う数値が出るでしょうが、大きな違いではないでしょう。
これを「加重平均」と言います。

そうやって、平均値を出すことはできるけれど、しかし、このデータで、平均値はどの程度の意味を持つのでしょうか?
上の度数分布表を見直していただけるとわかりのですが、データの分布が明らかに割れています。
平均値は、そうしたデータの分布を表すことができません。
もっと、データの分布を把握できる数値はないものでしょうか。

ここから、いよいよ、データの分布をどのように表していくかという話が始まっていきます。




  • 同じカテゴリー(算数・数学)の記事画像
    確率の乗法定理。
    条件付き確率。
    独立試行の確率。
    反復試行の確率。
    道順と確率。これは難問です。
    確率と余事象。
    同じカテゴリー(算数・数学)の記事
     確率の乗法定理。 (2018-07-16 13:41)
     条件付き確率。 (2018-07-11 12:53)
     独立試行の確率。 (2018-07-04 12:32)
     反復試行の確率。 (2018-06-26 16:03)
     道順と確率。これは難問です。 (2018-06-22 14:35)
     確率と余事象。 (2018-06-18 13:53)

    ※このブログではブログの持ち主が承認した後、コメントが反映される設定です。
    上の画像に書かれている文字を入力して下さい
     
    <ご注意>
    書き込まれた内容は公開され、ブログの持ち主だけが削除できます。

    削除
    データの分析。相対度数とは何か。
      コメント(0)