たまりば

地域と私・始めの一歩塾 地域と私・始めの一歩塾三鷹市 三鷹市

2024年12月04日

高校数学B「統計的な推測」二項分布の平均と分散。

高校数学B「統計的な推測」二項分布の平均と分散。

数B「統計的な推測」は、旧課程の頃は、この単元丸ごと学習しない高校が多かったのです。
しかし、新課程になり、大学入試共通テストの範囲が数学B・Cとなってからは、文系の生徒が数学Cの「複素数平面」で受験するよりは、「統計的な推測」のほうがまだ理解しやすいのではないかという判断からか、高校でも扱う学校が増えてきました。
同時に、あまりのわかりにくさに悲鳴も上がっています。

公式を理解し、覚えてしまえばあとは簡単なのですが、数Ⅰ「データの分析」のときから、統計に苦手意識があり、どうにも公式が理解しづらい様子です。
そもそも、用語がわかりづらい・・・。
聞いたことのない用語が一気に出てくるので、それで面食らう、ということがあるようです。
これは、覚えるしかないので、用語の意味がわからなくなったら、逐一、定義に戻って意味を確認してください。

とはいえ、定義もかなり難しい・・・。
まず、二項分布の定義から見ていきましょう。

1回の試行で事象Aの起こる確率が p である独立試行を n 回繰り返し、Aの起こる回数を確率変数 X とすると、
P(X=r)
=nCr・p^r(1-p)^n-r
である。
このとき、Xの確率分布を二項分布といい、
B(n , p )
で表す。
平均は、
E(X)=np
分散は、
V(X)=np(1-p)
標準偏差は、
σ(X)=√np(1-p)
である。

・・・何、それ?

まずは、具体的に考えてみましょう。

問題 1個のさいころを5回投げるとき、3の目が出る回数を X とする。確率変数 X の平均と標準偏差を求めよ。

これは、数Aで学習した、反復試行の確率の問題と似ていますよね。
反復試行は、大丈夫でしょうか?
というわけで、反復試行の確率の問題を復習しておきましょう。


復習問題 1個のさいころを5回投げるとき、3の目が2回出る確率を求めよ。

このように、同じ試行を繰り返していく場合の確率が、反復試行の確率です。
さいころを5回投げるとき、3の目が2回出る・・・。
具体的に考えます。
まず、単純に、1回目と2回目に3の目が出て、以降は3以外の目が出たのだとしてみましょう。
その確率は、
1/6・1/6・5/6・5/6・5/6
しかし、これだけでは、1回目と2回目に3が出た場合のみの確率です。
3の目が2回出るのは、1回目と2回目に出る場合だけではありません。
1回目と3回目に3が出て、他はそれ以外の目。
2回目と3回目に3が出て、他はそれ以外の目。
・・・など、複数の出方があります。
その全ての場合で、それぞれの確率は、
1/6・1/6・5/6・5/6・5/6
です。
そして、それらの目の出方は、互いに排反。
すなわち、かぶりませんから、確率を足せばいいのだとわかります。
では、5回のうち、3の目が2回だけ出る場合の数は?
それは、5回のうち、3の目が出る2か所を選ぶ場合の数と考えられますから、組み合わせの公式を用いて、
5C2
となります。
したがって、1個のさいころを5回投げるとき、3の目が2回出る確率は、
5C2・(1/6)^2・(5/6)^3
という式で求めることができます。
これが、反復試行の確率の求め方です。

では、少しずつ、一般化しましょう。
さいころを n 回投げて、3の目が r 回出る確率は、
nCr・(1/6)^r・(5/6)^n-r

さらに一般化しましょう。
さいころから離れ、3の目からも離れます。

1回の試行で事象Aが起こる確率が p である独立試行を n 回繰り返すとき、Aの起こる回数が r 回である確率は、
nCr・p^r・(1-p)^n-r

ここまで、いいでしょうか?


さて、そこで、二項分布の定義を見直しましょう。

1回の試行で事象Aの起こる確率がpである独立試行を n 回繰り返し、Aの起こる回数を確率変数 X とすると、
P(X=r)
=nCr・p^r(1-p)^n-r
である。
このとき、Xの確率分布を二項分布といい、
B(n , p )
で表す。

これが定義です。

P(X=r) というのは、この「統計的な推測」という単元の一番最初に学習した表し方でした。
X が r のときの確率、という意味でした。
ということは、書き方が少し複雑なだけで、これは、反復試行の公式そのままです。

確率が、反復試行の公式をそのまま使うことになることが明白な場合、きっと確率の分布に何かルールがあるぞ、ということは推測できます。
こういう形の確率分布を、二項分布と呼ぶ、というのが、まずは定義です。

・・・なぜ二項という名前を使うのか?
というと、それは、数Ⅱで学習した「二項定理」が関係しているのです。
二項定理は覚えているでしょうか。
こういうものでした。

例えば、
(x+3)^5=5C0・x^5+5C1・x^4・3+5C2・x^3・3^2+5C3・x^2・3^3+5C4・x・3^4+5C5・3^5
=x^5+3x^4+90x^3+270x^2+405x+243

公式は、
(p+q)^n=nC0・p^n+nC1・p^n-1・q+nC2・p^n-2・q^2+・・・+nCn-1・pq^n-1+nCn・q^n

・・・何か似てる!
反復試行の確率の公式に似てる!
というか、そっくりです。
だから、二項分布という名前なのです。
何か知らないけど、そう呼ぶのだな、という把握で、今は大丈夫です。

とりあえず、反復試行の確率の確率分布を、二項分布と呼びます。
そして、B(n , p)で表します。

・・・なぜB?
「二項分布」は、英語で、binominal distribution と呼びます。
その頭文字のBです。

B(n , p)

Bは、「これは二項分布、つまり反復試行の確率の確率分布ですよー」という合図。
そして、試行回数はnですよー。
1回の試行で、ある事象Aが起こる確率はpですよー。
そういう意味です。
そして、n と p、その2つの数値さえわかれば、反復試行の確率の式は立つのです。
重要な数値は、この2つ。
これで確率分布は決まるよー。
そういう意味だと、ざっくりとらえれば、大丈夫です。

さて、ここまで、まあ何とか呑み込んだとして。
ここからが重要。
3本の公式が出てきます。

平均は、
E(X)=np
分散は、
V(X)=np(1-p)
標準偏差は、
σ(X)=√np(1-p)

この公式が、あまりにもシンプル過ぎて、逆に意味がわからない・・・。
そういう悩みがあるかと思います。

なぜ、X の平均、すなわち期待値が、npで出るのか?
何で、そこがかけ算なのか?
どういう意味?

でも、これも、現実に即して考えれば、当たり前です。
例えば、こんな例で考えてみましょう。

例 1個のさいころを6回投げるとき、2の目は何回出ると期待できるか?

2の目がX 回出るとしましょう。
さいころの目は6種類あります。
そのうちの2の目は、6回投げたら、1回くらいは出ると期待できるんじゃないでしょうか。
6回に1回。
1/6の確率なのですから、6回に1回は出てもいいでしょう。

これがまさに、二項分布B(6 , 1/6) において、
E(X)=np=6・1/6=1 
です。
公式と感覚が完全に一致します。

X は、この例では、1個のさいころを6回投げるのとき、2の目が X 回出る、という意味の X です。
X は確率変数ですので、何種類かの値を取ります。
今、さいころを6回投げていますから、Xは、
X=0 , 1 , 2 , 3 , 4 , 5 , 6
の7通りが考えられますが、
6回も投げたのに、2の目が0回ということは、そんなにあることではない。(勿論、実際はありえます)
6回も投げて、6回とも2の目ということも、そんなにあることではない。(勿論、これも可能性はあります)
実際のところ、1回投げるごとの、2の目が出る確率は1/6なのだから、その1/6が、集まって集まって集まって、
1/6+1/6+1/+1/6+1/6+1/6
=1/6・6
=1
となり、6回投げたら、1回くらいは2の目が出ると期待できる。
2の目が出る平均の回数は、1回である。
そういう意味でとらえれば、この公式は、するっと頭に入ると思います。

式として、比較的しっかりと証明するならば、

1回の試行で事象Aの起こる確率を p とする。
この試行を n 回繰り返すとき、
第 k 回の試行でAが起これば1、起こらなければ0の値をとる確率変数をXk とする。

・・・ついてきてますかー?

k=0,1,2,3,・・・,n
となります。
そのそれぞれで、実際に A という事象が起これば1、起こらなければ0の値を取ります。

ここも難しいところです。
期待値のこれまでの学習と混ざって、kの値×確率pではないのか、という混乱が起こりそうですが、実際には、そんなかけ算はあり得ません。
k は、第 k 回の試行というだけの数字なので、2回目だから急に値が2に増えるということはありません。
第何回でも、平等に、事象 A が起これば1、起こらなければ0。
そうとらえます。

このとき、
P(Xk=1)=p、P(Xk=0)=q (q=1-p)
です。

これも書き方が難しいですが、
Xkが1である、すなわち第k回目に、Aという事象が起こる確率は、pである。
Xkが0である、すなわち第k回目に、Aという事象が起こらない確率は、q (ただしq=1-p)。
ということです。

となると、k 回目にAという事象が起こる期待値は、
E(Xk=1)=1・p+0・q=p 
となります。

で、実際に、X1 や X2 が1になるか0になるかは、そのとき次第ですが、
X=X1+X2+X3+X4+・・・+Xn
とおくと、この X は、n 回のうち A が起こる回数ということですから、その平均、すなわち期待値は、
E(X)=E(X1)+E(X2)+E(X3)+・・・+E(Xn)
   =p+p+p+・・・+p
   =np
となります。

実感は簡単なのに、証明するとなると難しい・・・。


次に課題となるのが、分散の公式の意味です。
分散は、
V(X)=np(1-p)

これも、もう諦めてこのまま覚えますというのなら、それでも良いと思うのですが、やはり、それでは不安定で、覚えづらく、脳からすぐ消えていきそうな気がします。
一度はしっかりと、理解しておきたい。

分散の公式は大丈夫でしょうか?
数Ⅰ「データの分析」で分散を学習したときに、定義通りの1本目の公式しか覚えなかった人もいると思いますが、分散の公式は、2本目のほうが使い道があるのです。
数学の公式は、大体そうです。
2本あるときは、2本目に意味があります。
難しい問題ほど、2本目のほうが威力を発揮します。

分散の公式の2本目とは、
分散=2乗の値の平均値-平均の2乗
という公式です。

V(X)=E(X^2)-{E(X)}^2

ここで、平均と期待値は同じ意味だということも、改めて把握しましょう。
平均でどれくらいなのかと、どれくらい期待できるのかは、同じ意味です。

したがって、
分散=(X^2の期待値)-(Xの期待値)^2
となります。

さきほど、
E(Xk)=1・p+0・q=p
でした。
また、
E(Xk^2)=1^2・p+0^2・q=p
となります。
よって、
V(Xk)=E(Xk^2)-{E(Xk)}^2
   =p-p^2
   =p(1-p)
   =pq

つまり、
V(X1)=pq 
ですし、
V(X2)=pq
です。

ここで、確率変数X1,X2,X3,・・・Xnは互いに独立だから、
V(X)=V(X1)+V(X2)+V(X3)+・・・+V(Xn)
   =pq+pq+pq+・・・+pq
   =npq
   =np(1-p)
となります。

標準偏差は、分散の正の平方根のことですので、証明は不要ですね。


何とか呑み込んだら、後は、使うのみです。
問題に戻りましょう。

問題 1個のさいころを5回投げるとき、3の目が出る回数をXとする。確率変数Xの平均と標準偏差を求めよ。

さいころを1回投げて3の目が出る確率は1/6。
明らかに反復試行ですので、確率変数 X は、二項分布 B(5 , 1/6) に従います。
平均というのは期待値のことですから、
E(X)=np=5・1/6=5/6
よって、平均は、5/6。
分散は、
V(X)=npq
   =5・1/6・5/6
   =25/36
標準偏差は、分散の正の平方根ですから、
σ=√25/36=5/6
標準偏差は、5/6 です。






  • 同じカテゴリー(算数・数学)の記事画像
    定期テストの得点をどう見るか。テストの後に何をするか。
    中学数学・方程式。新傾向の文章題。
    高校数Ⅱ「軌跡」。文字が何を表しているのかで混乱する。
    高校数学B 数学的帰納法と不等式の証明。
    中学数学「反比例」。大問の横の文を読まない子。
    中学数学 方程式の文章題の式が上手く立てられない。
    同じカテゴリー(算数・数学)の記事
     定期テストの得点をどう見るか。テストの後に何をするか。 (2024-11-23 14:46)
     中学数学・方程式。新傾向の文章題。 (2024-11-17 13:04)
     高校数Ⅱ「軌跡」。文字が何を表しているのかで混乱する。 (2024-11-10 13:03)
     高校数学B 数学的帰納法と不等式の証明。 (2024-10-19 15:39)
     中学数学「反比例」。大問の横の文を読まない子。 (2024-10-13 08:39)
     中学数学 方程式の文章題の式が上手く立てられない。 (2024-09-21 11:47)

    Posted by セギ at 15:20│Comments(0)算数・数学
    ※このブログではブログの持ち主が承認した後、コメントが反映される設定です。
    上の画像に書かれている文字を入力して下さい
     
    <ご注意>
    書き込まれた内容は公開され、ブログの持ち主だけが削除できます。

    削除
    高校数学B「統計的な推測」二項分布の平均と分散。
      コメント(0)