2024年12月04日
高校数学B「統計的な推測」二項分布の平均と分散。
数B「統計的な推測」は、旧課程の頃は、この単元丸ごと学習しない高校が多かったのです。
しかし、新課程になり、大学入試共通テストの範囲が数学B・Cとなってからは、文系の生徒が数学Cの「複素数平面」で受験するよりは、「統計的な推測」のほうがまだ理解しやすいのではないかという判断からか、高校でも扱う学校が増えてきました。
同時に、あまりのわかりにくさに悲鳴も上がっています。
公式を理解し、覚えてしまえばあとは簡単なのですが、数Ⅰ「データの分析」のときから、統計に苦手意識があり、どうにも公式が理解しづらい様子です。
そもそも、用語がわかりづらい・・・。
聞いたことのない用語が一気に出てくるので、それで面食らう、ということがあるようです。
これは、覚えるしかないので、用語の意味がわからなくなったら、逐一、定義に戻って意味を確認してください。
とはいえ、定義もかなり難しい・・・。
まず、二項分布の定義から見ていきましょう。
1回の試行で事象Aの起こる確率が p である独立試行を n 回繰り返し、Aの起こる回数を確率変数 X とすると、
P(X=r)
=nCr・p^r(1-p)^n-r
である。
このとき、Xの確率分布を二項分布といい、
B(n , p )
で表す。
平均は、
E(X)=np
分散は、
V(X)=np(1-p)
標準偏差は、
σ(X)=√np(1-p)
である。
・・・何、それ?
まずは、具体的に考えてみましょう。
問題 1個のさいころを5回投げるとき、3の目が出る回数を X とする。確率変数 X の平均と標準偏差を求めよ。
これは、数Aで学習した、反復試行の確率の問題と似ていますよね。
反復試行は、大丈夫でしょうか?
というわけで、反復試行の確率の問題を復習しておきましょう。
復習問題 1個のさいころを5回投げるとき、3の目が2回出る確率を求めよ。
このように、同じ試行を繰り返していく場合の確率が、反復試行の確率です。
さいころを5回投げるとき、3の目が2回出る・・・。
具体的に考えます。
まず、単純に、1回目と2回目に3の目が出て、以降は3以外の目が出たのだとしてみましょう。
その確率は、
1/6・1/6・5/6・5/6・5/6
しかし、これだけでは、1回目と2回目に3が出た場合のみの確率です。
3の目が2回出るのは、1回目と2回目に出る場合だけではありません。
1回目と3回目に3が出て、他はそれ以外の目。
2回目と3回目に3が出て、他はそれ以外の目。
・・・など、複数の出方があります。
その全ての場合で、それぞれの確率は、
1/6・1/6・5/6・5/6・5/6
です。
そして、それらの目の出方は、互いに排反。
すなわち、かぶりませんから、確率を足せばいいのだとわかります。
では、5回のうち、3の目が2回だけ出る場合の数は?
それは、5回のうち、3の目が出る2か所を選ぶ場合の数と考えられますから、組み合わせの公式を用いて、
5C2
となります。
したがって、1個のさいころを5回投げるとき、3の目が2回出る確率は、
5C2・(1/6)^2・(5/6)^3
という式で求めることができます。
これが、反復試行の確率の求め方です。
では、少しずつ、一般化しましょう。
さいころを n 回投げて、3の目が r 回出る確率は、
nCr・(1/6)^r・(5/6)^n-r
さらに一般化しましょう。
さいころから離れ、3の目からも離れます。
1回の試行で事象Aが起こる確率が p である独立試行を n 回繰り返すとき、Aの起こる回数が r 回である確率は、
nCr・p^r・(1-p)^n-r
ここまで、いいでしょうか?
さて、そこで、二項分布の定義を見直しましょう。
1回の試行で事象Aの起こる確率がpである独立試行を n 回繰り返し、Aの起こる回数を確率変数 X とすると、
P(X=r)
=nCr・p^r(1-p)^n-r
である。
このとき、Xの確率分布を二項分布といい、
B(n , p )
で表す。
これが定義です。
P(X=r) というのは、この「統計的な推測」という単元の一番最初に学習した表し方でした。
X が r のときの確率、という意味でした。
ということは、書き方が少し複雑なだけで、これは、反復試行の公式そのままです。
確率が、反復試行の公式をそのまま使うことになることが明白な場合、きっと確率の分布に何かルールがあるぞ、ということは推測できます。
こういう形の確率分布を、二項分布と呼ぶ、というのが、まずは定義です。
・・・なぜ二項という名前を使うのか?
というと、それは、数Ⅱで学習した「二項定理」が関係しているのです。
二項定理は覚えているでしょうか。
こういうものでした。
例えば、
(x+3)^5=5C0・x^5+5C1・x^4・3+5C2・x^3・3^2+5C3・x^2・3^3+5C4・x・3^4+5C5・3^5
=x^5+3x^4+90x^3+270x^2+405x+243
公式は、
(p+q)^n=nC0・p^n+nC1・p^n-1・q+nC2・p^n-2・q^2+・・・+nCn-1・pq^n-1+nCn・q^n
・・・何か似てる!
反復試行の確率の公式に似てる!
というか、そっくりです。
だから、二項分布という名前なのです。
何か知らないけど、そう呼ぶのだな、という把握で、今は大丈夫です。
とりあえず、反復試行の確率の確率分布を、二項分布と呼びます。
そして、B(n , p)で表します。
・・・なぜB?
「二項分布」は、英語で、binominal distribution と呼びます。
その頭文字のBです。
B(n , p)
Bは、「これは二項分布、つまり反復試行の確率の確率分布ですよー」という合図。
そして、試行回数はnですよー。
1回の試行で、ある事象Aが起こる確率はpですよー。
そういう意味です。
そして、n と p、その2つの数値さえわかれば、反復試行の確率の式は立つのです。
重要な数値は、この2つ。
これで確率分布は決まるよー。
そういう意味だと、ざっくりとらえれば、大丈夫です。
さて、ここまで、まあ何とか呑み込んだとして。
ここからが重要。
3本の公式が出てきます。
平均は、
E(X)=np
分散は、
V(X)=np(1-p)
標準偏差は、
σ(X)=√np(1-p)
この公式が、あまりにもシンプル過ぎて、逆に意味がわからない・・・。
そういう悩みがあるかと思います。
なぜ、X の平均、すなわち期待値が、npで出るのか?
何で、そこがかけ算なのか?
どういう意味?
でも、これも、現実に即して考えれば、当たり前です。
例えば、こんな例で考えてみましょう。
例 1個のさいころを6回投げるとき、2の目は何回出ると期待できるか?
2の目がX 回出るとしましょう。
さいころの目は6種類あります。
そのうちの2の目は、6回投げたら、1回くらいは出ると期待できるんじゃないでしょうか。
6回に1回。
1/6の確率なのですから、6回に1回は出てもいいでしょう。
これがまさに、二項分布B(6 , 1/6) において、
E(X)=np=6・1/6=1
です。
公式と感覚が完全に一致します。
X は、この例では、1個のさいころを6回投げるのとき、2の目が X 回出る、という意味の X です。
X は確率変数ですので、何種類かの値を取ります。
今、さいころを6回投げていますから、Xは、
X=0 , 1 , 2 , 3 , 4 , 5 , 6
の7通りが考えられますが、
6回も投げたのに、2の目が0回ということは、そんなにあることではない。(勿論、実際はありえます)
6回も投げて、6回とも2の目ということも、そんなにあることではない。(勿論、これも可能性はあります)
実際のところ、1回投げるごとの、2の目が出る確率は1/6なのだから、その1/6が、集まって集まって集まって、
1/6+1/6+1/+1/6+1/6+1/6
=1/6・6
=1
となり、6回投げたら、1回くらいは2の目が出ると期待できる。
2の目が出る平均の回数は、1回である。
そういう意味でとらえれば、この公式は、するっと頭に入ると思います。
式として、比較的しっかりと証明するならば、
1回の試行で事象Aの起こる確率を p とする。
この試行を n 回繰り返すとき、
第 k 回の試行でAが起これば1、起こらなければ0の値をとる確率変数をXk とする。
・・・ついてきてますかー?
k=0,1,2,3,・・・,n
となります。
そのそれぞれで、実際に A という事象が起これば1、起こらなければ0の値を取ります。
ここも難しいところです。
期待値のこれまでの学習と混ざって、kの値×確率pではないのか、という混乱が起こりそうですが、実際には、そんなかけ算はあり得ません。
k は、第 k 回の試行というだけの数字なので、2回目だから急に値が2に増えるということはありません。
第何回でも、平等に、事象 A が起これば1、起こらなければ0。
そうとらえます。
このとき、
P(Xk=1)=p、P(Xk=0)=q (q=1-p)
です。
これも書き方が難しいですが、
Xkが1である、すなわち第k回目に、Aという事象が起こる確率は、pである。
Xkが0である、すなわち第k回目に、Aという事象が起こらない確率は、q (ただしq=1-p)。
ということです。
となると、k 回目にAという事象が起こる期待値は、
E(Xk=1)=1・p+0・q=p
となります。
で、実際に、X1 や X2 が1になるか0になるかは、そのとき次第ですが、
X=X1+X2+X3+X4+・・・+Xn
とおくと、この X は、n 回のうち A が起こる回数ということですから、その平均、すなわち期待値は、
E(X)=E(X1)+E(X2)+E(X3)+・・・+E(Xn)
=p+p+p+・・・+p
=np
となります。
実感は簡単なのに、証明するとなると難しい・・・。
次に課題となるのが、分散の公式の意味です。
分散は、
V(X)=np(1-p)
これも、もう諦めてこのまま覚えますというのなら、それでも良いと思うのですが、やはり、それでは不安定で、覚えづらく、脳からすぐ消えていきそうな気がします。
一度はしっかりと、理解しておきたい。
分散の公式は大丈夫でしょうか?
数Ⅰ「データの分析」で分散を学習したときに、定義通りの1本目の公式しか覚えなかった人もいると思いますが、分散の公式は、2本目のほうが使い道があるのです。
数学の公式は、大体そうです。
2本あるときは、2本目に意味があります。
難しい問題ほど、2本目のほうが威力を発揮します。
分散の公式の2本目とは、
分散=2乗の値の平均値-平均の2乗
という公式です。
V(X)=E(X^2)-{E(X)}^2
ここで、平均と期待値は同じ意味だということも、改めて把握しましょう。
平均でどれくらいなのかと、どれくらい期待できるのかは、同じ意味です。
したがって、
分散=(X^2の期待値)-(Xの期待値)^2
となります。
さきほど、
E(Xk)=1・p+0・q=p
でした。
また、
E(Xk^2)=1^2・p+0^2・q=p
となります。
よって、
V(Xk)=E(Xk^2)-{E(Xk)}^2
=p-p^2
=p(1-p)
=pq
つまり、
V(X1)=pq
ですし、
V(X2)=pq
です。
ここで、確率変数X1,X2,X3,・・・Xnは互いに独立だから、
V(X)=V(X1)+V(X2)+V(X3)+・・・+V(Xn)
=pq+pq+pq+・・・+pq
=npq
=np(1-p)
となります。
標準偏差は、分散の正の平方根のことですので、証明は不要ですね。
何とか呑み込んだら、後は、使うのみです。
問題に戻りましょう。
問題 1個のさいころを5回投げるとき、3の目が出る回数をXとする。確率変数Xの平均と標準偏差を求めよ。
さいころを1回投げて3の目が出る確率は1/6。
明らかに反復試行ですので、確率変数 X は、二項分布 B(5 , 1/6) に従います。
平均というのは期待値のことですから、
E(X)=np=5・1/6=5/6
よって、平均は、5/6。
分散は、
V(X)=npq
=5・1/6・5/6
=25/36
標準偏差は、分散の正の平方根ですから、
σ=√25/36=5/6
標準偏差は、5/6 です。
Posted by セギ at 15:20│Comments(0)
│算数・数学
※このブログではブログの持ち主が承認した後、コメントが反映される設定です。