山と数学、そして英語。:高校数学Ｂ「統計的な推測」二項分布の平均と分散。

2024年12月04日

高校数学Ｂ「統計的な推測」二項分布の平均と分散。

数Ｂ「統計的な推測」は、旧課程の頃は、この単元丸ごと学習しない高校が多かったのです。
しかし、新課程になり、大学入試共通テストの範囲が数学Ｂ・Ｃとなってからは、文系の生徒が数学Ｃの「複素数平面」で受験するよりは、「統計的な推測」のほうがまだ理解しやすいのではないかという判断からか、高校でも扱う学校が増えてきました。
同時に、あまりのわかりにくさに悲鳴も上がっています。

公式を理解し、覚えてしまえばあとは簡単なのですが、数Ⅰ「データの分析」のときから、統計に苦手意識があり、どうにも公式が理解しづらい様子です。
そもそも、用語がわかりづらい・・・。
聞いたことのない用語が一気に出てくるので、それで面食らう、ということがあるようです。
これは、覚えるしかないので、用語の意味がわからなくなったら、逐一、定義に戻って意味を確認してください。

とはいえ、定義もかなり難しい・・・。
まず、二項分布の定義から見ていきましょう。

１回の試行で事象Ａの起こる確率がｐである独立試行をｎ回繰り返し、Ａの起こる回数を確率変数Ｘとすると、
Ｐ(Ｘ＝ｒ)
＝ｎＣｒ・ｐ^ｒ(１－ｐ)^ｎ－ｒ
である。
このとき、Ｘの確率分布を二項分布といい、
Ｂ(ｎ , ｐ )
で表す。
平均は、
Ｅ(Ｘ)＝ｎｐ
分散は、
Ｖ(Ｘ)＝ｎｐ(１－ｐ)
標準偏差は、
σ(Ｘ)＝√ｎｐ(１－ｐ)
である。

・・・何、それ？

まずは、具体的に考えてみましょう。

問題　１個のさいころを５回投げるとき、３の目が出る回数をＸとする。確率変数Ｘの平均と標準偏差を求めよ。

これは、数Ａで学習した、反復試行の確率の問題と似ていますよね。
反復試行は、大丈夫でしょうか？
というわけで、反復試行の確率の問題を復習しておきましょう。

復習問題　１個のさいころを５回投げるとき、３の目が２回出る確率を求めよ。

このように、同じ試行を繰り返していく場合の確率が、反復試行の確率です。
さいころを５回投げるとき、３の目が２回出る・・・。
具体的に考えます。
まず、単純に、１回目と２回目に３の目が出て、以降は３以外の目が出たのだとしてみましょう。
その確率は、
１/６・１/６・５/６・５/６・５/６
しかし、これだけでは、１回目と２回目に３が出た場合のみの確率です。
３の目が２回出るのは、１回目と２回目に出る場合だけではありません。
１回目と３回目に３が出て、他はそれ以外の目。
２回目と３回目に３が出て、他はそれ以外の目。
・・・など、複数の出方があります。
その全ての場合で、それぞれの確率は、
１/６・１/６・５/６・５/６・５/６
です。
そして、それらの目の出方は、互いに排反。
すなわち、かぶりませんから、確率を足せばいいのだとわかります。
では、５回のうち、３の目が２回だけ出る場合の数は？
それは、５回のうち、３の目が出る２か所を選ぶ場合の数と考えられますから、組み合わせの公式を用いて、
5Ｃ2
となります。
したがって、１個のさいころを５回投げるとき、３の目が２回出る確率は、
5C2・(１/６)^2・(５/６)^3
という式で求めることができます。
これが、反復試行の確率の求め方です。

では、少しずつ、一般化しましょう。
さいころをｎ回投げて、３の目がｒ回出る確率は、
nＣr・(１/６)^r・(５/６)^n-r

さらに一般化しましょう。
さいころから離れ、３の目からも離れます。

１回の試行で事象Ａが起こる確率がｐである独立試行をｎ回繰り返すとき、Ａの起こる回数がｒ回である確率は、
nＣr・p^r・(１－p)^n-r

ここまで、いいでしょうか？

さて、そこで、二項分布の定義を見直しましょう。

１回の試行で事象Ａの起こる確率がｐである独立試行をｎ回繰り返し、Ａの起こる回数を確率変数Ｘとすると、
Ｐ(Ｘ＝ｒ)
＝nＣr・ｐ^ｒ(１－ｐ)^ｎ－ｒ
である。
このとき、Ｘの確率分布を二項分布といい、
Ｂ(ｎ , ｐ )
で表す。

これが定義です。

Ｐ(Ｘ＝ｒ) というのは、この「統計的な推測」という単元の一番最初に学習した表し方でした。
Ｘがｒのときの確率、という意味でした。
ということは、書き方が少し複雑なだけで、これは、反復試行の公式そのままです。

確率が、反復試行の公式をそのまま使うことになることが明白な場合、きっと確率の分布に何かルールがあるぞ、ということは推測できます。
こういう形の確率分布を、二項分布と呼ぶ、というのが、まずは定義です。

・・・なぜ二項という名前を使うのか？
というと、それは、数Ⅱで学習した「二項定理」が関係しているのです。
二項定理は覚えているでしょうか。
こういうものでした。

例えば、
(ｘ＋３)^5＝5Ｃ0・ｘ^5＋5Ｃ1・ｘ^4・３＋5Ｃ2・ｘ^3・３^2＋5Ｃ3・ｘ^2・３^3＋5Ｃ4・ｘ・３^4＋5Ｃ5・３^5
＝ｘ^5＋３ｘ^4＋９０ｘ^3＋２７０ｘ^2＋４０５ｘ＋２４３

公式は、
(ｐ＋ｑ)^n＝nＣ0・ｐ^n＋nＣ1・ｐ^n-1・ｑ＋nＣ2・ｐ^n-2・ｑ^2＋・・・＋nＣn-1・ｐｑ^n-1＋nＣn・ｑ^n

・・・何か似てる！
反復試行の確率の公式に似てる！
というか、そっくりです。
だから、二項分布という名前なのです。
何か知らないけど、そう呼ぶのだな、という把握で、今は大丈夫です。

とりあえず、反復試行の確率の確率分布を、二項分布と呼びます。
そして、Ｂ(ｎ , ｐ)で表します。

・・・なぜＢ？
「二項分布」は、英語で、binominal distribution と呼びます。
その頭文字のＢです。

Ｂ(ｎ , ｐ)

Ｂは、「これは二項分布、つまり反復試行の確率の確率分布ですよー」という合図。
そして、試行回数はｎですよー。
１回の試行で、ある事象Ａが起こる確率はｐですよー。
そういう意味です。
そして、ｎとｐ、その２つの数値さえわかれば、反復試行の確率の式は立つのです。
重要な数値は、この２つ。
これで確率分布は決まるよー。
そういう意味だと、ざっくりとらえれば、大丈夫です。

さて、ここまで、まあ何とか呑み込んだとして。
ここからが重要。
３本の公式が出てきます。

平均は、
Ｅ(Ｘ)＝ｎｐ
分散は、
Ｖ(Ｘ)＝ｎｐ(１－ｐ)
標準偏差は、
σ(Ｘ)＝√ｎｐ(１－ｐ)

この公式が、あまりにもシンプル過ぎて、逆に意味がわからない・・・。
そういう悩みがあるかと思います。

なぜ、Ｘの平均、すなわち期待値が、ｎｐで出るのか？
何で、そこがかけ算なのか？
どういう意味？

でも、これも、現実に即して考えれば、当たり前です。
例えば、こんな例で考えてみましょう。

例　１個のさいころを６回投げるとき、２の目は何回出ると期待できるか？

２の目がＸ回出るとしましょう。
さいころの目は６種類あります。
そのうちの２の目は、６回投げたら、１回くらいは出ると期待できるんじゃないでしょうか。
６回に１回。
１/６の確率なのですから、６回に１回は出てもいいでしょう。

これがまさに、二項分布Ｂ(６ , １/６) において、
Ｅ(Ｘ)＝ｎｐ＝６・１/６＝１　
です。
公式と感覚が完全に一致します。

Ｘは、この例では、１個のさいころを６回投げるのとき、２の目がＸ回出る、という意味のＸです。
Ｘは確率変数ですので、何種類かの値を取ります。
今、さいころを６回投げていますから、Ｘは、
Ｘ＝０ , １ , ２ , ３ , ４ , ５ , ６
の７通りが考えられますが、
６回も投げたのに、２の目が０回ということは、そんなにあることではない。(勿論、実際はありえます)
６回も投げて、６回とも２の目ということも、そんなにあることではない。(勿論、これも可能性はあります)
実際のところ、１回投げるごとの、２の目が出る確率は１/６なのだから、その１/６が、集まって集まって集まって、
１/６＋１/６＋１/＋１/６＋１/６＋１/６
＝１/６・６
＝１
となり、６回投げたら、１回くらいは２の目が出ると期待できる。
２の目が出る平均の回数は、１回である。
そういう意味でとらえれば、この公式は、するっと頭に入ると思います。

式として、比較的しっかりと証明するならば、

１回の試行で事象Ａの起こる確率をｐとする。
この試行をｎ回繰り返すとき、
第ｋ回の試行でＡが起これば１、起こらなければ０の値をとる確率変数をＸk とする。

・・・ついてきてますかー？

ｋ＝０,１,２,３,・・・,ｎ
となります。
そのそれぞれで、実際にＡという事象が起これば１、起こらなければ０の値を取ります。

ここも難しいところです。
期待値のこれまでの学習と混ざって、ｋの値×確率ｐではないのか、という混乱が起こりそうですが、実際には、そんなかけ算はあり得ません。
ｋは、第ｋ回の試行というだけの数字なので、２回目だから急に値が２に増えるということはありません。
第何回でも、平等に、事象Ａが起これば１、起こらなければ０。
そうとらえます。

このとき、
Ｐ(Ｘk＝１)＝ｐ、Ｐ(Ｘk＝０)＝ｑ　(ｑ＝１－ｐ)
です。

これも書き方が難しいですが、
Ｘkが１である、すなわち第ｋ回目に、Ａという事象が起こる確率は、ｐである。
Ｘkが０である、すなわち第ｋ回目に、Ａという事象が起こらない確率は、ｑ　(ただしｑ＝１－ｐ)。
ということです。

となると、ｋ回目にＡという事象が起こる期待値は、
Ｅ(Ｘk＝１)＝１・ｐ＋０・ｑ＝ｐ　
となります。

で、実際に、Ｘ1 やＸ2 が１になるか０になるかは、そのとき次第ですが、
Ｘ＝Ｘ1＋Ｘ2＋Ｘ3＋Ｘ4＋・・・＋Ｘn
とおくと、このＸは、ｎ回のうちＡが起こる回数ということですから、その平均、すなわち期待値は、
Ｅ(Ｘ)＝Ｅ(Ｘ1)＋Ｅ(Ｘ2)＋Ｅ(Ｘ3)＋・・・＋Ｅ(Ｘn)
　　　＝ｐ＋ｐ＋ｐ＋・・・＋ｐ
　　　＝ｎｐ
となります。

実感は簡単なのに、証明するとなると難しい・・・。

次に課題となるのが、分散の公式の意味です。
分散は、
Ｖ(Ｘ)＝ｎｐ(１－ｐ)

これも、もう諦めてこのまま覚えますというのなら、それでも良いと思うのですが、やはり、それでは不安定で、覚えづらく、脳からすぐ消えていきそうな気がします。
一度はしっかりと、理解しておきたい。

分散の公式は大丈夫でしょうか？
数Ⅰ「データの分析」で分散を学習したときに、定義通りの１本目の公式しか覚えなかった人もいると思いますが、分散の公式は、２本目のほうが使い道があるのです。
数学の公式は、大体そうです。
２本あるときは、２本目に意味があります。
難しい問題ほど、２本目のほうが威力を発揮します。

分散の公式の２本目とは、
分散＝２乗の値の平均値－平均の２乗
という公式です。

Ｖ(Ｘ)＝Ｅ(Ｘ^2)－{Ｅ(Ｘ)}^2

ここで、平均と期待値は同じ意味だということも、改めて把握しましょう。
平均でどれくらいなのかと、どれくらい期待できるのかは、同じ意味です。

したがって、
分散＝(Ｘ^2の期待値)－(Ｘの期待値)^2
となります。

さきほど、
Ｅ(Ｘk)＝１・ｐ＋０・ｑ＝ｐ
でした。
また、
Ｅ(Ｘk^2)＝１^2・ｐ＋０^2・ｑ＝ｐ
となります。
よって、
Ｖ(Ｘk)＝Ｅ(Ｘk^2)－{Ｅ(Ｘk)}^2
　　　＝ｐ－ｐ^2
　　　＝ｐ(１－ｐ)
　　　＝ｐｑ

つまり、
Ｖ(Ｘ1)＝ｐｑ　
ですし、
Ｖ(Ｘ2)＝ｐｑ
です。

ここで、確率変数Ｘ1,Ｘ2,Ｘ3,・・・Ｘnは互いに独立だから、
Ｖ(Ｘ)＝Ｖ(Ｘ1)＋Ｖ(Ｘ2)＋Ｖ(Ｘ3)＋・・・＋Ｖ(Ｘn)
　　　＝ｐｑ＋ｐｑ＋ｐｑ＋・・・＋ｐｑ
　　　＝ｎｐｑ
　　　＝ｎｐ(１－ｐ)
となります。

標準偏差は、分散の正の平方根のことですので、証明は不要ですね。

何とか呑み込んだら、後は、使うのみです。
問題に戻りましょう。

問題　１個のさいころを５回投げるとき、３の目が出る回数をＸとする。確率変数Ｘの平均と標準偏差を求めよ。

さいころを１回投げて３の目が出る確率は１/６。
明らかに反復試行ですので、確率変数Ｘは、二項分布Ｂ(５ , １/６) に従います。
平均というのは期待値のことですから、
Ｅ(Ｘ)＝ｎｐ＝５・１/６＝５/６
よって、平均は、５/６。
分散は、
Ｖ(Ｘ)＝ｎｐｑ
　　　＝５・１/６・５/６
　　　＝２５/３６
標準偏差は、分散の正の平方根ですから、
σ＝√２５/３６＝５/６
標準偏差は、５/６　です。

同じカテゴリー（算数・数学）の記事画像

同じカテゴリー（算数・数学）の記事

中学数学。１次方程式の利用。中級。速さに関する問題。
学習負担の軽量化と、その効果。
学年末テストの後の学習内容は重要です。
受験算数。直方体の展開図に関する、ちょっとした難問。
規則性の問題。受験算数・中学数学。
中１数学「比例・反比例」の活用の問題。

Posted by セギ at 15:20│Comments(0) │算数・数学

※このブログではブログの持ち主が承認した後、コメントが反映される設定です。

名前:
メール:
URL:
情報を記憶:
コメント:	上の画像に書かれている文字を入力して下さい
	＜ご注意＞書き込まれた内容は公開され、ブログの持ち主だけが削除できます。確認せずに書込

このページの上へ▲

S	M	T	W	T	F	S
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30