スライド

.
.
応用統計学
.
@hara sin16 (twitter)
http://blade.nagaokaut.ac.jp/˜hara/class/engmathII/
June 23, 2015
.
.
..
Figure:
http://blade.nagaokaut.ac.jp/˜hara/class/applied-statistics/
わかりやすい
数理統計の基礎
伊藤正義・伊藤公紀一書
森北出版株式会社
Figure: 教科書
テーマ
現象の起こる確率について
高度な「計量」をすること。
[問題](1) と (2) にはどのぐらい「差」があるか?
1
サイコロを 10 回振って 1 回しか 1 が出なかった。
2
サイコロを 100 回振って 10 回しか 1 が出なかった。
.
例1
..
2
.
..
n = 10, p = 16 , q = 56 , x = 1 で、( 56 )10 + 10 C1 ( 56 )9 ·
1
6
= 0.4845.
n = 100, p = 16 , q = 56 , x = 10 で、
( 56 )100 + 100 C1 · ( 56 )99 · 16 + · · · + 100 C10 · ( 56 )90 · ( 61 )10 = 0.0427
この計算を正規分布で近似する方法で計算すると、
10−100×1/6
√
100×1/6×5/6
表
0.5−x
= −1.7889 −−→ 0.4633 −−−−→ 0.0367
.
.
1
.
一般にサイズが k 倍になれば、対応点は
k倍
−−−→
√
k 倍になる。
順列と組み合わせ
§1 順列
.
定義 1
..
.
..
· · · 異なる n 個の中から r 個を取って並べた順列の総数。
n Pr
= n · (n − 1) · · · (n − r + 1) =
n!
.
(n − r)!
.
.
n Pr
.
. 2 上で 7 文字全て取り、abc と並ぶ通り数は幾つか。
..
.
.
.
.
例題 1
..
1 アルファベット a, b, c, d, e, f, g から 1 文字ずつ 5 文字並べる通り数
は幾つか。
§2 組合せ
.
.
.
.
例題 2
..
1,2,3,4,5
から 3 個取りだした組合せの数は?
.
..
.
定義 2
..
· · · 異なる n 個の中から r 個を取った組合せの総数。
n Cr
Cr を
.n
..
(n)
r
=
n Pr
r!
=
n · (n − 1) · · · (n − r + 1)
n!
=
.
r(r − 1) · · · 2 · 1
r!(n − r)!
とも書き 2 項係数と呼ぶ。
.
.
n Cr
.
.
.
.
.
練習問題 1
..
10
. 個の点から作られる三角形の (最大) 個数は?
..
.
定理 2.1
..
.
=
2
.
r!
n Cr = n Cn−r .
3
n Cr
= n−1 Cr + n−1 Cr−1 .
. 4 r · n Cr = n · n−1 Cr−1
..
.
.
n Pr
n Cr
1
§3 2 項定理
.
(a +
b)n
= n C0
an
+ n C1
an−1 b
+ · · · + n Cn−1
abn−1
+ n Cn
bn .
.
.
.
定理 3.1
..
(. 2 項定理)
..
.
.
.
.
系 3.2
..
n
n−1 + C xn .
(1
n n
. + x) = n C0 + n C1 x + · · · + n Cn−1 x
..
.
1
n C0
+ n C1 + · · · + n Cn−1 + n Cn =
2
n C0
− n C1 + · · · + (−1)n−1 n Cn−1 + (−1)n n Cn = 0.
2n .
n−1
. 3 n が奇数のとき、n C0 + n C2 + · · · + n Cn−1 = n C1 + n C3 + · · · + n Cn = 2 .
..
.
トピック…パスカルの三角形、パチンコ
.
.
系 3.3
..
§4 多項定理
.
.
.
.
例題 3
..
a,a,a,b,b,c,c
の並べ方は何通りあるか?
.
..
.
.
.
定義 3
..
n 個のもののうち a が p 個、b が q 個、c が r 個、d が s 個…あり、これら
の並べ方の通り数を
(p, q, r, s, · · · ) と書き、多項係数と言う。
.
..
.
(p, q, r, s, · · · ) =
.
..
.
(p + q + r + s + · · · )!
p! q! r! s! · · ·
.
.
.
定理 4.1
..
.
.
.
.
例題 4
..
tomorrow
の並べ替え方は何通り?
.
..
.
.
.
定理 4.2
.
..
n
p
q
r
s
(多項定理) (a + b + c + d + · · · ) の a b c d · · · の係数は (p, q, r, s, · · · )
である。
.
..
.
この定理から、(p, q, r, s, · · · ) を多項係数と呼ぶことがある。2 項係数
は、多項係数の一種であり、n Cr は (r, n − r) と書くことができる。
.
例題 5
.
..
6
3
2
(x
. + y + z) の x y z の係数は何か?
..
.
確率
§5 試行と事象
試行
事象
···
···
同じ条件の下で繰り返し実験や観察を行うこと
観察で得られた結果
.
.
.
.
.
.
.
例2
..
(試行の例) サイコロを 1 回振り、出た目を見る。
Ω={ , , , , , }
「あり得る全て」という事象
= 標本空間
{ 偶数の目 } = { , , }
事象 (の例)
{ }, { }, { }, { }, { }, { } これ以上分割できない事象
根源事象
{ , }, { , , }, · · ·
根源事象の幾つかの合併
複合事象
.
..
.
例3
..
2 枚の硬貨を同時に投げるという試行の例、
.(表, 裏), (表, 表), (裏, 裏), (裏, 裏), (表, 裏), · · ·
..
.
定義 4
..
(身も蓋もない抽象的な定義)
標本空間 Ω とは集合のことである。
. 2 事象 A とは Ω の部分集合のことである。
..
.
Ω
A
(注) つまり、A が事象であることは、Ω の要素であること「A ∈ Ω」では
なくて、部分集合であること「A ⊂ Ω」である。
.
1
.
.
記法 1
..
1
x が X の要素であることを x ∈ X と書く。
2
x が X の要素でないことを x < X と書く。
3
Y が X の部分集合であることを Y ⊂ X と書く (Y = X は許される)。
.
集合 X の部分集合全体を P(X) あるいは 2X と書き、X のべき集合と
いう。
.
..
.
(注)A ⊂ X ⇐⇒ A ∈ 2X .
.
.
例4
..
{1,2,3}
2.
= {ϕ, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}, {1, 2, 3}}
..
.
.
.
4
全事象 · · · Ω そのもののこと
空事象 · · · ϕ のこと
次の例は極めて重要である。今後この例を元に様々な確率論的考え方を
発展させていく。
.
.
例5
..
A 君が 1 枚の硬貨を 1 回だけ投げ、上になった面を読み取る。この時、
標本空間は、Ω = { 表, 裏 } である。
. 2 事象は、{}, { 表 }, { 裏 }, { 表, 裏 } の 4 つある。
..
.
.
1
.
例6
..
サイコロを 1 回だけ投げ、上になった面を読み取る。この時、
2
.
..
標本空間は、Ω = {
,
事象は、{}, {
個ある。
}, · · · , {
}, {
,
,
,
,
,
} である。
}, · · · , {
,
,
}, · · · の 26
.
.
1
.
.
.
例7
..
白黒 2 つのサイコロを 1 回だけ投げ、上になった面をそれぞれ読み取る。
この時、
2
.
..
標本空間は、Ω = {
の数は 36。
事象は、
{}, {
}, {
{
,
,
,
,
, ··· ,
}, {
}, · · · , {
}, {
36
}, · · · と、2 個ある。
} である。要素
,
}, · · · ,
.
.
1
§6 確率の考え方
数学的確率
P(A) =
|A|
.
|Ω|
.
.
.
.
記法 2
..
|A|
. で集合 A の要素の数を表す。
..
.
定義 5
..
.
(各根源事象が等確率である場合)
.
A が起こった回数
統計的確率 P(A) = limn→∞
.
n
.
..
.
「確率論」は数学的確率のみを扱う。数学的確率は、まず最初に確率の
仮定があって、それを元に別の確率を求める。例えば、「コインの表が出
1
る確率を とする。2枚のコインが両方共表である確率はいくらか?」
2
1
という具合である。このとき、「コインの表が出る確率は本当に か?」
2
とは問わない。
すなわち、数学的確率の問題とは、ある確率から別の確率を求める、と
いう問題である。
§7 樹形図
(授業では省略)
多くの場合、事象に含まれる要素の個数を数えることが確率を求めるこ
とに繋がるが、他の代表的な確率の計算のテクニックとして
1
入れ子式分割表
2
樹形図
がある。
(問) コインを 4 回投げ、2 回表が出れば勝ちとする。勝つ確率を求めよ。
(解) 樹形図で考える:
1/2 × 1/2
1/2 × 1/2 × 1/2
1/2 × 1/2 × 1/2 × 1/2
1/2 × 1/2 × 1/2
1/2 × 1/2 × 1/2 × 1/2
1/2 × 1/2 × 1/2 × 1/2
1
2
×
1
2
+
(
1
2
×
1
2
×
1
2
)
×2+
(
1
2
×
1
2
×
1
2
×
1
2
)
×3=
13
16 .
§8 「確率」とは
結局、各根源事象が等確率であるという仮定のもとで、
P(A) =
これだけ。
|A|
.
|Ω|
次の例は極めて重要である。
.
.
例8
..
A 君が 1 枚の硬貨を 1 回だけ投げ、上になった面を読み取る。この時、
1
標本空間は、Ω = { 表, 裏 } である。
2
事象は、{}, { 表 }, { 裏 }, { 表, 裏 } の 4 つある。
3
P(ϕ) = 0
4
P({ 表 }) = P({ 裏 }) =
.
.
. 5 P({ 表, 裏 }) = 1
..
1
2
.
例9
..
サイコロを 1 回だけ投げ、上になった面を読み取る。この時、
1
2
標本空間は、Ω = {
,
,
,
,
|A|
事象 A について、P(A) =
である。
6
,
標本空間は、Ω = {
の数は 36。
, ··· ,
.
} である。
.
..
2
事象 A について、P(A) =
,
,
|A|
である。
36
} である。要素
.
.
1
.
.
..
.
.
.
例 10
..
白黒 2 つのサイコロを 1 回だけ投げ、上になった面をそれぞれ読み取る。
この時、
§9 基礎問題
【問題 A】サイコロを振る。出る目が偶数である確率はいくつか?
§9 基礎問題
【問題 A】サイコロを振る。出る目が偶数である確率はいくつか?
3
【解答 A】 .
6
【問題 B】財布からコインを 2 枚を取り出し机においた。表裏それぞれ 1
枚ずつ出る確率はいくつか。
【問題 B】財布からコインを 2 枚を取り出し机においた。表裏それぞれ 1
枚ずつ出る確率はいくつか。
2
【解答 B】あり得る場合は、表表、裏裏、表裏、裏表の 4 通りなので、 。
4
【問題 B】財布からコインを 2 枚を取り出し机においた。表裏それぞれ 1
枚ずつ出る確率はいくつか。
2
【解答 B】あり得る場合は、表表、裏裏、表裏、裏表の 4 通りなので、 。
4
1
【解答 B’】あり得る場合は、表表、裏裏、表裏の 3 通りなので、 。
3
【問題 C】袋の中に、白い球が 3 個、黒い球が 2 個合計 5 個ある。ここか
ら 3 つ取り出した時、その中に白い玉が 3 つとも入っている確率は?
【問題 C】袋の中に、白い球が 3 個、黒い球が 2 個合計 5 個ある。ここか
ら 3 つ取り出した時、その中に白い玉が 3 つとも入っている確率は?
【解答 C】5 つの球から 3 つ取る組合せは 5 C3 通り。これは全て等確率で
起こる。また、白い球を 3 つ取る組合せは 3 C3 通り。よって、求める確
3 C3
率は、
。
5 C3
【問題 C】袋の中に、白い球が 3 個、黒い球が 2 個合計 5 個ある。ここか
ら 3 つ取り出した時、その中に白い玉が 3 つとも入っている確率は?
【解答 C】5 つの球から 3 つ取る組合せは 5 C3 通り。これは全て等確率で
起こる。また、白い球を 3 つ取る組合せは 3 C3 通り。よって、求める確
3 C3
率は、
。
5 C3
【解答 C’】5 つの球から 3 つ取って一列に並べる順列の数は 5 P3 通り。こ
れは全て等確率で起こる。また、白い球を 3 つ取る順列は 3 P3 通り。よっ
3 P3
て、求める確率は、
。
5 P3
【問題 C】袋の中に、白い球が 3 個、黒い球が 2 個合計 5 個ある。ここか
ら 3 つ取り出した時、その中に白い玉が 3 つとも入っている確率は?
【解答 C】5 つの球から 3 つ取る組合せは 5 C3 通り。これは全て等確率で
起こる。また、白い球を 3 つ取る組合せは 3 C3 通り。よって、求める確
3 C3
率は、
。
5 C3
【解答 C’】5 つの球から 3 つ取って一列に並べる順列の数は 5 P3 通り。こ
れは全て等確率で起こる。また、白い球を 3 つ取る順列は 3 P3 通り。よっ
3 P3
て、求める確率は、
。
5 P3
【解答 C”】5 つの球全てを取り出し一列に並べる方法が 5! 通り。これは
全て等確率で起こる。このうち左から 3 つを袋から取り出したと考え、
残りの 2 つは実はまだ袋に入ったままだと「思う」。左に 3 つ白い球を置
く方法は 3! 通りで、その後に黒い玉を置く方法は 2! 通り。よって、求め
3! × 2!
る確率は、
。
5!
§10 丁と半の話
サイコロを2つ投げる丁 (出た目の和が偶数) である確率と半 (出た目の和
が奇数) である確率は等しい。その理由は?
§10 丁と半の話
サイコロを2つ投げる丁 (出た目の和が偶数) である確率と半 (出た目の和
が奇数) である確率は等しい。その理由は?
§10 丁と半の話
サイコロを2つ投げる丁 (出た目の和が偶数) である確率と半 (出た目の和
が奇数) である確率は等しい。その理由は?
【問題 D】出た目の和が 3 で割り切れる確率は?
§11 誕生日が同じ確率
【問題】40 人のクラスで、同じ誕生日の人が 1 組以上いる確率は?
§11 誕生日が同じ確率
【問題】40 人のクラスで、同じ誕生日の人が 1 組以上いる確率は?
【解答】
2 人の誕生日が食い違う確率は 364
365
363
3 人の誕生日が食い違う確率は 364
365 × 365
364
362
4 人の誕生日が食い違う確率は 365 × 363
365 × 365
···
363
362
326
40 人の誕生日が食い違う確率は 364
365 × 365 × 365 × · · · × 365 ; 0.109
よって、少なくとも 1 人一致する確率は、1 − 0.109 = 0.891
§11 誕生日が同じ確率
【問題】40 人のクラスで、同じ誕生日の人が 1 組以上いる確率は?
【解答】
2 人の誕生日が食い違う確率は 364
365
363
3 人の誕生日が食い違う確率は 364
365 × 365
364
362
4 人の誕生日が食い違う確率は 365 × 363
365 × 365
···
363
362
326
40 人の誕生日が食い違う確率は 364
365 × 365 × 365 × · · · × 365 ; 0.109
よって、少なくとも 1 人一致する確率は、1 − 0.109 = 0.891
誕生日が一致する人がいる確率 (中段) 自分と誕生日が一致する確率 (下段)
10 人
0.117
0.024
20 人
0.411
0.051
30 人
0.706
0.076
40 人
0.891
0.101
50 人
0.970
0.126
60 人
0.994
0.149
70 人
0.999
0.172
80 人
1.000
0.195
§12 集合の演算
確率の話を進める前に、集合に関する言葉をまとめておく。
(演算)
積事象 · · · A ∩ B
和事象 · · · A ∪ B
余事象 · · · A
差事象 · · · A − B = A ∩ B
Ω
A
B
Ω
A
B
Ω
A
B
Ω
A
B
.
..
2
A ∪ Ω = Ω, A ∩ Ω = A.
3
A ∪ A = Ω, A ∩ A = ϕ.
4
分配法則.
A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C)
A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C).
5
ド・モルガンの法則.
A ∩ B = A ∪ B,
A ∪ B = A ∩ B.
.
.
.
.
.
.
.
定義 6
..
.A と B が背反 ⇐⇒ A ∩ B = ϕ.
..
.
命題 12.1
..
1 A ∪ ϕ = A, A ∩ ϕ = ϕ.
.
例 11
..
1
.
|A ∪ B| = |A| + |B| − |A ∩ B| (包除原理).
Ω
2
.
..
B
|2X | = 2|X| .
(例 )
|2{1,2,3} | = |{ϕ, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}, {1, 2, 3}}| = 8,
2|{1,2,3}| = 23 .
.
.
A
§13 確率の基本的性質
1
P(A) = 0.
2
P(Ω) = 1.
3
.
..
A1 , A2 , · · · が互いに排反事象
=⇒ P(A1 ∪ A2 ∪ · · · ) = P(A1 ) + P(A2 ) + · · · .
.
.
.
.
定義 7
..
写像 P : { 事象 } → { 実数 } は、以下の性質を満たすとき Ω 上の確率であ
るという。
§14 P の性質
.
定理 14.1
..
1
P(ϕ) = 0.
2
P(A) = 1 − P(A).
3
0 5 P(A) 5 1.
4
A ⊂ B =⇒ P(A) 5 P(B).
. 5 P(A ∪ B) = P(A) + P(B) − P(A ∩ B)
..
[証明] (5) だけ。
(確率の加法定理).
P(A ∪ B) + P(A ∩ B) = P(A ∪ (B − A ∩ B)) + P(A ∩ B)
= P(A) + P(B − A ∩ B) + P(A ∩ B)
= P(A) + P((B − A ∩ B) ∪ (A ∩ B))
= P(A) + P(B).
.
.
.
.
.
.
例題 6
..
52 枚からなるトランプから 1 枚引いたとき、それが、スペードあるいは
絵札である確率を求めなさい。
.
..
.
.
.
.
.
例題 6
..
52 枚からなるトランプから 1 枚引いたとき、それが、スペードあるいは
絵札である確率を求めなさい。
.
..
.
.
注1
.
..
ここで教科書 p.25 例 2.3 を見る。これはこれまでの「数学的確率」の
.フォーマットに乗っかっていないようにみえるが…
..
.
§15 条件付き確率と事象の独立
.
定義 8
..
.
A, B ⊂ Ω を事象とするとき、
と定義し、これを A という条件付き確率という。P(B|A) を PA (B) とも
.書く。
..
.
Ω
A
B
.
P(B|A) =「A が起こったとして B が起こる確率」
P′ (X) = P(X|A) は、標本空間 A 上の確率であり、任意の A の事象
B, C ⊂ A に対して、
P′ (B) : P′ (C) = P(B) : P(C)
が成り立つと仮定する。
特に、根源事象が等確率ならば、
|B ∩ A|
|A|
とすればよい。
.
定理 15.1
..
(. 確率の乗法定理) P(B ∩ A) = P(A) · P(B|A).
..
[証明] 意味を考えれば当たり前だが、根源事象が等確率の場合は、
P(B ∩ A) =
より分かる。
|A ∩ B|
,
|Ω|
P(A) =
|A|
,
|Ω|
P(B|A) =
|B ∩ A|
|A|
.
.
.
P(B|A) =
条件付き確率の公式
一般的には、次をもって条件付き確率の定義とする。
P(B|A) =
P(B ∩ A)
P(A)
.
.
例題 7
.
..
サイコロを振って、出た目が黒 (1 以外) であった。出た目が奇数である
確率は幾つか?
.
..
.
.
定理 15.2
..
P(B) は 0 でも 1 でもないとするとき、以下は同値。
P(A ∩ B) = P(A)P(B)
2
P(A|B) = P(A)
3
P(A|B) = P(A)
. 4 P(A|B) = P(A|B)
..
.
.
1
.
[証明]
P(A ∩ B) − P(A)P(B) = P(A|B)P(B) − P(A)P(B)
= (P(A|B) − P(A))P(B).
よって、(1) ⇐⇒ (2)。
P(A|B) − P(A) = P(A|B) − (P(A ∩ B) + P(A ∩ B))
= P(A|B) − (P(A|B)P(B) + P(A|B)P(B))
= P(A|B)(1 − P(B)) − P(A|B)P(B)
= P(A|B)P(B) − P(A|B)P(B)
= (P(A|B) − P(A|B))P(B).
よって、(2) ⇐⇒ (4)。この等式の B と B を入れ替えて、
P(A|B) − P(A) = (P(A|B) − P(A|B))P(B)。よって、(3) ⇐⇒ (4)。
.
.
.
定義 9
.
..
(事象の独立性) 上の定理の 1. が成り立つ時、事象 A と B は (P に関して)
独立であるという。
.
..
.
.
注2
.
..
前の定理より、P(A) と P(B) が 0 でも 1 でもないとき、P(A|B) = P(A|B) と
P(B|A)
= P(B|A) は同値である。
.
..
.
.
例 12
..
一つのサイコロを一回投げるとき
,
,
,
,
,
}
,
,
}で
A
B
P(A)
P(B)
P(A ∩ B)
P(B|A)
独立性
目は偶数
目は 2
1
2
1
6
1
6
1
3
×
目は偶数
目は 5 以下
1
2
5
6
2
6
2
3
×
目は偶数
.
..
目は 4 以下
1
2
4
6
2
6
2
3
○
.
.
Ω={
A={
.
.
.
例題 8
.
..
2つの事象 A と B が背反であるとき、ほとんどの場合独立でない。何
故か?
.
..
.
.
.
.
例題 9
..
(白白、白黒、黒黒のカードの問題) 表裏が、白白、白黒、黒黒である 3
枚のカードから、1 枚取って、机の上に置いた。このとき表が白であった
とする。裏も白である確率を求めなさい。
.
..
.
.
..
.
.
.
.
例 13
..
(モンティー・ホール問題) あるテレビ番組の話。ゲストは、3 つのドアを
見せられる。ドアの 1 つの後ろにはゲストが獲得できる車があり、一方、
他の 2 つのドアにはヤギがいる(ハズレ)。ゲストは、それぞれのドアの
後ろに何があるか知らないが、モンティ(司会) は知っている。
ゲストが 1 回目のドアの選択をした後、モンティは他の 2 つのドアのう
ちヤギが居る方を開けて見せる。更にゲストに、初めの選択のままでよ
いか、もう一方の閉じているドアに変更するか 2 回目の選択をさせる。
ゲストは、ドアを変更すべきだろうか?
§16 ベイズの定理
.
( P(A), P(B), P(A|B), P(A|B) から P(B|A) を求める定理)
P(B|A) =
P(B)P(A|B)
P(B)P(A|B) + P(B)P(A|B)
.
..
[証明] 分子 = P(B ∩ A), 分母 = P(B ∩ A) + P(B ∩ A) =
P((B ∩ A) ∪ (B ∩ A)) = P((B ∪ B) ∩ A) = P(A) なので。
.
.
(参考)
.
定理 16.1
..
(ベイズの定理)
.
例 14
..
1
は広告メールである。メール
3
1
本文に money という単語が入る確率は,広告メールでは ,広告でな
10
1
いメールでは
である。あるメールに money という単語が入っていた
100
とするとき、このメールが広告メールである確率を求めよ。
.
..
.
.
.
ある人の受け取るすべてのメールのうち
(解)A =「money が含まれている」, B =「広告メールである」とすると求
める確率は、P(B|A) =
P(B)P(A|B)
P(B)P(A|B) + P(B)P(A|B)
=
1
3
1
3
·
·
1
10
1
2
1
10 + 3 · 100
5
= 。
6
この文脈で P(A) を事後確率、P(B) を事前確率と呼ぶ。
確率変数
§17 確率変数と確率分布
.
定義 10
..
標本空間から R(実数) への関数
.
.
.
.
.
.
.
.
を確率変数という。
.
..
.
注3
..
つまり確率変数は関数である。
.
..
.
注4
..
確率
P : 2Ω → R と対比せよ。
.
..
.
X:Ω→R
確率と確率変数の違いを表す図式
サイコロを 1 回投げ、確率変数 X = (目の数)2 − 3(目の数) を計算する
標本空間Ω = {1, 2, 3, 4, 5, 6}
事象 A = {2, 4}
事象 B = {1, 2, 3}
事象 C = {6}
Ω
X
C
P
A
6
18
5
10
4
3
B 1
0 1/6 1/3 1/2
1
R
4
0
2
-2
.
定義 11
..
1
.
P(X = x) = P(X = x となる事象) と定義する。すなわち、
P(X = x) = P(X −1 (x))
これを「X = x となる確率」という。
2
一般に P(X に関する条件) = P(X がその条件を満たす x 全体) と定義
し、これを、「X がその条件を満たす確率」という。(例)
P(a 5 X 5 b)。
.
.
.
.
.
..
.
.
注5
..
−1
.X (x) = {ω ∈ Ω | X(ω) = x}.
..
.
.
.
注6
..
PX (B) = P(X −1 (B)), B ⊂ R とおくと、これは、R 上の確率を与える。これ
.を確率変数 X の「確率法則」と呼ぶ。
..
.
.
定義 12
..
1 x の関数 P(X = x) を確率変数 X の確率分布という。
.
.
.
.
.
. 2 F(x) = P(X 5 x) を X の分布関数という。
..
.
注7
..
つまり、分布関数
F(x) とは、確率変数が x 以下である確率。
.
..
.
.
.
例 15
..
1 枚の硬貨を 1 回だけ投げ、上になった面を読み取る。
A 君は、表が出れば 1 万円払い、裏が出れば払わない。
この時 A 君の払う金額 X 万円を確率変数として捉えるとき、X の確率分
布の表を作れ。
[解] 標本空間は、Ω = { 表, 裏 } であり、確率は P({ 表 }) = P({ 裏 }) = 21 で
決定される。
また、X は、次で与えられる。
ω
X(ω)
表
1
裏
0
.
..
x
P(X = x)
0
1
1
2
1
2
x
F(x)
0
1
1
2
2
2
.
.
従って、X の確率分布と分布関数は次のようになる。
.
例 16
..
1 つのサイコロを振って出た目を a としたとき、X = a、とする。この
とき、
標本空間: Ω = { ,
,
,
,
,
}
確率: P({
}) = P({
}) = P({
}) = P({
}) = P({
}) = P({
であり、確率変数 X の定義は以下の通り:
ω
X(ω)
1
2
3
4
5
}) =
.
1
6
6
.
..
.
.
Table: X の定義
X の確率分布は以下の通り:
x
P(X = x)
1
2
3
4
5
6
1
6
1
6
1
6
1
6
1
6
1
6
Table: X の確率分布
X の分布関数は以下の通り:
x
F(x)
1
2
3
4
5
6
1
6
2
6
3
6
4
6
5
6
6
6
Table: X の確率分布関数
次の例は重要で、今後何度も引用する。
.
.
例 17
..
1 枚の硬貨を 1 回だけ投げ、上になった面を読み取る。
A 君は、表が出れば 1 万円払い、裏が出れば払わない。
B 君は、裏が出れば 1 万円払い、表が出れば払わない。
この時 A 君の払う金額を X 万円、B 君の払う金額を Y 万円として、確率
変数として捉えるとき、X, Y の確率分布の表を作れ。
[解] 標本空間は、Ω = { 表, 裏 } であり、確率は P({ 表 }) = P({ 裏 }) = 12 で
決定される。
また、X, Y は、次で与えられる。
ω
X(ω)
表
1
裏
0
ω
Y(ω)
表
0
裏
1
.
..
x
P(X = x)
0
1
1
2
1
2
x
P(Y = x)
0
1
1
2
1
2
.
.
従って、X, Y の確率分布は次のようになる。
.
.
注8
.
..
上の例に見るように、X, Y の確率分布は同等である。一般に確率分布や
.分布関数だけからもとの確率変数を復元できない。
..
.
.
.
例 18
..
白黒 2 つのサイコロを振って出た目を a, b としたとき、X = a + b とす
る。このとき · · ·
を (3, 2) などと書くことにする。標本空間は次のように
たとえば、
整理して書ける。
a\b
1
2
3
4
5
6
1
(1, 1)
(2, 1)
(3, 1)
(4, 1)
(5, 1)
(6, 1)
2
(1, 2)
(2, 2)
(3, 2)
(4, 2)
(5, 2)
(6, 2)
3
(1, 3)
(2, 3)
(3, 3)
(4, 3)
(5, 3)
(6, 3)
4
(1, 4)
(2, 4)
(3, 4)
(4, 4)
(5, 4)
(6, 4)
5
(1, 5)
(2, 5)
(3, 5)
(4, 5)
(5, 5)
(6, 5)
6
(1, 6)
(2, 6)
(3, 6)
(4, 6)
(5, 6)
(6, 6)
.
..
.
.
Table: 標本空間 Ω
それぞれの ω = (i, j) に対して X(ω) = i + j を与える対応が次の確率変数
X である。
a\b
1
2
3
4
5
6
1
2
3
4
5
6
7
2
3
4
5
6
7
8
3
4
5
6
7
8
9
4
5
6
7
8
9
10
5
6
7
8
9
10
11
Table: 確率変数 X の表
6
7
8
9
10
11
12
X の確率分布と分布関数は次のように与えられる。
x
P(X = x)
2
3
4
5
6
7
8
9
10
11
12
1
36
2
36
3
36
4
36
5
36
6
36
5
36
4
36
3
36
2
36
1
36
Table: X の確率分布
x
F(x)
···
0
2
3
4
5
6
7
8
9
10
11
12
···
1
36
3
36
6
36
10
36
15
36
21
36
26
36
30
36
33
36
35
36
36
36
36
36
Table: X の確率分布関数
.
.
.
.
例題 10
..
例
. 18 で、P(4 < X 5 8) は?
..
.
.
例 19
..
定数関数 X = c の確率分布は、確率がどのように与えられたとしても、
.
..
= δ xc (クロネッカーのデルタ).
.
.



1 x = c
P(X = x) = 

0 x , c
.
命題 17.1
..
分布関数の性質
F( − ∞) = 0, F(∞) = 1.
2
x 5 x′ =⇒ F(x) 5 F(x′ ).
3
右連続.
′
′
. 4 P(x < X 5 x ) = F(x ) − F(x).
..
.
.
1
.
確率変数にはその値域によって離散的なものと連続的なものがある。連
続的なものでは、しばしば確率分布 P(X = x) は 0 である。(分布関数は 0
でない)。
従って連続的確率変数では、確率分布ではなく、分布関数 F(x) が基本に
なる。また、確率分布の代わりに次の様な f (x) を考える。
.
定理 17.2
..
(確率密度)
.
X にそれなりの条件があれば、任意の
a, b に対して
∫
b
P(a 5 X 5 b) =
f (x)dx となる関数 f (x) がある。 f (x) を X の確率密度
.という。
..
[証明] f (x) = F′ (x) とせよ。
.
.
a
このとき、
.
命題 17.3
..
∫ ∞
−∞
2
3
f (x)dx = 1.
f (x) = 0.
∫
F(x) =
x
−∞
f (x)dx.
′
. 4 F (x) = f (x).
..
となる。
.
.
1
.
言
ムニ
0
X
とこ
帆
伊 (メ
ご 丈
)
鮮
/
対み
敏
す
コ
ャ
や
ヽ
玄 す
荘
メ
4ニ
代
めr
写 t賀
密 導 )
レー
路チ7(X=A)
寺一
と輸
撫線6う
ら叱帯「
締
.
例 20
..
(0 < x < 1).
.
.
.f (x) = 2x
..
.
.
.
例 21
..
確率密度関数が存在しない例
列車の到着時刻を X とし、必ず定刻 X = 0 に列車は到着するとする。分
布関数は、
x<0
x=0
であるが、通常の意味では確率密度
f (x) は存在しない。(例 19 参照)
.
..
.
.



0
F(x) = 

1
§18 確率変数の基本性質
.
.
定理 18.1
..
1 X を確率変数、y = g(x) を関数とするとき、合成関数 Y = g ◦ X も確
率変数である。Y を g(X) と書く。
X, Y を確率変数、z = g(x, y) を関数とするとき、Z = g(X, Y) も確率
変数である。ただし
Z(ω) = g(X(ω), Y(ω)) と定義する。
.
..
.
g(X) の確率分布は X の確率分布から g を用いて計算できる。
また一般に、g(X, Y) の確率分布も確定していて、同時確率分布 (後述) で
決定できるが、必ずしも X, Y それぞれの確率分布だけから決定されない。
.
例 22
.
..
2
1 X を確率変数とするとき、 X も確率変数。
. 2 X, Y を確率変数とするとき、cX(c は定数), X + Y, XY も確率変数。
..
.
.
.
2
.
.
例題 11
.
..
サイコロを振る。出た目を X とするとき、Y = X 2 − 3X の確率分布を求め
.なさい。
..
.
.
.
注9
.
..
次の例題に見るように、X + Y の確率分布でさえ、X, Y の確率分布だけ
.からは決定されない。もちろん、決定されないが定義はされている。
..
.
.
.
.
.
例 23
..
1 枚の硬貨を 1 回だけ投げ、上になった面を読み取る。
A 君は、表が出れば 1 万円払い、裏が出れば払わない。
B 君は、裏が出れば 1 万円払い、表が出れば払わない。
C 君は、表が出れば 1 万円払い、裏が出れば払わない。
この時 A、B、C 君の払う金額を X, Y, Z 万円とする。このとき、
.X, Y, Z, X + Y, X + Z の確率分布を作れ。
..
[解]
Ω = { 表, 裏 }, P({ 表 }) = P({ 裏 }) =
ω
X(ω)
表
1
裏
0
ω
Y(ω)
1
2
表
0
裏
1
ω
Z(ω)
表
1
裏
0
で、確率変数が定義されている。よって、それぞれの確率分布は、
[解]
Ω = { 表, 裏 }, P({ 表 }) = P({ 裏 }) =
ω
X(ω)
表
1
裏
0
ω
Y(ω)
1
2
表
0
裏
1
ω
Z(ω)
表
1
裏
0
で、確率変数が定義されている。よって、それぞれの確率分布は、
x
P(X = x)
0
1
1
2
1
2
[解]
Ω = { 表, 裏 }, P({ 表 }) = P({ 裏 }) =
ω
X(ω)
表
1
裏
0
ω
Y(ω)
1
2
表
0
裏
1
ω
Z(ω)
表
1
裏
0
で、確率変数が定義されている。よって、それぞれの確率分布は、
x
P(X = x)
0
1
1
2
1
2
x
P(Y = x)
0
1
1
2
1
2
[解]
Ω = { 表, 裏 }, P({ 表 }) = P({ 裏 }) =
ω
X(ω)
表
1
裏
0
ω
Y(ω)
1
2
表
0
裏
1
ω
Z(ω)
表
1
裏
0
で、確率変数が定義されている。よって、それぞれの確率分布は、
x
P(X = x)
0
1
1
2
1
2
x
P(Y = x)
0
1
1
2
1
2
x
P(Z = x)
0
1
1
2
1
2
[解]
Ω = { 表, 裏 }, P({ 表 }) = P({ 裏 }) =
ω
X(ω)
表
1
ω
Y(ω)
裏
0
1
2
表
0
裏
1
ω
Z(ω)
表
1
裏
0
で、確率変数が定義されている。よって、それぞれの確率分布は、
x
P(X = x)
0
1
1
2
1
2
x
P(X + Y = x)
x
P(Y = x)
0
1
2
0
1
0
0
1
1
2
1
2
x
P(Z = x)
0
1
1
2
1
2
[解]
Ω = { 表, 裏 }, P({ 表 }) = P({ 裏 }) =
ω
X(ω)
表
1
ω
Y(ω)
裏
0
1
2
表
0
裏
1
ω
Z(ω)
表
1
裏
0
で、確率変数が定義されている。よって、それぞれの確率分布は、
x
P(X = x)
0
1
1
2
1
2
x
P(X + Y = x)
x
P(Y = x)
0
1
2
0
1
0
0
1
1
2
1
2
x
P(Z = x)
0
1
1
2
1
2
0
1
2
1
2
0
1
2
x
P(X + Z = x)
この件については、例 24 、28 、33 、次章「複数の確率変数」の例 38 で
再び議論する。
§19 確率変数の平均値
確率変数 X 平均値 E(X) とは、X のおよその値の表現のひとつである。
.
定義 13
.
..
(離散的なケースの平均値) Ω が、事象 A1 , A2 , · · · に分割されているとす
る。確率変数 X が A1 , A2 , · · · で、 x1 , x2 , · · · という定値を取るとき、X
の平均値あるいは期待値とは、
∑
x1 P(A1 ) + x2 P(A2 ) + · · · =
xi P(Ai ).
.
.
.
.
のことであり、これを
E(X) と書く。
.
..
.
注 10
..
定義において、
xi に重複があってもよい。Ai には重なりはない。
.
..
.
i
.
.
.
例 24
..
1 枚の硬貨を 1 回だけ投げ、上になった面を読み取る。
A 君は、表が出れば 1 万円払い、裏が出れば払わない。
B 君は、裏が出れば 1 万円払い、表が出れば払わない。
この時 A 君の払う金額を X 万円、B 君の払う金額を Y 万円とする。X, Y
の平均 E(X), E(Y) を求めよ。
(解)
E(X) = 1 · P({ 表 }) + 0 · P({ 裏 }) = 1 · 12 + 0 · 12 = 12 。
1
1
1
.E(Y) = 0 · P({ 表 }) + 1 · P({ 裏 }) = 0 · 2 + 1 · 2 = 2 。
..
.
.
例 25
..
例 16 では、
.
E(X) =
.
..
.
.
.
.
E(X) = 1·P({ })+2·P({ })+3·P({ })+4·P({ })+5·P({ })+6·P({ })
1
1
1
1
1
1 7
=1· +2· +3· +4· +5· +6· = 。
6
6
6
6
6
6 2
.
..
.
.
例 26
.
..
例 18 では、
E(X) = 2 · P({(1, 1)}) + 3 · P({(1, 2)}) + 3 · P({(2, 1)}) + · · · + 12 · P({(6, 6)})
1
1
1
1
=2·
+3·
+3·
+ · · · + 12 ·
= 7。
36
36
36
36
.
..
.
.
例 27
.
..
X = コインを何回か投げて初めて表が出るまでの回数 では、
.
例 25
..
例 16 では、
.
.
})
.
.
.
.
.
.
E(X) = 1·P({ })+2·P({ })+3·P({ })+4·P({ })+5·P({ })+6·P({
1
1
1
1
1
1 7
=1· +2· +3· +4· +5· +6· = 。
6
6
6
6
6
6 2
.
..
.
例 26
..
例 18 では、
E(X) = 2 · P({(1, 1)}) + 3 · P({(1, 2)}) + 3 · P({(2, 1)}) + · · · + 12 · P({(6, 6)})
1
1
1
1
=2·
+3·
+3·
+ · · · + 12 ·
= 7。
36
36
36
36
.
..
.
例 27
..
X = コインを何回か投げて初めて表が出るまでの回数 では、
1
1
1
E(X) = 1 · + 2 · + 3 · + · · · =
2
4
8
.
..
.
.
定理 19.1
..
1 確率変数 X が x1 , x2 , · · · という互いに異なる値を取るとき、
E(X) =
∑
.
xi P(X = xi ).
i
E(X) は定義における事象の分割に依存しない。すなわち、E(X) は、
X (と P) にのみ依存する。
.
..
.
[証明] (1)Ai = {ω ∈ Ω|X(ω) = xi } とおく。(2) 定義に用いられる標本空間を
分割する事象は (1) の Ai の細分だから。
.
2
.
.
例題 12
.
..
サイコロを振る。出た目をそれぞれ X とするとき、Y = X 2 − 3X の平均値
.を求めなさい。
..
.
.
E(X) = 1 · P(X = 1) + 2 · P(X = 2) + 3 · P(X = 3) + 4 · P(X = 4) + 5 · P(X =
5) + 6 · P(X = 6)
1
1
1
1
1 7
1
=1· +2· +3· +4· +5· +6· = 。
6
6
6
6
6
6 2
.
..
.
.
.
.
.
.
例 28
..
例 24 において、前定理 (1) の計算方法で、E(X), E(Y) を求めると、
E(X) = 0 · P(X = 0) + 1 · P(X = 1) = 0 · 12 + 1 · 12 = 12 。
1
1
1
.E(Y) = 0 · P(Y = 0) + 1 · P(Y = 1) = 0 · 2 + 1 · 2 = 2 。
..
.
例 29
..
例 16 では、
2
3
4
5
6
7
8
9 10 11 12
x
1
2
3
4
5
6
5
4
3
2
1
P(X = x) 36
36
36
36
36
36
36
36
36
36
36
より、
E(X) = 2 · P(X = 2) + 3 · P(X = 3) + 4 · P(X = 4) + 5 · P(X = 5) + 6 · P(X =
6) + 7 · P(X = 7) + 8 · P(X = 8) + 9 · P(X = 9) + 10 · P(X = 10) + 11 · P(X =
11) + 12 · P(X = 12)
=
1
2
3
4
5
6
5
4
3
2
1
2· +3· +4· +5· +6· +7· +8· +9· +10· +11· +12· = 7
36
36
36
36
36
36
36
36
36
36
36
.である。これを定義による方法 (例 26 ) と比較せよ。
..
.
.
.
.
例 30
..
サイコロの例 18 で、この定理を使うと、
.
.
注 11
.
..
確率変数が分からなくても、確率分布 (密度) すなわち確率法則が分かれ
ば、その平均は決まる! 別の言葉でいえば、確率と確率変数は事象でパラ
.メトライズされているが、そのパラメータは平均から消去される。
..
.
.
.
定義 14
.
..
(連続的なケースの平均値) 確率変数 X を離散的な確率変数の極限で表現
し、離散的な平均値の極限で
E(X) を定義する。
.
..
.
.
定理 19.2
.
..
確率変数 X が (−∞, ∞) に値を持っているとする。 f (x) を X の確率密度と
するとき、
∫
∞
x f (x)dx.
−∞
.
..
.
[証明] 略。ちょっと難しい。条件を制限すればリーマン積分の範囲で可能
かも。
.
E(X) =
C二 :翌
tr CMコ
う手ギキ掌ユ苫1上
角
乱歌的平↓
主
文
云
ボ
L(X)=ネ
‖
)
CX‐
え
幾幾的平拘
丈吉〔
京
にはうとi津弓
)拭北
.
例 31
..
例 20 の f (x) = 2x
0
(0 < x < 1) では、
∫1
x · f (x) dx = 0 x · 2x dx = [ 23 x3 ]10 = 23 。
.
.
E(X)
=
.
..
∫1
.
E(X) =
.
..
.
.
.
.
.
.
.
143
宝くじの期待値は
。
300
.
..
.
コラム 3
..
宝くじの期待値は連番で買ってももバラで買ってもも同じ。
.
..
.
コラム 4
..
倍倍ゲームとねずみ講
X = 2コインを何回か投げて初めて表が出るまでの回数+1 では、
.
.
.
コラム 1
.
..
JR 福知山線脱線事故 (2005 年)。平均と重心。電車の重心。重力質量と慣
性質量。
.
..
.
.
コラム 2
.
..
.
.
.
.
.
.
.
143
宝くじの期待値は
。
300
.
..
.
コラム 3
..
宝くじの期待値は連番で買ってももバラで買ってもも同じ。
.
..
.
コラム 4
..
倍倍ゲームとねずみ講
X = 2コインを何回か投げて初めて表が出るまでの回数+1 では、
1
1
1
E(X) = 2 · + 4 · + 8 · + · · · =
2
4
8
.
..
.
.
.
コラム 1
.
..
JR 福知山線脱線事故 (2005 年)。平均と重心。電車の重心。重力質量と慣
性質量。
.
..
.
.
コラム 2
.
..
.
.
.
.
.
.
.
143
宝くじの期待値は
。
300
.
..
.
コラム 3
..
宝くじの期待値は連番で買ってももバラで買ってもも同じ。
.
..
.
コラム 4
..
倍倍ゲームとねずみ講
X = 2コインを何回か投げて初めて表が出るまでの回数+1 では、
1
1
1
E(X) = 2 · + 4 · + 8 · + · · · = ∞
2
4
8
.
..
.
.
.
コラム 1
.
..
JR 福知山線脱線事故 (2005 年)。平均と重心。電車の重心。重力質量と慣
性質量。
.
..
.
.
コラム 2
.
..
§20 平均の基本性質
.
定理 20.1
..
X を確率変数、g(x) を x の関数とするとき、
1
.
X が離散的である場合、{xi } を X の互いに異なる値域、
pi = P(X = xi ) を X の確率分布とすれば、
∑
E(g(X)) =
g(xi )pi .
i
2
X が連続的である場合、 f (x) は X の確率密度とすれば、
∫ ∞
g(x) f (x)dx.
E(g(X)) =
.
−∞
.
..
.
.
注 12
.
..
この定理をもって、E(g(X)) の定義とする教科書があり、例 32 に見るよ
うに計算が楽だが、g(X) が確率変数なので、2 重定義になってしまう。
また、E(g, X) と g を陽に書く必要もある。
[証明] (1) 定義から明らかであるが詳しく書くと、Ai = {ω ∈ Ω|X(ω) = xi }
は Ω の分割で、この上で g(X(ω)) =∑
g(xi ) の値は一定である。よって定義
∑
g(xi )pi .
13 の条件を満たすので、E(g(X)) =
g(xi )P(Ai ) =
i
i
(2) も平均値の定義から。ただし例によって極限の問題はある。
.
例 32
.
..
X が 31 の確率で −1, 0, 1 の値を取るとする。この定理によれば、
E(X 2 ) = (−1)2 13 + 02 13 + 12 13 = 23 と計算できる。もし、定理 19.1 を使って
X2
0 1
なので、
確率 13 23
となり、ややこしい。
2 ) = 02 1 + 12 2 =
E(X
3
3
.
..
2
3
.
.
しまうと、X 2 の確率分布が、
.
定理 20.2
..
(E(X) の性質)
1
.
k を定数の確率変数とするとき、
E(k) = k
2
X, Y を確率変数とするとき、
E(X + Y) = E(X) + E(Y)
特に、E(X + Y) は、X, Y の確率分布 (密度) で決定できる。
.
..
X を確率変数、k を定数とするとき、kX も確率変数であり、
E(kX) = kE(X)
.
.
3
[証明]
(1) 明らか。
(2) 明らか。明らかなのに、定理 19.1 を使った次のような証明が時々見ら
れる。
∑
Z = X + Y と置くと Z の確率分布は、P(Z = zk ) = xi +y j =zk pi j である。こ
∑
こに pi j = xi +y j =zk P(X = xi かつ Y = y j ) と置いた。
E(X + Y) =
∑
∑
zk P(Z = zk ) =
k
=
zk pi j =
k xi +y j =zk
=
∑
i
=
∑
xi
∑
pi j +
j
∑
j
xi P(X = xi ) +
i
pi j
xi +y j =zk
k
∑ ∑
∑
zk
∑
(xi + y j )pi j
i, j
yj
∑
∑
pi j
i
y j P(Y = y j )
j
= E(X) + E(Y)
だが、これは、自明なことを複雑に証明しているように見える。
また、別の良くやる証明は、X が f (X)、Y が g(X) という形をしている
ケースについて、定理 20.1 より、
∑
E( f (X) + g(X)) =
( f (xi ) + g(xi ))P(X = xi )
=
i
∑
f (xi )P(X = xi ) +
i
= E( f (X)) + E(g(X))
こちらの方がまし(?)
(3) 同様。
∑
i
g(xi )P(X = xi )
.
.
.
例 33
..
再び 23 、24 、28 の例を考える (次ページ参照)。E(X) = E(Y) = E(Z) = 12
がわかっているので X + Y の確率分布がわからなくとも、E(X + Y) は、
E(X) + E(Y) = 12 + 21 = 1 と確定する。
一方、E(XY) は、E(X), E(Y) だけからは決まらないし、X, Y の確率分布
からも決定できない。
実際、XY は定値関数 0 であり、Z は X に等しくこれは 0, 1 という値しか
とならいので、XZ = X 2 = X 。
よって、X, Y, Z の確率分布は全て等しい一方、
E(XY) = E(0) = 0, E(XZ) = 12 である。
これについては、次章「複数の確率変数」の例
38 で再び議論する。
.
..
.
(23 の再掲)
A 君が 1 枚の硬貨を 1 回だけ投げ、上になった面を読み取る。
B 君は、表が出れば A 君に 1 万円払い、裏が出れば払わない。
C 君は、裏が出れば A 君に 1 万円払い、表が出れば払わない。
D 君は、表が出れば A 君に 1 万円払い、裏が出れば払わない。
この時 B、C、D 君の払う金額を X, Y, Z 万円とする。
Ω = { 表, 裏 }, P({ 表 }) = P({ 裏 }) =
X(表) = 1, X(裏) = 0
Y(表) = 0, Y(裏) = 1
Z(表) = 1, Z(裏) = 0
x
0 1
1
P(X = x) 12
2
1
1
E(X) = 0 · 2 + 1 · 2 =
1
2
1
2
x
0 1
1
P(Y = x) 12
2
1
1
E(Y) = 0 · 2 + 1 · 2 =
x
0 1 2
P(X + Y = x) 0 1 0
E(X + Y) = 0 · 0 + 1 · 1 + 2 · 0 = 1
x
0
P(XY = x) 1
E(XY) = 0 · 1 = 0
1
2
x
0
P(Z = x) 12
E(Z) = 0 · 12 + 1 ·
x
P(X + Z = x)
E(X + Z) = 0 ·
0
1
2
2
0 12
+1·0+2·
1
2
1
2
=
1
2
=1
1
2
1
1
2
x
0 1
1
P(XZ = x) 12
2
1
1
E(XZ) = 0 · 2 + 1 · 2 =
1
1
2
§21 確率変数の分散
.
定義 15
..
(分散)X を確率変数とし、µ = E(X) とするとき、
.
.
.
V(X) = E((X − µ)2 )
√
.を X の分散という。σ(X) = V(X) を標準偏差という。
..
.
.
注 13
.
..
分散とは、その確率変数がどのぐらい多様な値を取るかを表したもので
ある。特に、
「V(X) = 0 =⇒ X = 定値」が言える。
.
..
.
.
定理 21.1
..
(V(X) の性質)
k を定数の確率変数とするとき、V(k) = 0。
2
k を定数の確率変数とするとき、V(X + k) = V(X)。
2
. 3 X を確率変数、k を定数とするとき、V(kX) = k V(X)。
..
.
.
1
.
.
定理 21.2
..
.
.
V(X)
= E(X 2 ) − E(X)2 .
.
..
[証明] ストレートな計算による。
.
.
..
E((X − m)2 ) は、m = E(X) の時、最小値 V(X) を取る。
.
.
.
.
注 14
..
2
2
2
(別証) 任意の m について、E((X − m) ) = E(m − 2mX + X ) =
m2 − 2E(X)m + E(X 2 ) = (m − E(X))2 + E(X 2 ) − E(X)2 がいえる。ここで、
m = µ と置けばよい。結局、任意の m について、
E((X − m)2 ) = (m − E(X))2 + V(X) がいえるので、
.
例 34
..
.
コインを投げて表で 1 点、裏で 0 点 (例 24 ):
x
P(X = x)
0
1
1
2
1
2
では、
(定義による計算) E(X) = 12 ,
V(X)
1
E((X − )2 )
2
1 2 1
1
1
(0 − ) · + (1 − )2 ·
2
2
2
2
1
.
4
=
=
=
(定理 21.2 による計算) E(X) = 12 ,
.
..
よって、V(X) = E(X 2 ) − E(X)2 =
1
2
=
02 ·
=
1
2
1
1
+ 12 ·
2
2
− ( 21 )2 = 14 .
.
.
E(X 2 )
.
例 35
..
.
x
P(X = x)
サイコロの例 16 :
1
2
3
4
5
6
1
6
1
6
1
6
1
6
1
6
1
6
では、
(定義による計算) E(X) = 72 ,
V(X)
=
=
=
7
E((X − )2 )
2
7 2 1
7
1
7
1
7
1
(1 − ) · + (2 − )2 · + (3 − )2 · + (4 − )2 ·
2
6
2
6
2
6
2
6
7 2 1
7 2 1
+(5 − ) · + (6 − ) ·
2
6
2
6
35
.
12
(定理 21.2 による計算) E(X) = 72 ,
.
..
=
12 ·
=
91
6
1
1
1
1
1
1
+ 22 · + 32 · + 42 · + 52 · + 62 ·
6
6
6
6
6
6
よって、V(X) = E(X 2 ) − E(X)2 =
91
6
− ( 27 )2 =
35
.
12
.
.
E(X 2 )
サイコロの例 18 :
x
P(X = x)
2
3
4
5
6
7
8
9
10
11
12
1
36
2
36
3
36
4
36
5
36
6
36
5
36
4
36
3
36
2
36
1
36
では、
(定義による計算) E(X) = 7,
V(X)
=
=
E((X − 7)2 )
1
2
3
(2 − 7)2 ·
+ (3 − 7)2 ·
+ (4 − 7)2 ·
36
36
36
4
5
6
+(5 − 7)2 ·
+ (6 − 7)2 ·
+ (7 − 7)2 ·
36
36
36
5
4
3
+(8 − 7)2 ·
+ (9 − 7)2 ·
+ (10 − 7)2 ·
36
36
36
2
1
35
+(11 − 7)2 ·
+ (12 − 7)2 ·
=
.
36
36
6
(定理 21.2 による計算) E(X) = 7,
E(X 2 )
=
1
2
3
4
5
6
+ 32 ·
+ 42 ·
+ 52 ·
+ 62 ·
+ 72 ·
36
36
36
36
36
36
4
3
2
1
329
5
+ 92 ·
+ 102 ·
+ 112 ·
+ 122 ·
=
+82 ·
36
36
36
36
36
6
22 ·
よって、V(X) = E(X 2 ) − E(X)2 = 329/6 − 72 =
35
.
6
例 20 : f (x) = 2x (0 5 x 5 1) では、
(定義による計算) E(X) = 23 ,
V(X)
2
E((X − )2 )
3
∫ 1
2
(x − )2 · 2xdx
3
0
∫ 1
8
8
(2x3 − x2 + x)dx
3
9
0
1
.
18
=
=
=
=
(定理 21.2 による計算) E(X) = 23 ,
∫
E(X 2 )
1
=
x2 · 2xdx
∫
0
1
=
2x3 dx
0
=
よって、V(X) = E(X 2 ) − E(X)2 =
1
2
1
.
2
− ( 32 )2 =
1
。
18
.
定義 16
..
X, Y を確率変数とし、µX = E(X), µY = E(Y) とおくとき、
.
Cov(X, Y) = E((X − µX )(Y − µY ))
.
.
.
.を X と Y の共分散という。
..
.
.
注 15
.
..
V(X)
= Cov(X, X) である。
.
..
.
.
注 16
.
..
共分散とは、その 2 つの確率変数がどのぐらい「共起」するかを表した
ものである。
.
..
.
.
.
練習問題 2
.
..
A、B 二つの硬貨を投げ、「A が表なら X = 1、裏なら X = 0」、「B が表な
ら Y = 0、裏なら Y = 1」と確率変数 X, Y を定義する。Cov(X, Y) を求
.めよ。
..
.
.
.
練習問題 3
.
..
A、B 二つの硬貨を投げ、「A が表なら X = 1、裏なら X = 0」、「A(B じゃ
なくて) が表なら Y = 0、裏なら Y = 1」と確率変数 X, Y を定義する。
Cov(X,
Y) を求めよ。
.
..
.
.
定理 21.3
..
.
(Cov(X, Y) の性質)
2
k, k′ を定数の確率変数、X, Y を確率変数とするとき、
Cov(X + k, Y + k′ ) = Cov(X, Y)。
3
X, Y を確率変数とするとき、Cov(X, Y) = Cov(Y, X)。
4
X, Y を確率変数、k を定数とするとき、Cov(kX, Y) = kCov(X, Y)。
5
.
..
k を定数の確率変数、Y を確率変数とするとき、Cov(k, Y) = 0。
X, X ′ , Y を確率変数、k を定数とするとき、
Cov(X + X ′ , Y) = Cov(X, Y) + Cov(X ′ , Y)。
.
.
1
.
定理 21.4
..
.
.
.
.
.
Cov(X,
Y) = E(XY) − E(X)E(Y)
.
..
[証明] ストレートな計算による。
.
注 17
..
任意の m, n について、
E((X − m)(Y − n)) = (m − E(X))(n − E(Y)) + E(XY) − E(X)E(Y) =
.(m − E(X))(n − E(Y)) + Cov(X, Y) 。
..
.
§22 共分散行列
.
この節は試験範囲外である。
共分散行列という概念を用いると、分散と共分散は統一的に扱うとこと
ができる。
( )
X
⃗
今、X, Y を同一の確率 (標本) 空間上の確率変数として、X =
と置く。
Y
(
) ( )
⃗ = E(X) = µX とおくとき、
⃗µ = E(X)
E(Y)
µY
(
)
t
(X − µX )2
(X − µX )(Y − µY )
⃗
⃗
(X − ⃗µ) (X − ⃗µ) =
となる。
(X − µX )(Y − µY )
(Y − µY )2
.
.
定義 17
..
(
)
V(X)
Cov(X, Y)
⃗ = E((X
⃗ − ⃗µ) t (X
⃗ − ⃗µ)) =
V(X)
と書き、これを
Cov(X, Y)
V(Y)
( )
⃗ = X の共分散行列と言う。
X
Y
.
..
.
次の定理と系は、定理 21.2 、21.4 の拡張である。
.
定理 22.1
..
⃗ に対し、
任意のベクトル m
t
⃗ −m
⃗ −m
⃗ − ⃗µ) (X
⃗ − ⃗µ)) + E((⃗
⃗ ) (X
⃗ )) = E((X
E((X
m − ⃗µ) t (⃗
m − ⃗µ))
t
⃗ + E((⃗
= V(X)
m − ⃗µ) (⃗
m − ⃗µ)).
.
..
[証明]
t
⃗ −m
⃗ −m
(X
⃗ ) (X
⃗)
.
.
t
.
t
=
⃗ − ⃗µ − (⃗
⃗ − ⃗µ − (⃗
(X
m − ⃗µ)) (X
m − ⃗µ))
=
⃗ − ⃗µ) (X
⃗ − ⃗µ) − (X
⃗ − ⃗µ) t (⃗
⃗ − ⃗µ)
(X
m − ⃗µ) − (⃗
m − ⃗µ) (X
t
⃗
+(X − ⃗µ) (⃗
m − ⃗µ).
t
t
.
⃗ − ⃗µ) = E( t (X
⃗ − ⃗µ)) = 0 より、目的の式
ここで、両辺 E( ) をすると、E(X
が得られる。
.
.
系 22.2
..
t
t
⃗ − E(X)
⃗ E(X).
⃗
⃗ = E(X
⃗ X)
V(X)
.
..
.
⃗ = 0 と置け。
[証明] 上の定理で m
.
注 18
.
..
⃗ を用いると、次のようなことはすぐわかる。
V(X)
「X, Y が無相関、A が直
( )
( )
.
X′
X
交行列であるとき、 ′ = A
で定義される X ′ , Y ′ は、無相関である。」
Y
Y
.
..
.
様々な確率変数
ここでは、幾つかの良く現れる確率変数を紹介する。
§23 離散的な確率分布
確率変数の情報がなくても、その確率分布が分かれば、平均、分散など
は分かる。しばらく、確率分布を問題にする。
§24 当たるか外れるか
(ベルヌーイ分布)
確率変数 X の取り得る値が {0, 1} で、確率分布が
P(X = 1) = p, P(X = 0) = 1 − p
であるとき、E(X) と V(X) を求めよ。
§25 2 項分布 B(n, p)
確率分布
P(X = x) = n C x p x (1 − p)n−x ,
x = 0, · · · , n
を 2 項分布と呼び B(n, p) と書く。
(意味) 事象 A の起こる確率を p とするとき、それを n 回繰り返し、A が x
回起こる確率。また、独立なベルヌーイ分布の n 個の和とも言える。
.
定理 25.1
..
E(X) = np.
. 2 V(X) = np(1 − p).
..
[証明]
n
∑
1
x · n C x p (1 − p)
x
x=0
2
E(X 2 ) =
n
∑
x=0
.
n−x
= np
n
∑
n−1 C x−1 p
x=1
x2 · n C x p x (1− p)n−x = np
n
∑
x−1
(1 − p)n−1−(x−1) = np.
x· n−1 C x−1 p x−1 (1− p)n−1−(x−1) =
x=1
n
∑
np(1 +
(x − 1) · n−1 C x−1 p x−1 (1 − p)n−1−(x−1) ) = np(1 + (n − 1)p)n−1 .
x=1
よって、V(X) = np(1 + (n − 1)p) − (np)2 = np(1 − p).
.
1
.
.
.
注 19
.
..
実はこの計算は、確率変数の独立性を用いて、第 149 章定理 34.3 を用い
.ると簡単になる。
..
.
§26 多項分布
まず、ベルヌーイ分布の「多項版」を考える。
独立な事象、A, B, C が起こる確率が、 pA , pB , pC (pA + pB + pC = 1)
であるとする。このとき、A の上でのみ 1 という値を取る確率変数を XA 、
B の上でのみ 1 という値を取る確率変数を XB 、C の上でのみ 1 という値
を取る確率変数を XC とするとき、
.
.
定理 26.1
..
1 E(XA ) = pA .
V(XA ) = pA (1 − pA ).
. 3 Cov(XA , XB ) = −pA pB .
..
である。なぜなら、(3) のみ証明すると、XA XB = 0 なので、
Cov(XA , XB ) = E(XA XB ) − E(XA )E(XB ) = −pA pB である。
.
.
2
xA + xB + xC = n であるとき、(xA , xB , xC ) を多項係数として、
P(XA = xA , XB = xB , XC = xC ) = (xA , xB , xC )pA xA pB xB pC xc
を多項分布と呼ぶ。(この場合 3 項)
(意味) 事象 A, B, C の起こる確率を pA , pB , pC とするとき、 xA + xB + xC
回の試行で、A, B, C がそれぞれ xA , xB , xC 回起こる確率。
.
.
定理 26.2
..
1 E(XA ) = npA .
V(XA ) = npA (1 − pA ).
. 3 Cov(XA , XB ) = −npA pB .
..
[証明] 多項版ベルヌーイ分布の定理の n 倍。
.
.
2
§27 ポアソン (Simeon Poisson) 分布
λ x −λ
e
(x = 0, 1, 2, · · · ).
x!
(意味)2 項分布で、λ = np を固定し、 p → 0, n → ∞ とした近似。
.
注 20
..
1 λ = np とすると、 lim P(2 項分布 = k) = P(ポアソン分布 = k)。
P(X = x) =
.
2
3
.
..
この分布は x + λ の時最大値を取る。
∞
∑
λ x −λ
e = 1 はマクローリン展開で証明できる。
x!
x=0
.
.
n→∞
.
定理 27.1
..
ポアソン分布 X について、
E(X) = λ.
. 2 V(X) = λ.
..
[証明]
1
2
.
∞
∞
∑
λ x −λ ∑ λy+1 −λ
E(X) =
x e =
e = λ.
x!
y!
x=0
y=0
λ x −λ ∑
λy+1 −λ
e =
(y + 1)
e =
x!
y!
x=0
y=0
∞
∞
∑
λy+1 −λ ∑ λy+1 −λ
y
e +
e = λ · λ + λ よって、
y!
y!
y=0
y=0
E(X 2 ) =
∞
∑
∞
x2
V(X) = E(X 2 ) − E(X)2 = λ2 + λ − λ2 = λ.
.
1
.
(例) ある工場で作る液晶ディスプレイは 1 日平均 2 個不良品が出る。あ
る日に 2 個出る確率は幾つか?
(例) ある工場で作る液晶ディスプレイは 1 日平均 2 個不良品が出る。あ
る日に 2 個出る確率は幾つか?
(答)
22 −2
e = 0.2706.
2
§28 連続的な確率分布
§29 一様分布

1



(a 5 x 5 b)

f (x) = 
b−a


0 (他)
(意味) ある期間でランダムに起こる。起こるのは確実。
.
定理 29.1
..
一様分布 X について、
.
..
2
a+b
.
2
(b − a)2
V(X) =
.
12
E(X) =
.
.
1
.
§30 指数分布



λe−λx (x > 0)
f (x) = 

0 (他)
(意味) 単位あたりの発生回数がポワソン分布の時の、発生間隔の分布。
【証明】t 時間で現象が X 回起こるとすると、P(X = x) =
(λt) x −λt
e . よっ
x!
て、Y = 現象が初めて出現する時間 とすると、
P(Y = t) = 1 − P(Y < t) = 1 − P(X = 0) = 1 − e−λt 。よって、
d
f (t) = P(Y = t) = λe−λt 。
dt
.
定理 30.1
..
指数分布 X について、
2
3
.
..
1
.
λ
1
V(X) = 2 .
∫λ
E(X) =
x
F(x) =
0
f (x)dx = 1 − e−λx .
.
.
1
.
§31 正規分布
次の確率密度関数で表される分布を正規分布と言い、N(µ, σ2 ) と書く。
f (x) = √
1
2πσ
1 x−µ 2
σ )
e− 2 (
.
N(0, 1) を標準正規分布と言う。
. −∞
..
e
.
2
− x2
dx =
√
2π.
.
.
.
注 21
. .∫ ∞
.
定理 31.1
..
正規分布 N(µ, σ) に従う X について、
E(X) = µ.
2
. 2 V(X) = σ .
..
.
.
1
.
X が N(µ, σ2 ) に従うなら、Z =
X−µ
は、N(0, 1) に従い、
σ
P(a 5 X 5 b) = P(
a−µ
b−µ
5Z5
).
σ
σ
である。X から Z を作ることを「標準化」と言う。
.
.
.
.
問題 1
..
(教科書 p.43 例 2.19) 確率変数 X が N(50, 102 ) に従うとき、
P(35
5 X 5 75) を求めよ。
.
..
.
.
問題 2
.
..
(教科書 p.43 例 2.20) ある学校で新入生の身長が平均値 166cm、標準偏差
7cm だった。身長が正規分布に従うとすると、身長が 173cm 以上の学生
は全体の何
%いるか
.
..
.
§32 変数の変換
この項は授業範囲外である。一般に確率変数の X の確率密度関数を fX ,
確率分布関数を F X と書くことにする。
.
定理 32.1
.
..
確率変数 X, Y に対し、微分可能な単調増加関数 ϕ で Y = ϕ(X) の関係が
あるとき、y = ϕ(x) なら、
1
fX (x)
ϕ′ (x)
が成り立つ。
.
..
[証明] FY (y) = F X (x) に注意すると,
d
F(x)
d
fX (x)
d
fY (y) = FY (y) = F X (x) = dx dy = ′ 。
dy
dy
ϕ (x)
dx
.
.
fY (y) =
.
定理 32.2
..
X が N(0, 1) に従うなら,X 2 の確率密度関数は
である。
.
..
[証明] 上の定理を使う。
1
2πx
e− 2 x
1
.
.
√
.
複数の確率変数
この章では複数の確率変数を同時に考える。
§33 同時確率分布、同時確率密度関数
今標本空間 Ω 上の確率 P( ) を一つ固定して考え、Ω 上の 2 つの確率変数
X, Y を考える。
この節のテーマを扱う幾つかの場合、Ω は、
Ω1 × Ω2 = {(ω1 , ω2 )|ω1 ∈ Ω1 , ω2 ∈ Ω2 } の様に直積の形をしている。
.
例 36
..
「2 枚のコインを投げる」と言ったとき、標本空間は、
Ω = {(表, 表), (表, 裏), (裏, 表), (裏, 裏)} であるが、実はこれは、
Ω1 = { 表, 裏 }, Ω2 = { 表, 裏 } としたとき、
.
Ω = Ω1 × Ω2
と書ける。しばしばこれを
ω2 \ ω1
表
裏
表
(表, 表)
(裏, 表)
裏
(表, 裏)
(裏, 裏)
と書いたりする。
また、P({(ω1 , ω2 )}) = P({ω1 })P({ω2 }) で「定義」する。すなわち、
P({(表, 表)}) = P({(表, 裏)}) = P({(裏, 表)}) = P({(裏, 裏)}) = 14 とする。ごれ
.が、「2 枚のコインを投げる」ということの本質である。
..
.
.
Ω:
.
.
.
.
定義 18
..
(当たり前みたいだけど) X, Y を確率変数とするとき、
P(X に関する条件, Y に関する条件) =
P(X に関する条件と Y に関する条件が同時に成り立つという事象)
と定義する。
.
..
.
.
定義 19
.
..
(同時確率分布)X, Y を確率変数とするとき、 x, y の関数 P(X = x, Y = y)
.を (2 次元) 同時確率分布という。P((X, Y) = (x, y)) とも書く。
..
.
次の定理は、わざわざ定理とする必要はないが、後に述べる連続ケース
との対比のため述べる。
.
定理 33.1
.
..
確率変数 X, Y の値域が離散な値 {xi }i , {y j } j であるとき、
pi j = P(X = xi , Y = y j ) とおくと
∑
P((X, Y) ∈ D) =
pi j
が全ての
R2 の部分集合 D について成り立つ。
.
..
.
.
(xi , y j )∈D
.
.
注 22
..
1 2 つの確率変数 X と Y が与えられただけで、同時確率分布は得られ
る。このことは、しばしば誤解されている。
3
.
..
標本空間が Ω = Ω1 × Ω2 と直積の形をしていても、確率が
P({(ω1 , ω2 )}) = P({ω1 })P({ω2 }) と積で与えられているとは限らない。
これもよく誤解されている。
Ω 上に2つの確率変数 X, Y が定義されているからといって、
P(X = x, Y = y) = P(X = x)P(Y = y) が成り立つとは限らない。
.
.
2
.
.
定義 20
.
..
確率変数 X の確率分布を同時確率変数 (X, Y) における X の周辺確率分布
という。
また、確率変数 Y の確率分布を同時確率変数 (X, Y) における Y の周辺確
.率分布という。
..
.
.
定理 33.2
..
確率変数 X, Y の値域が離散な値 {(xi , y j )}i j であるとき、
pi j = P(X = xi , Y = y j ) とおくと、周辺確率分布は次で与えられる。
P(X = xi ) =
∑
.
pi j .
j
.
..
∑
i
pi j .
.
.
P(Y = y j ) =
.
.
例 37
..
「2 枚のコインを投げる。X =1 枚目が表なら 1 裏なら 0、Y =2 枚目が表
なら 1 裏なら 0。」と言ったときの同時確率分布表を書く。
X と Y の同時確率分布表 P(X = x, Y = y):
y\x
0
1
0
1
1
4
1
4
1
4
1
4
.
..
x
P(X = x)
0
1
1
2
1
2
y
P(Y = y)
0
1
1
2
1
2
.
.
周辺確率分布は次のようになる。
.
例 38
..
.
1
,
2
X(表) = 1, X(裏) = 0, Y(表) = 0, Y(裏) = 1, Z(表) = 1, Z(裏) = 0 につい
て、X, Y の同時確率分布表と、X, Z の同時確率分布表と、X, Y, Z の周
辺確率分布を書いてみよう。
.
..
.
.
前章例 23 の X, Y, Z すなわち、Ω = { 表, 裏 }, P({ 表 }) = P({ 裏 }) =
.
例 38
..
.
1
,
2
X(表) = 1, X(裏) = 0, Y(表) = 0, Y(裏) = 1, Z(表) = 1, Z(裏) = 0 につい
て、X, Y の同時確率分布表と、X, Z の同時確率分布表と、X, Y, Z の周
辺確率分布を書いてみよう。
前章例 23 の X, Y, Z すなわち、Ω = { 表, 裏 }, P({ 表 }) = P({ 裏 }) =
y\x
0
1
z\x
X と Z の同時確率分布表:
0
1
X と Y の同時確率分布表:
0
0
1/2
0
1/2
0
1
1/2
0
1
0
1/2
.
..
x
P(X = x)
0
1
1
2
1
2
y
P(Y = y)
0
1
1
2
1
2
z
P(Z = z)
0
1
1
2
1
2
.
.
以下の様に、周辺確率分布は、単に X, Y, Z の確率分布である。
.
例 39
..
サイコロを 2 つ振ったときの 1 つめの目 X と 2 つめの目 Y 。
Ω = {1, 2, 3, 4, 5, 6} × {1, 2, 3, 4, 5, 6}.
x, Y = y)
5
6
1/36 1/36
1/36 1/36
1/36 1/36
1/36 1/36
1/36 1/36
1/36 1/36
.
.
.
..
X と Y の同時確率分布表 P(X =
y\x
1
2
3
4
1
1/36 1/36 1/36 1/36
2
1/36 1/36 1/36 1/36
3
1/36 1/36 1/36 1/36
4
1/36 1/36 1/36 1/36
5
1/36 1/36 1/36 1/36
6
1/36 1/36 1/36 1/36
.
x
P(X = x)
y
P(Y = y)
X の周辺確率分布
1
2
3
4
1/6 1/6 1/6 1/6
Y の周辺確率分布
1
2
3
4
1/6 1/6 1/6 1/6
5
1/6
6
1/6
5
1/6
6
1/6
.
例 40
..
サイコロを 1 つ振ったときの上側 X と手前側 Y 。
Ω = {1, 2, 3, 4, 5, 6} × {1, 2, 3, 4, 5, 6}.
X と Y の同時分布表 P(X = x,
1
2
3
4
0
1/24 1/24 1/24
1/24
0
1/24 1/24
1/24 1/24
0
0
1/24 1/24
0
0
1/24
0
1/24 1/24
0
1/24 1/24 1/24
Y = y)
5
1/24
0
1/24
1/24
0
1/24
6
0
1/24
1/24
1/24
1/24
0
.
.
.
..
y\x
1
2
3
4
5
6
.
x
P(X = x)
y
P(Y = y)
X の周辺確率分布
1
2
3
4
1/6 1/6 1/6 1/6
Y の周辺確率分布
1
2
3
4
1/6 1/6 1/6 1/6
5
1/6
6
1/6
5
1/6
6
1/6
.
例 41
..
1 例 39 で、P(3 5 X 5 4, 3 5 Y 5 4) を求める。
D = {(3, 3), (3, 4), (4, 3), (4, 4)} であり、
P((X, Y) ∈ D) =
∑
.
P(X = x, Y = y)
(x, y)∈D
= P(X = 3, Y = 3) + P(X = 3, Y = 4)
+P(X = 4, Y = 3) + P(X = 4, Y = 4)
= 1/36 + 1/36 + 1/36 + 1/36 = 1/9.
2
例 40 で、P(3 5 X 5 4, 3 5 Y 5 4) を求める。
D = {(3, 3), (3, 4), (4, 3), (4, 4)} であり、
∑
P((X, Y) ∈ D) =
P(X = x, Y = y)
(x, y)∈D
= P(X = 3, Y = 3) + P(X = 3, Y = 4)
.
..
= 0 + 0 + 0 + 0 = 0.
.
.
+P(X = 4, Y = 3) + P(X = 4, Y = 4)
.
定理 33.3
..
(同時確率密度)X, Y を連続的な確率変数とするとき、
.
∫
P((X, Y) ∈ D) =
f (x, y)dxdy
D
.
.
が全ての R2 の部分集合 D について成り立つような、関数 f (x, y) がほぼ
.存在する。
..
.
∂2
[証明] f (x, y) =
P(X 5 x, Y 5 y) と置け。
∂x∂y
.
注 23
.
..
実は X = Y のような単純なケースでもこの定理は成り立たず、なかなか
一筋縄ではいかない。
.
..
.
上の f (x, y) を X と Y の同時確率密度関数という。
.
.
定理 33.4
..
同時確率変数 (X, Y) によって誘導された確率変数 X, Y の密度関数は以下
で与えられる。
f1 (x) =
f2 (y) =
∞
∫−∞
∞
f (x, y)dy.
f (x, y)dx.
−∞
.
..
これらを ( f による)X, Y の周辺確率密度関数いう。
[証明] 略。
.
.
∫
.
例 42
..



4xy (0 5 x 5 1, 0 5 y 5 1)
確率密度関数が f (x, y) = 
で与えられる確

0 (その他)
率分布に対し、P(0 5 X 5 12 , 0 5 Y 5 12 ) 及び、周辺確率密度を求める。
1
1
P(0 5 X 5 , 0 5 Y 5 ) =
2
2
∫
1
2
0
∫
f1 (x) =
∫
1
2
4xydxdy =
0
1
.
1
,
16
4xydy = 2x,
0
.
..
0
1
4xydx = 2y.
.
.
∫
f2 (y) =
.
例 43
..
.



 x + y (0 5 x 5 1, 0 5 y 5 1)
確率密度関数が f (x, y) = 
で与えられる

0 (その他)
確率分布に対し、P(0 5 X 5 12 , 0 5 Y 5 12 ) 及び、周辺確率密度を求める。
.
..
∫
1
2
∫
1
2
1
(x + y)dxdy = ,
8
0
0
∫ 1
1
f1 (x) =
(x + y)dy = x + ,
2
0
∫ 1
1
f2 (y) =
(x + y)dx = y + .
2
0
.
.
1
1
P(0 5 X 5 , 0 5 Y 5 ) =
2
2
.
例 44
..
2
3
.
..
X = 気温、Y = 湿度。
X と定数値 k の同時確率密度関数は f (x)δ(y − k) である。ここで、
f (x) は X の確率密度関数。
X と X の同時確率密度関数は f (x)δ(y − x) である。ここで、 f (x) は X
の確率密度関数。
.
.
1
.
.
定理 33.5
..
確率変数 X, Y の値域が離散な値 {xi }i , {y j } j であるとき、
pi j = P(X = xi , Y = y j ) とおくと、2 変数関数 g(x, y) に対して
E(g(X, Y)) =
∑
.
g(xi , y j )pi j
.が成り立つ。
..
.
[証明] 事象 Ai j = {ω ∈ Ω|X(ω) = xi かつ Y(ω) = y j } 上での g の値は
g(xi , y j ) で一定であり、Ai j は Ω の分割である。よって、P(Ai j ) = pi j と定
義 13 より。
.
i, j
.
定理 33.6
.
..
確率変数 X, Y の値域が連続で f (x, y) を同時確率密度関数とするとき、2
変数関数 g(x, y) に対して
E(g(X, Y)) =
が成り立つ。
.
..
[証明] 略。
∞
−∞
∫
∞
−∞
g(x, y) f (x, y)dxdy
.
.
∫
.
練習問題 4
..
次の例について、E(XY) を求めよ。
2 枚のコインの例 37 。
2
1 枚のコインの例 38 。
3
2 個のさいころの例 39 。
4
1 個のさいころの例 40 。
5
確率密度が 4xy の例 42 。
. 6 確率密度が x + y の例 43 。
..
.
.
1
.
§34 確率変数の独立
.
.
定義 21
..
(確率変数の独立) 確率変数 X, Y が (P に関して) 独立であるとは、「X に関
する条件を満たす事象」と「Y に関する条件を満たす事象」とが常に (P
に関して) 独立であるときに言う。すなわち、
であるときに言う。
.
..
.
.
P(X に関する条件, Y に関する条件) = P(X に関する条件) · P( Y に関する条件)
.
定理 34.1
.
..
Ω が離散の時には、確率変数 X, Y が独立であることは、任意の a, b ∈ R
に対して
P(X = a, Y = b) = P(X = a) · P(Y = b)
.
.と同値。
..
.
[証明] 明らか。
.
.
定理 34.2
..
Ω が連続の時には、確率変数 X, Y が独立であることは、 f を、X, Y の同
時確率確率密度 f1 , f2 を X, Y の周辺確率密度として、
が成り立つことと同値。
.
..
[証明] 略。
.
.
f (x, y) = f1 (x) · f2 (y)
.
例 45
..
1 定数値と任意の確率変数は独立である。
2 枚のコインの例 37 の X, Y は独立である。
3
1 枚のコインの例 38 の X, Y, Z は独立でない。
4
2 個のさいころの例 39 の X, Y は独立である。
5
1 個のさいころの例 40 の X, Y は独立でない。
6
確率密度が 4xy の例 42 の X, Y は独立である。
. 7 確率密度が x + y の例 43 の X, Y は独立でない。
..
.
.
2
.
1
Y と Z の同時確率分布表を書きなさい。
2
Y と Z の周辺確率分布を書きなさい。
. 3 Y と Z は独立か?
..
.
.
.
例題 13
.
..
2 枚のコイン A, B を投げ、
W =「A が表なら 0 裏なら 1」, X =「B が表なら 0 裏なら 1」とし、さらに
Y = W + X, Z = W − X とする。次の問いに答えなさい。
.
定理 34.3
..
X と Y が独立な確率変数であるとき、
f (X) と g(Y) も独立。
2
E(XY) = E(X)E(Y).
3
Cov(X, Y) = 0.
4
V(X + Y) = V(X) + V(Y).
2
2
. 5 V(XY) = V(X)V(Y) + E(X) V(Y) + V(X)E(Y) .
..
.
.
1
.
[証明]
1
2
確率変数 X, Y の値域が離散な値 {xi }i , {y j } j であるとき、
pi j = P(X = xi , Y = y j ) とおくと、 pi , p j を X, Y の周辺確率だとすれ
ば、独立性より pi j = pi p j 。よって定理 33.5 より、
∑
∑
∑
∑
E(XY) = i, j xi y j pi j = i, j xi y j pi p j = ( i xi pi )( j y j p j ) = E(X)E(Y)
が成り立つ。
連続ケースは略。
3
定理 21.4 より、 Cov(X, Y) = E(XY) − E(X)E(Y) = 0.
4
そもそも V(X + Y) = V(X) + 2Cov(X, Y) + V(Y) である。
5
明らか。
V(XY) = E((XY)2 ) − E(XY)2 = E(X 2 )E(Y 2 ) − E(X)2 E(Y)2 =
(V(X) + E(X)2 )(V(Y) + E(Y)2 ) − E(X)2 E(Y)2 = 右辺。
§35 確率変数の直積 (試験範囲外)
【クイズ】任意の確率変数に対しその平均値は確定する。任意の確率変
数 X, Y に対し XY も確率変数である。では、X, Y が独立でなく一般の場
合、XY の平均値が確定しないのはなぜか?
(答) これは誤解である。XY の確率分布は確定し、XY の平均値も確定し
ている。ただ、XY の確率分布が X, Y それぞれの確率分布からは確定 (表
現) できないので、当然 XY の平均値は X, Y それぞれの平均値等で表現
できないだけである。
これは、平均値が確率変数 (によるパラメトライズ) によらず確率分布だ
けで決まることから、X, Y の確率分布で XY の確率分布が表現できるよ
うに思ってしまった、という誤解かもしれない。
確率空間 (Ω1 , P1 ), (Ω2 , P2 ) があったときその積の確率空間
(Ω1 × Ω2 , P1 · P2 ) が定義できる。ただし、P1 · P2 は、
(P1 · P2 )(A1 × A2 ) = P1 (A1 )P2 (A2 ) で「生成された」Ω1 × Ω2 上の確率。
確率空間の同型を定義すれば、「積空間に同型」で独立性を定義できる。
また、確率空間 (Ω, P) からそのべき (Ωn , Pn ) が定義できる。
また、Ω1 , Ω2 それぞれに確率変数 X, Y があれば、Ω1 × Ω2 上の確率変数
X ′ = X ◦ pr1 , Y ′ = Y ◦ pr2 (X × Y と誤解しないように。 pr1 , pr2 は Ω1 , Ω2
への射影。つまり、X ′ (ω1 , ω2 ) = X(ω1 ), Y ′ (ω1 , ω2 ) = Y(ω2 ) ) が定義でき
る。この 2 つの確率変数 X ′ , Y ′ は独立である。
標本 (確率変数)X の n 回の非復元抽出 (ω1 , ω2 , · · · , ωn ) の数学的表現は、
第 206 章の注 29 で述べる。
データの整理
§36 度数分布
1
変量
1
2
2
離散変量
連続変量
度数分布表 · · · 階級 (級) → 度数
級間隔 =⇒ スタージェスの公式 k = 1 + log2 N
3
階級値 = 階級の中央値
4
ヒストグラム
5
相対度数分布、累積度数分布、累積相対度数分布
§37 代表値と散布度
(1) 代表値
1
平均 (mean)
1∑
xi (n = 総数)
n i=1
n
x =
x =
n
n
∑
1 ∑
fi = 総数)
xi fi (n = 階級数, N =
N i=1
i
2
中央値 (median) Me · · · n の偶奇に注意
3
最頻値 (mode) Mo · · · これは階級に分けないと余り意味が無い。
(2) 散布度
1
2
範囲 R = xL − xS
平方和
S =
n
∑
(xi − x)2 ,
i=1
3
1
S =
n
∑
(xi − x)2 fi
i=1
分散 (variance)
S
1∑
=
(xi − x)2 ,
n
n i=1
n
s2 =
2
3
s2 =
n
S
1 ∑
=
(xi − x)2 fi
N
N i=1
√
標準偏差 (standard deviation) s = s2
不偏分散 (unbiased estimate of variance)
u2
=
S
1 ∑
=
(xi − x)2
n−1
n − 1 i=1
u2
=
1 ∑
S
=
(xi − x)2 fi
N−1
N − 1 i=1
n
n
(3) 計算
S
=
s2 =
S
=
s2 =
 n 2
1 ∑ 
− 
xi 
n i=1 
i=1
 n 2
n
1 ∑ 2  1 ∑ 
x −
xi 
n i=1 i  n i=1 
 n
2
n
∑

1 ∑
2
xi fi − 
xi fi 
N i=1
i=1

2
n
n
 1 ∑

1 ∑ 2
xi fi − 
xi fi 
N i=1
N i=1
n
∑
xi2
(4) 簡易計算 (p.10) · · · 全ての値を x0 ずらすと、平均は x0 ずれ、分散は
変わらない。全ての値を c 倍すると、平均は c 倍、分散は c2 倍になる。
.
.
.
.
練習問題 5
..
17 27 -13 -3 7
の平均値と分散を求めなさい。
.
..
§38 標準化
x が、 x1 , x2 , · · · xn という値を取るとき z =
z1 , z2 , · · · zn を x の標準化と言う。
1
z の平均は 0 で、分散は 1 である。
2
z の標準化は z そのものである。
x−x
を計算したもの、
sx
§39 相関と回帰
1
散布図 (相関図)
2
正の相関、負の相関、無相関
§40 相関係数
x x1 x2 · · · xn
y y1 y2 · · · yn
に対する相関係数を求める。
1∑
(xi − x)(yi − y)
n i=1
n
c xy =
を x と y の共分散 (covariance) という。
因みに「 s x 2 = x の分散 = c xx 」 である。
このとき
c xy
r xy = r =
s x · sy
を x と y の相関係数 (correlation) という。
.
注 24
..
1 共分散を標準化したものが相関係数である、と言える。
.
.
. 2 c xy = cyx , r xy = ryx である。
..
.
【相関係数 r の性質】
1
−1 5 r 5 1
2
r + 1 · · · xi − xと yi − yは比例している
r + −1 · · · xi − xと yi − yは比例している (ただし比例係数は負)
r + 0 · · · xi − xと yi − yは比例関係にない
3
x と y を 1 次変換しても r は不変。(例 F = 1.8 × C + 32)
.
.
.
注 25
..
2
2
r を決定係数と言う。R と書いたり R2 と書いたりする。「あーるじじょ
うち」と読んだりする。
.
..
.
x
y
1
2
3
4
x1
y1
x2
y2
∑
···
···
xn
に対する r の計算法
yn
∑
S x = i xi2 − 1n ( i xi )2
∑
∑
S y = i y2i − 1n ( i yi )2
∑
∑
∑
S xy = i xi yi − 1n ( i xi )( i yi )
S xy
r= √
Sx · Sy
.
20.5
90
15.5
の相関係数を求めよ。
120
.
.
.
例題 14
..
x 10.5
y
110
.
..
(
)
x 10.5 20.5 15.5
[解] r
=r
y 110
90
120
(
)
(
x 2 4 3
x -1 1
r
=r
y 1 -1 2
y 0 -2
(
x 10
y 10
)
0
1
xi yi xi2 y2i
−1 0 1 0
1 −2 1 4
0
1 0 1
0 −1 2 5
20
-10
15
20
)
=
xi yi
0
−2
0
−2
1
14
1 2
· 0 = 2, S y = 5 − · (−1)2 =
3
3
3
1
S xy = −2 − · 0 · (−1) = −2
3
√
−2
3
r = √
=−
.
7
14
2· 3
Sx = 2−
§41 回帰直線
.
.
定義 22
.
..
2
2
2
図の l1 + l2 + · · · + ln を最小にするような直線 y = a + bx を (y の x への) 回
帰直線という。
.
..
.
.
.
.
.
注 26
..
回帰は英語で
regression で、F.Galton が定義した。
.
..
.
y−y
x−x
= r xy
.
sy
sx
である。ここで、r xy は x と y の相関係数、x, y は、x, y の平均、s x , sy は
.x, y の標準偏差である。
..
.
.
.
定理 41.1
..
回帰直線は
[証明] x = (xi ), y = (yi ) とし、1 = (1 · · · 1) とおく。
x·1
˜ = y − y1, x˜ = x − x1 とおく。
y = y·1
n , x= n , y
y − (bx + a1) = y˜ − b x˜ + (y − bx − a)1 であり、 y˜ , x˜ ⊥ 1 より、
|y − (bx + a1)|2 = |˜y − b x˜ |2 + |(y − bx − a)1|2
ここで、|˜y − b x˜ |2 = | x˜ |2 b2 − 2 x˜ · y˜ b + |˜y|2 = | x˜ |2 (b −
x˜ · y˜ 2
(x · y)2
2
)
+
|˜
y
|
−
.
| x˜ |2
|x|2
c xy
x˜ · y˜
=
のとき最小になり、また、
| x˜ |2
sx 2
|(y − bx − a)1|2 = (y − bx − a)2 n は、a = y − bx のとき最小になる。
これは、b =
2
3
.
..
sx
sx
r + 0 の時、y の x へのと、x の y への回帰係数は 0 に近く、回帰直線
は大きく異なる。これは回帰直線の不安定さを示している。
y−y
x−x
yˆ =
, xˆ =
は、それぞれ x, y の標準化みたいなものであ
sy
sx
り、回帰直線は、yˆ = r xy xˆ と書ける。
.
.
.
.
注 27
..
sy
c xy
1 これを y = a + bx と書いたとき、b = r
= 2 を回帰係数と言う。
.
例題 15
.
..
次はある地域の5日間の天気予報の降水確率 x(%) と実際の降水量 y(mm)
である。
80
40
20
0
40
20
1
x と y の平均 x、y を求めよ。
2
x と y の分散 s x 2 , sy 2 を求めよ。
3
x と y の共分散 c xy を求めよ。
4
x と y の相関係数 r を求めよ。
. 5 y の x への回帰直線を求めよ。
..
60
50
50
40
.
.
x
y
.
注 28
..
1
相関係数等計算機 (WEB 版)
http://blade.nagaokaut.ac.jp/˜hara/class/applied-statistics/covar/
2
確率分布 (WEB 版)
http://blade.nagaokaut.ac.jp/˜hara/class/applied-statistics/dist/
. 3 カシオの計算サイト http://keisan.casio.jp/
..
.
.
.
//blade.nagaokaut.ac.jp/˜hara/class/applied-statistics/covar/
標本分布
§42 母集団と標本
1
全数調査
2
標本調査
3
母集団
4
無作為抽出
5
標本、標本の大きさ
6
有限母集団:無限母集団
7
復元抽出法:非復元抽出法
母集団
標本
§43 統計学と数学
ここでは、現実の統計と理論的な確率 (論) を結びつける。
例とする母集団として、新潟県の中学生全体を取ろう。中学生のどんな
部分的な集団 (例えば西中学校の中学生) に対してもその全体からみた
パーセンテージがえられる。
よって、つぎのような「なぞらえ」を行うと、「現実」を数学の枠組みで
捉えられるだろう。
母集団 (全中学生)
=⇒
Ω (標本空間)
部分集団
=⇒
A (事象)
部分集団の割合
=⇒
P(A) (確率)
これはすなわち、個々のメンバーに注目することを根源事象とし、根元
事象が等確率で起こるとして、P を定義したことに相当する。
ところで、個々のメンバー (中学生) に対しては、様々な特性 (例えば身長
とか体重とか) がある。その特性の標本を 1 つ取り出すこと、つまり「1
つの標本を取る」あるいは、
「1 つの標本 X を取る」あるいは、
「1 つの標
本 X がその実現値 x を取る」に相当する数学的表現は何だろうか?1 つ
の考え方を以下に述べる。
1 つの Ω の要素 ω に対して身長などの特性を表す実数 x がある。従って、
標本 X は、確率変数 X であるとみなすことができる。つまり、X は ω に
x = X(ω) を対応付けている。 x を標本 X の実現値と呼ぶ。
更に、例えば「身長が xcm 以下の中学生」のパーセンテージを考えるこ
とができる。すなわち、実数 x に対しては、確率 P(X = x) や P(X 5 x) を
考えることができる。これが、標本分布あるいは標本の分布関数である。
メンバーωと特性 x の対応
=⇒
x = X(ω) (X : 確率変数)
特性に条件をつけた集団の割合
=⇒
P(X 5 x) (分布関数)
実際には、ω, X, X(ω) のどれもが標本と呼ばれることがあるので注意す
る必要がある。(また、次に述べる複数個の確率変数 X1 , X2 , · · · を標本と
呼ぶこともある。)
「ある特性について、大きさ n の標本 X1 , X2 , · · · , Xn を取る」と言った
ときは、「各確率変数 Xi は、ある確率変数 X と同じ確率分布を持ち、互
いに独立である」ということを仮定する。
.
.
注 29
..
この X の n 回の復元抽出を数学的に表現してみる。
Ω 上の確率変数 X が与えられたとする。
Ωn = {(ω1 , ω2 , · · · , ωn ) | ω1 , ω2 , · · · , ωn ∈ Ω} 上の確率変数上の Ωn 上の
確率変数の集まり X1 , X2 , · · · , Xn を次のように定義する。
Xi :
Ωn → R
X の大きさ n の標本とは、この X1 , X2 , · · · , Xn のことである。これらの
確率変数は互いに独立である。
また、X1 , X2 , · · · , Xn の実現値 x1 , x2 , · · · , xn とは、その値の集まり
.X(ω1 ), X(ω2 ), · · · , X(ωn ) である。
..
.
.
(ω1 , ω2 , · · · , ωi , · · · , ωn ) 7→ X(ωi ).
さて、ここからが面白い (?) ところだが、一般に確率変数の集まり
X1 , X2 , · · · , Xn を一つの集合だと思って、「データ整理」のところで述べ
X1 + X2 + · · · + Xn
のよ
た各種の量を計算することができる。例えば X =
n
うな標本平均や標本分散などである。このような量を統計量という。統
計量の実現値の計算こそが「データ整理」である。
統計量も Ωn 上の確率変数であり、分布を持つ。この分布を標本分布と
呼ぶ。
これに対して元の X に対する平均 E(X) や分散 V(X) は、母平均、母分散
と言い、総称して母数という。X がある特性から作られた確率変数なら、
E(X), V(X) は、その母集団の特性の値のデータ平均や分散と一致する。
(この後の定理 44.1 )
統計学の目的の一つは、統計量 (の実現値) から母数を推し量ることで
ある。
§44 標本平均 X の分布
.
.
.
定理 44.1
..
データの平均が µ、データの分散が σ2 である母集団から取った 1 つの標
2
.本を確率変数 X で表せば、E(X) = µ, V(X) = σ である。
..
.
[証明] 各メンバーを ωi 、メンバーの総数を
n とする。
∑
∑
∑
i)
E(X) = i X(ωi )P({ωi }) = i X(ωi ) 1n = i X(ω
= µ. また、
n
V(X) = E((X − E(X))2 ) =
∑
2
i (X(ωi )−µ)
n
= σ2 . .
定義 23
..
大きさ n の標本 X1 , X2 , · · · , Xn を考える。
標本平均 X とは、 n 個の確率変数 Xi の平均である。すなわち
X=
2
標本分散 S 2 (X) とは、 n 個の確率変数 Xi の分散である。すなわち
S 2 (X) =
.
..
X1 + · · · + Xn
.
n
(X1 − X)2 + · · · + (Xn − X)2
.
n
これについては後で考察する。
.
.
1
.
.
定理 44.2
.
..
2
確率変数 X1 , · · · , Xn が独立で、平均値 µ、分散 σ の分布に従うとき、
X1 + · · · + Xn
の分布の平均、分散は、
n
2
σ
E(X) = µ, V(X) =
である。
n
.
..
∑
∑
∑
µ
i Xi
i E(Xi )
)=
= i = µ.
[証明] E(X) = E(
n ∑
n
∑n
∑ 2
σ2
i Xi
i V(Xi )
iσ
また、V(X) = V(
) =
=
=
.
n
n
n2
n2
定理 34.3
.
.
その標本平均 X =
§45 正規分布に関わること
.
一般には次のような「大定理」がある。
.
.
定理 45.1
..
(中心極限定理) 確率変数 X1 , · · · , Xn が独立で、平均 µ、分散 σ2 の同一
X1 + · · · + Xn
の分布に従うとき、その標本平均 X =
の分布は、n が大き
n
σ2
いとき、N(µ,
) に近づく。
n
.
..
.
この定理は多くのデータが正規分布に従っていると仮定する根拠となっ
ている。
.
定理 45.2
..
(正規分布の再現性)
2
.
..
X, Y が独立で正規分布 N(µ x , σ x 2 ), N(µy , σy 2 ) に従うなら、X + Y
は、正規分布 N(µ x + µy , σ x 2 + σy 2 ) に従う。
X が正規分布 N(µ, σ2 ) に従うなら、kX は正規分布 N(kµ, k2 σ2 ) に
従う。
.
.
1
.
.
注 30
..
2
X + Y が 2 山にならない。
因みに 2 つの集団があってそれぞれ大きさが n1 , n2 、平均が µ1 , µ2 、
分散が s1 2 , s2 2 であるとき、それを合わせた集団の平均と分散を
µ, s2 とすると、
µ =
s2 =
3
.
..
n1 µ1 + n2 µ2
,
n1 + n2
n1 s1 2 + n2 s2 2
n1 n2
+
(µ1 − µ2 )2 .
n1 + n2
(n1 + n2 )2
X1 , X2 が同一で、独立な確率変数なら、V(X1 + X2 ) = 2V(X1 ). 一方、
V(X1 + X1 ) = 4V(X1 ).
.
.
1
.
.
系 45.3
..
.
.
.
N(µ, σ2 ) に従う母集団から取った大きさ n の標本 X1 , X2 , · · · , Xn の標本
σ2
平均を X とすると、X は、N(µ,
) に従う。
n
.
..
.
.
系 45.4
.
..
N(µ, σ2 ) に従う母集団から取った大きさ n の標本 X1 , X2 , · · · , Xn の標本
X−µ
平均を X とすると、X の標準化
√ は、標準正規分布 N(0, 1) に従う。
σ/ n
.
..
.
§46 標本比率の分布
母集団が A と A に分けられるとき、A 上で 1、A 上で 0 となる確率変数を
考える。
これは、ベルヌーイ分布と呼ぶのだった。
P(A) = p を母集団比率と言う。
さて、n 回の復元抽出をした時の標本平均を標本比率と言う。
すなわち、各 Xi を i 回目に A に入るとき 1、A に入るとき 0 である独立
X
な確率変数とし、X = X1 + · · · Xn として、 を標本比率と言う。
n
以下のことが言える。
1
2
3
4
E(Xi ) = p, V(Xi ) = p(1 − p).
X は、2 項分布 B(n, p) に従い、E(X) = np, V(X) = np(1 − p).
X
X
p(1 − p)
E( ) = p, V( ) =
.
n
n
n
X
p(1 − p)
n が大きいとき、中心極限定理より、 は N(p,
) に近い。
n
n
.
次の定理は、中心極限定理を用いずとも素朴に証明できる。
.
定理 46.1
.
..
(ラプラスの定理) X を 2 項分布 B(n, p) に従う確率変数とすると、n が
大きいとき、
X
p(1 − p)
は、N(p,
) に近い。
1
n
n
2 X は、 N(np, np(1 − p)) に近い。
X − np
3 √
は、N(0, 1) に近い。
np(1 − p)
.
..
.
.
例題 16
..
次の (1) と (2) にはどのぐらい「差」があるか?
サイコロを 5 回振って 1 回以上 1 が出る確率
. 2 サイコロを 500 回振って 100 回以上 1 が出る確率
..
.
.
1
.
§47 χ2 分布
N(0, 1) に従う独立な確率変数 X1 , X2 , · · · , Xn に対し、χ2 =
.
n
∑
Xi 2 の従
i=1
う分布を自由度
n の χ2 分布という。χ2 (n) と書くことがある。
.
..
.
.
.
定義 24
..
06/09 - 16:25:28): ページ 4 (2008年6月9日 16:25)
は
χ2 (1)
に従う。
1
e− 2 x 。
1
X
2
n = 1 のときの確率密度関数は f1 (x) = √
3
.
..
.
が標準正規分布に従うなら、X 2
4
1
2πx
1 −1 x
n = 2 のときの確率密度関数は f2 (x) = e 2 。 (第 4 章の最後の定理)
2
x
漸化式: fn+2 (x) = fn (x)。
n
.
.
.
注 31
..
.
.
定理 47.1
.
..
2
X, Y が独立で、自由度 m, n の χ 分布に従うとき,X + Y は自由度 m + n
2
.の χ 分布に従う。
..
.
[証明] 定義より明らか。
n
∑
Xi − µ 2
平均を X とすると、χ2 =
(
) は自由度 n の χ2 分布に従う。
σ
i=1
.
..
[証明] 定義より明らか。
.
.
.
.
定理 47.2
..
N(µ, σ2 ) に従う母集団から取った大きさ n の標本 X1 , X2 , · · · , Xn の標本
X−µ
平均を X とすると、χ2 = ( √ )2 は自由度 1 の χ2 分布に従う。
σ/ n
.
..
X−µ
[証明] 系 45.4 より、 √ が N(0, 1) に従うから。
σ/ n
.
.
.
定理 47.3
.
..
2
N(µ, σ ) に従う母集団から取った大きさ n の標本 X1 , X2 , · · · , Xn の標本
.
定理 47.4
.
..
N(µ, σ2 ) に従う母集団から取った大きさ n の標本 X1 , X2 , · · · , Xn の標本
.
.
n
∑
Xi − X 2
平均を X とすると、χ2 =
(
) は自由度 n − 1 の χ2 分布に従う。
σ
i=1
.
..
.
[証明] 難しいので略。(n = 2 の時は明らかだが。) .
注 32
.
..
定理
47.2 と比較せよ。
.
..
.
教科書 p.51 例 3.2 をやろう。
§48 t 分布
スチューデントの t 分布と言われるが、「スチューデント」はギネスビー
ルの技術者コゼットのペンネームであった。
.
定義 25
.
..
X が N(0, 1)、Y が χ2 (n) に従い、X と Y が独立であるとき、
の従う分布を自由度
n の t 分布という。t(n) と書くことがある。
.
..
.
.
X
T= √
Y/n
.
注 33
..
. 2
..
.
.
.
1
n
E(T ) = 0, V(T ) =
, (n > 2) である。
n−2
n → ∞ あるいは n > 30 ぐらいで、T + N(0, 1) である。
.
定理 48.1
.
..
N(µ, σ2 ) に従う母集団から取った大きさ n の標本 X1 , X2 , · · · , Xn の標本
1∑
(Xi − X)2 とするとき、
n
は自由度
n − 1 の t 分布に従う。
.
..
.
注 34
..
系
. 45.4 と比較せよ。
..
X−µ
√
S/ n − 1
.
.
T=
.
.
.
平均を X 、標本分散を S 2 =
X−µ
n
√ は N(0, 1) に従い、定理 47.4 より、 2 S 2 は
σ
σ/ n
χ2 (n − 1) に従う。これらは独立でもある (証明略)。よって定義より、
[証明] 系 45.4 より、
√
X−µ
√
σ/ n
n 2
S /(n − 1)
σ2
=
X−µ
=T
√
S/ n − 1
は、自由度 n − 1 の t 分布 t(n − 1) に従う。
準化。
.
..
.
X−µ
√
S / n−1
を X のスチューデント化と言う。因みに Z =
X−µ
√
σ/ n
は標
.
.
.
注 35
..
この T =
教科書 p.52 例 3.3 をやる。例 3.4 はいい。
§49 F 分布
.
定義 26
..
X, Y が独立で χ2 (n1 ), χ2 (n2 ) に従うとき、
X/n1
Y/n2
の従う分布を自由度 (n1 , n2 ) の F 分布という。F(n1 , n2 ) と書くことが
.ある。
..
.
.
F=
.
.
注 36
..
n2
n2 −2
(n2 > 2), V(F) =
(n2 > 4).
.
.
E(F) =
.
..
.
2n22 (n1 +n2 −2)
n1 (n2 −2)2 (n2 −4)
.
定理 49.1
..
X1 , X2 , · · · , Xn を N(µ, σ2 ) に従う標本で、X =
∑
S 2 = 1n (Xi − X)2 · · · 標本分散 とするとき、
n
.
Xi · · · 標本平均、
(X − µ)2
S 2 /(n − 1)
.は自由度 (1, n − 1) の F 分布に従う。
..
.
.
F=
1∑
X−µ
n
√ は N(0, 1) に従い、定理 47.4 より、 2 S は
σ
σ/ n
χ2 (n − 1) に従う。これらは独立でもある (証明略)。よって定義より、
[証明] 系 45.4 より、
X−µ 2
√ ) /1
(X − µ)2
σ/ n
=F
=
n 2
S 2 /(n − 1)
S
/(n
−
1)
σ2
(
は、χ2 (n − 1) に従う。
§50 まとめ
X1 , X2 , · · · , Xn が N(0, 1) に従い独立であるとき、
√
X1 + X2 + · · · + Xn
1 X =
は N(0, 1/n) に従う。 n · X は N(0, 1) に
n
従う。
2
3
4
X1 2 + X2 2 + · · · + Xn 2 は χ2 (n) に従う。
2
2
2
(X1 − X) + (X2 − X) + · · · + (Xn − X) は χ2 (n − 1) に従う。
√
n−1
X
は t(n − 1) に従う。
√
n
2
2
2
(X1 − X) + (X2 − X) + · · · + (Xn − X)
【早見表】
χ2 分布
2
2
正 + 正 + ··· + 正
t 分布
2
√
正
2
2
正 + 正 + ··· + 正
自由度
2
F 分布
 2

 正 + 正2 + · · · + 正2 


自由度1
 2

 正 + 正2 + · · · + 正2 


自由度2
推定
§51 点推定
.
T (x1 , x2 , · · · , xn ) を n 変数の関数とする。母数 θ を持つ母集団から取っ
た標本 X1 , X2 , · · · , Xn について、確率変数 T (X1 , X2 , · · · , Xn ) を計算し
て θ を推定する。これを点推定と言う。
.
定義 27
.
..
E(T
. ) = θ となるとき T = T (X1 , X2 , · · · , Xn ) を θ の不偏推定量と言う。
..
.
n
Xi
均 X = i=1 は、µ の不偏推定量である。
n
.
..
[証明] (易) .
.
.
.
定理 51.1
..
母平均 µ∑を持つ母集団から取った標本 X1 , X2 , · · · , Xn について、標本平
∑n
.
(Xi −
は母分散 σ2 の不偏推定量である。(標本分
不偏分散 U 2 = i=1
n
−
1
∑n
(Xi − X)2
2
は母分散 σ2 の不偏推定量でない。)
散 S = i=1
n
.
..
.
X)2
.
.
定理 51.2
..
[証明] Xi − µ = Xi − X + X − µ の両辺を 2 乗して
(Xi − µ)2 = (Xi − X)2 + 2(Xi − X)(X − µ) + (X − µ)2
∑n
i=1
すると
n
n
n
n
∑
∑
∑
∑
(Xi − µ)2 =
(Xi − X)2 + 2 (Xi − X)(X − µ) +
(X − µ)2
i=1
i=1
i=1
i=1
(∑
)
∑
ここで、 ni=1 (Xi − X)(X − µ) = ni=1 (Xi − X) (X − µ) = 0 であるから、
n
n
n
n
∑
∑
∑
∑
(Xi − µ)2 =
(Xi − X)2 +
(X − µ)2 =
(Xi − X)2 + n(X − µ)2
i=1
であり、E(
∑n
i=1 (Xi
i=1
− µ)2 ) =
i=1
∑n
i=1
V(Xi ) = nσ2 、E((X − µ)2 ) = V(X) =
nσ2 = E(
n
∑
(Xi − X)2 ) + σ2
i=1
よって、証明された。
i=1
1 2
σ なので、
n
.
.
注 37
..
【数学的メモ (E に関するピタゴラスの定理)】確率変数 X, Y に対して、
X ⊥ Y (X と Y は直交する) ということを E(XY) = 0 と定義すると次の定
理が成り立つ。
例として、µ = E(X) のとき、(X − µ) ⊥ µ よって、
2
2
2
2
.E(X ) = E((X − µ) ) + E(µ) = E((X − µ) ) + E(X) 。
..
.
.
X ⊥ Y =⇒ E((X + Y)2 ) = E(X 2 ) + E(Y 2 )
§52 区間推定
母数 θ と、ある統計量 (確率変数) T 1 , T 2 について、P(T 1 < θ < T 2 ) = 1 − α
であり、T 1 , T 2 の実現値として、t1 , t2 が得られたとき、「1 − α を信頼係
数 (信頼度) として t1 < θ < t2 である」という言い方をする。
これを母数 θ の区間推定という。t1 , t2 を信頼限界、[t1 , t2 ] を信頼区間、
という。
母数 θ について「t1 < θ < t2 となる確率が 1 − α である。」という言い方
は、必ずしも間違いではないが、あまりしない。
【区間推定の基本的なトリック】
|X − θ| < k
すなわち、
θ−k < X <θ+k
を
X−k <θ < X+k
と逆転して考えると、X の実現値 x から、θ の区間推定、
x−k <θ < x+k
が得られる。
.
例題 17
..
正規分布 N(µ, 225) をなす母集団から、1 つサンプルを取ると値が 60
だった。µ を信頼係数 95% で推定せよ。
.
X−µ
は、標準正規分布
15
N(0, 1) に従い、従って、数表より、確率が 0.95 で
【解】N(µ, 225) から取った標本を X とすると、
|X − µ|
< 1.96
15
である。X の実現値が 60 なので、
60 − µ < 1.96
15 である。これを µ についての条件に直せば、次のように言える。
であれば、
X = 60 は、確率 0.95 以内で起こる出来事である。
.
..
.
.
32.6 < µ < 89.4
【今後の話の早見表】
タイプ
タイプ
タイプ
タイプ
1
2
3
4
母平均 µ
母分散 σ2
標本平均 X
標本分散
使う分布
推定量
推定量
要
不要
要
不要
推定量
推定量
要
要
不要
要
不要
要
母平均を利用した分散
要
正規分布
t(n − 1) 分布
χ2 (n) 分布
χ2 (n − 1) 分布
§53 母平均の推定
§54 σ2 と X から µ を推定
.
定理 54.1
.
..
2
2
母集団 N(µ, σ ) の σ が分かっている時の n 個の標本の平均 X から推定
する µ の信頼係数 1 − α の信頼区間は
σ
σ
すなわち、 X − λ √ < µ < X + λ √
n
n
である。ここに、λ は標準正規分布 N(0, 1)
えられる。
.
..
で与
.
.
σ
|X − µ| < λ √
n
[証明] Z =
X−µ
X−µ
√ は、N(0, 1) に従うので、P(| √ | < λ) = 1 − α から。
σ/ n
σ/ n
.
.
例題 18
.
..
例 4.3(改)(教科書 p.36) ある県では毎年 1 年入学時に数学の基礎学力テス
トを実施している。今年入学した全員に同一のテストを行ったところ、
2
ある高校の 450 人の平均点は 62.0 である。全県の分散は 15.02 点 であっ
た。テストの成績が正規分布に従うものとして信頼係数 95% で全県平均
µ
. を推定せよ。
..
.
.
.
例題 18
.
..
例 4.3(改)(教科書 p.36) ある県では毎年 1 年入学時に数学の基礎学力テス
トを実施している。今年入学した全員に同一のテストを行ったところ、
2
ある高校の 450 人の平均点は 62.0 である。全県の分散は 15.02 点 であっ
た。テストの成績が正規分布に従うものとして信頼係数 95% で全県平均
µ
. を推定せよ。
..
.
(答)
15.0
15.0
62.0 − 1.96 √
< µ < 62.0 + 1.96 √
で、60.61 < µ < 63.39。
450
450
§55 U 2 と X から µ を推定
.
定理 55.1
..
母集団 N(µ, σ2 ) から取った n 個の標本の平均 X と不偏分散
U2 =
.
1 ∑n
(Xi − X)2 から推定する µ の信頼係数 1 − α の信頼区間は
n − 1 i=1
U
|X − µ| < t √
n
U
U
すなわち、 X − t √ < µ < X + t √
n
n
.
..
で与えられる。
.
.
である。ここに、t は自由度 n − 1 の t 分布 t(n − 1)
[証明] 標本分散を S 2 =
X−µ
X−µ
=
√ は、t(n − 1) に従うので。
√
S / n − 1 U/ n
.
注 38
..
結論の
.
U
U
X−t √ <µ< X+t √
n
n
は、
X−t √
.と同じである。
..
S
n−1
<µ< X+t √
S
n−1
.
.
T=
1 ∑n
(Xi − X)2 とする。定理 48.1 より
n i=1
15.0
15.0
(答)62.0 − 1.96 √
< µ < 62.0 + 1.96 √
で、60.61 < µ < 63.39。
449
449
.
..
(参考: 例題??。実は値がほとんど変わらない。)
.
.
.
.
例題 19
..
ある県では毎年 1 年入学時に数学の基礎学力テストを実施している。今
年入学した全員に同一のテストを行ったところ、ある高校の 450 人の平
2
均点は 62.0、分散は 15.02 点 であった。テストの成績が正規分布に従う
ものとして信頼係数 95% で全県平均 µ を推定せよ。
.
例題 20
..
ある工場で作るねじを 5 個抜き取り調査するとその直径は
.
99.8 99.9 100.0 100.1 100.2 (mm)
であった。以下の問に答えよ。
2
このデータの平均 x と不偏分散 u2 を求めよ。
この工場で作るねじの大きさ
µ を信頼度 α = 99% で推定せよ。
√
( 5 = 2.24)
.
..
【解】
1
2
x = 100.0.
u2 = (0.22 + 0.12 + 0 + 0.12 + 0.22 )/4 = 0.025.
X−µ
X を標本平均とすると、T =
√ は自由度 4 の t 分布に従う。
U/ 5
P(|T | > t) = 0.01 となる
√ t は t = 4.604. よって求める信頼区間は
0.025
|100.0 − µ| < 4.604 · √
= 0.33.
5
.
.
1
.
.
練習問題 6
..
次は、電車のある運転手が、8 回電車を停車させた時の停車位置の基準線
からのずれを表している。
− 20
− 10 50 20
− 30 80 (単位 cm)
この運転手の停車位置のずれの平均の信頼区間を求めよ。ただし、信頼
係数は
90%とする。
.
..
.
.
90 60
他の問題:教科書例 4.4
1∑ 2
2
S2 =
Xi − X の方が計算しやすいかも。
n
§56 母分散の推定
§57 µ と S 0 2 から σ2 を推定
平均が分かっているのに分散が分からないという不自然なケース (?)
.
定理 57.1
..
母集団 N(µ, σ2 ) の µ が分かっているとき、n 個の標本から作った量
S 02 =
.
1 ∑n
(Xi − µ)2 から推定する σ2 の信頼係数 1 − α の信頼区間は
n i=1
k1 <
nS 0 2
nS 0 2
nS 0 2
2
<
k
すなわち、
<
σ
<
2
k2
k1
σ2
2
仏一
で
.
.
である。ここに、k1 , k2 は自由度 n の χ2 分布 χ2 (n)
.与えられる。
..
[証明] 定理 47.2 より χ0 2 =
n
∑
Xi − µ 2 nS 0 2
(
) =
は、χ2 (n) に従うので。
2
σ
σ
i=1
問題:教科書例 4.5。
1∑ 2
2
S 02 =
Xi − X + (X − µ)2 で計算すると良いかも。
n
§58 X と S 2 から σ2 を推定
.
定理 58.1
..
.
1 ∑n
Xi と
n i=1
1 ∑n
(Xi − X)2 から推定する σ2 の信頼係数 1 − α の信頼区間は
S2 =
n i=1
母集団 N(µ, σ2 ) から取った n 個の標本から作った量 X =
k1 <
nS 2
nS 2
nS 2
2
<
k
すなわち、
<
σ
<
2
k2
k1
σ2
.
..
で与えられる。
.
.
である。ここに、k1 , k2 は自由度 n − 1 の χ2 分布 χ2 (n − 1)
[証明] 定理 47.4 より
χ2
n
∑
Xi − X 2 nS 2
) = 2 は、χ2 (n − 1) に従うので。
=
(
σ
σ
i=1
〔例題〕
次は、電車のある運転手が、8 回電車を停車させた時の停車位置の基準線
からのずれを表している。
90 60
− 20
− 10 50 20
− 30 80 (単位 cm)
この運転手の停車位置のずれの分散の信頼区間を求めよ。ただし、信頼
係数は 90%とする。
【解】8 つの標本のずれの平均は x = 30、分散 s2 = 1900 である。
8S 2
この運転手のずれの分散を σ2 とすれば、χ2 = 2 は自由度 7 の χ2 分布
σ
に従う。
信頼区間外を 10%すなわち左右に 5%ずつ取るので、P(χ2 > k1 ) = 0.95 と
なる k1 を求めて k1 = 2.167。また、P(χ2 > k2 ) = 0.05 となる k2 を求めて
k1 = 14.07。
8s2
8s2
< σ2 <
すなわち、 1080 < σ2 < 7014 。
求める信頼区間は
k2
k1
.
練習問題 7
..
ある工場で作るねじを 5 個抜き取り調査するとその直径は
.
であった。この工場で作るねじの大きさの分散 σ2 を信頼度 α = 99% で
推定せよ。
.
..
.
.
99.8 99.9 100.0 100.1 100.2 (mm)
他の問題:教科書例 4.6。
1∑ 2
2
S2 =
Xi − X で計算すると良いかも。
n
§59 母比率の推定
§60 大標本の場合
〔例題〕
ある選挙において、有効得票 N = 200000 の内 n = 100 票を調べると
k = 50 票が T 氏の得票であった。T 氏の得票率 p を信頼度 a = 0.95 で推
定せよ。
以下が考え方である。
1
2
3
4
T 氏の得票数 X = X1 + X2 + · · · + Xn は B(n, p) に従う。
B(n, p) は n が大きいので、N(np, np(1 − p)) で近似できる。
X
標本平均 pˆ = は n が大きいので、N(p, p(1 − p)/n) で近似できる。
n
pˆ − p
標準化して Z = √
は、N(0, 1) に従う。
p(1 − p)/n
5. P(|Z| 5 z) = 0.95 となる z を求めると z = 1.96。
| pˆ − p|
5 z となる確率が 95%。
p(1 − p)/n
√
√
7. つまり pˆ − z p(1 − p)/n 5 p 5 pˆ + z p(1 − p)/n となる確率が 95%。
√
√
8.
p(1√− p)/n を p(1
ˆ − p)/n
ˆ
で近似して、
√
pˆ − z p(1
ˆ − p)/n
ˆ
5 p 5 pˆ + z p(1
ˆ − p)/n
ˆ
となる確率が 95%。
6. つまり √
9. √
pˆ の実現値 = k/n
√ = 50/100 = 0.5、
p(1
ˆ − p)/n
ˆ
= 0.5 · 0.5/100 = 0.05 より、0.402 5 p 5 0.598 で、
8.04 万 5 N p 5 11.96 万。
.
.
定理 60.1 (母比率の推定)
..
サイズ n の標本のうち性質 A を持つものが k 個あったすると、A の母比
率 p の信頼度 a の信頼区間は
√
pˆ − z
p(1
ˆ − p)
ˆ
5 p 5 pˆ + z
n
で与えられる。ここに pˆ =
√
p(1
ˆ − p)
ˆ
n
k
、z は N(0, 1) で P( − z 5 X 5 z) = a となる
n
.
.
.もの。
..
.
.
注 39
.
..
この近似が良いものであるためには、n pˆ も n(1 − p)
ˆ も 5 より大きいこと
が望ましい。
.
..
.
.
.
練習問題 8
.
..
H 氏は標本数 n = 100 で得票数 k = 30 だった。信頼度 95%で得票率を推
定せよ。
.
..
.
.
定理 60.2 (母比率の差の推定)
.
..
性質 A と性質 B は独立とする。サイズ nA の標本のうち性質 A を持つも
のが kA 個あったとし、サイズ nB の標本のうち性質 B を持つものが kB 個
あったとする。A, B の母比率 pA , pB の差 pA − pB の信頼度 a の信頼区間は
√
pˆ A − pˆ B
−z
5 pA − p B
5 pˆ A − pˆ B
√
+z
pˆ A (1 − pˆ A ) pˆ B (1 − pˆ B )
+
nA
nB
pˆ A (1 − pˆ A ) pˆ B (1 − pˆ B )
+
nA
nB
kA
kB
, pˆ B =
、z は N(0, 1) で
nA
nB
.P( − z 5 X 5 z) = a となるもの。
..
.
.
で与えられる。ここに pˆ A =
.
.
練習問題 9
.
..
T 氏は標本数 nA = 100 で得票数 kA = 50 だった。また別の選挙区で H 氏
は標本数 nB = 100 で得票数 kB = 30 だった。信頼度 95%で得票率の差を
推定せよ。
.
..
.
.
定理 60.3 (母比率の差の推定)
.
..
標本数 n のうち、性質 A を持つものが kA 個、性質 B を持つものが kB 個
あったとする。
√ A, B の母比率 pA , pB の差 pA − pB の信頼度 a の信頼区間は
pˆ A (1 − pˆ A ) + pˆ B (1 − pˆ B ) + 2 pˆ A pˆ B
5 pA − p B 5
n
√
pˆ A (1 − pˆ A ) + pˆ B (1 − pˆ B ) + 2 pˆ A pˆ B
pˆ A − pˆ B + z
n
kA
kB
で与えられる。ここに pˆ A =
, pˆ B =
、z は N(0, 1) で
nA
nB
.P( − z 5 X 5 z) = a となるもの。
..
(証明のヒント) 「様々な確率変数」での定理 26.2 より、
pˆ A pˆ B
Cov( pˆ A , pˆ B ) = −
であることから、V( pˆ A − pˆ B ) が計算できる。
n
.
.
pˆ A − pˆ B − z
.
.
練習問題 10
.
..
標本数 n = 100 のうち、T 氏は得票数 kA = 50、H 氏は得票数 kB = 30 だっ
た。信頼度
95%で得票率の差を推定せよ。
.
..
.
.
.
.
.
練習問題 11
..
前問において、信頼度
99%で得票率の差を推定せよ。
.
..
§61 小標本の場合
標本数が少ない場合の母比率の推定には、F 分布を用いる、という例が、
教科書 P.68 に載っているが、本講義では省略する。
§62 母相関係数の推定
母相関係数の推定には、Fisher の z 変換によって正規分布に持ち込む、
という例が、教科書 P.69 に載っているが、本講義では省略する。
検定
§63 最も単純な例
.
.
.
例題 21
..
飲むと太るという粉ミルクを飲んで育った生後 2ヶ月の赤ちゃん一人の体
重を測ると 6.8Kg グラムであった。一方、一般的には生後 2ヶ月の赤ちゃ
んの平均体重は 6Kg で、標準偏差は 0.5Kg である。
やはりこの粉ミルクは太らせるのか、有意水準
5%で検定せよ。
.
..
.
【解】この粉ミルクを飲んだ赤ちゃんの体重は正規分布 N(µ, σ2 ) (σ = 0.5)
に従うとする。µ0 = 6.0 を一般的な赤ちゃんの平均体重とするとき、
H0 (帰無仮説) : µ = µ0 すなわち「別に太らない」
H1 (対立仮説) : µ > µ0 すなわち「太る」
として、検定をする。
X を粉ミルクを飲んだ赤ちゃんの体重を表す確率変数とする。H0 の下、
X − µ0
特に太らず、X が N(µ0 , σ2 ) に従うとするなら、Z =
は N(0, 1) に
σ
従う。Z の実現値 z を X の実現値 x = 6.8 から求めると、
x − µ0 6.8 − 6.0
z=
=
= 1.6。一方、P(Z > λ) = 0.05 となる λ は数表より
σ
0.5
λ = 1.645。
1.6 < 1.645 より、H0 は棄却できない。
結論:
「太るとは言えない」
0.09
0.0
.0000
.0040
.0080
.0120
.0160
,o199
.0239
.0279
.0319
.0359
0.1
,0398
.0438
.0478
.0517
.0557
.0596
.0636
.0675
.0714
.0753
0.2
.0793
.0832
.0871
.0910
.0948
.0987
.llj26
0.3
,1179
.1217
.1255
.1293
.1331
.1368
,1406
.1443
.1480
.1517
0.4
.1554
.1591
.1628
.1664
1700
.1736
1772
.1808
.1844
.1879
0.5
.1915
.1950
.1985
.2019
.2054
.2088
.2123
.2157
.2190
.2224
06
.2257
.2291
.2324
.2357
.2389
.2422
.2454
.2486
.2517
.2549
0.7
.2580
.2611
.2642
.2673
.2704
.2734
.2764
.2794
.2823
.2852
0.8
.2881
.2910
,2939
.2967
.2995
.3023
.3051
.3078
.3106
.3133
09
.3159
.3186
.3212
.3238
.3264
.3289
.3315
.3340
.3865
.3389
1,0
.3438
.3461
,3485
,3508
.3531
.3554
.3577
.3599
1 , 1
.3413
・
3643
,3665
,3686
.3708
。3729
1.2
。
3849
.3869
.3888
.3907
.3925
.3944
.3962
.3980
.3997
.4015
ユ, 3
,4032
.4049
.4066
.4082
.4099
.4115
,4131
.4147
.4162
,4177
1.4
.4192
.4207
.4222
.4236
.4251
.4265
.4279
.4292
4306
1.5
,4332
.4345
,4357
.4370
.4382
.4394
.4406
.4418
.4429
9
.4452 .狙 63 .4474.4484臣
.3749
。3770
.1064
。3790
.1103
.3810
.1141
3621
.3830
.4319
.4441
.4515 .4525 .4535 .4545
.4554
.4564
.4573
.4582
憂 王 亜 轟
.4591 .4599
1.8
.4641
.4649
,4656
.4664
.4671
.4678
.4686
.4693
.4699
1.9
.4713
.4719
,4726
.4732
.4738
.4744
.4750
.4756
.4761
2.0
.4772
.4778
.4783
.4788
.4793
.4798
.4803
.4808
.4812
.4817
2.1
4821
。
.4826
.4830
.4834
.4838
.4842
.4846
.4850
.4854
.4857
2.2
.4861
.4864
.4868
.4871
.4875
,4878
.4881
.4884
.4887
.4890
2.3
.4893
.4896
.4898
.4901
.4904
2.4
.4918
.4920
.4922
4925
。4927
.4906
.4929
.4909
.4931
.4911
.4932
.4913
.4934
,4916
.4936
2.5
.4938
.4940
.4941
,4943
.4945
.4946
.4948
.4949
.4951
.4952
.4964
.4608
.4616
.4625
。 4633
,4706
,4767
2.6
.4953
.4955
,4956
,4957
.4959
.496o
,4961
.4962
.4963
2.7
.4965
.4966
.4967
.4968
.4969
.4970
.4971
.4972
.4973
2.8
.4974
.4975
。4976
。4977
.4977
.4978
.4979
.4979
.4980
4981
2.9
.4981
,4982
.4982
.4983
.4984
.4984
.4985
.4985
.4986
.4986
3.0
.4987
.4987
.4987
.4988
.4988
.4989
.4989
.4989
,4990
.4990
3.1
4990
。
.4991
.4991
.4991
.4992
.4992
.4992
.4992
.4993
.4993
4974
θ、
θS
汁い18θ土=│.8
例題 21 と同じ設定で、赤ちゃん一人ではなく二人の体重の平均が 6.8Kg
グラムであったとしたらどうか。
【解】粉ミルクを飲んだ赤ちゃんの体重を表す確率変数 X が特に太らず、
N(µ0 , σ2 ) に従うとするなら、二人体重の平均 X は (正規分布の再現性よ
X − µ0
り)、N(µ0 , σ2 /2)、Z =
√ は N(0, 1) に従う。
σ/ 2
x − µ0 6.8 − 6.0
z=
= 2.26。これは 1.645 より大きいので、H0 は棄却
√ =
σ/ 2 0.5/1.41
される。
結論:
「太ると言える」
p値
1
2
例題の前者で P(Z > 1.6) = 0.0548 をこの標本に基づく p 値と言う。
従ってこの様にも言う。「この標本に基づく p 値が 0.0548 であり、
有意水準 0.05 より大きいので、帰無仮説 µ = µ0 は棄却されない。」
例題の後者では P(Z > 2.26) = 0.012 をこの標本に基づく p 値と言う。
従ってこの様にも言う。「この標本に基づく p 値が 0.012 であり、有
意水準 0.05 より小さいので、帰無仮説 µ = µ0 は棄却される。」
§64 検定の考え方
[検定の考え方]
1
データを得る。
2
仮説立て、それを元にモデル (確率分布) を決める。
3
そのデータの結果が実現される確率が小さいとき、仮説は棄却さ
れる。
[検定の実際]
(1) パラメータに関する否定したい仮説 (帰無仮説)H0 と肯定したい仮説
(対立仮説) H1 を設定する。
(2) 適当な統計量 T を選び仮説 H0 の下で T の分布を決定する。
(3) 小さい実数 α(有意水準, 危険率) に対して P(T ∈ W) = α となる範囲
W (棄却域=めったに起こらないはずの領域) を仮説 H1 を考慮して決める。
W の決め方 (正規分布の例、一般には…)
言い回し
H0
H1
W
名称
異なるといえるか
T =c
T ,c
(−∞, λ1 ) ∪ (λ2 , ∞)
両側検定
大きいといえるか
T =c
T >c
(λ, ∞)
右側検定
小さいといえるか
T =c
T <c
(−∞, λ)
左側検定
(4) データに対する T の実現値 t に対して
1
t ∈ W =⇒ 有意水準 α で H0 を棄却する。(H1 の肯定)
2
t < W =⇒ 有意水準 α で H0 を 採択(受容)する。(何もいえない)
すなわち、
1
モデルに沿って考えるとめったにないことが起こった。
2
モデルに沿って考えるとめったにないことが起こったわけではない。
(5) 対立仮説は肯定されるか断言不能になるかどちらかである。
§65 母平均の検定
§66 母分散 σ2 が既知である場合の母平均 µ の検定
例題
(教科書 p.75 例 5.1) ある集団 A の中から、量 X のサイズ n = 108 のサン
プルを取ると、標本平均 X は x = 164.1(教科書では 164.2) だった。一方、
一般に X は N(µ0 , σ2 ) (µ0 = 163.1, σ = 6.99) に従っているとする。
次のケースで有意水準 α = 0.05 で検定せよ。
1
A の平均 µ は µ0 と異なる言えるか?
2
A の平均 µ は µ0 より大きいといえるか。
【解】
(1) 帰無仮説 H0 と対立仮説 H1 を次のように設定する。
H0 : µ = µ0
H1 : µ , µ0
とする。これを有意水準 α = 0.05 で検定する。H0 を仮定すると、
X − µ0
Z=
√ は N(0, 1) に従う。その実現値は
σ/ n
x − µ0 164.6 − 163.4
z=
= 1.78。一方、 P(|Z| > λ) = α = 0.05 となる λ
√ =
√
σ/ n
6.99/ 108
を求めると、λ = 1.96 (両側検定)。
−λ < z < λ より、H0 は棄却されない。
つまり、A について µ = µ0 は棄却できない。(採択される。H1 については
何とも言えない。)
(2) 帰無仮説 H0 と対立仮説 H1 を次のように設定する。
H0 : µ = µ0
H1 : µ > µ0
とする。これを有意水準 α = 0.05 で検定する。H0 を仮定すると、
X − µ0
x − µ0
Z=
√ は N(0, 1) に従う。その実現値は z =
√ = 1.78。一方、
σ/ n
σ/ n
P(Z > λ) = α = 0.05 となる λ を求めると、λ = 1.645 (右側検定)。
z > λ より、H0 は棄却される。
つまり、A について µ > µ0 といえる。(H1 であると言える。)
.
注 40
.
..
2
1 「母分散 σ が既知である場合の母平均 µ の検定」の「母分散」
、「母
平均」とは、検定の対象となる集団 A の分散と平均であって、「一
般」のそれではない。しかし、母分散については、「一般」の分散を
もって、A の母分散として代用する。
3
.
..
「母分散が既知とする」という言い方をよくするが、「A の分散が一
般の場合と等しいと仮定する」と言った方がいいだろう。
原理的には、A の平均 µ と「一般」の µ0 との比較でなく、A の平均
µ と任意の値との比較で検定ができる。ただ、しばしば「一般」の値
との違いに興味持つ事が多いということである。
.
.
2
.
注 41
.
..
1 両側検定で棄却できないが、右側では棄却できる。右側検定の方が
ゆるいのだろうか?そうではない。片側では、µ < µ0 のとき棄却で
きない。それを考えれば「イーヴン」である。
3
.
..
右側が「ゆるい」のはベースとなる知識によって第 2 種の誤りが大
きくならないことが分かっているので、安心しているから。
「大きい =⇒ 異なる」は真であるのに、両側で H0 が棄却できないの
に、右側で H0 が棄却できるのはなぜか?· · · ベースとなる知識があ
るから。
.
.
2
.
.
練習問題 12
.
..
世界の映画の上演時間の平均は 120.0 分、標準偏差は 10.0 分である。
「インド映画は長い」と言われているが、私の見たインド映画 5 本の上演
時間は (平均)127 分であった。インド映画の上演時間は世界の平均より長
いと言えるか有意水準 5%で検定せよ。ただし、上演時間は正規分布に従
うとする。
.
..
.
§67 母分散 σ2 が未知である場合の母平均 µ の検定
(例題)
(教科書 p.76 例 5.2) ある集団 A の中から、量 X のサイズ n = 30 のサンプ
ルをとると、標本平均は x = 0.1032、標本分散は s2 = 0.00242 だった。一
方、一般に X は N(µ0 , σ2 ) (µ0 = 0.1, σ2 = 未知) に従っているとする。A
の平均は µ0 と異なる言えるか?有意水準 α = 0.05 で検定せよ。
【解】A の平均を µ とするとき
H0 : µ = µ0
H1 : µ , µ0
とする。これを有意水準 α = 0.05 で検定する。X を標本平均、
∑
S 2 = n1 (Xi − X)2 を標本分散をあらわす確率変数とする。H0 を仮定する
X − µ0
と、T =
は自由度 n − 1 の t 分布 t(n − 1) に従う (「標本分布」の
√
S/ n − 1
x − µ0
0.1032 − 0.1
ところの定理 48.1 )。その実現値は t = √
=
√ = 7.18。
s/ n − 1 0.0024/ 29
一方、 P(|T | > λ) = α = 0.05 となる λ を求めると、λ = 2.045(両側検定)。
t > λ より、H0 は棄却される。
つまり、A について µ = µ0 は棄却される。
.
注 42
..
2
α = 0.05 で余裕なので α = 0.04 にして、「強い主張」に切り替えてい
いか?· · · そうすると第 2 種の誤り (後述) をする確率が大きくなる。
つまり t の値を見てから有意水準を決めてよいか? · · · もちろんよ
い。(だめと書いてある教科書もある)
. 3 なぜ「ぎりぎり検定」がないのか?· · · わかりません。
..
.
.
1
.
.
.
練習問題 13
..
世界の映画の上演時間の平均は 120.0 分である。「インド映画は長い」と
言われているが、私の見たインド映画 5 本の上演時間は
であった。インド映画の上演時間は世界の平均より長いと言えるか有意
水準
1%で検定せよ。ただし、上演時間は正規分布に従うとする。
.
..
.
.
130.0 150.0 130.0 125.0 140.0 (分)
§68 検定のポリシー
.
定義 28
..
.
第 1 種の誤り · · · H0 が正しいのに H0 を棄却すること
· · · 下図のα
第 2 種の誤り · · · H1 が正しいのに H0 を採択すること
· · · 下図のβ
第 1 種と第 2 種の誤りの説明図:
.
..
ジ
ン
う
負の
チ
.
.
的 物
イ
.
.
【棄却域設定のポリシー】
第 1 種の誤りを一定 (=小さい) に定め、その上で第 2 種の誤り (=母集団
の本当の確率分布が H1 を満たすとして、H0 を採択すること) の確率を最
小にするように棄却域を定める。
.
.
注 43
..
有意水準とは第
1 種の誤りを犯す確率である。
.
..
.
.
.
注 44
..
(正規分布等に関する) 対立仮説に応じた棄却域の取り方の根拠は「ネイ
.マン・ピアソンの補題」で証明される。
..
.
§69 2 つの母集団の分散が未知であるときの母平均の差の検定
.
定理 69.1
..
.
∑
.は自由度 m + n − 2 の t 分布に従う。
..
.
.
X1 , X2 , · · · , Xm を N(µ1 , σ2 ) に従う標本で、X = m1 Xi 、
∑
S 1 2 = m1 (Xi − X)2 。
∑
また、Y1 , Y2 , · · · , Yn を N(µ2 , σ2 ) に従う標本で、Y = 1n Yi 、
∑
S 2 2 = 1n (Yi − Y)2 とする。
このとき、
X − Y − (µ1 − µ2 )
T= √
(
)
1
mS 1 2 +nS 2 2 1
+
m+n−2
m n
[証明] 「標本分布」のところの定理 48.1 と同様にして示せる。正規分布
σ2 σ2
の再現性より、X − Y は N(µ1 − µ2 ,
+ ) に従い、χ2 分布の定義より、
m
n
m 2 n 2
2
S 1 + 2 S 2 は χ (m + n − 2) に従う。これらは独立でもある (証明略)。
σ2
σ
よって t 分布の定義より、
X − Y − (µ1 − µ2 )
√
X − Y − (µ1 − µ2 )
σ2 /m + σ2 /n
= √
v
t m
) =T
n 2
2
2 (
2
mS
+
nS
1
1
S1 + 2S2
1
2
+
σ2
σ
m+n−2 m n
m+n−2
は自由度 m + n − 2 の t 分布に従う。
.
.
例題 22
..
(教科書 p.79 例 5.4) ある市の住民検診で任意に選んだ男性、女性の最低
血圧の測定値は以下の通りであった。男女間に差はあるといえるか、男
女間で分散に差はないとし、有意水準 α = 5% で検定せよ。
分散
s1 2 = 82.9
s2 2 = 101.77
標本数
m = 11
n = 10
【解】帰無仮説 H0 と対立仮説 H1 を H0 : µ1 = µ2 H1 : µ1 , µ2 と設定す
る。これを有意水準 α = 0.05 で両側検定する。
82.91−81.04
= 0.420.
t0 = √ 2 x−y2
= √ 11×82.91+10×101.77
m·s1 +n·s2
1 1
( 111 + 101 )
11+10−2
m+n−2 ( m + n )
t(19) 分布で、両袖の合計が 0.05 になる x 軸の値は、2.093 なので、t0 は
棄却域に入らない。すなわち、
H0 は採択される。
.
..
.
.
男性
女性
平均
x = 82.91
y = 81.04
.
.
練習問題 14
..
ある植物を A と B のグループに分け、栽培を行う。グループ A には成長
促進の薬を与え、グループ B には何の薬も与えなかった。結果、グルー
プ A と B の植物の大きさに関して、以下のような表が得られた。
平均
x = 168.1
y = 164.3
分散
s1 2 = 8.8
s2 2 = 10.1
標本数
m = 10
n=8
グループ A と B の植物の大きさに関する分散は等しいと見なしてよいと
する。グループ A に与えた成長促進の薬は効果を与えるかどうか、検定
.せよ。
..
.
.
A
B
.
.
.
注 45
..
2 つのグループの分散が等しいとはかぎらないとする検定方法として、
ウェルチ
(Welch) 検定がある。
.
..
.
§70 母分散の検定
§71 µ が未知であるときの σ の検定
(例題)
(教科書 p.84 例 5.7) ある集団 A の中から、量 X のサイズ n = 10 のサンプ
ルをとると、標準偏差が s = 0.268 だった。一方、一般に X は
N(µ, σ20 ) (µ = 未知, σ0 = 0.245) に従っているとする。A の標準偏差は σ0
と異なる言えるか?有意水準 α = 0.05 で検定せよ。
【解】A の標準偏差を σ とするとき
H0
:
σ = σ0
H1
:
σ , σ0
とする。これを有意水準 α = 0.05 で検定する。
1 ∑n
nS 2
2
2
S 2 を標本分散、S 2 =
は χ2 (n − 1) に
i=1 (Xi − X) とする。H0 を仮定すると、χ =
n
σ20
10 × 0.2682
従う (「標本分布」のところの定理 47.4 )。その実現値は k =
= 12.0。一方、
0.2452
α
2
2
P(χ < k1 ) = P(χ > k2 ) = = 0.025 となる k1 , k2 を求めると、k1 = 2.700, k2 = 19.02。
2
よって、k1 < k < k2 。
すなわち、H0 は採択。
.
.
練習問題 15
..
次は、ある電車の運転手が、8 回電車を停車させた時の停車位置の基準線
からのずれを表している。
− 20
− 10 50 20
− 30 80 (単位 cm)
一般の運転手のずれの分散は σ0 2 = 8000 cm2 であるとして、この運転手
の停車位置のずれのばらつきは少ないといえるか、有意水準 5% で検定
せよ。
.
..
.
.
90 60
§72 適合度の検定
.
.
定理 72.1
..
事象 i が起こる確率を pi 、標本における i の出現確率 (相対度数) を gi と
するとき、
K=n
k
∑
(gi − pi )2
i=1
pi
.
.
は、標本数
n が大きいとき、自由度 k − 1 の χ2 分布に従う。
.
..
.
.
注 46
.
..
事象 i の頻度を qi 、標本における i の出現度数を fi とすると、K は次のよ
うにも書ける。
k
∑
( fi − qi )2
K=
qi
i=1
.
..
.
(例題)
サイコロを n=100 回振ったら出た目 i, (1 5 i 5 k, k = 6) の相対度数は以
下の様だった。
目 (i)
相対度数 ( fi )
1
0.11
2
0.24
3
0.13
4
0.18
5
0.12
6
0.22
このサイコロは正常か?有意水準 α = 5% で検定しなさい。
【解】
pi = 1/6 なので、K の実現値は
(
(0.11 − 0.1667)2 (0.24 − 0.1667)2 (0.13 − 0.1667)2
K = 100
+
+
0.1667
0.1667
0.1667
)
2
2
(0.12 − 0.1667)
(0.22 − 0.1667)2
(0.18 − 0.1667)
+
+
+
0.1667
0.1667
0.1667
= 9.08
また、自由度 k − 1 = 5 の χ2 分布の 5% 点は、11.07 なので、対立仮説
「確率 1/6 からずれている」は結論できず、帰無仮説「すべての確率は
1/6」は棄却できない。
.
.
練習問題 16
..
(教科書 p.90 例 5.12 参照) 植物の交配によって A, B 2 つの遺伝子が現わ
れる割合は非 A、非 B を A、B と表せば、AB : AB : AB : AB = 9 : 3 : 3 : 1
となることが期待されていたが、75 サンプルでの実験の結果は以下の通
りであった。
AB
0.504
AB
0.250
AB
0.244
AB
0.002
この理論は当てはまるといえるか、有意水準
5%で検定せよ。
.
..
.
.
表れ方
相対度数
§73 独立性の検定
.
定理 73.1
..
独立な事象のペア (i, j) の出現確率 (相対度数) を gi j とし、
∑I
∑
gi j とおくと、
gi• = Jj=1 gi j , g• j = i=1
K=n
.
J
I ∑
∑
(gi j − gi• g• j )2
i=1 j=1
gi• g• j
.
は、標本数
n が大きいとき、自由度 (I − 1)(J − 1) の χ2 分布に従う。
.
..
.
.
.
注 47
..
∑J
∑I
(i, j) の出現度数を fi j とし、 fi• = j=1 fi j , f• j = i=1 fi j とおくと、K は
次のようにも書ける。
.
..
I ∑
J
∑
(n fi j − fi• f• j )2
n fi• f• j
i=1 j=1
.
.
K=
(例題)
血液型が I = 4 種あり、性格を J = 4 種に分けて、n = 100 人のクラスで、
どれに当てはまるかアンケートを取った。
性格 (i) \血液型 (j)
大らか
几帳面
気まぐれ
二重人格
O
0.07
0.04
0.03
0.05
A
0.04
0.09
0.05
0.07
B
0.05
0.03
0.11
0.08
AB
0.06
0.04
0.10
0.09
血液型と性格は関連があるか?有意水準 α = 5% で検定しなさい。
【解】
性格 (i) \血液型 (j)
大らか
几帳面
気まぐれ
二重人格
g• j
(
O
0.07
0.04
0.03
0.05
0.19
A
0.04
0.09
0.05
0.07
0.23
B
0.05
0.03
0.11
0.08
0.27
AB
0.06
0.04
0.10
0.09
0.29
gi•
0.22
0.20
0.29
0.29
1.00
)
(0.07 − 0.22 · 0.19)2
K = 100
+ · · · = 10.85。また、自由度
0.22 · 0.19
(I − 1)(J − 1) = 9 の χ2 分布の 5% 点は、16.92 なので、帰無仮説「血液型
と性格は独立である」は棄却できず、対立仮説「血液型と性格は関係が
ある」が結論できない。
.
.
練習問題 17
..
ある工場で生産するシリコン基板の欠陥のパターンを A, B, C , D に分類
した。次の表は各時間帯での各欠陥パターンの出現頻度である。
欠陥と生産時間帯に関係があるか?
.
..
B
21
31
17
C
45
34
49
D
13
5
20
.
.
9:00–11:00
11:00-14:00
14:00-17:00
A
15
26
33
.
注 48
..
1
相関係数等計算機 (WEB 版)
http://blade.nagaokaut.ac.jp/˜hara/class/applied-statistics/covar/
2
確率分布 (WEB 版)
http://blade.nagaokaut.ac.jp/˜hara/class/applied-statistics/dist/
. 3 カシオの計算サイト http://keisan.casio.jp/
..
.
.
.