28.01.2015 Views

立資程

立資程

立資程

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

極 限 定 理<br />

陳 嘉 平<br />

國 立 中 山 大 學 資 訊 工 程 學 系<br />

機 率 學 講 義


本 章 內 容<br />

馬 可 夫 不 等 式<br />

Markov inequality<br />

契 比 雪 夫 不 等 式<br />

Chebyshev inequality<br />

隨 機 變 數 序 列<br />

sequence of random variables<br />

弱 大 數 法 則<br />

weak law of large numbers<br />

強 大 數 法 則<br />

strong law of large numbers<br />

中 央 極 限 定 理<br />

central limit theorem<br />

Chia-Ping Chen ( 中 山 資 工 ) Limit Theorems 機 率 學 講 義 2 / 28


馬 可 夫 不 等 式<br />

X 為 非 負 的 隨 機 變 數 ,a > 0, 則 以 下 不 等 式 成 立 , 稱<br />

為 馬 可 夫 不 等 式<br />

P(X ≥ a) ≤ E[X ]<br />

a .<br />

證 明<br />

令<br />

Y a (X ) (X < a) 0 : a.<br />

則<br />

Y a ≤ X ⇒ E[Y a ] ≤ E[X ]<br />

⇒ a P(X ≥ a) ≤ E[X ]<br />

⇒ P(X ≥ a) ≤ E[X ]<br />

a .<br />

Chia-Ping Chen ( 中 山 資 工 ) Limit Theorems 機 率 學 講 義 3 / 28


契 比 雪 夫 不 等 式<br />

X 為 隨 機 變 數 ,c > 0, 則 以 下 不 等 式 成 立 , 稱<br />

為 契 比 雪 夫 不 等 式<br />

P (|X − E[X ]| ≥ c) ≤ var(X )<br />

c 2 , ∀ c > 0.<br />

證 明<br />

令<br />

Z c (X ) (|X − E[X ]| < c) 0 : c 2 .<br />

則<br />

Z c ≤ (X − E[X ]) 2 ⇒ E[Z c ] ≤ E[(X − E[X ]) 2 ]<br />

⇒ c 2 P(|X − E[X ]| ≥ c) ≤ var(X )<br />

⇒ P(|X − E[X ]| ≥ c) ≤ var(X )<br />

c 2 .<br />

Chia-Ping Chen ( 中 山 資 工 ) Limit Theorems 機 率 學 講 義 4 / 28


Example 5.1 & 5.2<br />

Let X be uniformly distributed in the interval [0, 4] and note that<br />

利 用 馬 可 夫 不 等 式 , 可 得<br />

E[X ] = 2, var(X ) = 4 3 .<br />

P(X ≥ 2) ≤ E[X ]<br />

2<br />

P(X ≥ 3) ≤ E[X ]<br />

3<br />

= 1,<br />

= 2 3 .<br />

利 用 契 比 雪 夫 不 等 式 , 可 得<br />

P(|X − 2| ≥ 1) ≤ σ2<br />

1 = 4 3 .<br />

Chia-Ping Chen ( 中 山 資 工 ) Limit Theorems 機 率 學 講 義 5 / 28


Example 5.3<br />

When X is known to take values in a range [a, b], then<br />

P(|X − µ| ≥ c|) ≤<br />

(b − a)2<br />

4c 2 .<br />

證 明<br />

只 需 證 明 ( 練 習 )<br />

再 利 用 Chebyshev’s。<br />

σ 2 ≤<br />

(b − a)2<br />

.<br />

4<br />

Chia-Ping Chen ( 中 山 資 工 ) Limit Theorems 機 率 學 講 義 6 / 28


隨 機 變 數 序 列<br />

由 隨 機 變 數 構 成 的 序 列 , 稱 為 隨 機 變 數 序 列 。 例 如<br />

X 1 , X 2 , . . .<br />

獨 立 均 同 分 佈 independent and identically distributed<br />

若 隨 機 變 數 序 列 所 包 含 的 隨 機 變 數 彼 此 為 獨 立 , 而 且 機 率 分<br />

佈 函 數 相 同 , 則 稱 為 獨 立 均 同 分 佈 (i.i.d.)。<br />

Chia-Ping Chen ( 中 山 資 工 ) Limit Theorems 機 率 學 講 義 7 / 28


樣 本 和 與 樣 本 平 均<br />

假 設 隨 機 變 數 序 列 X 1 , X 2 , . . . 為 i.i.d., 每 個 變 數 期 望 值 為 µ, 變<br />

異 數 為 σ 2 。<br />

樣 本 和 sample sum<br />

樣 本 平 均 sample mean<br />

S n X 1 + · · · + X n .<br />

M n X 1 + · · · + X n<br />

n<br />

= S n<br />

n .<br />

規 範 化 樣 本 平 均 normalized sample mean<br />

Z n S n − nµ<br />

σ √ n .<br />

Chia-Ping Chen ( 中 山 資 工 ) Limit Theorems 機 率 學 講 義 8 / 28


樣 本 和<br />

樣 本 和 S n 的 期 望 值 為<br />

E[S n ] = E[X 1 + · · · + X n ]<br />

= E[X 1 ] + · · · + E[X n ]<br />

= nµ.<br />

變 異 數 為<br />

var(S n ) = var(X 1 + · · · + X n )<br />

n∑<br />

= var(X i ) + ∑ ∑<br />

cov(X i , X j )<br />

i=1<br />

i<br />

= nσ 2 .<br />

j≠i<br />

Chia-Ping Chen ( 中 山 資 工 ) Limit Theorems 機 率 學 講 義 9 / 28


樣 本 平 均<br />

樣 本 平 均 M n 的 期 望 值 為<br />

E[M n ] = E[S n]<br />

n<br />

= µ.<br />

變 異 數 為<br />

var(M n ) = var(S n)<br />

n 2<br />

= σ2<br />

n .<br />

Chia-Ping Chen ( 中 山 資 工 ) Limit Theorems 機 率 學 講 義 10 / 28


規 範 化 樣 本 平 均<br />

規 範 化 樣 本 平 均 Z n 的 期 望 值 為<br />

[ ]<br />

Sn − nµ<br />

E[Z n ] = E<br />

σ √ = E[S n − nµ]<br />

n σ √ n<br />

= 0.<br />

= E[S n] − nµ<br />

σ √ n<br />

變 異 數 為<br />

( )<br />

Sn − nµ<br />

var(Z n ) = var<br />

σ √ n<br />

= 1.<br />

= var(S n − nµ)<br />

σ 2 n<br />

= var(S n)<br />

σ 2 n<br />

= σ2 n<br />

σ 2 n<br />

Chia-Ping Chen ( 中 山 資 工 ) Limit Theorems 機 率 學 講 義 11 / 28


Example 5.5<br />

Let p be the fraction of voters who support a particular candidate for<br />

office. We interview n randomly selected voters and record M n , the<br />

fraction of them that support the candidate. We view M n as our<br />

estimate of p and would like to investigate its properties.<br />

說 明<br />

定 義 X i = ( 第 i 個 受 訪 者 支 持 ) 1 : 0。 則<br />

因 此<br />

E[X i ] = p,<br />

樣 本 平 均 的 期 望 值 與 變 異 數 為<br />

X i ∼ Bernoulli(p).<br />

var(X i ) = p(1 − p).<br />

E[M n ] = p, var(M n ) = var(S n)<br />

n 2 =<br />

p(1 − p)<br />

.<br />

n<br />

Chia-Ping Chen ( 中 山 資 工 ) Limit Theorems 機 率 學 講 義 12 / 28


估 計 的 確 度 與 信 度<br />

作 估 計 時 , 常 將 結 果 表 示 成<br />

P (|ˆp − p| ≥ ɛ) ≤ β,<br />

也 就 是 估 計 誤 差 超 過 ɛ 的 機 率 小 於 β。 我 們 稱 ɛ 為 確 度 ,1 − β<br />

為 信 度 。 信 度 與 確 度 的 要 求 決 定 取 樣 數 : 考 慮 民 調 的 例 子 , 根 據<br />

Chebyshev 不 等 式<br />

P (|M n − p| ≥ ɛ) ≤<br />

p(1 − p)<br />

nɛ 2 ≤ 1<br />

4nɛ 2 .<br />

欲 使 M n 與 p 的 誤 差 超 過 ɛ = 0.01 的 機 率 小 於 β = 0.05, 取 樣 數<br />

n 可 以 透 過 下 式 選 擇<br />

P (|M n − p| ≥ 0.01) ≤<br />

1<br />

4(n)(0.01 2 )<br />

≤ 0.05 ⇒ n ≥ 50000.<br />

Chia-Ping Chen ( 中 山 資 工 ) Limit Theorems 機 率 學 講 義 13 / 28


實 數 序 列 的 收 斂<br />

實 數 序 列 a 1 , a 2 , . . . 收 斂 到 a, 記 作<br />

lim a n = a.<br />

n→∞<br />

意 思 是 a n 與 a 的 距 離 |a n − a| 可 以 任 意 小 。<br />

任 意 小 的 意 思<br />

舉 例<br />

給 定 任 意 的 δ > 0, 都 可 以 找 到 n 0 使 得 只 要 n > n 0 ,|a n − a|<br />

就 比 δ 更 小 。 挑 戰 與 回 應 :δ 是 挑 戰 ,n 0 是 回 應 。<br />

考 慮 民 調 的 例 子 , 給 定 ɛ, 機 率 序 列<br />

為 實 數 序 列 , 收 斂 到 0。<br />

P (|M n − p| ≥ ɛ) , n = 1, 2, . . .<br />

Chia-Ping Chen ( 中 山 資 工 ) Limit Theorems 機 率 學 講 義 14 / 28


隨 機 變 數 序 列 的 收 斂 情 形<br />

隨 機 變 數 序 列 收 斂 分 為 幾 種 情 形 。 以 下 討 論 其 中 兩 類<br />

1 在 機 率 上 收 斂 converges in probability<br />

2 幾 乎 確 定 性 收 斂 converges almost surely<br />

Chia-Ping Chen ( 中 山 資 工 ) Limit Theorems 機 率 學 講 義 15 / 28


機 率 上 收 斂<br />

隨 機 變 數 序 列<br />

在 機 率 上 收 斂 到 a, 記 作<br />

Y = Y 1 , Y 2 , . . .<br />

Y<br />

P<br />

−−→ a,<br />

意 思 是 對 任 意 ɛ > 0,<br />

lim P(|Y n − a| ≥ ɛ) = 0.<br />

n→∞<br />

換 言 之 ,n → ∞ 時 Y n 與 a 的 距 離 不 為 任 意 小 的 機 率 為 任 意 小 。<br />

意 義<br />

這 裡 有 兩 個 序 列 : 隨 機 變 數 序 列 Y 1 , Y 2 , . . . 與 實 數 ( 機 率 ) 序<br />

列 P(|Y n − a| ≥ ɛ)。 若 實 數 ( 機 率 ) 序 列 收 斂 到 0, 則 隨 機 變<br />

數 序 列 在 機 率 上 收 斂 到 a。<br />

Chia-Ping Chen ( 中 山 資 工 ) Limit Theorems 機 率 學 講 義 16 / 28


Example 5.6<br />

Consider a sequence of independent random variables X n that are<br />

uniformly distributed in the interval [0, 1], and let<br />

Y n min(X 1 , . . . , X n ).<br />

Does Y 1 , Y 2 , . . . converge to zero in probability<br />

說 明<br />

P(|Y n − 0| ≥ ɛ) = (1 − ɛ) n<br />

n→∞<br />

−−−→ 0.<br />

Chia-Ping Chen ( 中 山 資 工 ) Limit Theorems 機 率 學 講 義 17 / 28


Example 5.7<br />

Let Y be an exponentially distributed random variable with<br />

parameter λ = 1。For any positive integer n, let Y n = Y /n. Does<br />

Y 1 , Y 2 , . . . converge to 0 in probability<br />

說 明<br />

P(|Y n − 0| ≥ ɛ) = e −nɛ<br />

n→∞<br />

−−−→ 0.<br />

Chia-Ping Chen ( 中 山 資 工 ) Limit Theorems 機 率 學 講 義 18 / 28


幾 乎 確 定 性 收 斂<br />

隨 機 變 數 序 列<br />

Y = Y 1 , Y 2 , . . .<br />

幾 乎 確 定 性 收 斂 或 以 機 率 1 收 斂 converges with probability 1 到<br />

a, 記 作<br />

a.s.<br />

Y −−−→ a,<br />

意 思 是<br />

意 義<br />

( )<br />

P lim Y n = a = 1.<br />

n→∞<br />

取 值 後 的 序 列 Y 1 , Y 2 , . . . 中 有 些 收 斂 到 a, 這 些 收 斂 到 a 的 序<br />

列 總 機 率 為 1。<br />

Chia-Ping Chen ( 中 山 資 工 ) Limit Theorems 機 率 學 講 義 19 / 28


Example 5.15<br />

Consider a discrete-time arrival process. The set of times is<br />

partitioned into consecutive intervals of the form<br />

I k = {2 k , 2 k + 1, . . . , 2 k+1 − 1}. Note that the length of I k is 2 k ,<br />

which increases with k. During each I k , there is exactly one arrival,<br />

and all times within an interval are equally likely. The arrival times<br />

within different intervals are assumed independent. Define Y n = 1 if<br />

there is an arrival at time n, and Y n = 0 otherwise.<br />

說 明<br />

此 隨 機 序 列 在 機 率 上 收 斂 到 0, 因 為<br />

P(|Y n − 0| > ɛ) = P(Y n ≠ 0) = 1 2 k<br />

n→∞<br />

−−−→ 0.<br />

然 而 , 取 值 後 的 序 列 Y 1 , Y 2 , . . . 顯 然 並 不 收 斂 。 因 此 , 收 斂 到<br />

0 的 機 率 為 0。 也 就 是 此 隨 機 序 列 不 以 機 率 1 收 斂 到 0。<br />

Chia-Ping Chen ( 中 山 資 工 ) Limit Theorems 機 率 學 講 義 20 / 28


大 數 法 則<br />

假 設 隨 機 變 數 序 列<br />

X = X 1 , X 2 , . . .<br />

為 i.i.d.。 此 外 ,X i 的 期 望 值 µ 與 變 異 數 σ 2 為 有 限 。<br />

弱 大 數 法 則 weak law of large numbers<br />

X 的 樣 本 平 均 序 列 在 機 率 上 收 斂 到 µ。<br />

強 大 數 法 則 strong law of large numbers<br />

X 的 樣 本 平 均 序 列 以 機 率 1 收 斂 到 µ。<br />

Chia-Ping Chen ( 中 山 資 工 ) Limit Theorems 機 率 學 講 義 21 / 28


弱 大 數 法 則 的 證 明<br />

令<br />

M = M 1 , M 2 , . . .<br />

為 樣 本 平 均 序 列 。M n 的 期 望 值 為 µ, 變 異 數 為<br />

σ 2<br />

n 。 根 據 契 比 雪<br />

夫 不 等 式<br />

因 此<br />

P (|M n − µ| ≥ ɛ) ≤ var(M n)<br />

ɛ 2<br />

M<br />

= σ2<br />

nɛ 2<br />

P<br />

−−→ µ.<br />

n→∞<br />

−−−→ 0, ∀ ɛ.<br />

Chia-Ping Chen ( 中 山 資 工 ) Limit Theorems 機 率 學 講 義 22 / 28


中 央 極 限 定 理<br />

隨 機 變 數 序 列<br />

X 1 , X 2 , . . .<br />

為 i.i.d., 則 其 規 範 化 樣 本 平 均 近 似 於 標 準 高 斯<br />

Z n = S n − nµ<br />

σ √ n<br />

→ Y ∼ N(0, 1).<br />

說 明<br />

Z n 的 MGF M Zn (s) 趨 近 於 Y 的 MGF M Y (s), 因 此 Z n 的 CDF<br />

收 斂 到 Y 的 CDF,<br />

F Zn (z) = P(Z n ≤ z)<br />

n→∞<br />

−−−→ Φ Y (z).<br />

Chia-Ping Chen ( 中 山 資 工 ) Limit Theorems 機 率 學 講 義 23 / 28


中 央 極 限 定 理 應 用<br />

X 1 , X 2 , . . . 為 i.i.d., 期 望 值 為 µ, 變 異 數 為 σ 2 , 樣 本 和 為 S n 。 則<br />

(<br />

Sn − nµ<br />

P(S n ≤ c) = P<br />

σ √ ≤ c − nµ )<br />

n σ √ n<br />

(<br />

= P Z n ≤ c − nµ )<br />

σ √ n<br />

( ) c − nµ<br />

≈ Φ Y<br />

σ √ .<br />

n<br />

Chia-Ping Chen ( 中 山 資 工 ) Limit Theorems 機 率 學 講 義 24 / 28


Example 5.9<br />

We load on a plane 100 packages whose weights are independent<br />

random variables that are uniformly distributed between 5 and 50<br />

pounds. What is the probability that the total weight will exceed<br />

3000 pounds<br />

說 明<br />

µ = 27.5, σ 2 (50 − 5)2<br />

= = 168.75.<br />

12<br />

( )<br />

S100 − 100 ∗ 27.5 3000 − 100 ∗ 27.5<br />

P(S 100 ≥ 3000) = P √ ≥ √<br />

100 ∗ 168.75 100 ∗ 168.75<br />

= P(Z n ≥ 1.92)<br />

≈ P(Y ≥ 1.92)<br />

= 1 − P(Y ≤ 1.92)<br />

= 0.0274.<br />

Chia-Ping Chen ( 中 山 資 工 ) Limit Theorems 機 率 學 講 義 25 / 28


Example 5.10<br />

A machine processes parts, one at a time. The processing times of<br />

different parts are independent random variables, uniformly<br />

distributed in [1, 5]. We wish to approximate the probability that the<br />

number of parts processed within 320 time units, denoted by N 320 , is<br />

at least 100.<br />

說 明<br />

{N 320 ≥ 100} = {S 100 ≤ 320}.<br />

µ = 3, σ 2 = 4/3.<br />

(<br />

S 100 − 100 ∗ 3<br />

P(S 100 ≤ 320) = P √ ≤<br />

100 ∗ 4/3<br />

= P(Z n ≤ 1.73)<br />

≈ P(Y ≤ 1.73)<br />

= 0.9582.<br />

)<br />

320 − 100 ∗ 3<br />

√<br />

100 ∗ 4/3<br />

Chia-Ping Chen ( 中 山 資 工 ) Limit Theorems 機 率 學 講 義 26 / 28


Example 5.11<br />

We poll n voters and record the fraction M n of those polled who are<br />

in favor of a particular candidate. If p is the fraction of the entire<br />

voter population that supports this candidate, then<br />

M n = X 1 + · · · + X n<br />

,<br />

n<br />

where X i ’s are i.i.d. Bernoulli random variables with parameter p.<br />

When n is large,<br />

M n − p = X 1 + · · · + X n − np<br />

n<br />

= X 1 + · · · + X n − np<br />

√ nσ<br />

= Z n<br />

) ≈ Y ).<br />

( √n<br />

( √n<br />

σ √n<br />

σ<br />

σ<br />

Chia-Ping Chen ( 中 山 資 工 ) Limit Theorems 機 率 學 講 義 27 / 28


(<br />

P(|M n − p| ≥ ɛ) ≈ 2P(M n − p ≥ ɛ) ≈ 2P Y ≥<br />

≤ 2<br />

[<br />

1 − P<br />

(<br />

Y ≤<br />

(√ n<br />

σ<br />

≤ 2 [ 1 − Φ Y (2 √ nɛ) ] .<br />

)<br />

ɛ<br />

)]<br />

若 要 求 確 度 為 ɛ = 0.01, 信 度 為 1 − δ = 0.95 時 , 則 需<br />

P(|M n − p| ≥ 0.01) ≤ 2(1 − Φ(2 · √n · 0.01)) ≤ 0.05<br />

(√ ) ) n<br />

ɛ<br />

σ<br />

⇒ Φ(2 · √n · 0.01) ≥ 0.975 ⇒ 2 · √n · 0.01 ≥ 1.96<br />

⇒ n ≥ 9604.<br />

Chia-Ping Chen ( 中 山 資 工 ) Limit Theorems 機 率 學 講 義 28 / 28

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!