21.11.2014 Views

20100615-IBISML-makino

20100615-IBISML-makino

20100615-IBISML-makino

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

ノンパラメトリックベイズに 基 づく<br />

x<br />

x<br />

統 計 的 機 械 学 習<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

Takaki Makino<br />

x<br />

x<br />

x<br />

Division of Project Coordination<br />

University of Tokyo<br />

x<br />

x<br />

2010.6.15 <strong>IBISML</strong> 第 1 回 研 究 会 にて 1<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x


本 発 表 の 目 標<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

誰 でもノンパラベイズがわかるように<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x背 景 知 識 x 、 用 x 語 の 知 識 x が 必 x 要 x<br />

この x 本 x → のおかげで、ベイズについ<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

ての 知 識 はだいぶ 普 及 した?<br />

x x<br />

x<br />

わからない 人 はとことんわからない<br />

できるだけ x x 背 景 知 識 を x 含 めて x<br />

x<br />

お 話 しします<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

Introductory な 内 容 なので、<br />

ご 存 じの 方 にはつまらないかも<br />

しれませんがご 了 承 ください<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

2<br />

x


Introduction: ベイジアンとは 何 か?<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

Quiz: x x 10 x 万 x 人 に1 x x人 がかかる x x<br />

x 病 x 気 θx<br />

がある。<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

検 査 D は、θ 病 の 人 を99.8% 陽 性 と 判 定 するが、<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

θ x 病 でない 人 x も0.1% 陽 x性 となってしまう。<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

あなたが D 陽 性 のとき、θ 病 である 確 率 は?<br />

x<br />

x<br />

x<br />

x<br />

p(D|θ) x x D 陽 性 x D 陰 x 性<br />

x<br />

p(D|θ 病 ) 0.998 0.002<br />

x<br />

x<br />

x<br />

p(D| 健 康 ) 0.001 0.999<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

p(θ|D) = ?<br />

x<br />

x<br />

x<br />

x


Introduction: ベイジアンとは 何 か?<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

Quiz: x x 10 x 万 x 人 に1 x x人 がかかる x x<br />

x 病 x 気 θx<br />

がある。<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

検 査 D は、θ 病 の 人 を99.8% 陽 性 と 判 定 するが、<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

θ x 病 でない 人 x も0.1% 陽 x性 となってしまう。<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

あなたが D 陽 性 のとき、θ 病 である 確 率 は?<br />

x<br />

x<br />

x<br />

x<br />

p(D|θ) x x D 陽 性 x D 陰 x 性<br />

x<br />

p(D|θ 病 ) 0.998 0.002<br />

x<br />

x<br />

x<br />

p(D| 健 康 ) 0.001 0.999<br />

x<br />

x<br />

x<br />

p(θ)<br />

θ 病 0.00001<br />

x<br />

健 康 0.99999<br />

x<br />

x<br />

x<br />

Bayes’<br />

x<br />

Posterior Likelihood Prior<br />

p(<br />

|<br />

Theorem p(<br />

D)<br />

x<br />

D)<br />

<br />

x<br />

p(<br />

D<br />

x<br />

| )<br />

p(<br />

)<br />

4<br />

x


Introduction: ベイジアンとは 何 か?<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

Quiz: x x 10 x 万 x 人 に1 x x人 がかかる x x<br />

x 病 x 気 θx<br />

がある。<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

検 査 D は、θ 病 の 人 を99.8% 陽 性 と 判 定 するが、<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

θ x 病 でない 人 x も0.1% 陽 x性 となってしまう。<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

あなたが D 陽 性 のとき、θ 病 である 確 率 は?<br />

x<br />

x<br />

x<br />

x<br />

p(D|θ) x x D 陽 性 x D 陰 x 性<br />

x<br />

p(D|θ 病 ) 0.998 0.002<br />

x<br />

x<br />

x<br />

p(D| 健 康 ) 0.001 0.999<br />

x<br />

x<br />

x<br />

p(θ)<br />

θ 病 0.00001<br />

x<br />

健 康 0.99999<br />

x<br />

x<br />

p(θ|D) p(θ|D 陽 性 ) p(θ|D 陰 性 )<br />

x<br />

x<br />

θ 病 ≈0.01 ≈0.00000002<br />

x<br />

健 康 ≈0.99 ≈0.99999998<br />

x<br />

Prior ( 事 前 分 布 )<br />

x<br />

Likelihood ( 尤 度 )<br />

x<br />

Posterior ( 事 後 分 5 布 )


Introduction: ベイジアンとは 何 か?<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

ベイジアン x x<br />

x x 確 率 x 論 x : 仮 x 説 x の「 x確 xからしさ」を x x<br />

x確 x率<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

で 表 現 し、ベイズの 定 理 で 推 論 する<br />

x<br />

x x<br />

x x<br />

x x<br />

x<br />

θ: 「 宇 宙 人 x がいる」or「いない」という x<br />

x 仮 説<br />

x D: 「UFOを x目 撃 する」or「しない」という x<br />

x x 事 象<br />

x x<br />

x<br />

x<br />

x<br />

p(θ): 宇 宙 人 の 存 在 はどのぐらい 確 からしいか?<br />

x x<br />

x x<br />

x x<br />

p(D|θ): 宇 宙 人 x がいる 時 にUFOを x 目 撃 する 確 率<br />

xp(θ|D): UFOを 目 撃 x したあとでは、 x<br />

x<br />

宇 宙 人 の 存 在 はどのぐらい 確 からしいか?<br />

x<br />

Bayes’<br />

x<br />

Posterior Likelihood Prior<br />

p(<br />

|<br />

Theorem p(<br />

D)<br />

x<br />

D)<br />

<br />

x<br />

p(<br />

D<br />

x<br />

| )<br />

p(<br />

)<br />

x<br />

x x<br />

x<br />

6<br />

x


Introduction: ベイジアンとは 何 か?<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

ベイジアン x x<br />

x x 確 率 x 論 x : 仮 x 説 x の「 x確 xからしさ」を x x<br />

x確 x率<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

で 表 現 し、ベイズの 定 理 で 推 論 一 般 する の ( 頻 度 主 義 的 )<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x θ: 「 宇 宙 人 x がいる」or「いない」という x 考 え x 仮 方 説 からすると、 x<br />

x D: 「UFOを x目 撃 する」or「しない」という x<br />

x x 事 象<br />

p(θ): 宇 宙 人 の 存 在 はどのぐらい 確 からしいか?<br />

x x<br />

x x<br />

x x<br />

p(D|θ): 宇 宙 人 x がいる 時 にUFOを x 目 撃 する 確 率<br />

xp(θ|D): UFOを 目 撃 x したあとでは、 x<br />

x<br />

宇 宙 人 の 存 在 はどのぐらい 確 からしいか?<br />

x<br />

Bayes’<br />

x<br />

p(<br />

|<br />

Theorem p(<br />

D)<br />

x<br />

D)<br />

確 率 では 書 けない<br />

Posterior Likelihood Prior<br />

<br />

x<br />

p(<br />

D<br />

x<br />

| )<br />

p(<br />

)<br />

x<br />

x<br />

7<br />

x<br />

x<br />

x


Introduction: 機 械 学 習 とベイズ<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

機 x 械 x 学 x習 x = パラメータ x x<br />

x 決 x 定 x= 仮 x 説 の x x選 択 x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

真 の x分 布<br />

8<br />

x


Introduction: 機 械 学 習 とベイズ<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

機 x 械 x 学 x習 x = パラメータ x x<br />

x 決 x 定 x= 仮 x 説 の x x選 択 x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x x<br />

x<br />

x x<br />

モデル x x パラメータ 空 x 間 ( 仮 x 説 空 間 )<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

観 測 したデータ x D<br />

x<br />

x<br />

x<br />

x<br />

真 の x分 布<br />

9<br />

x


Introduction: 機 械 学 習 とベイズ<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

機 x 械 x 学 x習 x = パラメータ x x<br />

x 決 x 定 x= 仮 x 説 の x x選 択 x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

p(D | θ)<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

モデル x x パラメータ 空 x 間 ( 仮 x 説 空 間 )<br />

x<br />

観 測 したデータ x D<br />

x<br />

x<br />

x<br />

θ<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

Likelihood<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

分 布 の 仮 説<br />

真 の x分 布<br />

x<br />

x<br />

x<br />

10<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

1


Introduction: 機 械 学 習 とベイズ<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

機 x 械 x 学 x習 x = パラメータ x x<br />

x 決 x 定 x= 仮 x 説 の x x選 択 x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

p(D | θ)<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

モデル x x パラメータ 空 x 間 ( 仮 x 説 空 間 )<br />

x<br />

観 測 したデータ x D<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

Likelihood<br />

x<br />

θ<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

最 尤 推 定<br />

(Maximum<br />

x<br />

Likelihood)<br />

x<br />

分 布 の 仮 説<br />

真 の x分 布<br />

x<br />

x<br />

x<br />

11<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

1


Introduction: 機 械 学 習 とベイズ<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

過 x 学 x 習 x問 x題<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x<br />

x x<br />

x<br />

x x<br />

x<br />

x x<br />

x<br />

x x<br />

x<br />

x x<br />

x x<br />

x x<br />

Likelihood 最 大 のパラメータを 選 んでも、<br />

x x<br />

x x<br />

x x<br />

x<br />

いい 仮 説 が x 得 られないx<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

12<br />

x


Introduction: 機 械 学 習 とベイズ<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

過 x 学 x 習 x問 x題<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x<br />

x x<br />

x<br />

x x<br />

x<br />

x x<br />

x<br />

x x<br />

x<br />

x x<br />

x x<br />

x x<br />

Likelihood 最 大 のパラメータを 選 んでも、<br />

x x<br />

x x<br />

x x<br />

x<br />

いい 仮 説 が x 得 られないx<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

Best-fit<br />

regression by<br />

x<br />

8 th -degree<br />

polynomial<br />

13<br />

x


Introduction: 機 械 学 習 とベイズ<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x<br />

非 x ベイジアンの x<br />

x x<br />

x 考 x え 方 x : x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

複 雑 すぎるモデルを 選 んだのが 原 因<br />

x x<br />

x x<br />

x x<br />

適 切 な 複 雑 x さのモデルを x 選 ぶべしx<br />

ベイジアンの 考 え 方 :<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

x<br />

Likelihood x x p(D|θ) だけで x 考 x えているのが x 原 因 x<br />

x<br />

x<br />

xPosterior p(θ|D) を x 考 えることが x 重 要 x<br />

そのために 必 要 なのは Prior p(θ)、つまり<br />

「あるパラメータ θ がどれだけ 確 からしいか」<br />

に 関 xする (データ x D 観 測 前 の) 知 x 識 x<br />

x<br />

x x<br />

x<br />

14<br />

x


Introduction: 機 械 学 習 とベイズ<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

Prior: x x データ x x 観 x測 前 x の x ( 主 x 観 的 x な) x 仮 x説 の x 確 xからし<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

さを、 確 率 分 布 の 形 で 表 現 したもの<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x 高 次 の 係 数 x が0から 離 れることは、あまりありそうにない<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

パラメータ 空 間<br />

x x<br />

小 0 大 <br />

高 次 の 係 数<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

15<br />

x


Introduction: 機 械 学 習 とベイズ<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

Prior: x x データ x x 観 x測 前 x の x ( 主 x 観 的 x な) x 仮 x説 の x 確 xからし<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

さを、 確 率 分 布 の 形 で 表 現 したもの<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x 高 次 の 係 数 x が0から 離 れることは、あまりありそうにない<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

Prior p(θ)<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

パラメータ 空 間<br />

x x<br />

小 0 大 <br />

高 次 の 係 数<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

16<br />

x<br />

x


Introduction: 機 械 学 習 とベイズ<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

Posterior: x x<br />

x x データ x x観 測 x 後 x の 確 x からしさ<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

Likelihood<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

Prior p(θ)<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

パラメータ 空 間<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

観 測 したデータ<br />

Bayes’ x D<br />

x<br />

x<br />

Posterior Likelihood Prior<br />

p(<br />

|<br />

Theorem p(<br />

D)<br />

x<br />

D)<br />

<br />

x<br />

p(<br />

D<br />

x<br />

| )<br />

p(<br />

)<br />

17<br />

x


Introduction: 機 械 学 習 とベイズ<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

Posterior: x x<br />

x x データ x x観 測 x 後 x の 確 x からしさ<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

Posterior p(θ|D)<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

パラメータ 空 間<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

観 測 したデータ<br />

Bayes’ x D<br />

x<br />

x<br />

Posterior Likelihood Prior<br />

p(<br />

|<br />

Theorem p(<br />

D)<br />

x<br />

D)<br />

<br />

x<br />

p(<br />

D<br />

x<br />

| )<br />

p(<br />

)<br />

18<br />

x


Introduction: 機 械 学 習 とベイズ<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

Posterior: x x<br />

x x データ x x観 測 x 後 x の 確 x からしさ<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

MAP 推 定<br />

x x<br />

(Maximum x A Posteriori) x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

Posterior p(θ|D)<br />

パラメータ 空 間<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

観 測 したデータ x D<br />

x<br />

x<br />

x<br />

x<br />

x<br />

19<br />

x


Introduction: 機 械 学 習 とベイズ<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

適 x 切 x なx<br />

prior x があれば、 x x<br />

x x 過 学 x 習 x を 起 x こしにくい<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

Regression x<br />

with prior<br />

using x<br />

x<br />

8 th -degree<br />

x<br />

polynomial<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

20<br />

x


Introduction: 機 械 学 習 とベイズ<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

なぜパラメータ x x<br />

x x<br />

x θx<br />

の 同 x 定 x にこだわる?<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

Posterior p(θ|D)<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

θ<br />

x<br />

x<br />

パラメータ 空 間<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

21<br />

x


Introduction: 機 械 学 習 とベイズ<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

なぜパラメータ x x<br />

x x<br />

x θx<br />

の 同 x 定 x にこだわる?<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

欲 しいものは、モデルに 基 づく 何 らかの 予 測<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x x<br />

x<br />

θ<br />

x<br />

x<br />

x<br />

Posterior p(θ|D)<br />

パラメータ 空 間<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

未 知 のケース x に 対 応 する 予 測<br />

22<br />

x


Introduction: 機 械 学 習 とベイズ<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

なぜパラメータ x x<br />

x x<br />

x θx<br />

の 同 x 定 x にこだわる?<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

欲 しいものは、モデルに 基 づく 何 らかの 予 測<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

θ をひとつ 選 ぶ = posterior が 含 む 多 くの 情 報<br />

x<br />

x x<br />

x x<br />

x<br />

を 利 用 しない<br />

x<br />

x x<br />

x<br />

θ<br />

x<br />

x<br />

パラメータ 空 間<br />

x x<br />

x<br />

x x<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

未 知 のケース x に 対 応 する 予 測<br />

23<br />

x


Introduction: 機 械 学 習 とベイズ<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

Posterior<br />

x x<br />

x<br />

全<br />

x<br />

体<br />

xから x<br />

予<br />

x測 x<br />

をしたい!<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

p(<br />

x |<br />

<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

パラメータ θ を 積 分 消 去 予 測 分 布 p(x|D)<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

D)<br />

x<br />

x<br />

<br />

p(<br />

x | )<br />

p(<br />

|<br />

x<br />

x<br />

x<br />

D)<br />

d<br />

x<br />

x<br />

xθ 2<br />

パラメータ 空 間<br />

θ 1 x θ3<br />

x<br />

x<br />

x<br />

Posterior p(θ|D)<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

24


Introduction: 機 械 学 習 とベイズ<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

Posterior<br />

x x<br />

x<br />

全<br />

x<br />

体<br />

xから x<br />

予<br />

x測 x<br />

をしたい!<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

p(<br />

x |<br />

<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

パラメータ θ を 積 分 消 去 予 測 分 布 p(x|D)<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

D)<br />

x<br />

x<br />

<br />

p(<br />

x | )<br />

p(<br />

|<br />

x<br />

x<br />

x<br />

D)<br />

d<br />

x<br />

x<br />

x<br />

x<br />

x<br />

Posterior p(θ|D)<br />

パラメータ 空 間<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

E[x]<br />

x<br />

x<br />

p(x|D)<br />

x<br />

x<br />

25


Introduction: 機 械 学 習 とベイズ<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

Posterior<br />

x x<br />

x<br />

全<br />

x<br />

体<br />

xから x<br />

予<br />

x測 x<br />

をしたい!<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

p(<br />

x |<br />

<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

パラメータ θ を 積 分 消 去 予 測 分 布 p(x|D)<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

D)<br />

x<br />

x<br />

<br />

p(<br />

x | )<br />

p(<br />

|<br />

x<br />

x<br />

x<br />

D)<br />

d<br />

x<br />

x<br />

x<br />

x<br />

x<br />

Posterior p(θ|D)<br />

パラメータ 空 間<br />

x x<br />

期 待 値 E[x]<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

E x]<br />

x<br />

x p(<br />

x | D)<br />

x<br />

<br />

x<br />

dx<br />

x<br />

x<br />

x<br />

E[x]<br />

x<br />

x<br />

p(x|D)<br />

x<br />

x<br />

26


Introduction: 機 械 学 習 とベイズ<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

予 x 測 x の x分 x布 p(x|D) x x から、 x x 予 x測 x の 確 x からしさ<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

( 不 確 かさ) を 知 ることができる<br />

x<br />

x x<br />

x x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

分 散 が 小 さい<br />

( 予 測 の 確 実 性 が 高 い)<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

分 散 が 大 きい<br />

( 予 測 が 不 x 確 実 )<br />

x<br />

x<br />

x<br />

27<br />

x


Introduction:<br />

ベイジアン 機 械 学 習 のまとめ<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

パラメータ=モデル 仮 説 の「 確 からしさ」を 確 率 分<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

布 で x 考 えるx<br />

x<br />

x x<br />

x x<br />

x x<br />

ベイズの x x 定 理 で、データからパラメータ x x<br />

x x 分 布 x を 推 x 論<br />

x<br />

x<br />

x<br />

x<br />

x<br />

過 学 習 を 起 こしにくい<br />

x<br />

x<br />

x<br />

適 切 な prior が 必 要 (モデル 選 択 よりは 簡 単 )<br />

自 x動 モデル x 選 択 とみなすこともできる<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

Posterior x 全 体 を 使 xって 予 測 分 x 布 を 作 れる<br />

パラメータ 空 間 の 座 標 の 取 り 方 に 依 存 しない<br />

予 測 の 不 確 かさが 明 示 的 に 表 現 される<br />

学 習 が<br />

x<br />

理 論 的<br />

x<br />

に、きれいに 記 述 できる<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

主 観 的 要 素 (prior) と 推 論 の 分 離<br />

28<br />

x<br />

x


Talk Outline<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

Introduction<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

ベイジアンとは 何 か?<br />

x<br />

x x<br />

x<br />

ベイズHMMモデル<br />

x<br />

x<br />

x<br />

x Dirichlet 分 布 x<br />

x<br />

ノンパラメトリックベイズHMMモデル<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

機 械 学 習 とベイズ<br />

Bayesian HMM<br />

Dirichlet process<br />

x<br />

Hierarchical Dirichlet process<br />

Infinite Hidden Markov Model<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

HMMの 状 態 の 階 層 的 クラスタリング<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

29<br />

x


隠 れマルコフモデル (HMM)<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

時 x 系 x 列 xの x確 率 x 分 x 布 を x 表 x わすモデル<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

状 態 s<br />

x t は 直 前 の 状 態 s<br />

x<br />

x x t-1 にのみ 依 存<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

p<br />

( st<br />

1 | s , , , ) ( |<br />

x<br />

1<br />

s2<br />

s<br />

x<br />

t<br />

p s<br />

x<br />

t1<br />

s<br />

x<br />

t<br />

出 力 記 号 e t は s t にのみ 依 存<br />

x<br />

p<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

( et<br />

| s1,<br />

,<br />

s<br />

x t,<br />

e1<br />

, ,<br />

et<br />

-1)<br />

p(<br />

e | )<br />

x t<br />

st<br />

x x<br />

s 0 s 1 s 2 s 3<br />

)<br />

x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

e 1 e 2 e 3<br />

x<br />

x<br />

30<br />

x


HMMの 行 列 表 現<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

状 x 態 x を 整 x 数 x {1,…,N} x x<br />

x で、 x 出 x力 xを{1,…,M}で<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

表 わす<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

パラメータは2つの x 行 x 列 で 表 わされる<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

a<br />

b<br />

ji<br />

ki x<br />

<br />

x<br />

<br />

p<br />

( st<br />

x<br />

1<br />

p(<br />

e<br />

t<br />

j | s<br />

k | s<br />

x<br />

t<br />

t<br />

x<br />

i)<br />

i)<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x x<br />

列 i は、 x 状 態 i から 出 力 されx<br />

x<br />

x<br />

列 i は、 状 態 i の 後 の<br />

状 態 の 分 布 を 表 わす<br />

x<br />

る 記 号 の 分 布 を 表 わす<br />

x<br />

x<br />

Transition<br />

Matrix<br />

A =<br />

x<br />

a 11<br />

a 21<br />

a N1<br />

x<br />

a 1i<br />

a 2i<br />

a Ni<br />

x<br />

a 1N<br />

a 2N<br />

a NN<br />

x<br />

Emission<br />

Matrix<br />

B =<br />

x<br />

b 11<br />

b 21<br />

b M1<br />

b 1i<br />

b 2i<br />

x<br />

b Mi<br />

b 1N<br />

b 2N<br />

b MN<br />

31<br />

x


HMMのベイズ 的 扱 い 方<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

Prior、Posterior x x<br />

x x<br />

x を x 表 わすために、 x x<br />

x x HMMのパ<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x<br />

ラメータ 空 間 の 上 の 確 率 分 布 を 記 述 したい<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

Dirichlet x分 布 を 組 み x 合 わせて x使 う<br />

x<br />

( 多<br />

x<br />

項 分 布 のパラメータ<br />

x x<br />

上 の<br />

x<br />

確 率<br />

x分 布 )<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

Transition<br />

Matrix<br />

A =<br />

x<br />

a 11<br />

a 21<br />

a N1<br />

x<br />

a 1i<br />

a 2i<br />

a Ni<br />

x<br />

a 1N<br />

a 2N<br />

a NN<br />

x<br />

Emission<br />

Matrix<br />

B =<br />

x<br />

b 11<br />

b 21<br />

b M1<br />

b 1i<br />

b 1N<br />

b 2i b<br />

x 2N<br />

x<br />

32<br />

b Mi<br />

b MN


多 項 分 布<br />

(multinomial distribution)<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

N x 値 x 離 散 x 確 x 率 変 x 数 x の x確 x率 分 x 布 x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

p( X j | θ)<br />

x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

N 個 のパラメータで 表 わされる<br />

x<br />

x<br />

x<br />

θ ( 1<br />

,..., N<br />

)<br />

確 率 分 布 としての 制 約 を 満 たす<br />

<br />

x<br />

0 1<br />

i<br />

N<br />

i1<br />

<br />

x<br />

x<br />

HMM の<br />

x<br />

遷 移<br />

x行 列 の<br />

各 列 は 多 項 分 布 である<br />

i<br />

j<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

A = x<br />

x<br />

Transition<br />

Matrix<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

θ 4<br />

θ<br />

θ<br />

x 2 x x<br />

1 θ3<br />

θ 5<br />

x<br />

1 2 3 4 5<br />

x<br />

x<br />

x<br />

4, 2, 3, 1, 4, 5, 2, 4, 4, 1,<br />

5, 3, 2, x 4, 5, 5, x 4, 2, 1, 3…<br />

x<br />

a 11<br />

a N1<br />

x<br />

a 1i<br />

a Ni<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

a 1N<br />

x<br />

a NN<br />

33<br />

x<br />

x<br />

x<br />

x<br />

x


Dirichlet 分 布 (1)<br />

x<br />

1, x<br />

1,<br />

2,<br />

1,<br />

3,<br />

…<br />

3,<br />

1,<br />

3,<br />

2,<br />

3,<br />

…<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

多 x 項 x 分 x布 xの prior x x を 表 x わすのに x<br />

x x 便 x利 xな 分 x布<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

多 項 分 布 のパラメータ θ ( 1<br />

,..., N<br />

) 上 の 確 率 分 布<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

ハイパーパラメータ x α x<br />

x<br />

x<br />

1 …α N が 分 布 の 形 を 表 わす<br />

θ 1<br />

x x<br />

θ 2 θ 3<br />

x<br />

1 2 3<br />

x<br />

θ 1 θ 2<br />

θ 3<br />

1 2 3<br />

x<br />

Dir( θ<br />

x<br />

x<br />

| <br />

θ 1<br />

θ 2<br />

1<br />

, ,<br />

N<br />

)<br />

x x<br />

<br />

x x<br />

x<br />

x x<br />

x<br />

x<br />

N<br />

<br />

i1<br />

<br />

x<br />

θ 3<br />

x<br />

i<br />

-1<br />

i<br />

x<br />

x<br />

x<br />

Dir(3,2,6)<br />

x<br />

x<br />

x<br />

x<br />

34<br />

x<br />

x<br />

x


Dirichlet 分 布 (2)<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x 多 x 項 x 分 x布 xの 共 x 役 x 事 前 x 分 x 布 (conjugate x x<br />

x x prior) x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

p<br />

<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

データ 観 測 後 のposteriorも、priorと 同 じ 形 式 で 記<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

述 できる x<br />

x<br />

x<br />

x<br />

Dir( θ<br />

x<br />

1<br />

x<br />

x<br />

θ | , ,<br />

,<br />

N<br />

x<br />

| <br />

1<br />

, ,<br />

N<br />

)<br />

X <br />

x x<br />

j<br />

x<br />

<br />

<br />

<br />

x<br />

x<br />

N<br />

<br />

i1<br />

x<br />

p(<br />

X<br />

<br />

j<br />

<br />

N<br />

i1<br />

Dir( θ<br />

i<br />

-1<br />

i<br />

<br />

<br />

x<br />

<br />

x<br />

i<br />

-1<br />

i<br />

x<br />

x x<br />

x x<br />

j | θ)<br />

Dir(<br />

θ<br />

x<br />

| , ,<br />

1,<br />

,<br />

<br />

1<br />

j<br />

x<br />

x<br />

| , ,<br />

<br />

ハイパーパラメータ α j は、 事 前 に j を 観 測 していた 回 数 に 相 当<br />

35<br />

1<br />

N<br />

)<br />

x<br />

N<br />

x<br />

)<br />

x<br />

x<br />

x


Dirichlet 分 布 (3)<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x Dirichlet x x<br />

x 分 x 布 の x 例 x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

観 測 のたびに、ハイパーパラメータが 更 新 される<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

Prior Likelihood Posterior<br />

x<br />

x<br />

x<br />

Dir(θ |1,1,1) × p ( X 3| θ)<br />

3<br />

∝ Dir(θ |1,1, 2)<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

36<br />

x


Dirichlet 分 布 (3)<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x Dirichlet x x<br />

x 分 x 布 の x 例 x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

観 測 のたびに、ハイパーパラメータが 更 新 される<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

Prior Likelihood Posterior<br />

x<br />

x<br />

x<br />

Dir(θ |1,1, 2) × p ( X 1|<br />

θ)<br />

1<br />

∝ Dir(θ | 2,1, 2)<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

37<br />

x


Dirichlet 分 布 (3)<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x Dirichlet x x<br />

x 分 x 布 の x 例 x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

観 測 のたびに、ハイパーパラメータが 更 新 される<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

Prior Likelihood Posterior<br />

x<br />

x<br />

x<br />

Dir(θ | 2,1, 2) × p ( X 3| θ)<br />

3<br />

∝ Dir(θ | 2,1, 3)<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

38<br />

x


Dirichlet 分 布 (3)<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x Dirichlet x x<br />

x 分 x 布 の x 例 x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

観 測 のたびに、ハイパーパラメータが 更 新 される<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

Prior Likelihood Posterior<br />

x<br />

x<br />

x<br />

Dir(θ | 2,1, 3) × p ( X 2 | θ)<br />

2<br />

∝ Dir(θ | 2, 2, 3)<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

39<br />

x


Dirichlet 分 布 (3)<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x Dirichlet x x<br />

x 分 x 布 の x 例 x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

観 測 のたびに、ハイパーパラメータが 更 新 される<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

Prior Likelihood Posterior<br />

x<br />

x<br />

x<br />

Dir(θ | 2, 2, 3) × p ( X 2 | θ)<br />

2<br />

∝ Dir(θ | 2, 3, 3)<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

40<br />

x


Dirichlet 分 布 (3)<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x Dirichlet x x<br />

x 分 x 布 の x 例 x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

観 測 のたびに、ハイパーパラメータが 更 新 される<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

Prior Likelihood Posterior<br />

x<br />

x<br />

x<br />

Dir(θ | 2, 3, 3) × p ( X 2 | θ)<br />

2<br />

∝ Dir(θ | 2, 4, 3)<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

41<br />

x


Dirichlet 分 布 (3)<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x Dirichlet x x<br />

x 分 x 布 の x 例 x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

観 測 のたびに、ハイパーパラメータが 更 新 される<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

Prior Likelihood Posterior<br />

x<br />

x<br />

x<br />

Dir(θ | 2, 4, 3) × p ( X 2 | θ)<br />

2<br />

∝ Dir(θ | 2, 5, 3)<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

42<br />

x


Dirichlet 分 布 (3)<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x Dirichlet x x<br />

x 分 x 布 の x 例 x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

観 測 のたびに、ハイパーパラメータが 更 新 される<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

Prior Likelihood Posterior<br />

x<br />

x<br />

x x<br />

観 測 数 が 増 えると、 事 後 分 布 の 幅<br />

x<br />

x x<br />

が 狭 くなっていく<br />

↑<br />

x<br />

Dir(θ | 2, 5, 3) × p ( X 2 | θ)<br />

2<br />

∝ Dir(θ | 2, 6, 3)<br />

x x<br />

x x<br />

観 測 x により 仮 説 の 不 確 x かさが 減 尐<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

43<br />

x


Dirichlet 分 布 (4)<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

予 x 測 x 分 x布 xも 簡 x単 xに 構 x成 x できる x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

p(<br />

X<br />

x<br />

<br />

<br />

Dir( x<br />

<br />

x<br />

j<br />

x<br />

x x<br />

x x<br />

パラメータ θ を 積 分 消 去 する<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

θ | , ,<br />

<br />

x<br />

1<br />

p(<br />

X<br />

j<br />

x<br />

j<br />

x<br />

N<br />

)<br />

x x<br />

N<br />

N<br />

x<br />

N<br />

<br />

| θ)<br />

<br />

j<br />

x<br />

i1<br />

<br />

i<br />

-1<br />

i<br />

p(<br />

X<br />

j | θ) Dir( θ | , ,<br />

<br />

<br />

1<br />

| , ,<br />

<br />

1<br />

<br />

<br />

<br />

)<br />

x x<br />

x x<br />

1<br />

N<br />

x<br />

) dθ<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x<br />

1 2 3<br />

x x<br />

?<br />

x<br />

44<br />

x<br />

1 2 3<br />

x


Dirichlet 分 布 (5)<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

1 x 未 x 満 のx<br />

α x = 疎 x な x 分 布 x の x 事 前 x 分 x 布 x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

x x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

確 率 が 端 に 集 中 … 出 る 確 率 がほぼ0の 値 がある<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

45<br />

x


HMM パラメータの 分 布<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

パラメータ:<br />

x x<br />

x x<br />

遷 移<br />

x x行 列<br />

xと x出 力<br />

x行 x列<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

行 列 の 各 列 が 多 項 分 布<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

Dirichlet x分 布 で prior x を 表 現 できる<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

状<br />

x<br />

態 列 S が<br />

x<br />

与 えられれば、posterior<br />

x<br />

x x<br />

もまたx<br />

Dirichlet 分 布 で 表 現 できる<br />

x x<br />

x x<br />

x x<br />

S 中 の 各 状 態 x遷 移 の 回 数 分 、ハイパーパラメータ<br />

x<br />

x<br />

xを 更 新<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

Transition<br />

Matrix<br />

A =<br />

x<br />

a 11<br />

a 12<br />

a 21 a 22<br />

x<br />

a N1 a N2<br />

a 1i<br />

a 2i<br />

a Ni<br />

x<br />

a 1N<br />

a 2N<br />

a NN<br />

a<br />

x<br />

ji<br />

<br />

x<br />

x<br />

p( s<br />

1<br />

j | s i)<br />

t<br />

t<br />

46<br />

x


HMMのベイズ 推 定<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

出 x 力 x 列 x D x 観 測 x 後 x の posterior x x<br />

x p(θ x | D) x x が 欲 x しい x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

状 態 列 S が 与 えられれば、 p(θ | S,D) は 解 析 的 に<br />

x x<br />

x x<br />

x x<br />

x x<br />

解 ける (Dirichlet x 分 布 を x 使 う)<br />

x<br />

x<br />

x x<br />

通 常 は S が<br />

x<br />

不 明<br />

x<br />

p(θ | D) は<br />

x<br />

解 析<br />

x的 に 解 けない<br />

x x<br />

状 態 列 S を 隠 れ 変 数 とみなし、<br />

x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

状 態 列 S とパラメータ θ の 同 時 分 布 を 推 定<br />

x<br />

x x<br />

状 態 列 S をパラメータ θ から 推 定 : p(S | θ,D)<br />

パラメータ θ を 状 態 列 S から 推 定 : p(θ | S,D)<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

47<br />

x<br />

x<br />

x


x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

HMM Bayesian Model<br />

x x<br />

x x<br />

x<br />

0 x x<br />

x x<br />

x<br />

x p(<br />

x<br />

x x<br />

as t-1<br />

s<br />

x<br />

t<br />

x<br />

p(<br />

e<br />

p(<br />

a<br />

x<br />

b<br />

x<br />

x<br />

x<br />

x<br />

x<br />

<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

Dir( x<br />

x<br />

x<br />

x x<br />

, x<br />

x<br />

x<br />

x<br />

<br />

x<br />

x<br />

x<br />

x<br />

t t st<br />

et<br />

st<br />

x x<br />

x x<br />

x x<br />

x E<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

s 0<br />

s 1 s 2 s 3 s 4 s 5<br />

bs t<br />

x N x<br />

x x<br />

e 1<br />

x e 2 e 3 e 4 e 5<br />

48<br />

x<br />

px<br />

(<br />

s<br />

s<br />

t-1<br />

s<br />

s<br />

, a<br />

)<br />

s<br />

, b<br />

0<br />

E<br />

t-1<br />

)<br />

)<br />

)<br />

<br />

<br />

<br />

<br />

Dir( , ,<br />

)<br />

a<br />

b<br />

s<br />

t<br />

s<br />

t-1<br />

<br />

0<br />

E<br />

,<br />

0<br />

E<br />

x<br />

x x<br />

x<br />

)


隠 れ 変 数 があるモデルのベイズ 推 定<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

変<br />

x<br />

分<br />

x<br />

ベイズ<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

分 布 の 形 状 を、 変 分 法 を 使 って 近 似<br />

x x<br />

x x<br />

x x<br />

変 数 間 の 独 立 を 仮 定<br />

x<br />

x<br />

x<br />

x 熱 力 学 モデルの x x平 均 場 近 似 xに 相 当 x<br />

比 較 的 高 速 だが、 近 似 誤 差 が 残 る<br />

x x<br />

x x<br />

x<br />

マルコフ 連 鎖 モンテカルロ x<br />

(MCMC) x 法<br />

x<br />

x<br />

xサンプリングにより x 分 布 を 推 x 定<br />

x<br />

多 くのサンプルを 集 めることで、 誤 差 を 減 らせる<br />

遅 いx<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

49<br />

x<br />

x<br />

x<br />

x<br />

x


( 非 ベイズ) EM アルゴリズム<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

1. x適 x当 なパラメータ x x<br />

x x θ からスタート<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

2. 状 態 列 の 分 布 確 率 を 計 算<br />

x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

q(S) ∝ p(S | θ,D)<br />

x<br />

3. Likelihood 最 大 になる<br />

パラメータ x x θ を 計 算 x<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

θ = argmax θ E q(S) [p(D | θ,S)]<br />

x<br />

x<br />

4. 収 束 してなければ2に 戻 る<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

Expectation<br />

x<br />

x x<br />

x<br />

Expectation<br />

x<br />

s 0<br />

Maximization<br />

Maximization<br />

Expectation<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

s 1<br />

x s 2<br />

xs<br />

x<br />

x<br />

s' 0 s' 1 s' 2 s'<br />

θ''<br />

x<br />

x<br />

s'' 1 s'' 2 s'<br />

s'' 0<br />

θ<br />

θ'<br />

50


変 分 ベイズ 法<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

1. x適 x当 なパラメータ x x<br />

x x 分 布 x xq(θ) xからスタート<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

2. 状 態 の 期 待 分 布 を 計 算<br />

x<br />

x x<br />

x x<br />

x<br />

q(S) x ∝ exp Ex<br />

x<br />

q(θ) [log p(D,S | θ)]<br />

x<br />

x<br />

x<br />

3. パラメータの 期 待 分 布 を 計 算<br />

x<br />

q(θ) ∝ p(θ) exp E q(S) [log p(D,S | θ)]<br />

x<br />

4. 収 束 してなければ2に 戻 る<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

VB-E step<br />

x<br />

VB-E step<br />

s 0<br />

VB-M step<br />

VB-M step<br />

VB-E step<br />

x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

s 1<br />

x s 2<br />

xs<br />

x<br />

x<br />

s' 0<br />

s'' 1 s'' 2<br />

x<br />

s' 1 s' 2 s'<br />

x<br />

q''(θ)<br />

x<br />

s'<br />

s'' 0<br />

q(θ)<br />

q'(θ)<br />

51


マルコフ 連 鎖 モンテカルロ 法 (1)<br />

Blocked Gibbs Sampling<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

1. x適 x当 なパラメータ x x<br />

x x θ からスタート<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

2. 期 待 分 布 から 状 態 列 S<br />

x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

をサンプリング<br />

x<br />

x x<br />

q(S) ∝ p(S,E | θ)<br />

3. 期 待 x 分 布 x からパラメータ x x<br />

x<br />

x<br />

θ をサンプリング<br />

x<br />

x<br />

q(θ) ∝ p(θ) p(S,E | θ)<br />

4. 2に 戻 る ( 収 束 しない)<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

Sampling<br />

x<br />

Sampling<br />

Sampling<br />

s 0<br />

Sampling<br />

Sampling<br />

x<br />

x<br />

x<br />

x<br />

s 1<br />

x s 2 s x<br />

x<br />

x<br />

s' 0 s' 1 s' 2 s'<br />

θ''<br />

x<br />

x<br />

s'' 1 s'' 2 s'<br />

s'' 0<br />

θ<br />

θ'<br />

52


マルコフ 連 鎖 モンテカルロ 法 (2)<br />

Collapsed Gibbs Sampling<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

状 x 態 x 列 x S xを 各 x々の x 時 x 刻 x ごとに x x Gibbs x xSampling<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

予 測 分 布 を 使 うことでパラメータ θ を 積 分 消 去<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

Dirichlet 分 布 の exchangeability を 利 用<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x x<br />

x<br />

x<br />

s 1 s 3 s 4 s 5<br />

x<br />

x<br />

x<br />

1 2 3 4 5<br />

s 0<br />

S<br />

x<br />

x<br />

x x<br />

e 1 e 2 e 3 e 4 e 5<br />

x


マルコフ 連 鎖 モンテカルロ 法 (2)<br />

Collapsed Gibbs Sampling<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

状 x 態 x 列 x S xを 各 x々の x 時 x 刻 x ごとに x x Gibbs x xSampling<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

予 測 分 布 を 使 うことでパラメータ θ を 積 分 消 去<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

Dirichlet 分 布 の exchangeability を 利 用<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x x<br />

x<br />

x<br />

s 1 s 2 s 4 s 5<br />

x<br />

x<br />

x<br />

1 2 3 4 5<br />

s 0<br />

S<br />

x<br />

x<br />

x x<br />

e 1 e 2 e 3 e 4 e 5<br />

x


Talk Outline<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

Introduction<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

ベイジアンとは 何 か?<br />

x<br />

x x<br />

x<br />

ベイズHMMモデル<br />

x<br />

x<br />

x<br />

x Dirichlet 分 布 x<br />

x<br />

ノンパラメトリックベイズHMMモデル<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

機 械 学 習 とベイズ<br />

Bayesian HMM<br />

Dirichlet process<br />

x<br />

Hierarchical Dirichlet process<br />

Infinite Hidden Markov Model<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

HMMの 状 態 の 階 層 的 クラスタリング<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

55<br />

x


ノンパラメトリックベイズ<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

複 数 のパラメータ 空 間 に 対 する prior を 導 入<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

xHMM であれば、それぞれの x x<br />

x x N ( 隠 れ x 状 x態 数 ) に x対 して x<br />

prior 確 率 p(N) を 割 り 振 る<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

N が 異 なる 複 数 のモデルの 予 測 を 統 合 できる<br />

x<br />

(Nを 積 分 消 去 )<br />

x x<br />

x x<br />

個 同 時 に 考 えることができる<br />

x<br />

x<br />

適 切 な prior を 与 えれば、Nの 異 なるモデルを 無 限<br />

x<br />

ノンパラメトリックベイズモデル<br />

x x<br />

x<br />

“ノンパラメトリック” とは、パラメータ 空 間 が 固 定 されて<br />

いない、とか、データに 応 じて 変 わる、という 意 味<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

56<br />

x<br />

x<br />

x<br />

x<br />

x


Dirichlet Process<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

G ~ DP( α<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x 0 , G<br />

x 0 )<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

Dirichlet 分 布 を N → ∞ に 拡 張 したもの<br />

x x<br />

x<br />

Dir(<br />

, , )<br />

x 1<br />

<br />

x N<br />

x<br />

<br />

x<br />

x x<br />

i x<br />

G 0 : 基 底 測 度 (base measure)<br />

x x<br />

x<br />

x<br />

α 0 : ハイパーパラメータ<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

0<br />

i<br />

xG0<br />

( i)<br />

G 0 が 連 続 であれば、DP は 無 限 次 元 の 離 散 分 布<br />

α 0 → ∞ の 極 限 では、 G → G 0<br />

α 0 が 小 さくなると、より 疎 な 分 布 になる<br />

G 0<br />

x<br />

x<br />

x<br />

G(x) の 有 限 個 の 点 で 確 率 1になる<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

0x<br />

x<br />

57<br />

α 0 Large α 0 Small<br />

<br />

<br />

<br />

i<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x


x<br />

ハイパーパラメータ<br />

(α 1 ,…,α N )<br />

x x<br />

x x<br />

x x<br />

N 項 の Dirichlet 分 布<br />

x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

Dir(αx<br />

1 ,…,α N )<br />

x<br />

x<br />

x<br />

x<br />

パラメータ<br />

(θ 1 ,…, θ N )<br />

x<br />

x<br />

x<br />

x<br />

N 項 の 多 項 分 布<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

ハイパーパラ<br />

メータ α 0<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

Dirichlet Process<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

DP(α<br />

x x<br />

x 0 ,G<br />

x 0 )<br />

x<br />

x<br />

x x<br />

x<br />

無 限 個 のパラメータ<br />

x<br />

x x<br />

無 限 項<br />

x<br />

の 多 項 分 布<br />

x<br />

G = (θ 1 , θ 2 ,…,)<br />

基 底 測 度 G 0<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

θ 1 θ 2<br />

θ 3<br />

1 2 3<br />

x x<br />

N 値 の 離 散 確 率 変 数<br />

x<br />

1, 3, 1, 2, 3, 3, 3, …<br />

-1 0 1<br />

x x<br />

無 限 値 の 離 散 確 率 変 数<br />

x<br />

-0.24, 0.93, 0.07, -0.24, …<br />

x


a<br />

i<br />

am<br />

he<br />

ab<br />

are<br />

and<br />

zz<br />

aaa<br />

the<br />

you<br />

zzz<br />

aaaa<br />

that<br />

zzzz<br />

aaaaa<br />

x<br />

基 底 測 度 G 0<br />

-1 0 1<br />

実 数 空 間 上 の 分 布<br />

x<br />

x<br />

x<br />

x<br />

x<br />

基 底 測 度 G 0<br />

… … … … …<br />

a b<br />

z<br />

aa<br />

アルファベット 列 の 分 布<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

μ<br />

基 底 測 度 G 0<br />

x<br />

α<br />

x<br />

x<br />

λ<br />

2 次 元 実 数 上 の 分 布<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

DP(α<br />

x<br />

x<br />

x x<br />

x<br />

0 ,G 0 )<br />

x<br />

x<br />

x<br />

分 布 G<br />

-1 0 x 1x<br />

x<br />

x<br />

x<br />

x<br />

実 数 の 離 散 分 布<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

DP(α<br />

x<br />

x<br />

x x<br />

0 ,G 0 )<br />

x x<br />

x<br />

x<br />

分 布 G<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

x<br />

DP(α<br />

x<br />

x<br />

x<br />

x x<br />

0 ,G 0 )<br />

x<br />

x<br />

x<br />

x x<br />

アルファベット 列 の<br />

x<br />

離 散 分 布<br />

x<br />

x<br />

x<br />

分 布 G<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

実 数 の 組 の 離 散 分 x 布<br />

正 規 分 布<br />

x<br />

の 分 布<br />

正 規 分 布 の 混 合<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

μ<br />

λ<br />

=1/σ


Stick-breaking construction<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

分 x 布 x Gx<br />

を x明 示 x 的 x にサンプリングする x x<br />

x x<br />

x 方 x 法 x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

(Sethuraman, x<br />

x 1994; x Ishwaran x & xJames , 2001) x x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

長 さ1の 棒 を v<br />

x i ~ Beta(1, α<br />

x 0 ) の 比<br />

率 で 折 りながら、G x x 0 から 選 んだ x 点<br />

i に 確 率 を 振 る<br />

x x<br />

x<br />

x x<br />

x x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

G 0 : Prior Distribution<br />

of English words<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

60<br />

x


Stick-breaking construction<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

分 x 布 x Gx<br />

を x明 示 x 的 x にサンプリングする x x<br />

x x<br />

x 方 x 法 x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

(Sethuraman, x<br />

x 1994; x Ishwaran x & xJames , 2001) x x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

長 さ1の 棒 を v<br />

x i ~ Beta(1, α<br />

x 0 ) の 比<br />

率 で 折 りながら、G x x 0 から 選 んだ x 点<br />

i に 確 率 を 振 る<br />

x x<br />

x<br />

x x<br />

x x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

G 0 : Prior Distribution<br />

of English words<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

like<br />

x<br />

x<br />

x<br />

61<br />

x


Stick-breaking construction<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

分 x 布 x Gx<br />

を x明 示 x 的 x にサンプリングする x x<br />

x x<br />

x 方 x 法 x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

(Sethuraman, x<br />

x 1994; x Ishwaran x & xJames , 2001) x x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

長 さ1の 棒 を v<br />

x i ~ Beta(1, α<br />

x 0 ) の 比<br />

率 で 折 りながら、G x x 0 から 選 んだ x 点<br />

i に 確 率 を 振 る<br />

x x<br />

x<br />

x x<br />

x x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

G 0 : Prior Distribution<br />

of English words<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

the<br />

like<br />

x<br />

x<br />

x<br />

62<br />

x


Stick-breaking construction<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

分 x 布 x Gx<br />

を x明 示 x 的 x にサンプリングする x x<br />

x x<br />

x 方 x 法 x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

(Sethuraman, x<br />

x 1994; x Ishwaran x & xJames , 2001) x x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

長 さ1の 棒 を v<br />

x i ~ Beta(1, α<br />

x 0 ) の 比<br />

率 で 折 りながら、G x x 0 から 選 んだ x 点<br />

i に 確 率 を 振 る<br />

x x<br />

x<br />

x x<br />

x x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

G 0 : Prior Distribution<br />

of English words<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

you<br />

love<br />

have<br />

that<br />

is<br />

ball<br />

he<br />

the<br />

like<br />

…<br />

x<br />

=<br />

x<br />

p<br />

63<br />

x


Chinese Restaurant Process<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x<br />

Dirichlet x x<br />

x Process x<br />

x x のよい x x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

性 質 を 活 用 したいが、<br />

x x<br />

x x<br />

無 x 限 個 のパラメータは<br />

x<br />

x<br />

扱<br />

x<br />

いづらいx<br />

x x<br />

x<br />

して、 確 率 変 数 x の 予 測<br />

x<br />

x<br />

x<br />

x<br />

x<br />

パラメータを 積 分 消 去<br />

分 布 を 直 接 計 算 する<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

G 0<br />

x α x<br />

x x<br />

x x<br />

x<br />

x 0 x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

Dirichlet x<br />

xProcess<br />

x<br />

x<br />

x<br />

DP(α 0 ,G 0 )<br />

x<br />

G = (θx<br />

x 1 , θ 2 ,…,)<br />

x<br />

x<br />

無 限 個 のパラメータ<br />

x 無 限 項 の 多 項 分 布 x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

無 限 値 の 離 散 確 率 変 数<br />

x<br />

-0.24, 0.93, 0.07, -0.24, … 64


Chinese Restaurant Process<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

G<br />

x<br />

を<br />

x<br />

計 算<br />

x<br />

せず、<br />

x<br />

x<br />

多<br />

x<br />

項 分<br />

x<br />

布<br />

x<br />

の<br />

x予 x測 分<br />

x<br />

布<br />

x<br />

を 求<br />

x<br />

める<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x (Aldous, x 1983; x Pitman, x 1995) x<br />

客 x = 確 x 率 変 数 x x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x G 0 : 英 単 語 の 分 布<br />

皿 = 確 率 変 数 に 割 り 当 てられた 値<br />

x<br />

x x<br />

x x<br />

x<br />

卓 = 客 と 皿 の 組 み 合 わせかた<br />

x x<br />

x x<br />

x x<br />

Partitioning に 関 する prior になっている<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

5 x<br />

x 3<br />

x<br />

4<br />

x<br />

x<br />

he the ball<br />

x 1<br />

x<br />

x x<br />

2<br />

x x<br />

x 6 5+α<br />

2 5+α<br />

2 5+α<br />

1 5+α<br />

α<br />

x<br />

65<br />

x<br />

x<br />

x


Chinese Restaurant Process<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

G<br />

x<br />

を<br />

x<br />

計 算<br />

x<br />

せず、<br />

x<br />

x<br />

多<br />

x<br />

項 分<br />

x<br />

布<br />

x<br />

の<br />

x予 x測 分<br />

x<br />

布<br />

x<br />

を 求<br />

x<br />

める<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

(Aldous, x 1983; x Pitman, x 1995) x<br />

客 x = 確 x 率 変 数 x x<br />

x<br />

x<br />

x<br />

x<br />

皿 = 確 率 変 数 に 割 り 当 てられた 値<br />

x x<br />

x<br />

卓 = 客 と 皿 の 組 み 合 わせかた<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

Partitioning に 関 する prior になっている<br />

x<br />

x<br />

x x<br />

x x 3<br />

x 7<br />

4<br />

x<br />

x 5<br />

x 2<br />

he the ball<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

G 0 : 英 単 語 の 分 布<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x 1<br />

x<br />

x 7 6+α<br />

2 6+α<br />

3 6+α<br />

1 6+α<br />

α<br />

x<br />

x<br />

x<br />

66<br />

x


Chinese Restaurant Process<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

G<br />

x<br />

を<br />

x<br />

計 算<br />

x<br />

せず、<br />

x<br />

x<br />

多<br />

x<br />

項 分<br />

x<br />

布<br />

x<br />

の<br />

x予 x測 分<br />

x<br />

布<br />

x<br />

を 求<br />

x<br />

める<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

(Aldous, x 1983; x Pitman, x 1995) x<br />

客 x = 確 x 率 変 数 x x<br />

x<br />

x<br />

x<br />

x<br />

皿 = 確 率 変 数 に 割 り 当 てられた 値<br />

x x<br />

x<br />

卓 = 客 と 皿 の 組 み 合 わせかた<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

Partitioning に 関 する prior になっている<br />

x<br />

x<br />

x<br />

x x 3<br />

x<br />

4<br />

x<br />

x 5<br />

x 2<br />

he the ball<br />

love<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

G 0 : 英 単 語 の 分 布<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x 7 x 8<br />

7+α<br />

x<br />

x<br />

x 1<br />

x<br />

x 8 7+α<br />

2 7+α<br />

3 7+α<br />

1 7+α<br />

1<br />

x<br />

x<br />

x<br />

α<br />

67<br />

x


Dirichlet Process の 応 用<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

混 x 合 x 正 x規 x分 布 x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x x<br />

x<br />

x x<br />

x x<br />

それぞれの 皿 がひとつの<br />

x x<br />

x x<br />

x<br />

正 規 分 布 x(クラスタ) を 表 x わす<br />

x<br />

予 測 分 布 を<br />

x<br />

使 うことで、<br />

x<br />

各 データが<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

Gauss-Gamma Distribution<br />

x<br />

x x<br />

所 属 するクラスタを 再 計 算 = collapsed Gibbs sampling<br />

x<br />

x<br />

x<br />

x<br />

x<br />

1 , 1 2 , 2 3 , 3 4 , 4<br />

68<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x


Dirichlet Process の 応 用<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

混 x 合 x 正 x規 x分 布 x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x x<br />

x<br />

x x<br />

x x<br />

それぞれの 皿 がひとつの<br />

x x<br />

x x<br />

x<br />

正 規 分 布 x(クラスタ) を 表 x わす<br />

x<br />

予 測 分 布 を<br />

x<br />

使 うことで、<br />

x<br />

各 データが<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

Gauss-Gamma Distribution<br />

x<br />

x x<br />

所 属 するクラスタを 再 計 算 = collapsed Gibbs sampling<br />

x<br />

x<br />

x<br />

x<br />

x<br />

1 , 1 2 , 2 3 , 3 4 , 4<br />

69<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x


Dirichlet Process の 応 用<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

混 x 合 x 正 x規 x分 布 x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x x<br />

x<br />

x x<br />

x x<br />

それぞれの 皿 がひとつの<br />

x x<br />

x x<br />

x<br />

正 規 分 布 x(クラスタ) を 表 x わす<br />

x<br />

予 測 分 布 を<br />

x<br />

使 うことで、<br />

x<br />

各 データが<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

Gauss-Gamma Distribution<br />

x<br />

x x<br />

所 属 するクラスタを 再 計 算 = collapsed Gibbs sampling<br />

x<br />

x<br />

x<br />

x<br />

x<br />

1 , 1 2 , 2 3 , 3 4 , 4<br />

70<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x


Dirichlet Process の 応 用<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

混 x 合 x 正 x規 x分 布 x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x x<br />

x<br />

x x<br />

x x<br />

それぞれの 皿 がひとつの<br />

x x<br />

x x<br />

x<br />

正 規 分 布 x(クラスタ) を 表 x わす<br />

x<br />

予 測 分 布 を<br />

x<br />

使 うことで、<br />

x<br />

各 データが<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

Gauss-Gamma Distribution<br />

x<br />

x x<br />

所 属 するクラスタを 再 計 算 = collapsed Gibbs sampling<br />

x<br />

x<br />

x<br />

x<br />

x<br />

1 , 1 2 , 2 3 , 3 4 , 4<br />

71<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x


Dirichlet Process の 応 用<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

混 x 合 x 正 x規 x分 布 x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x x<br />

x<br />

x x<br />

x x<br />

それぞれの 皿 がひとつの<br />

x x<br />

x x<br />

x<br />

正 規 分 布 x(クラスタ) を 表 x わす<br />

x<br />

予 測 分 布 を<br />

x<br />

使 うことで、<br />

x<br />

各 データが<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

Gauss-Gamma Distribution<br />

x<br />

x x<br />

所 属 するクラスタを 再 計 算 = collapsed Gibbs sampling<br />

x<br />

x<br />

x<br />

x<br />

x<br />

1 , 1 2 , 2 3 , 3 4 , 4<br />

72<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x


そのほかの 主 な<br />

ノンパラメトリックベイズモデル (1)<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

Gaussian x x<br />

x Process x<br />

x x (O’Hagen, x x 1978) x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

多 変 数 ガウス 分 布 の 無 限 変 数 版<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

関 数 回 帰 のノンパラメトリックモデル<br />

x<br />

x<br />

x<br />

x<br />

x<br />

双 対 表 現 、カーネルトリックを 利 用<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

(Figure from Rasmussen&Williams, 2005)<br />

x<br />

x<br />

x<br />

73<br />

x


そのほかの 主 な<br />

ノンパラメトリックベイズモデル (2)<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

Pitman-Yor Process (Pitman & Yor, 1997)<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x<br />

Dirichlet Process の 拡 張<br />

x x<br />

x x<br />

x x<br />

x x<br />

k 番 目 のStick を 折 る 比 率 が Beta( 1-d, α<br />

x<br />

x<br />

x 0 +kd )<br />

x<br />

x Power-law x 分 布 のx<br />

prior = 「ロングテール」を x x 表 現 x<br />

Beta Process, Indian Buffet Process<br />

x<br />

x<br />

(Griffiths&Ghahramani, 2005; Thibaux&Jordan, 2007)<br />

x<br />

xデータの 背 後 にある x 隠 れ 変 x数 が 単 一 の<br />

カテゴリではなく、feature の 組 み 合 わせ<br />

Mondorian Process<br />

x x<br />

k 次 元 treeに 対 する prior x<br />

(Roy&Teh, 2008)<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

(Figure from<br />

Ghahramani, 2005 / Roy&Teh, 2008)<br />

x<br />

x<br />

x<br />

x<br />

74<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x


Nonparametric Bayesian HMM (1)<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

直<br />

x<br />

観<br />

x<br />

的<br />

xには、 x<br />

遷<br />

x<br />

移<br />

x<br />

行<br />

x節 xの 各<br />

x<br />

列<br />

x<br />

のpriorを<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x Dirichlet x 分 x 布 x から Dirichlet x x Process x x に 置 き x 換 x<br />

えればよさそうに x x<br />

x 思 x える x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

Transition a 11 a 12<br />

Matrix a 21 x<br />

a 22 x<br />

A<br />

x=<br />

xa N1 a N2<br />

x<br />

a 1i<br />

a 2i<br />

a Ni<br />

x<br />

a 1N<br />

a 2N<br />

x<br />

a NN<br />

x<br />

x<br />

x<br />

Transition<br />

Matrix<br />

x<br />

A =<br />

x<br />

x<br />

a 11 a 12<br />

x<br />

a 21 a 22<br />

x<br />

a 1i<br />

a 2i x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

しかし、これはうまくいかない<br />

x<br />

x<br />

x<br />

75<br />

x


Nonparametric Bayesian HMM (2)<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

Dirichlet x x<br />

x Process x<br />

x x からサンプルした x x<br />

x x<br />

x多 x項 分 x 布 x に<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

おいては、 有 限 個 の 点 だけが 非 0 確 率 を 持 つ<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

列 iと 列 jは 確 率 1でdisjoint<br />

x<br />

x<br />

遷 移 先 は 常 に 未 知 の 状 態 に<br />

なってしまう<br />

x x<br />

x<br />

Transition x 0<br />

Matrix<br />

x 0<br />

0<br />

A =<br />

x a ji<br />

x 0<br />

x<br />

x<br />

x<br />

x x<br />

a j'i'<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

G 0<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

76<br />

x<br />

x


Nonparametric Bayesian HMM (3)<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

Hierarchical x x<br />

x x Dirichlet x x<br />

xProcess x<br />

x を x 使 うx<br />

x<br />

x<br />

x<br />

x<br />

x<br />

(Beal+, x 2002; Teh+, x 2006) x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

Dirichlet x x Process x からサンプルした x<br />

x x 分 布 x を、 x別 の<br />

x<br />

x<br />

x<br />

x<br />

Dirichlet Process の 基 底 測 度 に 使 う<br />

G<br />

G<br />

x<br />

i<br />

, H<br />

<br />

x<br />

x<br />

~ DP( , H)<br />

x<br />

x<br />

x<br />

0,<br />

G ~ DP( 0,<br />

G<br />

x<br />

G が 離 散 なので、 多 数 の 分 布<br />

がサポートを x x 共 有 するように<br />

できる<br />

x<br />

)<br />

x<br />

x<br />

x<br />

H<br />

G<br />

x<br />

G 1<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

G 2<br />

77<br />

x<br />

x<br />

x<br />

x


Infinite Hidden Markov Models<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

HMM で 使 うことのできるすべて<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

この HMM で 利 用 される<br />

x<br />

x<br />

x<br />

の 状 態 に 対 する ( 一 様 ) 分 布<br />

状 態 の 確 率 分 布<br />

x<br />

G<br />

G<br />

x<br />

i<br />

, H<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

0,<br />

G ~ DP( 0,<br />

xG)<br />

<br />

~ DP( , H)<br />

遷 移 行 列 の i 列 目<br />

= 状 態 i からの x 遷 x移 先 の<br />

x 状 態 の 確 率 分 布<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

Transition<br />

Matrix<br />

A =<br />

H<br />

x<br />

x<br />

G<br />

x<br />

x<br />

x<br />

x<br />

a 11<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

a 12<br />

a 21 a 22<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

G i<br />

a 1i<br />

x<br />

x<br />

a 2i<br />

x<br />

x<br />

78<br />

x<br />

x


Infinite Hidden Markov Models<br />

x<br />

x x<br />

H<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

G 0<br />

x<br />

x<br />

x<br />

Gs t-1<br />

x<br />

x<br />

x<br />

0<br />

∞<br />

x<br />

s<br />

t<br />

x<br />

x<br />

x<br />

G<br />

x<br />

x x<br />

e<br />

G<br />

t<br />

i<br />

s<br />

x<br />

t-1<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

~ some x distribution<br />

x<br />

x<br />

x<br />

x<br />

x<br />

t<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

s 0<br />

x<br />

x x<br />

e 1<br />

x e 2 e 3 e 4 e 5<br />

x<br />

79<br />

Es t<br />

s 1 s 2 s 3 s 4 s 5<br />

s<br />

, H x<br />

, G<br />

t<br />

E<br />

s<br />

, E<br />

t-1<br />

s<br />

i<br />

t<br />

~ DP( x<br />

, Hx<br />

)<br />

x<br />

, G ~ DP(<br />

0<br />

~<br />

~<br />

G<br />

E<br />

s<br />

s<br />

t-1<br />

0<br />

, G)<br />

x


Infinite Hidden Markov Models<br />

x<br />

x x<br />

H<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

Size<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

Stickiness<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

G 0<br />

x<br />

x<br />

x<br />

Density<br />

x<br />

Gs t-1<br />

x<br />

x<br />

x<br />

0<br />

∞<br />

x<br />

s 0<br />

b<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

s<br />

t<br />

G<br />

x<br />

x x<br />

e<br />

G<br />

t<br />

i<br />

s<br />

x<br />

t-1<br />

s<br />

, H x<br />

t<br />

x<br />

x<br />

x<br />

, G<br />

E<br />

s<br />

, E<br />

t-1<br />

s<br />

t<br />

x<br />

x<br />

x<br />

x<br />

x<br />

<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

~ some x distribution<br />

x<br />

x<br />

x<br />

x<br />

i<br />

x<br />

~ DP( x<br />

, Hx<br />

)<br />

x<br />

, G ~ DP(<br />

0<br />

~<br />

~<br />

G<br />

E<br />

x<br />

t<br />

t-1<br />

x x<br />

s<br />

s<br />

0<br />

, G)<br />

x<br />

x<br />

x<br />

x x<br />

Es t<br />

s 1 s 2 s 3 s 4 s 5<br />

e 1 e 2 e 3 e 4 e 5<br />

x<br />

80<br />

x


State Sequence Produced by iHMMs<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

ハイパーパラメータを x x<br />

x x<br />

x x<br />

x 設 x 定 することで、 x x<br />

x x 様 々な<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

系 列 が 生 成 される<br />

0 1000<br />

x<br />

b 0.1<br />

100 x<br />

x x<br />

x x<br />

x<br />

x x<br />

x x<br />

x<br />

x x<br />

x x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

x 0 0.1<br />

x<br />

b 0<br />

x 100<br />

x<br />

x<br />

x<br />

0 2<br />

b 8<br />

2<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

Taken from (Beal+, 2002)<br />

x<br />

81<br />

x<br />

0 1<br />

b 1<br />

10000<br />

x


iHMM の 学 習<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x<br />

変 分 ベイズ 法 (Beal, 2003)<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x状 態 数 を x 有 限 x 個 ( 多 めに) x x置 いて 近 x 似 する x<br />

Blocked x Gibbs x Sampler x x (Teh+, x 2006) x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

Stick-Breaking x process x を 使 い、 x遷 移 行 x列 を sampling x<br />

状 態 が 無 限 個 あるため、Forward-backward が 利 用<br />

不 x能 x<br />

Beam Sampler x (Van x Gael+, 2008) x<br />

x<br />

x<br />

Collapsed x Gibbs Sampler x<br />

Chinese Restaurant Process を 使 い、 遷 移 行 列 の 期 待<br />

分 布 を 計 算<br />

Conditional Simultaneous Draws Sampler (Makino+,<br />

x<br />

2009)<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

82<br />

x<br />

x<br />

x<br />

x<br />

x


Hierarchical Dirichlet Process の 応 用 (1)<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x 0<br />

x<br />

x x<br />

文 x 書 x のトピックモデル x x<br />

x x<br />

x (Teh, x Jordan, x x Beal&Blei x 2004) G<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x 0<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

Latent Dirichlet Allocation (Blei, Ng&Jordan 2003)<br />

x x<br />

x x<br />

x x<br />

x x<br />

のノンパラメトリック x 版 x<br />

x<br />

x<br />

トピック 数<br />

xK を 明<br />

x示 的 に 与 えず、<br />

x<br />

各<br />

x文 書 の<br />

トピック 分 布 を 生 成 する<br />

x x<br />

x x<br />

データ ( 文 書 集 x 合 ) 観 測 後 の 事 後 x<br />

x分 布 を 計 算 することで、 x 最 適 x な<br />

トピック 数 の 分 布 とともに、<br />

各 トピックの 単 語 分 布 を 推 定 できる<br />

x x<br />

x<br />

x<br />

x<br />

β<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

G j<br />

z ji<br />

w ji<br />

x<br />

N<br />

83<br />

x<br />

xM<br />

x<br />

x


Hierarchical Dirichlet Process の 応 用 (2)<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

N-gram model (Teh, 2006)<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

Suffix tree x の 各 x node に、 x x<br />

単 語 分 布 を 表 わす Pitman-Yor<br />

x<br />

x x<br />

x x<br />

Process を 割 x り 当 てる<br />

学 習 は 階 層 x Chinese x Restaurant x<br />

process 上 のサンプリングで 実 現<br />

Kneser-Ney スムージング<br />

x x<br />

x x<br />

が 帰 着 できる<br />

さらに x N を 積 分 消 去 x した<br />

∞-gram モデル (Mochihashi<br />

&Sumita, 2007)、Sequence<br />

Memoizer x (Wood+, x 2009) …<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

G bag of<br />

x x<br />

x<br />

x<br />

of<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x x<br />

G of G to<br />

bag<br />

three<br />

G three states of<br />

G<br />

x states x<br />

x<br />

x<br />

G states of<br />

to<br />

x<br />

84<br />

x<br />

x<br />

united<br />

G united states of<br />

x


iHMM の 状 態 の 階 層 クラスタリング<br />

(Makino+, 2009; Makino+, in submission)<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

HMM:<br />

x x<br />

各<br />

x<br />

々の<br />

x<br />

x隠 xれ 状<br />

x<br />

態<br />

x<br />

は 独<br />

x<br />

立<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

現 実 には、 状 態 間 の 類 似 性 がある 場 合 が 多 い<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

Dirichlet x Process x は、クラスタリングのためにも<br />

x<br />

x<br />

x<br />

利<br />

x<br />

用 できるx<br />

x<br />

うまく 組 み 合 わせて、<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

隠 れ 状 態 x をクラスタリングする<br />

x<br />

x<br />

x<br />

adjective noun noun noun noun verb noun aux verb verb<br />

superlative common common common proper transitive pronoun present transitive<br />

x<br />

time title title name past bare form<br />

x<br />

family<br />

x<br />

Last night Prime Minister Koizumi said he will make<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

85<br />

x<br />

x<br />

x


iHMM with Dirichlet Process Mixtures<br />

(Fox+, 2008)<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

HMMからの x x<br />

x x 出 x 力 x をクラスタリングする<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x<br />

Nested Chinese Restaurant Process (Blei+, 2004)<br />

x x<br />

x x<br />

x x<br />

x x<br />

を HMM に x 拡 張 したものに x 相 当 x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x<br />

State x 1<br />

State 2 State 3<br />

x<br />

x<br />

x<br />

x<br />

G<br />

x 0<br />

x x E<br />

x<br />

~ DP( , H )<br />

x<br />

x<br />

Gsx<br />

~ DP( T<br />

, G0<br />

)<br />

Z ~ DP( , H )<br />

s<br />

z<br />

0<br />

Z<br />

x<br />

x<br />

~ some x distribution x<br />

e.g. Gauss-Wishart<br />

x<br />

86<br />

x


iHMM with Dirichlet Process Mixtures<br />

x x<br />

x<br />

x<br />

x<br />

0<br />

x<br />

x<br />

G 0<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

T<br />

x<br />

x x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

Gs t-1<br />

x x<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

G<br />

G<br />

x<br />

Z<br />

E<br />

x x<br />

x<br />

0<br />

~ DP(<br />

x<br />

x x<br />

x<br />

s<br />

s<br />

z<br />

x~ DP( x<br />

x<br />

<br />

0<br />

x<br />

, H<br />

x<br />

x<br />

, G<br />

T<br />

x<br />

x x<br />

~ DP( , H )<br />

Z<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

~ xsome distributi x<br />

)<br />

0<br />

)<br />

on<br />

x<br />

x<br />

Z<br />

x<br />

x<br />

x<br />

∞<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x x<br />

Zs t<br />

s 1 s 2 s 3 s 4 s 5<br />

x<br />

x<br />

x<br />

z 1 z 2 z 3 z 4 z 5<br />

Ez x t x<br />

x x<br />

∞<br />

x<br />

e 1 e 2 e 3 e 4 e 5<br />

87<br />

x


提 案 手 法<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

クラスタ x x<br />

x 構 x 造 が、 x x 遷 移 x に x 影 響 x しない<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

欲 しいのは、むしろ 遷 移 確 率 に 関 するクラスタ<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

クラスタ 内 の 各 状 態 への 遷 移 が 類 似<br />

x<br />

x<br />

クラスタ 内 の 各 状 態 からの 遷 移 が 類 似<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

z t も 状 態 の 一 部 となるようにできないか?<br />

Hierarchical Nested infinite HMM (HN-iHMM)<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

88<br />

x<br />

x<br />

x<br />

x


2 階 層 HN-iHMM<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

zx<br />

x<br />

x<br />

x x<br />

x x<br />

x t が 状 態 x の x 一 x部 となるためには:<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

t<br />

t<br />

x<br />

x x<br />

x x<br />

z t が s t+1 の 確 率 に 影 響 する<br />

x x<br />

x x<br />

x x<br />

z x<br />

x<br />

x<br />

t の 確 率 が s t-1 (と z t-1 ) に 依 存 する<br />

st<br />

-<br />

z<br />

e<br />

x<br />

~ p(<br />

st<br />

| st<br />

1)<br />

x x<br />

~ p(<br />

zt<br />

| st<br />

)<br />

x<br />

~ p(<br />

e | z )<br />

t<br />

t<br />

x<br />

x<br />

x<br />

x x<br />

s<br />

x<br />

t<br />

~<br />

zt<br />

~<br />

x<br />

e ~<br />

t<br />

x<br />

x<br />

p(<br />

s<br />

p(<br />

e<br />

x<br />

t<br />

p(<br />

z<br />

t<br />

t<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

x<br />

| st<br />

| s<br />

| z<br />

-1<br />

x<br />

t<br />

t<br />

, s<br />

)<br />

,<br />

z<br />

t-1<br />

t-1<br />

x<br />

)<br />

, zt-<br />

1)<br />

x<br />

x x<br />

x<br />

x<br />

s 1 s 2<br />

s 1 s 2<br />

x x<br />

x<br />

z 1 z 2<br />

z 1 z 2<br />

x<br />

e 1 e 2<br />

x<br />

e 1 e 2<br />

89<br />

x


2 階 層 HN-iHMMの 構 成 (1)<br />

x x<br />

x<br />

x<br />

x<br />

0<br />

x<br />

x<br />

G 0<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

T<br />

x<br />

x<br />

x<br />

Gs t-1<br />

∞<br />

x x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

∞<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

0<br />

~ GEM( <br />

x<br />

x x 0<br />

x<br />

x<br />

x<br />

x x<br />

~ DP(<br />

x<br />

~ xGEM(<br />

x<br />

x x<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

Zs t<br />

s 1 s 2 s 3 s 4 s 5<br />

G<br />

G<br />

x<br />

Z<br />

E<br />

s<br />

s<br />

z<br />

, G<br />

T<br />

x<br />

<br />

x<br />

~ some distribution<br />

Z<br />

)<br />

0<br />

)<br />

)<br />

x<br />

x<br />

x<br />

Z<br />

90<br />

x<br />

z 1 z 2 z 3 z 4 z 5<br />

Ez t x x<br />

x x<br />

∞<br />

x<br />

x<br />

e 1 e 2 e 3 e 4 e 5


2 階 層 HN-iHMMの 構 成 (2)<br />

x<br />

x x<br />

x x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

T x x<br />

0 T 1<br />

x T x2<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

G 0 Gs t-1<br />

x x<br />

x<br />

Z x<br />

∞<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x x<br />

x x<br />

x x<br />

x zx<br />

t が s t+1 の x 確 率 x<br />

x<br />

x<br />

Gs t-1<br />

z t-1 ∞<br />

x x<br />

に 影 響 する<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

∞<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

s<br />

x<br />

~ GEM( x x<br />

x<br />

~ DP( x<br />

x<br />

1x<br />

T<br />

x<br />

2<br />

T<br />

,<br />

x<br />

~ DP( <br />

~ GEM( )<br />

x x<br />

0<br />

)<br />

, G<br />

x<br />

x<br />

Z<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

~ some distribution<br />

Zs t<br />

s 1 s 2 s 3 s 4 s 5<br />

G<br />

G<br />

G<br />

0<br />

s,<br />

z<br />

Z<br />

E<br />

s<br />

z<br />

T<br />

G<br />

0<br />

s<br />

)<br />

)<br />

x<br />

x<br />

x<br />

z 1 z 2 z 3 z 4 z 5<br />

Ez t x x<br />

x x<br />

∞<br />

x<br />

x<br />

e 1 e 2 e 3 e 4 91e<br />

5


x x<br />

x x<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

T x x<br />

0 T 1<br />

x<br />

x<br />

x x<br />

G 0<br />

x<br />

2 階 層 HN-iHMMの 構 成 (3)<br />

x<br />

x T x2<br />

x x<br />

x<br />

x<br />

Gs t-1<br />

x x<br />

Zs t<br />

x<br />

x<br />

x x<br />

x<br />

Gs t-1<br />

z t-1<br />

s t x<br />

Zs<br />

z t-1<br />

t-1<br />

∞ ∞<br />

Zs t x<br />

s t-1<br />

Z 0 Z 1<br />

x Z x2<br />

x<br />

x x<br />

x<br />

x x<br />

x<br />

x x<br />

x x<br />

x z t の 確 x率 が<br />

x x<br />

s t-1 (と z t-1 )<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

∞<br />

に 依 存 する<br />

x<br />

x<br />

x<br />

x<br />

s,<br />

z<br />

s'<br />

x<br />

s',<br />

s,<br />

z<br />

0<br />

~ GEM( )<br />

x<br />

~ DP( x<br />

x<br />

1<br />

, G<br />

, G<br />

2<br />

T<br />

x<br />

x<br />

0<br />

x<br />

s<br />

0<br />

~ GEM( )<br />

1<br />

~ DP( , Z<br />

x s'<br />

2<br />

~ DP( , xZ<br />

x<br />

x<br />

x<br />

x<br />

Ez<br />

~ some distribution<br />

x x<br />

x x<br />

s 1 s 2 s<br />

x 3 s 4 s<br />

x 5<br />

x<br />

x<br />

z 1 z 2 z 3 z 4 z 5<br />

x<br />

) x<br />

Ez t<br />

x x<br />

∞ x<br />

x<br />

e 1 e 2 e 3 e 4 92e<br />

5<br />

Z<br />

G<br />

Z<br />

G<br />

G<br />

Z<br />

0<br />

s',<br />

s<br />

~ x DP( x<br />

s<br />

T<br />

Z<br />

Z<br />

T<br />

Z<br />

)<br />

)<br />

)<br />

s',<br />

s


2 階 層 以 上 のHN-iHMM<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

が x 状 態 x の x 一 x部 xであるように x x<br />

x 表 x 記 を x 変 x 更 x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

<br />

x<br />

<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

- 階 層 状 態 の HMM に 自 然 に 拡 張 できる<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

k<br />

x<br />

kx<br />

1: k-1<br />

1:<br />

st<br />

~ p(<br />

st<br />

| st<br />

, xs<br />

t-<br />

x<br />

e ~<br />

t<br />

p(<br />

e<br />

t<br />

|<br />

s<br />

n<br />

t<br />

)<br />

x x<br />

1)<br />

x<br />

n<br />

x<br />

G<br />

k<br />

s'<br />

x<br />

G<br />

x<br />

k<br />

s'<br />

1: k-1<br />

E<br />

1: k<br />

x<br />

k<br />

-1<br />

~ GEM( x 0<br />

)<br />

x<br />

k<br />

~ DP( , G<br />

, s<br />

s<br />

1: l<br />

1: n<br />

l<br />

k<br />

s'<br />

1: k-1<br />

x<br />

, s<br />

x<br />

)<br />

1: l-1<br />

~ some distribution<br />

x x<br />

x<br />

93<br />

x


HN-iHMMの 例<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

生 x 成 x された<br />

x x<br />

x<br />

x<br />

x<br />

x x<br />

遷 移 行 列 の 例<br />

x<br />

x x<br />

クラスタ 構 x造<br />

x による、 遷 x移<br />

確 率 の 類 似<br />

x x<br />

性 が 実 現 され<br />

xている<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

From x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

To<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

94<br />

x


実 験 (1)<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

人 x 工 x HMMから x x<br />

x 生 x 成 したシーケンスをもとに、<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

もとの HMM を 推 定 する<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

一 見 、ノイズの x 多 い A-B-C x の 繰 り 返 x しに<br />

x 見 えるが、 x尐 しずつ x 性 質 の 異 x なる 多 x 数 の<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

Beam Sampling x 50,000 step 後 xの 状 態 列 と、<br />

x<br />

シーケンスの 組 み 合 わせで 構 成 されている<br />

x<br />

真 の 状 態 列 との 間 の 相 互 情 報 量 で 評 価<br />

x x<br />

データ 長 N=500<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x


頻 度<br />

結 果 (1)<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

従 x 来 x のx<br />

iHMM<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

では、 正 しく 分 離<br />

x x<br />

x<br />

して x 隠 れ 状 態 x を<br />

学<br />

x<br />

習 することが<br />

x<br />

できない<br />

x<br />

x x<br />

x x<br />

MCMC サンプリングの x 系 列 が<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

相 互 情 報 x 量<br />

x x<br />

local maximum に 陥 ってしまい、<br />

脱 出 できない<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

サンプリングされた 状 態<br />

真 の 状 態<br />

x<br />

x<br />

このときの<br />

相 互 情 報 量<br />

MI = 3.61<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

96<br />

x<br />

x<br />

x<br />

x<br />

x


頻 度<br />

結 果 (2)<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

2 x 階 x 層 HN-iHMM<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x x<br />

を 使 うと、より 精<br />

x x<br />

x<br />

度 x よく 推 定 できる<br />

x<br />

x<br />

x<br />

しかし、 手 掛<br />

かりの 尐 ない<br />

x x<br />

状 態 につい<br />

xては、 分 離<br />

できないこ<br />

とが 多 い<br />

x x<br />

x<br />

x<br />

真 の 状 態<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

相 互 情 報 x 量<br />

サンプリングされた x 状 x 態<br />

x<br />

このときの<br />

相 互 情 報 量<br />

MI = 4.18<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

97<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x


頻 度<br />

結 果 (3)<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

3 x 階 x 層 HN-iHMM<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

を 使 うと、かなり<br />

x x<br />

x x<br />

精 x 度 よく 推 定 x 可 能<br />

サンプリングされた x<br />

x状 態<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x<br />

相 互 情 報 x 量<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

真 の 状 態<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

このときの<br />

相 互 情 報 量<br />

MI = 4.65<br />

x<br />

x<br />

x<br />

98<br />

x


実 験 1の 考 察<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

HN-iHMM x x<br />

x x では、 x x余 分 x なx<br />

state x が x 多 x数 x生 成 x さx<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

れるが、 精 度 が 下 がらない<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

通 常 の HMM x (や iHMM) x では、 余 分 x な state があ x<br />

x ると 精 度 が x 低 下 する x<br />

x<br />

HN-iHMM では、クラスタ 中 の 他 状 態 の 情 報 が 使<br />

x x<br />

x x<br />

えるので、 精 度 x が 下 がりにくい<br />

x x<br />

x<br />

逆 に、 学 習 における local maximum からの 脱 出<br />

を 助 ける 効 果 がある<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

99<br />

x<br />

x<br />

x<br />

x<br />

x


実 験 (2)<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

Alice’s Adventure in Wonderland のテキストを 利<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

用 した x 実 験 x (Makino+, x in submission)<br />

x x<br />

x<br />

x<br />

x<br />

2 階 層 状 態 HMM を 利 用<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

28,120 語 (End-Of-Sentence 含 む)<br />

x<br />

x<br />

2 回 以 下 しか 登 場 しない 単 語 は UNK に 置 換 異 な<br />

り 単 語 数 1,078 語<br />

x x<br />

x x<br />

x x<br />

Conditional Simultaneous x Draws Sampler x (Makino+,<br />

x<br />

x<br />

2009) によりサンプリング<br />

19,000 回 目 の sweep の 後 では、34 個 のクラスタ 中 に<br />

774 個 の 状 態 があった<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

100<br />

x<br />

x<br />

x<br />

x<br />

x


x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

結 果 (2)<br />

101


x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

結 果 (2)<br />

102


x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

結 果 (2)<br />

103


まとめ<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

機 械 学 習 におけるベイジアンの 位 置 づけ<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x x<br />

不 確 かさを x明 示 的 に 扱 える x<br />

x パラメータを x 積 分 消 x 去 予 測 分 x 布 の x利 用<br />

x<br />

パラメータの x 分 x 布 を 考 xえることで、パラメータ x<br />

x x 空 間 x の<br />

取 り 方 に 依 存 せず、 過 学 習 しにくい 推 定 を 可 能 に<br />

Infinite HMM: HMMのノンパラメトリックベイズ 版<br />

x<br />

x<br />

x<br />

HN-iHMM: HMM 隠 れ 状 態 の 階 層 クラスタリング<br />

遷 移 確 x 率 の 類 x 似 に 基 づいて 隠 れ 状 x態 を 階 層 x 化<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

x<br />

x<br />

x<br />

x<br />

x x<br />

隠 れ 状 態 数 N を 積 分 消 去 し、 理 論 上 、 無 限 個 の 隠 れ<br />

x<br />

x<br />

状 態 を 扱 える 学 習 xモデル<br />

x<br />

x<br />

Hierarchical Dirichlet Process を 利 用<br />

類 似 する 系 列 が 多 数 現 れる 場 合 の 学 習 ・ 予 測 の 実 現<br />

x<br />

104<br />

x

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!