20100615-IBISML-makino
20100615-IBISML-makino
20100615-IBISML-makino
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
ノンパラメトリックベイズに 基 づく<br />
x<br />
x<br />
統 計 的 機 械 学 習<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
Takaki Makino<br />
x<br />
x<br />
x<br />
Division of Project Coordination<br />
University of Tokyo<br />
x<br />
x<br />
2010.6.15 <strong>IBISML</strong> 第 1 回 研 究 会 にて 1<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x
本 発 表 の 目 標<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
誰 でもノンパラベイズがわかるように<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x背 景 知 識 x 、 用 x 語 の 知 識 x が 必 x 要 x<br />
この x 本 x → のおかげで、ベイズについ<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
ての 知 識 はだいぶ 普 及 した?<br />
x x<br />
x<br />
わからない 人 はとことんわからない<br />
できるだけ x x 背 景 知 識 を x 含 めて x<br />
x<br />
お 話 しします<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
Introductory な 内 容 なので、<br />
ご 存 じの 方 にはつまらないかも<br />
しれませんがご 了 承 ください<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
2<br />
x
Introduction: ベイジアンとは 何 か?<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
Quiz: x x 10 x 万 x 人 に1 x x人 がかかる x x<br />
x 病 x 気 θx<br />
がある。<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
検 査 D は、θ 病 の 人 を99.8% 陽 性 と 判 定 するが、<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
θ x 病 でない 人 x も0.1% 陽 x性 となってしまう。<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
あなたが D 陽 性 のとき、θ 病 である 確 率 は?<br />
x<br />
x<br />
x<br />
x<br />
p(D|θ) x x D 陽 性 x D 陰 x 性<br />
x<br />
p(D|θ 病 ) 0.998 0.002<br />
x<br />
x<br />
x<br />
p(D| 健 康 ) 0.001 0.999<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
p(θ|D) = ?<br />
x<br />
x<br />
x<br />
x
Introduction: ベイジアンとは 何 か?<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
Quiz: x x 10 x 万 x 人 に1 x x人 がかかる x x<br />
x 病 x 気 θx<br />
がある。<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
検 査 D は、θ 病 の 人 を99.8% 陽 性 と 判 定 するが、<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
θ x 病 でない 人 x も0.1% 陽 x性 となってしまう。<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
あなたが D 陽 性 のとき、θ 病 である 確 率 は?<br />
x<br />
x<br />
x<br />
x<br />
p(D|θ) x x D 陽 性 x D 陰 x 性<br />
x<br />
p(D|θ 病 ) 0.998 0.002<br />
x<br />
x<br />
x<br />
p(D| 健 康 ) 0.001 0.999<br />
x<br />
x<br />
x<br />
p(θ)<br />
θ 病 0.00001<br />
x<br />
健 康 0.99999<br />
x<br />
x<br />
x<br />
Bayes’<br />
x<br />
Posterior Likelihood Prior<br />
p(<br />
|<br />
Theorem p(<br />
D)<br />
x<br />
D)<br />
<br />
x<br />
p(<br />
D<br />
x<br />
| )<br />
p(<br />
)<br />
4<br />
x
Introduction: ベイジアンとは 何 か?<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
Quiz: x x 10 x 万 x 人 に1 x x人 がかかる x x<br />
x 病 x 気 θx<br />
がある。<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
検 査 D は、θ 病 の 人 を99.8% 陽 性 と 判 定 するが、<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
θ x 病 でない 人 x も0.1% 陽 x性 となってしまう。<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
あなたが D 陽 性 のとき、θ 病 である 確 率 は?<br />
x<br />
x<br />
x<br />
x<br />
p(D|θ) x x D 陽 性 x D 陰 x 性<br />
x<br />
p(D|θ 病 ) 0.998 0.002<br />
x<br />
x<br />
x<br />
p(D| 健 康 ) 0.001 0.999<br />
x<br />
x<br />
x<br />
p(θ)<br />
θ 病 0.00001<br />
x<br />
健 康 0.99999<br />
x<br />
x<br />
p(θ|D) p(θ|D 陽 性 ) p(θ|D 陰 性 )<br />
x<br />
x<br />
θ 病 ≈0.01 ≈0.00000002<br />
x<br />
健 康 ≈0.99 ≈0.99999998<br />
x<br />
Prior ( 事 前 分 布 )<br />
x<br />
Likelihood ( 尤 度 )<br />
x<br />
Posterior ( 事 後 分 5 布 )
Introduction: ベイジアンとは 何 か?<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
ベイジアン x x<br />
x x 確 率 x 論 x : 仮 x 説 x の「 x確 xからしさ」を x x<br />
x確 x率<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
で 表 現 し、ベイズの 定 理 で 推 論 する<br />
x<br />
x x<br />
x x<br />
x x<br />
x<br />
θ: 「 宇 宙 人 x がいる」or「いない」という x<br />
x 仮 説<br />
x D: 「UFOを x目 撃 する」or「しない」という x<br />
x x 事 象<br />
x x<br />
x<br />
x<br />
x<br />
p(θ): 宇 宙 人 の 存 在 はどのぐらい 確 からしいか?<br />
x x<br />
x x<br />
x x<br />
p(D|θ): 宇 宙 人 x がいる 時 にUFOを x 目 撃 する 確 率<br />
xp(θ|D): UFOを 目 撃 x したあとでは、 x<br />
x<br />
宇 宙 人 の 存 在 はどのぐらい 確 からしいか?<br />
x<br />
Bayes’<br />
x<br />
Posterior Likelihood Prior<br />
p(<br />
|<br />
Theorem p(<br />
D)<br />
x<br />
D)<br />
<br />
x<br />
p(<br />
D<br />
x<br />
| )<br />
p(<br />
)<br />
x<br />
x x<br />
x<br />
6<br />
x
Introduction: ベイジアンとは 何 か?<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
ベイジアン x x<br />
x x 確 率 x 論 x : 仮 x 説 x の「 x確 xからしさ」を x x<br />
x確 x率<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
で 表 現 し、ベイズの 定 理 で 推 論 一 般 する の ( 頻 度 主 義 的 )<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x θ: 「 宇 宙 人 x がいる」or「いない」という x 考 え x 仮 方 説 からすると、 x<br />
x D: 「UFOを x目 撃 する」or「しない」という x<br />
x x 事 象<br />
p(θ): 宇 宙 人 の 存 在 はどのぐらい 確 からしいか?<br />
x x<br />
x x<br />
x x<br />
p(D|θ): 宇 宙 人 x がいる 時 にUFOを x 目 撃 する 確 率<br />
xp(θ|D): UFOを 目 撃 x したあとでは、 x<br />
x<br />
宇 宙 人 の 存 在 はどのぐらい 確 からしいか?<br />
x<br />
Bayes’<br />
x<br />
p(<br />
|<br />
Theorem p(<br />
D)<br />
x<br />
D)<br />
確 率 では 書 けない<br />
Posterior Likelihood Prior<br />
<br />
x<br />
p(<br />
D<br />
x<br />
| )<br />
p(<br />
)<br />
x<br />
x<br />
7<br />
x<br />
x<br />
x
Introduction: 機 械 学 習 とベイズ<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
機 x 械 x 学 x習 x = パラメータ x x<br />
x 決 x 定 x= 仮 x 説 の x x選 択 x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
真 の x分 布<br />
8<br />
x
Introduction: 機 械 学 習 とベイズ<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
機 x 械 x 学 x習 x = パラメータ x x<br />
x 決 x 定 x= 仮 x 説 の x x選 択 x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x x<br />
x<br />
x x<br />
モデル x x パラメータ 空 x 間 ( 仮 x 説 空 間 )<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
観 測 したデータ x D<br />
x<br />
x<br />
x<br />
x<br />
真 の x分 布<br />
9<br />
x
Introduction: 機 械 学 習 とベイズ<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
機 x 械 x 学 x習 x = パラメータ x x<br />
x 決 x 定 x= 仮 x 説 の x x選 択 x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
p(D | θ)<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
モデル x x パラメータ 空 x 間 ( 仮 x 説 空 間 )<br />
x<br />
観 測 したデータ x D<br />
x<br />
x<br />
x<br />
θ<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
Likelihood<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
分 布 の 仮 説<br />
真 の x分 布<br />
x<br />
x<br />
x<br />
10<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
1
Introduction: 機 械 学 習 とベイズ<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
機 x 械 x 学 x習 x = パラメータ x x<br />
x 決 x 定 x= 仮 x 説 の x x選 択 x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
p(D | θ)<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
モデル x x パラメータ 空 x 間 ( 仮 x 説 空 間 )<br />
x<br />
観 測 したデータ x D<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
Likelihood<br />
x<br />
θ<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
最 尤 推 定<br />
(Maximum<br />
x<br />
Likelihood)<br />
x<br />
分 布 の 仮 説<br />
真 の x分 布<br />
x<br />
x<br />
x<br />
11<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
1
Introduction: 機 械 学 習 とベイズ<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
過 x 学 x 習 x問 x題<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x<br />
x x<br />
x<br />
x x<br />
x<br />
x x<br />
x<br />
x x<br />
x<br />
x x<br />
x x<br />
x x<br />
Likelihood 最 大 のパラメータを 選 んでも、<br />
x x<br />
x x<br />
x x<br />
x<br />
いい 仮 説 が x 得 られないx<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
12<br />
x
Introduction: 機 械 学 習 とベイズ<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
過 x 学 x 習 x問 x題<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x<br />
x x<br />
x<br />
x x<br />
x<br />
x x<br />
x<br />
x x<br />
x<br />
x x<br />
x x<br />
x x<br />
Likelihood 最 大 のパラメータを 選 んでも、<br />
x x<br />
x x<br />
x x<br />
x<br />
いい 仮 説 が x 得 られないx<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
Best-fit<br />
regression by<br />
x<br />
8 th -degree<br />
polynomial<br />
13<br />
x
Introduction: 機 械 学 習 とベイズ<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x<br />
非 x ベイジアンの x<br />
x x<br />
x 考 x え 方 x : x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
複 雑 すぎるモデルを 選 んだのが 原 因<br />
x x<br />
x x<br />
x x<br />
適 切 な 複 雑 x さのモデルを x 選 ぶべしx<br />
ベイジアンの 考 え 方 :<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
x<br />
Likelihood x x p(D|θ) だけで x 考 x えているのが x 原 因 x<br />
x<br />
x<br />
xPosterior p(θ|D) を x 考 えることが x 重 要 x<br />
そのために 必 要 なのは Prior p(θ)、つまり<br />
「あるパラメータ θ がどれだけ 確 からしいか」<br />
に 関 xする (データ x D 観 測 前 の) 知 x 識 x<br />
x<br />
x x<br />
x<br />
14<br />
x
Introduction: 機 械 学 習 とベイズ<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
Prior: x x データ x x 観 x測 前 x の x ( 主 x 観 的 x な) x 仮 x説 の x 確 xからし<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
さを、 確 率 分 布 の 形 で 表 現 したもの<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x 高 次 の 係 数 x が0から 離 れることは、あまりありそうにない<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
パラメータ 空 間<br />
x x<br />
小 0 大 <br />
高 次 の 係 数<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
15<br />
x
Introduction: 機 械 学 習 とベイズ<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
Prior: x x データ x x 観 x測 前 x の x ( 主 x 観 的 x な) x 仮 x説 の x 確 xからし<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
さを、 確 率 分 布 の 形 で 表 現 したもの<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x 高 次 の 係 数 x が0から 離 れることは、あまりありそうにない<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
Prior p(θ)<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
パラメータ 空 間<br />
x x<br />
小 0 大 <br />
高 次 の 係 数<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
16<br />
x<br />
x
Introduction: 機 械 学 習 とベイズ<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
Posterior: x x<br />
x x データ x x観 測 x 後 x の 確 x からしさ<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
Likelihood<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
Prior p(θ)<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
パラメータ 空 間<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
観 測 したデータ<br />
Bayes’ x D<br />
x<br />
x<br />
Posterior Likelihood Prior<br />
p(<br />
|<br />
Theorem p(<br />
D)<br />
x<br />
D)<br />
<br />
x<br />
p(<br />
D<br />
x<br />
| )<br />
p(<br />
)<br />
17<br />
x
Introduction: 機 械 学 習 とベイズ<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
Posterior: x x<br />
x x データ x x観 測 x 後 x の 確 x からしさ<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
Posterior p(θ|D)<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
パラメータ 空 間<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
観 測 したデータ<br />
Bayes’ x D<br />
x<br />
x<br />
Posterior Likelihood Prior<br />
p(<br />
|<br />
Theorem p(<br />
D)<br />
x<br />
D)<br />
<br />
x<br />
p(<br />
D<br />
x<br />
| )<br />
p(<br />
)<br />
18<br />
x
Introduction: 機 械 学 習 とベイズ<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
Posterior: x x<br />
x x データ x x観 測 x 後 x の 確 x からしさ<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
MAP 推 定<br />
x x<br />
(Maximum x A Posteriori) x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
Posterior p(θ|D)<br />
パラメータ 空 間<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
観 測 したデータ x D<br />
x<br />
x<br />
x<br />
x<br />
x<br />
19<br />
x
Introduction: 機 械 学 習 とベイズ<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
適 x 切 x なx<br />
prior x があれば、 x x<br />
x x 過 学 x 習 x を 起 x こしにくい<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
Regression x<br />
with prior<br />
using x<br />
x<br />
8 th -degree<br />
x<br />
polynomial<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
20<br />
x
Introduction: 機 械 学 習 とベイズ<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
なぜパラメータ x x<br />
x x<br />
x θx<br />
の 同 x 定 x にこだわる?<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
Posterior p(θ|D)<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
θ<br />
x<br />
x<br />
パラメータ 空 間<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
21<br />
x
Introduction: 機 械 学 習 とベイズ<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
なぜパラメータ x x<br />
x x<br />
x θx<br />
の 同 x 定 x にこだわる?<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
欲 しいものは、モデルに 基 づく 何 らかの 予 測<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x x<br />
x<br />
θ<br />
x<br />
x<br />
x<br />
Posterior p(θ|D)<br />
パラメータ 空 間<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
未 知 のケース x に 対 応 する 予 測<br />
22<br />
x
Introduction: 機 械 学 習 とベイズ<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
なぜパラメータ x x<br />
x x<br />
x θx<br />
の 同 x 定 x にこだわる?<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
欲 しいものは、モデルに 基 づく 何 らかの 予 測<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
θ をひとつ 選 ぶ = posterior が 含 む 多 くの 情 報<br />
x<br />
x x<br />
x x<br />
x<br />
を 利 用 しない<br />
x<br />
x x<br />
x<br />
θ<br />
x<br />
x<br />
パラメータ 空 間<br />
x x<br />
x<br />
x x<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
未 知 のケース x に 対 応 する 予 測<br />
23<br />
x
Introduction: 機 械 学 習 とベイズ<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
Posterior<br />
x x<br />
x<br />
全<br />
x<br />
体<br />
xから x<br />
予<br />
x測 x<br />
をしたい!<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
p(<br />
x |<br />
<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
パラメータ θ を 積 分 消 去 予 測 分 布 p(x|D)<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
D)<br />
x<br />
x<br />
<br />
p(<br />
x | )<br />
p(<br />
|<br />
x<br />
x<br />
x<br />
D)<br />
d<br />
x<br />
x<br />
xθ 2<br />
パラメータ 空 間<br />
θ 1 x θ3<br />
x<br />
x<br />
x<br />
Posterior p(θ|D)<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
24
Introduction: 機 械 学 習 とベイズ<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
Posterior<br />
x x<br />
x<br />
全<br />
x<br />
体<br />
xから x<br />
予<br />
x測 x<br />
をしたい!<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
p(<br />
x |<br />
<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
パラメータ θ を 積 分 消 去 予 測 分 布 p(x|D)<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
D)<br />
x<br />
x<br />
<br />
p(<br />
x | )<br />
p(<br />
|<br />
x<br />
x<br />
x<br />
D)<br />
d<br />
x<br />
x<br />
x<br />
x<br />
x<br />
Posterior p(θ|D)<br />
パラメータ 空 間<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
E[x]<br />
x<br />
x<br />
p(x|D)<br />
x<br />
x<br />
25
Introduction: 機 械 学 習 とベイズ<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
Posterior<br />
x x<br />
x<br />
全<br />
x<br />
体<br />
xから x<br />
予<br />
x測 x<br />
をしたい!<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
p(<br />
x |<br />
<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
パラメータ θ を 積 分 消 去 予 測 分 布 p(x|D)<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
D)<br />
x<br />
x<br />
<br />
p(<br />
x | )<br />
p(<br />
|<br />
x<br />
x<br />
x<br />
D)<br />
d<br />
x<br />
x<br />
x<br />
x<br />
x<br />
Posterior p(θ|D)<br />
パラメータ 空 間<br />
x x<br />
期 待 値 E[x]<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
E x]<br />
x<br />
x p(<br />
x | D)<br />
x<br />
<br />
x<br />
dx<br />
x<br />
x<br />
x<br />
E[x]<br />
x<br />
x<br />
p(x|D)<br />
x<br />
x<br />
26
Introduction: 機 械 学 習 とベイズ<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
予 x 測 x の x分 x布 p(x|D) x x から、 x x 予 x測 x の 確 x からしさ<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
( 不 確 かさ) を 知 ることができる<br />
x<br />
x x<br />
x x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
分 散 が 小 さい<br />
( 予 測 の 確 実 性 が 高 い)<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
分 散 が 大 きい<br />
( 予 測 が 不 x 確 実 )<br />
x<br />
x<br />
x<br />
27<br />
x
Introduction:<br />
ベイジアン 機 械 学 習 のまとめ<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
パラメータ=モデル 仮 説 の「 確 からしさ」を 確 率 分<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
布 で x 考 えるx<br />
x<br />
x x<br />
x x<br />
x x<br />
ベイズの x x 定 理 で、データからパラメータ x x<br />
x x 分 布 x を 推 x 論<br />
x<br />
x<br />
x<br />
x<br />
x<br />
過 学 習 を 起 こしにくい<br />
x<br />
x<br />
x<br />
適 切 な prior が 必 要 (モデル 選 択 よりは 簡 単 )<br />
自 x動 モデル x 選 択 とみなすこともできる<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
Posterior x 全 体 を 使 xって 予 測 分 x 布 を 作 れる<br />
パラメータ 空 間 の 座 標 の 取 り 方 に 依 存 しない<br />
予 測 の 不 確 かさが 明 示 的 に 表 現 される<br />
学 習 が<br />
x<br />
理 論 的<br />
x<br />
に、きれいに 記 述 できる<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
主 観 的 要 素 (prior) と 推 論 の 分 離<br />
28<br />
x<br />
x
Talk Outline<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
Introduction<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
ベイジアンとは 何 か?<br />
x<br />
x x<br />
x<br />
ベイズHMMモデル<br />
x<br />
x<br />
x<br />
x Dirichlet 分 布 x<br />
x<br />
ノンパラメトリックベイズHMMモデル<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
機 械 学 習 とベイズ<br />
Bayesian HMM<br />
Dirichlet process<br />
x<br />
Hierarchical Dirichlet process<br />
Infinite Hidden Markov Model<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
HMMの 状 態 の 階 層 的 クラスタリング<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
29<br />
x
隠 れマルコフモデル (HMM)<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
時 x 系 x 列 xの x確 率 x 分 x 布 を x 表 x わすモデル<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
状 態 s<br />
x t は 直 前 の 状 態 s<br />
x<br />
x x t-1 にのみ 依 存<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
p<br />
( st<br />
1 | s , , , ) ( |<br />
x<br />
1<br />
s2<br />
s<br />
x<br />
t<br />
p s<br />
x<br />
t1<br />
s<br />
x<br />
t<br />
出 力 記 号 e t は s t にのみ 依 存<br />
x<br />
p<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
( et<br />
| s1,<br />
,<br />
s<br />
x t,<br />
e1<br />
, ,<br />
et<br />
-1)<br />
p(<br />
e | )<br />
x t<br />
st<br />
x x<br />
s 0 s 1 s 2 s 3<br />
)<br />
x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
e 1 e 2 e 3<br />
x<br />
x<br />
30<br />
x
HMMの 行 列 表 現<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
状 x 態 x を 整 x 数 x {1,…,N} x x<br />
x で、 x 出 x力 xを{1,…,M}で<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
表 わす<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
パラメータは2つの x 行 x 列 で 表 わされる<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
a<br />
b<br />
ji<br />
ki x<br />
<br />
x<br />
<br />
p<br />
( st<br />
x<br />
1<br />
p(<br />
e<br />
t<br />
j | s<br />
k | s<br />
x<br />
t<br />
t<br />
x<br />
i)<br />
i)<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x x<br />
列 i は、 x 状 態 i から 出 力 されx<br />
x<br />
x<br />
列 i は、 状 態 i の 後 の<br />
状 態 の 分 布 を 表 わす<br />
x<br />
る 記 号 の 分 布 を 表 わす<br />
x<br />
x<br />
Transition<br />
Matrix<br />
A =<br />
x<br />
a 11<br />
a 21<br />
a N1<br />
x<br />
a 1i<br />
a 2i<br />
a Ni<br />
x<br />
a 1N<br />
a 2N<br />
a NN<br />
x<br />
Emission<br />
Matrix<br />
B =<br />
x<br />
b 11<br />
b 21<br />
b M1<br />
b 1i<br />
b 2i<br />
x<br />
b Mi<br />
b 1N<br />
b 2N<br />
b MN<br />
31<br />
x
HMMのベイズ 的 扱 い 方<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
Prior、Posterior x x<br />
x x<br />
x を x 表 わすために、 x x<br />
x x HMMのパ<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x<br />
ラメータ 空 間 の 上 の 確 率 分 布 を 記 述 したい<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
Dirichlet x分 布 を 組 み x 合 わせて x使 う<br />
x<br />
( 多<br />
x<br />
項 分 布 のパラメータ<br />
x x<br />
上 の<br />
x<br />
確 率<br />
x分 布 )<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
Transition<br />
Matrix<br />
A =<br />
x<br />
a 11<br />
a 21<br />
a N1<br />
x<br />
a 1i<br />
a 2i<br />
a Ni<br />
x<br />
a 1N<br />
a 2N<br />
a NN<br />
x<br />
Emission<br />
Matrix<br />
B =<br />
x<br />
b 11<br />
b 21<br />
b M1<br />
b 1i<br />
b 1N<br />
b 2i b<br />
x 2N<br />
x<br />
32<br />
b Mi<br />
b MN
多 項 分 布<br />
(multinomial distribution)<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
N x 値 x 離 散 x 確 x 率 変 x 数 x の x確 x率 分 x 布 x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
p( X j | θ)<br />
x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
N 個 のパラメータで 表 わされる<br />
x<br />
x<br />
x<br />
θ ( 1<br />
,..., N<br />
)<br />
確 率 分 布 としての 制 約 を 満 たす<br />
<br />
x<br />
0 1<br />
i<br />
N<br />
i1<br />
<br />
x<br />
x<br />
HMM の<br />
x<br />
遷 移<br />
x行 列 の<br />
各 列 は 多 項 分 布 である<br />
i<br />
j<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
A = x<br />
x<br />
Transition<br />
Matrix<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
θ 4<br />
θ<br />
θ<br />
x 2 x x<br />
1 θ3<br />
θ 5<br />
x<br />
1 2 3 4 5<br />
x<br />
x<br />
x<br />
4, 2, 3, 1, 4, 5, 2, 4, 4, 1,<br />
5, 3, 2, x 4, 5, 5, x 4, 2, 1, 3…<br />
x<br />
a 11<br />
a N1<br />
x<br />
a 1i<br />
a Ni<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
a 1N<br />
x<br />
a NN<br />
33<br />
x<br />
x<br />
x<br />
x<br />
x
Dirichlet 分 布 (1)<br />
x<br />
1, x<br />
1,<br />
2,<br />
1,<br />
3,<br />
…<br />
3,<br />
1,<br />
3,<br />
2,<br />
3,<br />
…<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
多 x 項 x 分 x布 xの prior x x を 表 x わすのに x<br />
x x 便 x利 xな 分 x布<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
多 項 分 布 のパラメータ θ ( 1<br />
,..., N<br />
) 上 の 確 率 分 布<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
ハイパーパラメータ x α x<br />
x<br />
x<br />
1 …α N が 分 布 の 形 を 表 わす<br />
θ 1<br />
x x<br />
θ 2 θ 3<br />
x<br />
1 2 3<br />
x<br />
θ 1 θ 2<br />
θ 3<br />
1 2 3<br />
x<br />
Dir( θ<br />
x<br />
x<br />
| <br />
θ 1<br />
θ 2<br />
1<br />
, ,<br />
N<br />
)<br />
x x<br />
<br />
x x<br />
x<br />
x x<br />
x<br />
x<br />
N<br />
<br />
i1<br />
<br />
x<br />
θ 3<br />
x<br />
i<br />
-1<br />
i<br />
x<br />
x<br />
x<br />
Dir(3,2,6)<br />
x<br />
x<br />
x<br />
x<br />
34<br />
x<br />
x<br />
x
Dirichlet 分 布 (2)<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x 多 x 項 x 分 x布 xの 共 x 役 x 事 前 x 分 x 布 (conjugate x x<br />
x x prior) x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
p<br />
<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
データ 観 測 後 のposteriorも、priorと 同 じ 形 式 で 記<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
述 できる x<br />
x<br />
x<br />
x<br />
Dir( θ<br />
x<br />
1<br />
x<br />
x<br />
θ | , ,<br />
,<br />
N<br />
x<br />
| <br />
1<br />
, ,<br />
N<br />
)<br />
X <br />
x x<br />
j<br />
x<br />
<br />
<br />
<br />
x<br />
x<br />
N<br />
<br />
i1<br />
x<br />
p(<br />
X<br />
<br />
j<br />
<br />
N<br />
i1<br />
Dir( θ<br />
i<br />
-1<br />
i<br />
<br />
<br />
x<br />
<br />
x<br />
i<br />
-1<br />
i<br />
x<br />
x x<br />
x x<br />
j | θ)<br />
Dir(<br />
θ<br />
x<br />
| , ,<br />
1,<br />
,<br />
<br />
1<br />
j<br />
x<br />
x<br />
| , ,<br />
<br />
ハイパーパラメータ α j は、 事 前 に j を 観 測 していた 回 数 に 相 当<br />
35<br />
1<br />
N<br />
)<br />
x<br />
N<br />
x<br />
)<br />
x<br />
x<br />
x
Dirichlet 分 布 (3)<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x Dirichlet x x<br />
x 分 x 布 の x 例 x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
観 測 のたびに、ハイパーパラメータが 更 新 される<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
Prior Likelihood Posterior<br />
x<br />
x<br />
x<br />
Dir(θ |1,1,1) × p ( X 3| θ)<br />
3<br />
∝ Dir(θ |1,1, 2)<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
36<br />
x
Dirichlet 分 布 (3)<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x Dirichlet x x<br />
x 分 x 布 の x 例 x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
観 測 のたびに、ハイパーパラメータが 更 新 される<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
Prior Likelihood Posterior<br />
x<br />
x<br />
x<br />
Dir(θ |1,1, 2) × p ( X 1|<br />
θ)<br />
1<br />
∝ Dir(θ | 2,1, 2)<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
37<br />
x
Dirichlet 分 布 (3)<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x Dirichlet x x<br />
x 分 x 布 の x 例 x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
観 測 のたびに、ハイパーパラメータが 更 新 される<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
Prior Likelihood Posterior<br />
x<br />
x<br />
x<br />
Dir(θ | 2,1, 2) × p ( X 3| θ)<br />
3<br />
∝ Dir(θ | 2,1, 3)<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
38<br />
x
Dirichlet 分 布 (3)<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x Dirichlet x x<br />
x 分 x 布 の x 例 x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
観 測 のたびに、ハイパーパラメータが 更 新 される<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
Prior Likelihood Posterior<br />
x<br />
x<br />
x<br />
Dir(θ | 2,1, 3) × p ( X 2 | θ)<br />
2<br />
∝ Dir(θ | 2, 2, 3)<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
39<br />
x
Dirichlet 分 布 (3)<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x Dirichlet x x<br />
x 分 x 布 の x 例 x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
観 測 のたびに、ハイパーパラメータが 更 新 される<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
Prior Likelihood Posterior<br />
x<br />
x<br />
x<br />
Dir(θ | 2, 2, 3) × p ( X 2 | θ)<br />
2<br />
∝ Dir(θ | 2, 3, 3)<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
40<br />
x
Dirichlet 分 布 (3)<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x Dirichlet x x<br />
x 分 x 布 の x 例 x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
観 測 のたびに、ハイパーパラメータが 更 新 される<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
Prior Likelihood Posterior<br />
x<br />
x<br />
x<br />
Dir(θ | 2, 3, 3) × p ( X 2 | θ)<br />
2<br />
∝ Dir(θ | 2, 4, 3)<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
41<br />
x
Dirichlet 分 布 (3)<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x Dirichlet x x<br />
x 分 x 布 の x 例 x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
観 測 のたびに、ハイパーパラメータが 更 新 される<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
Prior Likelihood Posterior<br />
x<br />
x<br />
x<br />
Dir(θ | 2, 4, 3) × p ( X 2 | θ)<br />
2<br />
∝ Dir(θ | 2, 5, 3)<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
42<br />
x
Dirichlet 分 布 (3)<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x Dirichlet x x<br />
x 分 x 布 の x 例 x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
観 測 のたびに、ハイパーパラメータが 更 新 される<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
Prior Likelihood Posterior<br />
x<br />
x<br />
x x<br />
観 測 数 が 増 えると、 事 後 分 布 の 幅<br />
x<br />
x x<br />
が 狭 くなっていく<br />
↑<br />
x<br />
Dir(θ | 2, 5, 3) × p ( X 2 | θ)<br />
2<br />
∝ Dir(θ | 2, 6, 3)<br />
x x<br />
x x<br />
観 測 x により 仮 説 の 不 確 x かさが 減 尐<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
43<br />
x
Dirichlet 分 布 (4)<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
予 x 測 x 分 x布 xも 簡 x単 xに 構 x成 x できる x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
p(<br />
X<br />
x<br />
<br />
<br />
Dir( x<br />
<br />
x<br />
j<br />
x<br />
x x<br />
x x<br />
パラメータ θ を 積 分 消 去 する<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
θ | , ,<br />
<br />
x<br />
1<br />
p(<br />
X<br />
j<br />
x<br />
j<br />
x<br />
N<br />
)<br />
x x<br />
N<br />
N<br />
x<br />
N<br />
<br />
| θ)<br />
<br />
j<br />
x<br />
i1<br />
<br />
i<br />
-1<br />
i<br />
p(<br />
X<br />
j | θ) Dir( θ | , ,<br />
<br />
<br />
1<br />
| , ,<br />
<br />
1<br />
<br />
<br />
<br />
)<br />
x x<br />
x x<br />
1<br />
N<br />
x<br />
) dθ<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x<br />
1 2 3<br />
x x<br />
?<br />
x<br />
44<br />
x<br />
1 2 3<br />
x
Dirichlet 分 布 (5)<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
1 x 未 x 満 のx<br />
α x = 疎 x な x 分 布 x の x 事 前 x 分 x 布 x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
x x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
確 率 が 端 に 集 中 … 出 る 確 率 がほぼ0の 値 がある<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
45<br />
x
HMM パラメータの 分 布<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
パラメータ:<br />
x x<br />
x x<br />
遷 移<br />
x x行 列<br />
xと x出 力<br />
x行 x列<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
行 列 の 各 列 が 多 項 分 布<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
Dirichlet x分 布 で prior x を 表 現 できる<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
状<br />
x<br />
態 列 S が<br />
x<br />
与 えられれば、posterior<br />
x<br />
x x<br />
もまたx<br />
Dirichlet 分 布 で 表 現 できる<br />
x x<br />
x x<br />
x x<br />
S 中 の 各 状 態 x遷 移 の 回 数 分 、ハイパーパラメータ<br />
x<br />
x<br />
xを 更 新<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
Transition<br />
Matrix<br />
A =<br />
x<br />
a 11<br />
a 12<br />
a 21 a 22<br />
x<br />
a N1 a N2<br />
a 1i<br />
a 2i<br />
a Ni<br />
x<br />
a 1N<br />
a 2N<br />
a NN<br />
a<br />
x<br />
ji<br />
<br />
x<br />
x<br />
p( s<br />
1<br />
j | s i)<br />
t<br />
t<br />
46<br />
x
HMMのベイズ 推 定<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
出 x 力 x 列 x D x 観 測 x 後 x の posterior x x<br />
x p(θ x | D) x x が 欲 x しい x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
状 態 列 S が 与 えられれば、 p(θ | S,D) は 解 析 的 に<br />
x x<br />
x x<br />
x x<br />
x x<br />
解 ける (Dirichlet x 分 布 を x 使 う)<br />
x<br />
x<br />
x x<br />
通 常 は S が<br />
x<br />
不 明<br />
x<br />
p(θ | D) は<br />
x<br />
解 析<br />
x的 に 解 けない<br />
x x<br />
状 態 列 S を 隠 れ 変 数 とみなし、<br />
x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
状 態 列 S とパラメータ θ の 同 時 分 布 を 推 定<br />
x<br />
x x<br />
状 態 列 S をパラメータ θ から 推 定 : p(S | θ,D)<br />
パラメータ θ を 状 態 列 S から 推 定 : p(θ | S,D)<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
47<br />
x<br />
x<br />
x
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
HMM Bayesian Model<br />
x x<br />
x x<br />
x<br />
0 x x<br />
x x<br />
x<br />
x p(<br />
x<br />
x x<br />
as t-1<br />
s<br />
x<br />
t<br />
x<br />
p(<br />
e<br />
p(<br />
a<br />
x<br />
b<br />
x<br />
x<br />
x<br />
x<br />
x<br />
<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
Dir( x<br />
x<br />
x<br />
x x<br />
, x<br />
x<br />
x<br />
x<br />
<br />
x<br />
x<br />
x<br />
x<br />
t t st<br />
et<br />
st<br />
x x<br />
x x<br />
x x<br />
x E<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
s 0<br />
s 1 s 2 s 3 s 4 s 5<br />
bs t<br />
x N x<br />
x x<br />
e 1<br />
x e 2 e 3 e 4 e 5<br />
48<br />
x<br />
px<br />
(<br />
s<br />
s<br />
t-1<br />
s<br />
s<br />
, a<br />
)<br />
s<br />
, b<br />
0<br />
E<br />
t-1<br />
)<br />
)<br />
)<br />
<br />
<br />
<br />
<br />
Dir( , ,<br />
)<br />
a<br />
b<br />
s<br />
t<br />
s<br />
t-1<br />
<br />
0<br />
E<br />
,<br />
0<br />
E<br />
x<br />
x x<br />
x<br />
)
隠 れ 変 数 があるモデルのベイズ 推 定<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
変<br />
x<br />
分<br />
x<br />
ベイズ<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
分 布 の 形 状 を、 変 分 法 を 使 って 近 似<br />
x x<br />
x x<br />
x x<br />
変 数 間 の 独 立 を 仮 定<br />
x<br />
x<br />
x<br />
x 熱 力 学 モデルの x x平 均 場 近 似 xに 相 当 x<br />
比 較 的 高 速 だが、 近 似 誤 差 が 残 る<br />
x x<br />
x x<br />
x<br />
マルコフ 連 鎖 モンテカルロ x<br />
(MCMC) x 法<br />
x<br />
x<br />
xサンプリングにより x 分 布 を 推 x 定<br />
x<br />
多 くのサンプルを 集 めることで、 誤 差 を 減 らせる<br />
遅 いx<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
49<br />
x<br />
x<br />
x<br />
x<br />
x
( 非 ベイズ) EM アルゴリズム<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
1. x適 x当 なパラメータ x x<br />
x x θ からスタート<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
2. 状 態 列 の 分 布 確 率 を 計 算<br />
x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
q(S) ∝ p(S | θ,D)<br />
x<br />
3. Likelihood 最 大 になる<br />
パラメータ x x θ を 計 算 x<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
θ = argmax θ E q(S) [p(D | θ,S)]<br />
x<br />
x<br />
4. 収 束 してなければ2に 戻 る<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
Expectation<br />
x<br />
x x<br />
x<br />
Expectation<br />
x<br />
s 0<br />
Maximization<br />
Maximization<br />
Expectation<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
s 1<br />
x s 2<br />
xs<br />
x<br />
x<br />
s' 0 s' 1 s' 2 s'<br />
θ''<br />
x<br />
x<br />
s'' 1 s'' 2 s'<br />
s'' 0<br />
θ<br />
θ'<br />
50
変 分 ベイズ 法<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
1. x適 x当 なパラメータ x x<br />
x x 分 布 x xq(θ) xからスタート<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
2. 状 態 の 期 待 分 布 を 計 算<br />
x<br />
x x<br />
x x<br />
x<br />
q(S) x ∝ exp Ex<br />
x<br />
q(θ) [log p(D,S | θ)]<br />
x<br />
x<br />
x<br />
3. パラメータの 期 待 分 布 を 計 算<br />
x<br />
q(θ) ∝ p(θ) exp E q(S) [log p(D,S | θ)]<br />
x<br />
4. 収 束 してなければ2に 戻 る<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
VB-E step<br />
x<br />
VB-E step<br />
s 0<br />
VB-M step<br />
VB-M step<br />
VB-E step<br />
x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
s 1<br />
x s 2<br />
xs<br />
x<br />
x<br />
s' 0<br />
s'' 1 s'' 2<br />
x<br />
s' 1 s' 2 s'<br />
x<br />
q''(θ)<br />
x<br />
s'<br />
s'' 0<br />
q(θ)<br />
q'(θ)<br />
51
マルコフ 連 鎖 モンテカルロ 法 (1)<br />
Blocked Gibbs Sampling<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
1. x適 x当 なパラメータ x x<br />
x x θ からスタート<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
2. 期 待 分 布 から 状 態 列 S<br />
x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
をサンプリング<br />
x<br />
x x<br />
q(S) ∝ p(S,E | θ)<br />
3. 期 待 x 分 布 x からパラメータ x x<br />
x<br />
x<br />
θ をサンプリング<br />
x<br />
x<br />
q(θ) ∝ p(θ) p(S,E | θ)<br />
4. 2に 戻 る ( 収 束 しない)<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
Sampling<br />
x<br />
Sampling<br />
Sampling<br />
s 0<br />
Sampling<br />
Sampling<br />
x<br />
x<br />
x<br />
x<br />
s 1<br />
x s 2 s x<br />
x<br />
x<br />
s' 0 s' 1 s' 2 s'<br />
θ''<br />
x<br />
x<br />
s'' 1 s'' 2 s'<br />
s'' 0<br />
θ<br />
θ'<br />
52
マルコフ 連 鎖 モンテカルロ 法 (2)<br />
Collapsed Gibbs Sampling<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
状 x 態 x 列 x S xを 各 x々の x 時 x 刻 x ごとに x x Gibbs x xSampling<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
予 測 分 布 を 使 うことでパラメータ θ を 積 分 消 去<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
Dirichlet 分 布 の exchangeability を 利 用<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x x<br />
x<br />
x<br />
s 1 s 3 s 4 s 5<br />
x<br />
x<br />
x<br />
1 2 3 4 5<br />
s 0<br />
S<br />
x<br />
x<br />
x x<br />
e 1 e 2 e 3 e 4 e 5<br />
x
マルコフ 連 鎖 モンテカルロ 法 (2)<br />
Collapsed Gibbs Sampling<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
状 x 態 x 列 x S xを 各 x々の x 時 x 刻 x ごとに x x Gibbs x xSampling<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
予 測 分 布 を 使 うことでパラメータ θ を 積 分 消 去<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
Dirichlet 分 布 の exchangeability を 利 用<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x x<br />
x<br />
x<br />
s 1 s 2 s 4 s 5<br />
x<br />
x<br />
x<br />
1 2 3 4 5<br />
s 0<br />
S<br />
x<br />
x<br />
x x<br />
e 1 e 2 e 3 e 4 e 5<br />
x
Talk Outline<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
Introduction<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
ベイジアンとは 何 か?<br />
x<br />
x x<br />
x<br />
ベイズHMMモデル<br />
x<br />
x<br />
x<br />
x Dirichlet 分 布 x<br />
x<br />
ノンパラメトリックベイズHMMモデル<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
機 械 学 習 とベイズ<br />
Bayesian HMM<br />
Dirichlet process<br />
x<br />
Hierarchical Dirichlet process<br />
Infinite Hidden Markov Model<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
HMMの 状 態 の 階 層 的 クラスタリング<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
55<br />
x
ノンパラメトリックベイズ<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
複 数 のパラメータ 空 間 に 対 する prior を 導 入<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
xHMM であれば、それぞれの x x<br />
x x N ( 隠 れ x 状 x態 数 ) に x対 して x<br />
prior 確 率 p(N) を 割 り 振 る<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
N が 異 なる 複 数 のモデルの 予 測 を 統 合 できる<br />
x<br />
(Nを 積 分 消 去 )<br />
x x<br />
x x<br />
個 同 時 に 考 えることができる<br />
x<br />
x<br />
適 切 な prior を 与 えれば、Nの 異 なるモデルを 無 限<br />
x<br />
ノンパラメトリックベイズモデル<br />
x x<br />
x<br />
“ノンパラメトリック” とは、パラメータ 空 間 が 固 定 されて<br />
いない、とか、データに 応 じて 変 わる、という 意 味<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
56<br />
x<br />
x<br />
x<br />
x<br />
x
Dirichlet Process<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
G ~ DP( α<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x 0 , G<br />
x 0 )<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
Dirichlet 分 布 を N → ∞ に 拡 張 したもの<br />
x x<br />
x<br />
Dir(<br />
, , )<br />
x 1<br />
<br />
x N<br />
x<br />
<br />
x<br />
x x<br />
i x<br />
G 0 : 基 底 測 度 (base measure)<br />
x x<br />
x<br />
x<br />
α 0 : ハイパーパラメータ<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
0<br />
i<br />
xG0<br />
( i)<br />
G 0 が 連 続 であれば、DP は 無 限 次 元 の 離 散 分 布<br />
α 0 → ∞ の 極 限 では、 G → G 0<br />
α 0 が 小 さくなると、より 疎 な 分 布 になる<br />
G 0<br />
x<br />
x<br />
x<br />
G(x) の 有 限 個 の 点 で 確 率 1になる<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
0x<br />
x<br />
57<br />
α 0 Large α 0 Small<br />
<br />
<br />
<br />
i<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x
x<br />
ハイパーパラメータ<br />
(α 1 ,…,α N )<br />
x x<br />
x x<br />
x x<br />
N 項 の Dirichlet 分 布<br />
x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
Dir(αx<br />
1 ,…,α N )<br />
x<br />
x<br />
x<br />
x<br />
パラメータ<br />
(θ 1 ,…, θ N )<br />
x<br />
x<br />
x<br />
x<br />
N 項 の 多 項 分 布<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
ハイパーパラ<br />
メータ α 0<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
Dirichlet Process<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
DP(α<br />
x x<br />
x 0 ,G<br />
x 0 )<br />
x<br />
x<br />
x x<br />
x<br />
無 限 個 のパラメータ<br />
x<br />
x x<br />
無 限 項<br />
x<br />
の 多 項 分 布<br />
x<br />
G = (θ 1 , θ 2 ,…,)<br />
基 底 測 度 G 0<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
θ 1 θ 2<br />
θ 3<br />
1 2 3<br />
x x<br />
N 値 の 離 散 確 率 変 数<br />
x<br />
1, 3, 1, 2, 3, 3, 3, …<br />
-1 0 1<br />
x x<br />
無 限 値 の 離 散 確 率 変 数<br />
x<br />
-0.24, 0.93, 0.07, -0.24, …<br />
x
a<br />
i<br />
am<br />
he<br />
ab<br />
are<br />
and<br />
zz<br />
aaa<br />
the<br />
you<br />
zzz<br />
aaaa<br />
that<br />
zzzz<br />
aaaaa<br />
x<br />
基 底 測 度 G 0<br />
-1 0 1<br />
実 数 空 間 上 の 分 布<br />
x<br />
x<br />
x<br />
x<br />
x<br />
基 底 測 度 G 0<br />
… … … … …<br />
a b<br />
z<br />
aa<br />
アルファベット 列 の 分 布<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
μ<br />
基 底 測 度 G 0<br />
x<br />
α<br />
x<br />
x<br />
λ<br />
2 次 元 実 数 上 の 分 布<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
DP(α<br />
x<br />
x<br />
x x<br />
x<br />
0 ,G 0 )<br />
x<br />
x<br />
x<br />
分 布 G<br />
-1 0 x 1x<br />
x<br />
x<br />
x<br />
x<br />
実 数 の 離 散 分 布<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
DP(α<br />
x<br />
x<br />
x x<br />
0 ,G 0 )<br />
x x<br />
x<br />
x<br />
分 布 G<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
x<br />
DP(α<br />
x<br />
x<br />
x<br />
x x<br />
0 ,G 0 )<br />
x<br />
x<br />
x<br />
x x<br />
アルファベット 列 の<br />
x<br />
離 散 分 布<br />
x<br />
x<br />
x<br />
分 布 G<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
実 数 の 組 の 離 散 分 x 布<br />
正 規 分 布<br />
x<br />
の 分 布<br />
正 規 分 布 の 混 合<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
μ<br />
λ<br />
=1/σ
Stick-breaking construction<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
分 x 布 x Gx<br />
を x明 示 x 的 x にサンプリングする x x<br />
x x<br />
x 方 x 法 x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
(Sethuraman, x<br />
x 1994; x Ishwaran x & xJames , 2001) x x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
長 さ1の 棒 を v<br />
x i ~ Beta(1, α<br />
x 0 ) の 比<br />
率 で 折 りながら、G x x 0 から 選 んだ x 点<br />
i に 確 率 を 振 る<br />
x x<br />
x<br />
x x<br />
x x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
G 0 : Prior Distribution<br />
of English words<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
60<br />
x
Stick-breaking construction<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
分 x 布 x Gx<br />
を x明 示 x 的 x にサンプリングする x x<br />
x x<br />
x 方 x 法 x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
(Sethuraman, x<br />
x 1994; x Ishwaran x & xJames , 2001) x x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
長 さ1の 棒 を v<br />
x i ~ Beta(1, α<br />
x 0 ) の 比<br />
率 で 折 りながら、G x x 0 から 選 んだ x 点<br />
i に 確 率 を 振 る<br />
x x<br />
x<br />
x x<br />
x x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
G 0 : Prior Distribution<br />
of English words<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
like<br />
x<br />
x<br />
x<br />
61<br />
x
Stick-breaking construction<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
分 x 布 x Gx<br />
を x明 示 x 的 x にサンプリングする x x<br />
x x<br />
x 方 x 法 x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
(Sethuraman, x<br />
x 1994; x Ishwaran x & xJames , 2001) x x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
長 さ1の 棒 を v<br />
x i ~ Beta(1, α<br />
x 0 ) の 比<br />
率 で 折 りながら、G x x 0 から 選 んだ x 点<br />
i に 確 率 を 振 る<br />
x x<br />
x<br />
x x<br />
x x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
G 0 : Prior Distribution<br />
of English words<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
the<br />
like<br />
x<br />
x<br />
x<br />
62<br />
x
Stick-breaking construction<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
分 x 布 x Gx<br />
を x明 示 x 的 x にサンプリングする x x<br />
x x<br />
x 方 x 法 x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
(Sethuraman, x<br />
x 1994; x Ishwaran x & xJames , 2001) x x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
長 さ1の 棒 を v<br />
x i ~ Beta(1, α<br />
x 0 ) の 比<br />
率 で 折 りながら、G x x 0 から 選 んだ x 点<br />
i に 確 率 を 振 る<br />
x x<br />
x<br />
x x<br />
x x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
G 0 : Prior Distribution<br />
of English words<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
you<br />
love<br />
have<br />
that<br />
is<br />
ball<br />
he<br />
the<br />
like<br />
…<br />
x<br />
=<br />
x<br />
p<br />
63<br />
x
Chinese Restaurant Process<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x<br />
Dirichlet x x<br />
x Process x<br />
x x のよい x x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
性 質 を 活 用 したいが、<br />
x x<br />
x x<br />
無 x 限 個 のパラメータは<br />
x<br />
x<br />
扱<br />
x<br />
いづらいx<br />
x x<br />
x<br />
して、 確 率 変 数 x の 予 測<br />
x<br />
x<br />
x<br />
x<br />
x<br />
パラメータを 積 分 消 去<br />
分 布 を 直 接 計 算 する<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
G 0<br />
x α x<br />
x x<br />
x x<br />
x<br />
x 0 x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
Dirichlet x<br />
xProcess<br />
x<br />
x<br />
x<br />
DP(α 0 ,G 0 )<br />
x<br />
G = (θx<br />
x 1 , θ 2 ,…,)<br />
x<br />
x<br />
無 限 個 のパラメータ<br />
x 無 限 項 の 多 項 分 布 x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
無 限 値 の 離 散 確 率 変 数<br />
x<br />
-0.24, 0.93, 0.07, -0.24, … 64
Chinese Restaurant Process<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
G<br />
x<br />
を<br />
x<br />
計 算<br />
x<br />
せず、<br />
x<br />
x<br />
多<br />
x<br />
項 分<br />
x<br />
布<br />
x<br />
の<br />
x予 x測 分<br />
x<br />
布<br />
x<br />
を 求<br />
x<br />
める<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x (Aldous, x 1983; x Pitman, x 1995) x<br />
客 x = 確 x 率 変 数 x x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x G 0 : 英 単 語 の 分 布<br />
皿 = 確 率 変 数 に 割 り 当 てられた 値<br />
x<br />
x x<br />
x x<br />
x<br />
卓 = 客 と 皿 の 組 み 合 わせかた<br />
x x<br />
x x<br />
x x<br />
Partitioning に 関 する prior になっている<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
5 x<br />
x 3<br />
x<br />
4<br />
x<br />
x<br />
he the ball<br />
x 1<br />
x<br />
x x<br />
2<br />
x x<br />
x 6 5+α<br />
2 5+α<br />
2 5+α<br />
1 5+α<br />
α<br />
x<br />
65<br />
x<br />
x<br />
x
Chinese Restaurant Process<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
G<br />
x<br />
を<br />
x<br />
計 算<br />
x<br />
せず、<br />
x<br />
x<br />
多<br />
x<br />
項 分<br />
x<br />
布<br />
x<br />
の<br />
x予 x測 分<br />
x<br />
布<br />
x<br />
を 求<br />
x<br />
める<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
(Aldous, x 1983; x Pitman, x 1995) x<br />
客 x = 確 x 率 変 数 x x<br />
x<br />
x<br />
x<br />
x<br />
皿 = 確 率 変 数 に 割 り 当 てられた 値<br />
x x<br />
x<br />
卓 = 客 と 皿 の 組 み 合 わせかた<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
Partitioning に 関 する prior になっている<br />
x<br />
x<br />
x x<br />
x x 3<br />
x 7<br />
4<br />
x<br />
x 5<br />
x 2<br />
he the ball<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
G 0 : 英 単 語 の 分 布<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x 1<br />
x<br />
x 7 6+α<br />
2 6+α<br />
3 6+α<br />
1 6+α<br />
α<br />
x<br />
x<br />
x<br />
66<br />
x
Chinese Restaurant Process<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
G<br />
x<br />
を<br />
x<br />
計 算<br />
x<br />
せず、<br />
x<br />
x<br />
多<br />
x<br />
項 分<br />
x<br />
布<br />
x<br />
の<br />
x予 x測 分<br />
x<br />
布<br />
x<br />
を 求<br />
x<br />
める<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
(Aldous, x 1983; x Pitman, x 1995) x<br />
客 x = 確 x 率 変 数 x x<br />
x<br />
x<br />
x<br />
x<br />
皿 = 確 率 変 数 に 割 り 当 てられた 値<br />
x x<br />
x<br />
卓 = 客 と 皿 の 組 み 合 わせかた<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
Partitioning に 関 する prior になっている<br />
x<br />
x<br />
x<br />
x x 3<br />
x<br />
4<br />
x<br />
x 5<br />
x 2<br />
he the ball<br />
love<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
G 0 : 英 単 語 の 分 布<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x 7 x 8<br />
7+α<br />
x<br />
x<br />
x 1<br />
x<br />
x 8 7+α<br />
2 7+α<br />
3 7+α<br />
1 7+α<br />
1<br />
x<br />
x<br />
x<br />
α<br />
67<br />
x
Dirichlet Process の 応 用<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
混 x 合 x 正 x規 x分 布 x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x x<br />
x<br />
x x<br />
x x<br />
それぞれの 皿 がひとつの<br />
x x<br />
x x<br />
x<br />
正 規 分 布 x(クラスタ) を 表 x わす<br />
x<br />
予 測 分 布 を<br />
x<br />
使 うことで、<br />
x<br />
各 データが<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
Gauss-Gamma Distribution<br />
x<br />
x x<br />
所 属 するクラスタを 再 計 算 = collapsed Gibbs sampling<br />
x<br />
x<br />
x<br />
x<br />
x<br />
1 , 1 2 , 2 3 , 3 4 , 4<br />
68<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x
Dirichlet Process の 応 用<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
混 x 合 x 正 x規 x分 布 x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x x<br />
x<br />
x x<br />
x x<br />
それぞれの 皿 がひとつの<br />
x x<br />
x x<br />
x<br />
正 規 分 布 x(クラスタ) を 表 x わす<br />
x<br />
予 測 分 布 を<br />
x<br />
使 うことで、<br />
x<br />
各 データが<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
Gauss-Gamma Distribution<br />
x<br />
x x<br />
所 属 するクラスタを 再 計 算 = collapsed Gibbs sampling<br />
x<br />
x<br />
x<br />
x<br />
x<br />
1 , 1 2 , 2 3 , 3 4 , 4<br />
69<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x
Dirichlet Process の 応 用<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
混 x 合 x 正 x規 x分 布 x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x x<br />
x<br />
x x<br />
x x<br />
それぞれの 皿 がひとつの<br />
x x<br />
x x<br />
x<br />
正 規 分 布 x(クラスタ) を 表 x わす<br />
x<br />
予 測 分 布 を<br />
x<br />
使 うことで、<br />
x<br />
各 データが<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
Gauss-Gamma Distribution<br />
x<br />
x x<br />
所 属 するクラスタを 再 計 算 = collapsed Gibbs sampling<br />
x<br />
x<br />
x<br />
x<br />
x<br />
1 , 1 2 , 2 3 , 3 4 , 4<br />
70<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x
Dirichlet Process の 応 用<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
混 x 合 x 正 x規 x分 布 x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x x<br />
x<br />
x x<br />
x x<br />
それぞれの 皿 がひとつの<br />
x x<br />
x x<br />
x<br />
正 規 分 布 x(クラスタ) を 表 x わす<br />
x<br />
予 測 分 布 を<br />
x<br />
使 うことで、<br />
x<br />
各 データが<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
Gauss-Gamma Distribution<br />
x<br />
x x<br />
所 属 するクラスタを 再 計 算 = collapsed Gibbs sampling<br />
x<br />
x<br />
x<br />
x<br />
x<br />
1 , 1 2 , 2 3 , 3 4 , 4<br />
71<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x
Dirichlet Process の 応 用<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
混 x 合 x 正 x規 x分 布 x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x x<br />
x<br />
x x<br />
x x<br />
それぞれの 皿 がひとつの<br />
x x<br />
x x<br />
x<br />
正 規 分 布 x(クラスタ) を 表 x わす<br />
x<br />
予 測 分 布 を<br />
x<br />
使 うことで、<br />
x<br />
各 データが<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
Gauss-Gamma Distribution<br />
x<br />
x x<br />
所 属 するクラスタを 再 計 算 = collapsed Gibbs sampling<br />
x<br />
x<br />
x<br />
x<br />
x<br />
1 , 1 2 , 2 3 , 3 4 , 4<br />
72<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x
そのほかの 主 な<br />
ノンパラメトリックベイズモデル (1)<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
Gaussian x x<br />
x Process x<br />
x x (O’Hagen, x x 1978) x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
多 変 数 ガウス 分 布 の 無 限 変 数 版<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
関 数 回 帰 のノンパラメトリックモデル<br />
x<br />
x<br />
x<br />
x<br />
x<br />
双 対 表 現 、カーネルトリックを 利 用<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
(Figure from Rasmussen&Williams, 2005)<br />
x<br />
x<br />
x<br />
73<br />
x
そのほかの 主 な<br />
ノンパラメトリックベイズモデル (2)<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
Pitman-Yor Process (Pitman & Yor, 1997)<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x<br />
Dirichlet Process の 拡 張<br />
x x<br />
x x<br />
x x<br />
x x<br />
k 番 目 のStick を 折 る 比 率 が Beta( 1-d, α<br />
x<br />
x<br />
x 0 +kd )<br />
x<br />
x Power-law x 分 布 のx<br />
prior = 「ロングテール」を x x 表 現 x<br />
Beta Process, Indian Buffet Process<br />
x<br />
x<br />
(Griffiths&Ghahramani, 2005; Thibaux&Jordan, 2007)<br />
x<br />
xデータの 背 後 にある x 隠 れ 変 x数 が 単 一 の<br />
カテゴリではなく、feature の 組 み 合 わせ<br />
Mondorian Process<br />
x x<br />
k 次 元 treeに 対 する prior x<br />
(Roy&Teh, 2008)<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
(Figure from<br />
Ghahramani, 2005 / Roy&Teh, 2008)<br />
x<br />
x<br />
x<br />
x<br />
74<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x
Nonparametric Bayesian HMM (1)<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
直<br />
x<br />
観<br />
x<br />
的<br />
xには、 x<br />
遷<br />
x<br />
移<br />
x<br />
行<br />
x節 xの 各<br />
x<br />
列<br />
x<br />
のpriorを<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x Dirichlet x 分 x 布 x から Dirichlet x x Process x x に 置 き x 換 x<br />
えればよさそうに x x<br />
x 思 x える x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
Transition a 11 a 12<br />
Matrix a 21 x<br />
a 22 x<br />
A<br />
x=<br />
xa N1 a N2<br />
x<br />
a 1i<br />
a 2i<br />
a Ni<br />
x<br />
a 1N<br />
a 2N<br />
x<br />
a NN<br />
x<br />
x<br />
x<br />
Transition<br />
Matrix<br />
x<br />
A =<br />
x<br />
x<br />
a 11 a 12<br />
x<br />
a 21 a 22<br />
x<br />
a 1i<br />
a 2i x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
しかし、これはうまくいかない<br />
x<br />
x<br />
x<br />
75<br />
x
Nonparametric Bayesian HMM (2)<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
Dirichlet x x<br />
x Process x<br />
x x からサンプルした x x<br />
x x<br />
x多 x項 分 x 布 x に<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
おいては、 有 限 個 の 点 だけが 非 0 確 率 を 持 つ<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
列 iと 列 jは 確 率 1でdisjoint<br />
x<br />
x<br />
遷 移 先 は 常 に 未 知 の 状 態 に<br />
なってしまう<br />
x x<br />
x<br />
Transition x 0<br />
Matrix<br />
x 0<br />
0<br />
A =<br />
x a ji<br />
x 0<br />
x<br />
x<br />
x<br />
x x<br />
a j'i'<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
G 0<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
76<br />
x<br />
x
Nonparametric Bayesian HMM (3)<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
Hierarchical x x<br />
x x Dirichlet x x<br />
xProcess x<br />
x を x 使 うx<br />
x<br />
x<br />
x<br />
x<br />
x<br />
(Beal+, x 2002; Teh+, x 2006) x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
Dirichlet x x Process x からサンプルした x<br />
x x 分 布 x を、 x別 の<br />
x<br />
x<br />
x<br />
x<br />
Dirichlet Process の 基 底 測 度 に 使 う<br />
G<br />
G<br />
x<br />
i<br />
, H<br />
<br />
x<br />
x<br />
~ DP( , H)<br />
x<br />
x<br />
x<br />
0,<br />
G ~ DP( 0,<br />
G<br />
x<br />
G が 離 散 なので、 多 数 の 分 布<br />
がサポートを x x 共 有 するように<br />
できる<br />
x<br />
)<br />
x<br />
x<br />
x<br />
H<br />
G<br />
x<br />
G 1<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
G 2<br />
77<br />
x<br />
x<br />
x<br />
x
Infinite Hidden Markov Models<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
HMM で 使 うことのできるすべて<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
この HMM で 利 用 される<br />
x<br />
x<br />
x<br />
の 状 態 に 対 する ( 一 様 ) 分 布<br />
状 態 の 確 率 分 布<br />
x<br />
G<br />
G<br />
x<br />
i<br />
, H<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
0,<br />
G ~ DP( 0,<br />
xG)<br />
<br />
~ DP( , H)<br />
遷 移 行 列 の i 列 目<br />
= 状 態 i からの x 遷 x移 先 の<br />
x 状 態 の 確 率 分 布<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
Transition<br />
Matrix<br />
A =<br />
H<br />
x<br />
x<br />
G<br />
x<br />
x<br />
x<br />
x<br />
a 11<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
a 12<br />
a 21 a 22<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
G i<br />
a 1i<br />
x<br />
x<br />
a 2i<br />
x<br />
x<br />
78<br />
x<br />
x
Infinite Hidden Markov Models<br />
x<br />
x x<br />
H<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
G 0<br />
x<br />
x<br />
x<br />
Gs t-1<br />
x<br />
x<br />
x<br />
0<br />
∞<br />
x<br />
s<br />
t<br />
x<br />
x<br />
x<br />
G<br />
x<br />
x x<br />
e<br />
G<br />
t<br />
i<br />
s<br />
x<br />
t-1<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
~ some x distribution<br />
x<br />
x<br />
x<br />
x<br />
x<br />
t<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
s 0<br />
x<br />
x x<br />
e 1<br />
x e 2 e 3 e 4 e 5<br />
x<br />
79<br />
Es t<br />
s 1 s 2 s 3 s 4 s 5<br />
s<br />
, H x<br />
, G<br />
t<br />
E<br />
s<br />
, E<br />
t-1<br />
s<br />
i<br />
t<br />
~ DP( x<br />
, Hx<br />
)<br />
x<br />
, G ~ DP(<br />
0<br />
~<br />
~<br />
G<br />
E<br />
s<br />
s<br />
t-1<br />
0<br />
, G)<br />
x
Infinite Hidden Markov Models<br />
x<br />
x x<br />
H<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
Size<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
Stickiness<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
G 0<br />
x<br />
x<br />
x<br />
Density<br />
x<br />
Gs t-1<br />
x<br />
x<br />
x<br />
0<br />
∞<br />
x<br />
s 0<br />
b<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
s<br />
t<br />
G<br />
x<br />
x x<br />
e<br />
G<br />
t<br />
i<br />
s<br />
x<br />
t-1<br />
s<br />
, H x<br />
t<br />
x<br />
x<br />
x<br />
, G<br />
E<br />
s<br />
, E<br />
t-1<br />
s<br />
t<br />
x<br />
x<br />
x<br />
x<br />
x<br />
<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
~ some x distribution<br />
x<br />
x<br />
x<br />
x<br />
i<br />
x<br />
~ DP( x<br />
, Hx<br />
)<br />
x<br />
, G ~ DP(<br />
0<br />
~<br />
~<br />
G<br />
E<br />
x<br />
t<br />
t-1<br />
x x<br />
s<br />
s<br />
0<br />
, G)<br />
x<br />
x<br />
x<br />
x x<br />
Es t<br />
s 1 s 2 s 3 s 4 s 5<br />
e 1 e 2 e 3 e 4 e 5<br />
x<br />
80<br />
x
State Sequence Produced by iHMMs<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
ハイパーパラメータを x x<br />
x x<br />
x x<br />
x 設 x 定 することで、 x x<br />
x x 様 々な<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
系 列 が 生 成 される<br />
0 1000<br />
x<br />
b 0.1<br />
100 x<br />
x x<br />
x x<br />
x<br />
x x<br />
x x<br />
x<br />
x x<br />
x x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
x 0 0.1<br />
x<br />
b 0<br />
x 100<br />
x<br />
x<br />
x<br />
0 2<br />
b 8<br />
2<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
Taken from (Beal+, 2002)<br />
x<br />
81<br />
x<br />
0 1<br />
b 1<br />
10000<br />
x
iHMM の 学 習<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x<br />
変 分 ベイズ 法 (Beal, 2003)<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x状 態 数 を x 有 限 x 個 ( 多 めに) x x置 いて 近 x 似 する x<br />
Blocked x Gibbs x Sampler x x (Teh+, x 2006) x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
Stick-Breaking x process x を 使 い、 x遷 移 行 x列 を sampling x<br />
状 態 が 無 限 個 あるため、Forward-backward が 利 用<br />
不 x能 x<br />
Beam Sampler x (Van x Gael+, 2008) x<br />
x<br />
x<br />
Collapsed x Gibbs Sampler x<br />
Chinese Restaurant Process を 使 い、 遷 移 行 列 の 期 待<br />
分 布 を 計 算<br />
Conditional Simultaneous Draws Sampler (Makino+,<br />
x<br />
2009)<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
82<br />
x<br />
x<br />
x<br />
x<br />
x
Hierarchical Dirichlet Process の 応 用 (1)<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x 0<br />
x<br />
x x<br />
文 x 書 x のトピックモデル x x<br />
x x<br />
x (Teh, x Jordan, x x Beal&Blei x 2004) G<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x 0<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
Latent Dirichlet Allocation (Blei, Ng&Jordan 2003)<br />
x x<br />
x x<br />
x x<br />
x x<br />
のノンパラメトリック x 版 x<br />
x<br />
x<br />
トピック 数<br />
xK を 明<br />
x示 的 に 与 えず、<br />
x<br />
各<br />
x文 書 の<br />
トピック 分 布 を 生 成 する<br />
x x<br />
x x<br />
データ ( 文 書 集 x 合 ) 観 測 後 の 事 後 x<br />
x分 布 を 計 算 することで、 x 最 適 x な<br />
トピック 数 の 分 布 とともに、<br />
各 トピックの 単 語 分 布 を 推 定 できる<br />
x x<br />
x<br />
x<br />
x<br />
β<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
G j<br />
z ji<br />
w ji<br />
x<br />
N<br />
83<br />
x<br />
xM<br />
x<br />
x
Hierarchical Dirichlet Process の 応 用 (2)<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
N-gram model (Teh, 2006)<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
Suffix tree x の 各 x node に、 x x<br />
単 語 分 布 を 表 わす Pitman-Yor<br />
x<br />
x x<br />
x x<br />
Process を 割 x り 当 てる<br />
学 習 は 階 層 x Chinese x Restaurant x<br />
process 上 のサンプリングで 実 現<br />
Kneser-Ney スムージング<br />
x x<br />
x x<br />
が 帰 着 できる<br />
さらに x N を 積 分 消 去 x した<br />
∞-gram モデル (Mochihashi<br />
&Sumita, 2007)、Sequence<br />
Memoizer x (Wood+, x 2009) …<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
G bag of<br />
x x<br />
x<br />
x<br />
of<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x x<br />
G of G to<br />
bag<br />
three<br />
G three states of<br />
G<br />
x states x<br />
x<br />
x<br />
G states of<br />
to<br />
x<br />
84<br />
x<br />
x<br />
united<br />
G united states of<br />
x
iHMM の 状 態 の 階 層 クラスタリング<br />
(Makino+, 2009; Makino+, in submission)<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
HMM:<br />
x x<br />
各<br />
x<br />
々の<br />
x<br />
x隠 xれ 状<br />
x<br />
態<br />
x<br />
は 独<br />
x<br />
立<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
現 実 には、 状 態 間 の 類 似 性 がある 場 合 が 多 い<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
Dirichlet x Process x は、クラスタリングのためにも<br />
x<br />
x<br />
x<br />
利<br />
x<br />
用 できるx<br />
x<br />
うまく 組 み 合 わせて、<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
隠 れ 状 態 x をクラスタリングする<br />
x<br />
x<br />
x<br />
adjective noun noun noun noun verb noun aux verb verb<br />
superlative common common common proper transitive pronoun present transitive<br />
x<br />
time title title name past bare form<br />
x<br />
family<br />
x<br />
Last night Prime Minister Koizumi said he will make<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
85<br />
x<br />
x<br />
x
iHMM with Dirichlet Process Mixtures<br />
(Fox+, 2008)<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
HMMからの x x<br />
x x 出 x 力 x をクラスタリングする<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x<br />
Nested Chinese Restaurant Process (Blei+, 2004)<br />
x x<br />
x x<br />
x x<br />
x x<br />
を HMM に x 拡 張 したものに x 相 当 x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x<br />
State x 1<br />
State 2 State 3<br />
x<br />
x<br />
x<br />
x<br />
G<br />
x 0<br />
x x E<br />
x<br />
~ DP( , H )<br />
x<br />
x<br />
Gsx<br />
~ DP( T<br />
, G0<br />
)<br />
Z ~ DP( , H )<br />
s<br />
z<br />
0<br />
Z<br />
x<br />
x<br />
~ some x distribution x<br />
e.g. Gauss-Wishart<br />
x<br />
86<br />
x
iHMM with Dirichlet Process Mixtures<br />
x x<br />
x<br />
x<br />
x<br />
0<br />
x<br />
x<br />
G 0<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
T<br />
x<br />
x x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
Gs t-1<br />
x x<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
G<br />
G<br />
x<br />
Z<br />
E<br />
x x<br />
x<br />
0<br />
~ DP(<br />
x<br />
x x<br />
x<br />
s<br />
s<br />
z<br />
x~ DP( x<br />
x<br />
<br />
0<br />
x<br />
, H<br />
x<br />
x<br />
, G<br />
T<br />
x<br />
x x<br />
~ DP( , H )<br />
Z<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
~ xsome distributi x<br />
)<br />
0<br />
)<br />
on<br />
x<br />
x<br />
Z<br />
x<br />
x<br />
x<br />
∞<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x x<br />
Zs t<br />
s 1 s 2 s 3 s 4 s 5<br />
x<br />
x<br />
x<br />
z 1 z 2 z 3 z 4 z 5<br />
Ez x t x<br />
x x<br />
∞<br />
x<br />
e 1 e 2 e 3 e 4 e 5<br />
87<br />
x
提 案 手 法<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
クラスタ x x<br />
x 構 x 造 が、 x x 遷 移 x に x 影 響 x しない<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
欲 しいのは、むしろ 遷 移 確 率 に 関 するクラスタ<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
クラスタ 内 の 各 状 態 への 遷 移 が 類 似<br />
x<br />
x<br />
クラスタ 内 の 各 状 態 からの 遷 移 が 類 似<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
z t も 状 態 の 一 部 となるようにできないか?<br />
Hierarchical Nested infinite HMM (HN-iHMM)<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
88<br />
x<br />
x<br />
x<br />
x
2 階 層 HN-iHMM<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
zx<br />
x<br />
x<br />
x x<br />
x x<br />
x t が 状 態 x の x 一 x部 となるためには:<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
t<br />
t<br />
x<br />
x x<br />
x x<br />
z t が s t+1 の 確 率 に 影 響 する<br />
x x<br />
x x<br />
x x<br />
z x<br />
x<br />
x<br />
t の 確 率 が s t-1 (と z t-1 ) に 依 存 する<br />
st<br />
-<br />
z<br />
e<br />
x<br />
~ p(<br />
st<br />
| st<br />
1)<br />
x x<br />
~ p(<br />
zt<br />
| st<br />
)<br />
x<br />
~ p(<br />
e | z )<br />
t<br />
t<br />
x<br />
x<br />
x<br />
x x<br />
s<br />
x<br />
t<br />
~<br />
zt<br />
~<br />
x<br />
e ~<br />
t<br />
x<br />
x<br />
p(<br />
s<br />
p(<br />
e<br />
x<br />
t<br />
p(<br />
z<br />
t<br />
t<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
x<br />
| st<br />
| s<br />
| z<br />
-1<br />
x<br />
t<br />
t<br />
, s<br />
)<br />
,<br />
z<br />
t-1<br />
t-1<br />
x<br />
)<br />
, zt-<br />
1)<br />
x<br />
x x<br />
x<br />
x<br />
s 1 s 2<br />
s 1 s 2<br />
x x<br />
x<br />
z 1 z 2<br />
z 1 z 2<br />
x<br />
e 1 e 2<br />
x<br />
e 1 e 2<br />
89<br />
x
2 階 層 HN-iHMMの 構 成 (1)<br />
x x<br />
x<br />
x<br />
x<br />
0<br />
x<br />
x<br />
G 0<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
T<br />
x<br />
x<br />
x<br />
Gs t-1<br />
∞<br />
x x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
∞<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
0<br />
~ GEM( <br />
x<br />
x x 0<br />
x<br />
x<br />
x<br />
x x<br />
~ DP(<br />
x<br />
~ xGEM(<br />
x<br />
x x<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
Zs t<br />
s 1 s 2 s 3 s 4 s 5<br />
G<br />
G<br />
x<br />
Z<br />
E<br />
s<br />
s<br />
z<br />
, G<br />
T<br />
x<br />
<br />
x<br />
~ some distribution<br />
Z<br />
)<br />
0<br />
)<br />
)<br />
x<br />
x<br />
x<br />
Z<br />
90<br />
x<br />
z 1 z 2 z 3 z 4 z 5<br />
Ez t x x<br />
x x<br />
∞<br />
x<br />
x<br />
e 1 e 2 e 3 e 4 e 5
2 階 層 HN-iHMMの 構 成 (2)<br />
x<br />
x x<br />
x x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
T x x<br />
0 T 1<br />
x T x2<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
G 0 Gs t-1<br />
x x<br />
x<br />
Z x<br />
∞<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x x<br />
x x<br />
x x<br />
x zx<br />
t が s t+1 の x 確 率 x<br />
x<br />
x<br />
Gs t-1<br />
z t-1 ∞<br />
x x<br />
に 影 響 する<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
∞<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
s<br />
x<br />
~ GEM( x x<br />
x<br />
~ DP( x<br />
x<br />
1x<br />
T<br />
x<br />
2<br />
T<br />
,<br />
x<br />
~ DP( <br />
~ GEM( )<br />
x x<br />
0<br />
)<br />
, G<br />
x<br />
x<br />
Z<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
~ some distribution<br />
Zs t<br />
s 1 s 2 s 3 s 4 s 5<br />
G<br />
G<br />
G<br />
0<br />
s,<br />
z<br />
Z<br />
E<br />
s<br />
z<br />
T<br />
G<br />
0<br />
s<br />
)<br />
)<br />
x<br />
x<br />
x<br />
z 1 z 2 z 3 z 4 z 5<br />
Ez t x x<br />
x x<br />
∞<br />
x<br />
x<br />
e 1 e 2 e 3 e 4 91e<br />
5
x x<br />
x x<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
T x x<br />
0 T 1<br />
x<br />
x<br />
x x<br />
G 0<br />
x<br />
2 階 層 HN-iHMMの 構 成 (3)<br />
x<br />
x T x2<br />
x x<br />
x<br />
x<br />
Gs t-1<br />
x x<br />
Zs t<br />
x<br />
x<br />
x x<br />
x<br />
Gs t-1<br />
z t-1<br />
s t x<br />
Zs<br />
z t-1<br />
t-1<br />
∞ ∞<br />
Zs t x<br />
s t-1<br />
Z 0 Z 1<br />
x Z x2<br />
x<br />
x x<br />
x<br />
x x<br />
x<br />
x x<br />
x x<br />
x z t の 確 x率 が<br />
x x<br />
s t-1 (と z t-1 )<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
∞<br />
に 依 存 する<br />
x<br />
x<br />
x<br />
x<br />
s,<br />
z<br />
s'<br />
x<br />
s',<br />
s,<br />
z<br />
0<br />
~ GEM( )<br />
x<br />
~ DP( x<br />
x<br />
1<br />
, G<br />
, G<br />
2<br />
T<br />
x<br />
x<br />
0<br />
x<br />
s<br />
0<br />
~ GEM( )<br />
1<br />
~ DP( , Z<br />
x s'<br />
2<br />
~ DP( , xZ<br />
x<br />
x<br />
x<br />
x<br />
Ez<br />
~ some distribution<br />
x x<br />
x x<br />
s 1 s 2 s<br />
x 3 s 4 s<br />
x 5<br />
x<br />
x<br />
z 1 z 2 z 3 z 4 z 5<br />
x<br />
) x<br />
Ez t<br />
x x<br />
∞ x<br />
x<br />
e 1 e 2 e 3 e 4 92e<br />
5<br />
Z<br />
G<br />
Z<br />
G<br />
G<br />
Z<br />
0<br />
s',<br />
s<br />
~ x DP( x<br />
s<br />
T<br />
Z<br />
Z<br />
T<br />
Z<br />
)<br />
)<br />
)<br />
s',<br />
s
2 階 層 以 上 のHN-iHMM<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
が x 状 態 x の x 一 x部 xであるように x x<br />
x 表 x 記 を x 変 x 更 x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
<br />
x<br />
<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
- 階 層 状 態 の HMM に 自 然 に 拡 張 できる<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
k<br />
x<br />
kx<br />
1: k-1<br />
1:<br />
st<br />
~ p(<br />
st<br />
| st<br />
, xs<br />
t-<br />
x<br />
e ~<br />
t<br />
p(<br />
e<br />
t<br />
|<br />
s<br />
n<br />
t<br />
)<br />
x x<br />
1)<br />
x<br />
n<br />
x<br />
G<br />
k<br />
s'<br />
x<br />
G<br />
x<br />
k<br />
s'<br />
1: k-1<br />
E<br />
1: k<br />
x<br />
k<br />
-1<br />
~ GEM( x 0<br />
)<br />
x<br />
k<br />
~ DP( , G<br />
, s<br />
s<br />
1: l<br />
1: n<br />
l<br />
k<br />
s'<br />
1: k-1<br />
x<br />
, s<br />
x<br />
)<br />
1: l-1<br />
~ some distribution<br />
x x<br />
x<br />
93<br />
x
HN-iHMMの 例<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
生 x 成 x された<br />
x x<br />
x<br />
x<br />
x<br />
x x<br />
遷 移 行 列 の 例<br />
x<br />
x x<br />
クラスタ 構 x造<br />
x による、 遷 x移<br />
確 率 の 類 似<br />
x x<br />
性 が 実 現 され<br />
xている<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
From x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
To<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
94<br />
x
実 験 (1)<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
人 x 工 x HMMから x x<br />
x 生 x 成 したシーケンスをもとに、<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
もとの HMM を 推 定 する<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
一 見 、ノイズの x 多 い A-B-C x の 繰 り 返 x しに<br />
x 見 えるが、 x尐 しずつ x 性 質 の 異 x なる 多 x 数 の<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
Beam Sampling x 50,000 step 後 xの 状 態 列 と、<br />
x<br />
シーケンスの 組 み 合 わせで 構 成 されている<br />
x<br />
真 の 状 態 列 との 間 の 相 互 情 報 量 で 評 価<br />
x x<br />
データ 長 N=500<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x
頻 度<br />
結 果 (1)<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
従 x 来 x のx<br />
iHMM<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
では、 正 しく 分 離<br />
x x<br />
x<br />
して x 隠 れ 状 態 x を<br />
学<br />
x<br />
習 することが<br />
x<br />
できない<br />
x<br />
x x<br />
x x<br />
MCMC サンプリングの x 系 列 が<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
相 互 情 報 x 量<br />
x x<br />
local maximum に 陥 ってしまい、<br />
脱 出 できない<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
サンプリングされた 状 態<br />
真 の 状 態<br />
x<br />
x<br />
このときの<br />
相 互 情 報 量<br />
MI = 3.61<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
96<br />
x<br />
x<br />
x<br />
x<br />
x
頻 度<br />
結 果 (2)<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
2 x 階 x 層 HN-iHMM<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x x<br />
を 使 うと、より 精<br />
x x<br />
x<br />
度 x よく 推 定 できる<br />
x<br />
x<br />
x<br />
しかし、 手 掛<br />
かりの 尐 ない<br />
x x<br />
状 態 につい<br />
xては、 分 離<br />
できないこ<br />
とが 多 い<br />
x x<br />
x<br />
x<br />
真 の 状 態<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
相 互 情 報 x 量<br />
サンプリングされた x 状 x 態<br />
x<br />
このときの<br />
相 互 情 報 量<br />
MI = 4.18<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
97<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x
頻 度<br />
結 果 (3)<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
3 x 階 x 層 HN-iHMM<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
を 使 うと、かなり<br />
x x<br />
x x<br />
精 x 度 よく 推 定 x 可 能<br />
サンプリングされた x<br />
x状 態<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x<br />
相 互 情 報 x 量<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
真 の 状 態<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
このときの<br />
相 互 情 報 量<br />
MI = 4.65<br />
x<br />
x<br />
x<br />
98<br />
x
実 験 1の 考 察<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
HN-iHMM x x<br />
x x では、 x x余 分 x なx<br />
state x が x 多 x数 x生 成 x さx<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
れるが、 精 度 が 下 がらない<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
通 常 の HMM x (や iHMM) x では、 余 分 x な state があ x<br />
x ると 精 度 が x 低 下 する x<br />
x<br />
HN-iHMM では、クラスタ 中 の 他 状 態 の 情 報 が 使<br />
x x<br />
x x<br />
えるので、 精 度 x が 下 がりにくい<br />
x x<br />
x<br />
逆 に、 学 習 における local maximum からの 脱 出<br />
を 助 ける 効 果 がある<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
99<br />
x<br />
x<br />
x<br />
x<br />
x
実 験 (2)<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
Alice’s Adventure in Wonderland のテキストを 利<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
用 した x 実 験 x (Makino+, x in submission)<br />
x x<br />
x<br />
x<br />
x<br />
2 階 層 状 態 HMM を 利 用<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
28,120 語 (End-Of-Sentence 含 む)<br />
x<br />
x<br />
2 回 以 下 しか 登 場 しない 単 語 は UNK に 置 換 異 な<br />
り 単 語 数 1,078 語<br />
x x<br />
x x<br />
x x<br />
Conditional Simultaneous x Draws Sampler x (Makino+,<br />
x<br />
x<br />
2009) によりサンプリング<br />
19,000 回 目 の sweep の 後 では、34 個 のクラスタ 中 に<br />
774 個 の 状 態 があった<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
100<br />
x<br />
x<br />
x<br />
x<br />
x
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
結 果 (2)<br />
101
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
結 果 (2)<br />
102
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
結 果 (2)<br />
103
まとめ<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
機 械 学 習 におけるベイジアンの 位 置 づけ<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x x<br />
不 確 かさを x明 示 的 に 扱 える x<br />
x パラメータを x 積 分 消 x 去 予 測 分 x 布 の x利 用<br />
x<br />
パラメータの x 分 x 布 を 考 xえることで、パラメータ x<br />
x x 空 間 x の<br />
取 り 方 に 依 存 せず、 過 学 習 しにくい 推 定 を 可 能 に<br />
Infinite HMM: HMMのノンパラメトリックベイズ 版<br />
x<br />
x<br />
x<br />
HN-iHMM: HMM 隠 れ 状 態 の 階 層 クラスタリング<br />
遷 移 確 x 率 の 類 x 似 に 基 づいて 隠 れ 状 x態 を 階 層 x 化<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
x<br />
x<br />
x<br />
x<br />
x x<br />
隠 れ 状 態 数 N を 積 分 消 去 し、 理 論 上 、 無 限 個 の 隠 れ<br />
x<br />
x<br />
状 態 を 扱 える 学 習 xモデル<br />
x<br />
x<br />
Hierarchical Dirichlet Process を 利 用<br />
類 似 する 系 列 が 多 数 現 れる 場 合 の 学 習 ・ 予 測 の 実 現<br />
x<br />
104<br />
x