Nichtlineare Dimensionsreduktionsmethoden in der ... - DPI
Nichtlineare Dimensionsreduktionsmethoden in der ... - DPI
Nichtlineare Dimensionsreduktionsmethoden in der ... - DPI
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Kapitel 3<br />
Kern-PCA<br />
Die Kern-PCA ist e<strong>in</strong>e nichtl<strong>in</strong>eare Verallgeme<strong>in</strong>erung <strong>der</strong> l<strong>in</strong>earen PCA.<br />
Die dah<strong>in</strong>ter stehende Idee ist bestechend e<strong>in</strong>fach: Man transformiert die<br />
E<strong>in</strong>gangsdaten durch e<strong>in</strong>e nichtl<strong>in</strong>eare Abbildung Φ <strong>in</strong> e<strong>in</strong>en möglicherweise<br />
sehr hochdimensionalen Merkmalsraum F und führt dort e<strong>in</strong>e l<strong>in</strong>eare PCA<br />
durch. Die Hoffnung besteht hier dar<strong>in</strong>, dass die E<strong>in</strong>gangsdaten bei geeigneter<br />
Wahl <strong>der</strong> Abbildung im hochdimensionalen Merkmalsraum entfaltet“ o<strong>der</strong><br />
”<br />
ausgebreitet“ werden und auf e<strong>in</strong>er l<strong>in</strong>earen Untermannigfaltigkeit sehr viel<br />
”<br />
niedrigerer Dimension liegen. Die orthogonalen Richtungen größter Varianz,<br />
die durch Anwendung <strong>der</strong> PCA <strong>in</strong> F gefunden werden, entsprechen dabei<br />
nichtl<strong>in</strong>earen Richtungen im E<strong>in</strong>gaberaum 1 . Die eigentliche Nichtl<strong>in</strong>earität<br />
bei <strong>der</strong> Kern-PCA steckt also nur <strong>in</strong> <strong>der</strong> Abbildung <strong>in</strong> den Merkmalsraum.<br />
Was so bestechend e<strong>in</strong>fach kl<strong>in</strong>gt, wirft <strong>in</strong> <strong>der</strong> Praxis jedoch e<strong>in</strong> Problem<br />
auf: die Dimension von F , die je nach Φ sehr groß, durchaus sogar unendlich<br />
groß se<strong>in</strong> kann. In <strong>der</strong> Bil<strong>der</strong>kennung hat es sich z.B. als nützlich erwiesen,<br />
Produkte o<strong>der</strong> Monome d-ter Ordnung von Pixeln e<strong>in</strong>es Bildes zu betrachten,<br />
d.h. das Produkt von jeweils d Bildpunkten. Für e<strong>in</strong> Bild, das aus N Pixeln<br />
besteht, gibt es<br />
(N + d − 1)!<br />
N F = (3.1)<br />
d!(N − 1)!<br />
verschiedene solcher Monome d-ter Ordnung [27]. Die Abbildung Φ : R N →<br />
F des Bildes <strong>in</strong> den Raum aller möglichen Monome 5-ter Ordnung hat also<br />
selbst für M<strong>in</strong>i-Bil<strong>der</strong> von 16 × 16 Pixeln e<strong>in</strong>e Dimension von 10 10 , was es<br />
unmöglich macht, diese Abbildung explizit zu berechnen. Die Frage ist nun,<br />
wie man trotzdem mit vertretbarem Aufwand die Kern-PCA berechnen kann.<br />
1 Sofern die verwendete Abbildung nichtl<strong>in</strong>ear ist.