07.10.2013 Aufrufe

Identifikation nichtlinearer mechatronischer Systeme mit ...

Identifikation nichtlinearer mechatronischer Systeme mit ...

Identifikation nichtlinearer mechatronischer Systeme mit ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

8 2 Statische und dynamische Neuronale Netze<br />

tatsächlicher Ausgabe des Neuronalen Netzes zu erhalten.<br />

Es wird zwischen drei Arten des Lernens unterschieden<br />

• Überwachtes Lernen<br />

• Bestärkendes Lernen<br />

• Unüberwachtes Lernen<br />

Beim überwachten Lernen gibt ein externer ” Lehrer“ zu jedem Eingangssignal der<br />

Trainingsmenge das korrekte bzw. das beste Ausgangssignal dazu an. Aufgabe des<br />

Lernverfahrens ist es, die Parameter des Netzes so zu verändern, dass das Netz nach<br />

Abschluss der Lernphase die Assoziation zwischen Ein- und Ausgang selbstständig<br />

auch für unbekannte, ähnliche Eingangssignale vornehmen kann. Diese Art des Lernens<br />

ist üblicherweise die schnellste Methode, ein Neuronales Netz für eine Aufgabe<br />

zu trainieren. Außerdem ist dieses Verfahren das einzige der drei oben benannten<br />

Verfahren, welches sich für eine Online-<strong>Identifikation</strong> eignet. Aus diesem Grund wird<br />

in dieser Arbeit einzig und alleine das überwachte Lernen verwendet, wobei in diesem<br />

Fall der externe ” Lehrer“ das zu approximierende System ist. Die allgemeine<br />

Form des überwachten Lernens wird durch Abbildung 2.1 veranschaulicht. Diese<br />

Darstellung wird in der Literatur auch als Ausgangsfehleranordnung bezeichnet.<br />

PSfrag replacements<br />

u<br />

System<br />

Neuronales<br />

Netz<br />

Abb. 2.1: Prinzip des überwachten Lernens<br />

Beim bestärkenden Lernen gibt der Lehrer nicht die erwünschte Ausgabe an, sondern<br />

nur, ob die Ausgabe richtig oder falsch ist. Eventuell wird zusätzlich noch der<br />

Grad der Richtigkeit <strong>mit</strong> angegeben. Jedoch sind keine Zielwerte für den Ausgang<br />

des Neuronalen Netzes vorhanden. Das Lernverfahren muss selbst die richtige Ausgabe<br />

finden. Diese Art des Lernverfahrens ist neurobiologisch plausibler, weil man<br />

einfache Rückkopplungsmechanismen der Umwelt (Bestrafung bei falscher Entscheidung,<br />

Belohnung bei richtiger) bei niederen und höheren Lebewesen beobachten<br />

kann. Dagegen haben bestärkende Lernverfahren den Nachteil, dass sie für Aufgaben,<br />

bei denen die erwünschte Ausgabe bekannt ist, viel länger zum Lernen brauchen<br />

e<br />

y<br />

ˆy

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!