16.12.2012 Aufrufe

Quantitative Analyse von Arzneistoff-Membran-Wechselwirkungen ...

Quantitative Analyse von Arzneistoff-Membran-Wechselwirkungen ...

Quantitative Analyse von Arzneistoff-Membran-Wechselwirkungen ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Modellierung der Verteilungsvorgänge<br />

in Abhängigkeit <strong>von</strong> der Zusammensetzung der Gruppen. Aus kombinatorischen Gründen (exponentielle<br />

Zunahme der Kombinationsmöglichkeiten) ist es selbst bei kleineren Datensätzen unmöglich,<br />

systematisch alle Gruppierungen durchzurechnen. Daher wird die Prozedur mehrfach wiederholt (20<br />

bis 100) und der Mittelwert der statistischen Größen gebildet. Die random group-Methode führt zu<br />

einer mehr konservativen Abschätzung der Vorhersagekraft. Je geringer die Zahl der Gruppen, desto<br />

höher ist die Zahl der Gruppenmitglieder und folglich auch die Härte der Modellvalidierung. Als<br />

Ergebnis erhält man die mittlere Vorhersagekraft q 2 und die Standardabweichung der Vorhersage.<br />

Um ein <strong>von</strong> der Varianz der Aktivitätswerte unabhängiges Maß für die Vorhersagekraft des<br />

Modells zu erhalten, wurde ein cross-validiertes Bestimmtheitsmaß, der q 2 -Wert, eingeführt. Die<br />

optimale Anzahl an latenten Variablen kann anhand des kleinsten Wertes der Standardabweichung in<br />

Verbindung mit dem höchsten q 2 -Wert entnommen werden.<br />

4Y -Y 9<br />

= 1 −<br />

Gl. 22<br />

q 2<br />

!<br />

∑<br />

∑<br />

2<br />

obs pred<br />

Yobs -Y<br />

2<br />

2 7<br />

In Analogie zur Standardabweichung der Schätzwerte s, ein Maß für die Güte der Anpasssung der<br />

Gleichung, wurde eine Standardabweichung der Vorhersagen SDEP (standard deviation of error of<br />

prediction) für das PLS-Verfahren definiert. Die SDEP-Berechnung in GOLPE (Gleichung 23a)<br />

berücksichtigt nicht die Zahl der latenten Variablen, wie es in der MLR und auch im QSAR-Modul<br />

<strong>von</strong> SYBYL üblich ist (Gleichung 23b).<br />

Yobs -Ypred<br />

SDEP = Gl. 23a Gl. 23b<br />

n<br />

∑4 92<br />

Yobs -Ypred<br />

SDEP =<br />

n-c-1<br />

∑4 92<br />

GOLPE berechnet weiterhin eine Standardabweichung <strong>von</strong> SDEP, der SDEV-Wert (standard<br />

deviation of the SDEP values). Die Indizes der Aktivitätswerte stehen für:<br />

Yobs beobachteter Y-Wert; Ypred vorhergesagter Y-Wert durch PLS mit CV;<br />

Y Mittelwert aller Y-Werte; c Zahl der latenten Variablen des Modells.<br />

Das Modell mit dem höchsten q 2 -Wert und den kleinsten SDEP- und SDEV-Werten wird als das<br />

beste Modell betrachtet. Die als optimal gefundene Anzahl latenter Variablen (optimal number of<br />

components = onc) ist ein Maß für die Komplexität des Modells. Je weniger LV extrahiert werden<br />

müssen, um einen bestimmten q 2 -Wert zu erreichen, desto einheitlicher ist der Zusammenhang<br />

zwischen den Strukturvariablen und den Aktivitätswerten.<br />

"<br />

#<br />

$ #<br />

89

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!