elektronik-magazin für chip-, board- & system-design - ITwelzel.biz
elektronik-magazin für chip-, board- & system-design - ITwelzel.biz
elektronik-magazin für chip-, board- & system-design - ITwelzel.biz
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
SYSTEM-DESIGN<br />
88<br />
»Beyond Five Nines« oder 10 ppm<br />
»Carrier Class Availability«<br />
– leichtgemacht<br />
Wer kennt das nicht: Schauplatz irgendeine Autobahn<br />
in Deutschland, landschaftlich sehr reizvoll,<br />
da leicht hügelig, gerade mal wieder eines dieser<br />
überaus wichtigen Gespräche, sei es mit dem eigenen<br />
Chef oder dem wichtigsten Geschäftspartner<br />
überhaupt, plötzlich sphärische Klänge – Segen der<br />
digitalen Telefonie, kein Rauschen, sondern ein<br />
paar fehlende Bit, wenn das Signal schwach und<br />
schwächer wird – und plötzlich ist die Verbindung<br />
abgerissen. Kein Beinbruch, man versucht es eben<br />
aufs Neue, so das Display verkündet, dass wieder<br />
Verbindung zum Provider besteht. Was aber, wenn<br />
die Verbindung schlagartig weg ist und man kurz<br />
darauf im Anschluss an die Nachrichten, quasi als<br />
Verkehrsinfospezial erfahren muss, dass im Raum<br />
XYZ das Mobilfunknetz des Dx-Betreibers ausgefallen<br />
ist. Für den einen gerade recht, endlich mal<br />
Ruhe, <strong>für</strong> den anderen kein Beinbruch, so man<br />
vielleicht ein zweites Handy, das auf einem anderen<br />
Netz läuft, sein Eigen nennt. Der geschilderte Fall<br />
ist nicht konstruiert, kommt aber auch Gott sei<br />
Dank recht selten vor. Dass dies so ist, liegt an<br />
einem gerade im Telekom-Sektor wichtigen<br />
Umstand. Hier werden von den Betreibern solcher<br />
Anlagen hohe Anforderungen, oder anders ausgedrückt,<br />
minimale Ausfallzeiten verlangt.<br />
Diese Forderung wird in<br />
diesem Segment zwischenzeitlich<br />
mit dem Begriff<br />
»Carrier Class Availability«<br />
umschrieben. Anschaulich<br />
ausgedrückt beschreibt<br />
das den Umstand,<br />
den heute jeder als selbstverständlich<br />
ansieht; man<br />
nimmt den Telefonhörer ab<br />
und hat ein Freizeichen. Diesen<br />
Qualitätsstandard hat die<br />
Telekom-Branche in den<br />
letzten 30 Jahren erreicht.<br />
Die Angelsachsen umschreiben<br />
das mit »Five Nines«<br />
oder mit »99,999 %«iger<br />
Verfügbarkeit eines<br />
Systems.<br />
Vergleicht man das mit<br />
unseren geradezu unzuläng-<br />
lichen PCs – wer hat nicht<br />
schon Tage erwischt, an denen<br />
man den Eindruck hat,<br />
nichts anderes zu tun als permanent<br />
neu zu booten? Wie<br />
oft plagen uns Probleme, ins<br />
Internet zu kommen oder<br />
nicht plötzlich herauszufallen?<br />
Ein IP-Netzwerk hat sicherlich<br />
gerade mal nur ein<br />
paar »Neunen«.<br />
Der Trend ist bereits erkennbar<br />
– von »five 9s« zu<br />
»six 9s«. Der Grund, die Datenmengen<br />
werden immer<br />
größer, ein Fehler in der<br />
Übertragung oder auf einer<br />
Karte enden mit dem Verlust<br />
von Daten, und Datenverlust<br />
geht in vielen Fällen mit<br />
Gewinneinbußen einher. Ge-<br />
winneinbußen zeigen sich<br />
sehr deutlich dort, wo Geschäfte<br />
übers Internet abgewickelt<br />
werden, im e-Commerce.<br />
Wie schaut es mit den<br />
Servern aus, die am Ende<br />
der Übertragungsstrecken liegen?<br />
Solche Systeme sind<br />
fehlertolereant ausgelegt.<br />
Wenn die Fehlertoleranz aber<br />
soweit geht, dass diese mit einer<br />
Einbuße an Serviceleistung<br />
einhergeht, geht es an<br />
den Geldbeutel. Kein Service,<br />
kein Umsatz also Umsatzverlust.<br />
Beyond five 9s, die angelsächische<br />
Darstellung <strong>für</strong><br />
99,999 Prozent, oder das entspricht<br />
unseren 10 ppm, sind<br />
Qualitätsstandards, mit denen<br />
sich Systemanbieter von Telekomunikatisonsequipment<br />
bereits befassen oder, so noch<br />
nicht geschehen, sich Gedan-<br />
ken machen müssen. Um<br />
Werte von 10 ppm oder besser<br />
auf Systemebene erreichen<br />
zu können – das entspricht<br />
einer Ausfallzeit von<br />
5 Minuten und 15 Sekunden<br />
im Jahr – ist eine <strong>system</strong>atische<br />
Vorgehensweise zur<br />
Fehlereindämmung, Identifikation<br />
und Ursachenforschung<br />
notwendig.<br />
Ein erster Schritt in diese<br />
Richtung kann eine Standardisierung<br />
in Richtung einer<br />
durchgehenden modularen<br />
Architektur im Bereich Po-<br />
Infos zu Anzeigen/Redaktions-Kennziffern via www.<strong>system</strong>e-online.de/direkt<br />
wer-Management der einzelnen<br />
Line-Cards bzw. der<br />
Plattform sein. Geht man davon<br />
aus, dass der Ausfall einer<br />
Baugruppe in vielen Fällen,<br />
gerade im Zeitalter von<br />
immer häufiger anzutreffenden<br />
Komponenten mit Mehrspannungs-Versorgungsstruktur,<br />
ihre Ursache in einem<br />
spannungsrelevanten<br />
Problem hat, würde die Möglichkeit,<br />
Informationen, die<br />
zum Zeitpunkt des Ausfalls<br />
vorgelegen haben, zur Fehleranalyse<br />
heranziehen zu können,<br />
bei der Ursachenforschung<br />
einen großen Schritt<br />
weiterhelfen.<br />
Je größer die Anzahl der<br />
Baugruppen, die sich solch<br />
eine Architektur in einem<br />
System zu nutze machen, um<br />
so größer die statistische<br />
Wahrscheinlichkeit, dass ein<br />
Die Fehleranalyse im Falle eines katastrophalen Feldausfalls<br />
ist meist unmöglich<br />
Fehler in diesem Bereich auftritt,<br />
der aber, sofern lokalisier-<br />
und bestimmbar, im Gegenzug<br />
die statistische Verteilung<br />
senkt, wenn der Fehler<br />
analysiert und in Zukunft vermieden<br />
werden kann, was in<br />
einer Minimierung der Wiederholungswahrscheinlichkeit<br />
mündet.<br />
Die Fehlererkennung, der<br />
erste und wichtigste Schritt,<br />
bedeutet in diesem Zusammenhang,<br />
einen Fehler- oder<br />
Störfall mit einem einzigen<br />
Bauelement oder einer ein-<br />
Systeme 9/2000