Praxis | SSD-Diagnosedows ein und erlaubt die Konfiguration von E-Mail-Benachrichtigungen bequem per Mausklicküber eine grafische Bedienoberfläche.GrenzwertigDie SMART-Datenausgabe liefert gleichmehrere Werte pro Attribut. Die Grundlagesind dabei jeweils die sogenannten Roh -daten (Raw Values), mit denen die SSD überdie tatsächlich aufgetretenen Lese- undSchreibfehler, die geschriebene Datenmenge,die Anzahl der Betriebsstunden, dieTemperatur und so weiter Buch führt. Fürjedes Attribut wandelt die SSD den Rohwertaußerdem nach einem herstellerspezifischenUmrechnungsfaktor in einen normalisiertenWert (VALUE) um. Eine Ausnahmebildet das Temperatur-Attribut, bei dem alsnormalisierter Wert meistens ebenfalls derRohdatenwert angezeigt wird.Während mit zunehmender Betriebsdauerund fortschreitendem Verschleiß die Rohdatenwerteansteigen, sinkt der VALUE. Sobalder einen <strong>vom</strong> Hersteller vorgegebenen Grenzwert(Threshold) unterschreitet, trägt die SSDdiesen Moment in die SMART-Datenstrukturein. Er erscheint dann bei der nächsten Abfragein der Spalte „WHEN_FAILED“, die man sichbei GSmartControl im detaillierten Smartctl-Output-Fenster über den Button View Outputanzeigen lassen kann. Sofern ein Pre-failure-Attribut betroffen ist, liefert auch die minimaleAbfrage der Festplattengesundheit, wie siedas BIOS stellt, jetzt nicht mehr „OK“, sonderneine Fehlermeldung – spätestens jetzt mussman sich um ein Backup kümmern. Old-Age-Attribute sind nicht minder interessant, weisenaber nur auf Verschleiß und nicht aufeinen unmittelbaren SSD-Schaden hin. Selbstwenn eines solcher Attribute den kritischenGrenzwert erreicht, kann der via SMART gemeldeteallgemeine Gesundheitszustand alsoimmer noch in Ordnung sein.Manchmal sind Fehler nur temporär,können schnell behoben werden und tretennicht gehäuft auf, etwa wenn der SSD-Controllernach einem Schreibfehler den defektenBlock gegen Speicher aus der Reserve austauscht.Doch selbst solche, möglicherweisezunächst ein maligen Negativereignisse könnenein Indiz für schleichende Defekte sein.Damit auch diese Effekte nicht unter denTisch fallen, erfasst SMART pro Attribut aucheinen sogenannten WORST VALUE, also denschlechtesten über die Lebensdauer der SSDgemessenen normalisierten Wert. Bei einerneuen, unbenutzten SSD entspricht diesergenau dem VALUE, kann wie gerade erklärtmit fortschreitender Nutzungsdauer durchEinzelereignisse aber auch darunter fallen.Meistens sind VALUE und WORST VALUE aberidentisch.Bei den Attributen unterscheidet SMARTsolche, die „online“, also permanent, sowiejene, die nur sporadisch „offline“ aktualisiertwerden. Letztere können Auswirkungen aufden laufenden Betrieb haben und werdenvon der SSD deshalb nur in Leerlaufphasenund nur etwa alle vier Stunden aktualisiert.Standardmäßig ist die Offline Data Collectiondeaktiviert, sie lässt sich aber bei Bedarf beimanchen SMART-Tools, etwa GSmartControl,aktivieren. Zu den weiteren Diagnosefunktionenvon SMART zählen Laufwerksselbsttests,die ebenfalls nicht automatisch laufen,sondern per SMART-Tool explizit angestoßenwerden müssen.Die kürzeste Variante ist der weniger alseinminütige Short-Self-Test, bei der die SSDstichprobenartige Hardware- und Lesetestsdurchführt. Er eignet sich, um etwa die Vermutungnach schwerwiegenden Hardware-Defekten zu erhärten, für die man nicht unbedingtdie zeitaufwendige Überprüfungdes gesamten Speicherbereichs in Kauf nehmenmöchte. Letzteres ist im längeren Extended-Self-Testenthalten. Da die SSD-Kapazitätennach wie vor gering und die Übertragungsgeschwindigkeithoch ist, dauert aucher selten länger als eine Stunde. Bei Terabyte-Festplattenmuss man dafür jedoch gleichmehrere Stunden einplanen. Die SMART-Selbsttest-Routinen mancher SSDs bietenaußerdem einen sogenannten Conveyance-Test an, der Transportschäden entlarven soll.Das ist aber wohl eher nur für stoßanfälligemechanische Festplatten interessant unddürfte im Zusammenspiel mit SSDs nur seltenErhellendes zu Tage fördern.Worauf achten?Bei allen Selbsttests greift SMART lesend aufdie SSDs zu. Die Selbsttestroutinen einigerSSDs kennen außerdem einen Datenintegritätstest,bei dem in freie Speicherbereichegeschrieben wird. Die gespeicherten Datentasten die Routinen nicht an. Das Testergebnisfindet man später in einem Protokoll – beiGSmartControl unter dem Reiter Self-TestLogs. Meldet SMART hier Lesefehler, ist daslängst noch kein Grund zur Panik – daskommt immer mal im SSD-Leben vor. Da dieSSD nicht weiß, welche Daten in die betreffendeSpeicher-Page gehören, bleibt der Fehlerso lange bestehen, bis die SSD beimSchreiben wieder auf diesen Datenblock trifft.Dann sollte sie den Defekt bemerken undden Block gegen einen anderen aus dem Reservepoolaustauschen. Das gezielte Überschreibenvon Sektoren (unter Datenverlust!)zur Behebung des Problems hilft anders alsbei magnetischen Festplatten nicht: Wegendes Wear Leveling besteht kein eindeutigerBezug zwischen den physischen (Flash-)Speicherzellenund den Sektor adressen, die perSATA erreichbar sind.Die Menge der noch zur Verfügung stehendenReservesektoren spiegelt unter anderemder normalisierte Wert des SMART-Attributs Reserved Block Count wider: JeDie rot markiertenAttribute erklären,warum diese SSDSchreibfehler pro -duziert: Der Flash-Speicher ist ab -genutzt, immerhäufiger musstenReserveblöcke inAnspruch genom -men werden. Bei derminimalen Abfrageder Festplatten -gesundheit perMainboard-BIOSwäre das nicht auf -gefallen, da dabeinur die sogenanntenPre-Fail-, aber nichtdie Old-Age-Attribute in dieBewertungeinfließen.<strong>15</strong>4 c’t 2013, Heft <strong>15</strong>
Praxis | SSD-Diagnosehöher der normalisierte Wert und je weiter er<strong>vom</strong> Grenzwert entfernt liegt, desto besser,denn dann stehen der SSD noch viele Reservesektorenzur Verfügung. Wie oft ein sogenanntesRemapping schon stattgefundenhat, entnimmt man dem SMART-Attribut ReallocationEvent Count. Ein rapides Zunehmenausgelagerter Blöcke ist ein Indiz für dasbaldige Ableben der SSD. Die Menge der alsdefekt markierten Speicherblöcke findetman in den Rohdaten bei Reallocated SectorCount. Auch über die Anzahl der noch nichtausgelagerten, aber zur Auslagerung vorgesehenenSpeicherblöcke (Current PendingSector Count) geben manche SSDs Auskunft.Ursache für Lesefehler können Schreibabbrüchesein, für die Flash-Programmierfehler(Program Fail Count) die Ursache sein können.Treten solche Fehler häufiger auf, sind Controller-Defektedenkbar oder aber zunehmenderVerschleiß der Flash-Speicherchips. JedeFlash-Speicherzelle verträgt nur eine begrenzteAnzahl an Schreib zyklen. Wie viele es sind,hängt <strong>vom</strong> Typ ab: Single-Level-Cell-(SLC-)Chips, die nur ein Bit pro Zelle speichern, sindrobuster als Multi-Level-Cell-(MLC-)Chips mitzwei oder drei Bits pro Zelle. Außerdem sinktdie Haltbarkeit von Flash-Speicherchips mitsteigender Datendichte: Für heutige Flash-Chip-Generationen aus der 19-Nanometer-Fertigung spezifizieren die Hersteller nur nochwenige tausend Schreibzyklen.SSD-Controller bemühen sich zwar darum,per Wear-Leveling die Abnutzung möglichstgleichmäßig über alle zur Verfügung stehendenSpeicherzellen zu verteilen, sodass siesich möglichst gleichmäßig abnutzen, dennochverschleißen die Zellen mit zunehmenderLebensdauer. Bei Intel-SSDs signalisiertder per SMART auslesbare Media Wear outIndicator (MWI) den gegenwärtigen Verschleißzustand.Typischerweise beginnenSSDs ihr Leben mit einem normalisiertenMWI-Wert von 100 (Prozent). Dieser sinkt allepaar geschriebenen Terabytes um einenPunkt. Bei einem MWI von „1“ endet bei Inteldie vorzeitige Hersteller garantie. Den Rohwertdieses Attributs kann man geflissentlichignorieren. Er beträgt immer null. Gleichesgilt für aktuelle SSDs mit Sandforce-Controller,die statt eines MWI das Attribut SSD LifeLeft kennen. Der normalisierte Wert zählthier ebenfalls von „100“ herunter.Wie MWI und Co. genau zu interpretierensind, hängt <strong>vom</strong> (SSD-)Hersteller ab. Es ergibtnicht einmal Sinn, sie zwischen verschiedenenSSD-Modellen zu vergleichen. Möglicherweiseauch deshalb bieten manche wie Samsungdas Attribut bei ihren SSDs gar nicht erstan. Nützlicher ist da schon die Angabe zurGesamtmenge geschriebener Da ten (TotalBytes Written). Bei typischen, für den PC-Einsatzgedachten SSDs gewähren die Herstellerdrei bis fünf Jahre Garantie, wenn nicht mehrals 40 GByte täglich, also 14,6 TByte pro Jahrgeschrieben werden. Für den typischen PC-Nutzer ist das mehr als ausreichend: Microsofthat für gewöhnliche Win dows-7-PCs18 GByte an geschriebener Datenmenge ermittelt.SanDisk geht dagegen davon aus,SMART-Attribute bei SSDs (Auswahl)SMART-AttributRaw Read Error RateReallocated Sector CountPower-On TimeProgram Fail CountErase Fail CountTemperatureCRC Error CountMedia Wearout Indicator/ SSD Life LeftHost Writes/Total LBAs WrittenHost Reads/Total LBAs Readdass bei 8,5-stündiger Arbeit am PC nur4 GByte täglich geschrieben werden [2].Inwieweit das zum eigenen Nutzerverhaltenpasst, lässt sich dank SMART bequem überwachen.Hat eine SSD Temperatursensoren anBord, lässt sich auch die Betriebstemperaturper SMART auslesen. Für die Haltbarkeit vonSSDs spielt das aber nur eine untergeordneteRolle. Flash-Speicher toleriert sehr viel höhereTemperaturen als die Mechanik magnetischerFestplatten. Zu heiß laufende SSDssind aber beispielsweise keine gute Wahl fürenge Notebook-Gehäuse, wo sonst permanenthochdrehende Lüfter drohen. Um daszu verhindern – und für den Einsatz inGehäusen ohne Lüfter –, können mancheak tuellen Exemplare wie Crucials M500 dieLeistung automatisch drosseln [3]. Erfahrungsgemäßlaufen SSDs aber nur seltensehr heiß. Das passiert höchstens bei sehrlanganhaltenden Schreibzugriffen, die beimtypischen PC- oder Notebook-Einsatz unüblichsind.BeobachtungenIn Stichproben mit einigen SSDs, die schonlänger im c’t-Labor im Einsatz waren, scheinensich einige typische Vorurteile zu bestätigen:Flash-Speicher altert, was sich auchaus den SMART-Daten herauslesen lässt. Dramatischwird es aber erst, wenn man SSDstäglich 24 Stunden mit Schreibzugriffenquält, wie wir es für einen Härtetest getanhaben [4]. Nach mehreren hundert geschriebenenTerabyte – also der etwa zehnfachenvon den Herstellern innerhalb des SSD-Garantiezeitraums garantierten Mindestschreibmenge– stiegen unsere Testkandidatenallmählich aus und begannen Schreibfehlerzu melden. SMART lieferte die Bestätigung,warum: Die Attribute Media WearoutIndicator und SSD Life Left hatten kritischeGrenzwerte erreicht. Im normalen PC-Einsatzsollten solche Effekte erst nach sehr vielenJahren zu sehen sein – womöglich haben Siebis dahin die SSD längst gegen ein größeresoder schnelleres Exemplar ausgetauscht.Abgesehen von den Exemplaren aus unseremSSD-Zerstörungstest zeigte von denvon uns untersuchten nur noch eines nochSMART-Auffälligkeiten: Es meldete eine rechthohe Anzahl an CRC-Fehlern. Ursache fürdieses Problem sind nicht unbedingt technischeFehler in der SSD selbst, sondernBedeutungLesefehlerrateausgelagerte Daten in ReservesektorenAnzahl der BetriebsstundenFlash-ProgrammierfehlerFlash-LöschfehlerBetriebstemperatur laut internem Sensoraufgetretene SATA-SchnittstellenfehlerIndikator für Flash-Abnutzungzählt die geschriebene Gesamtdatenmenge in Sektorenzählt die gelesene Gesamtdatenmenge in Sektorenmanchmal auch schlechte SATA-Kabel oderChipsatzprobleme. Manchmal kann das Tauschendes Kabels oder der Wechsel desSATA-Ports das Problem beheben. Fehlerdieser Art sind zwar nicht kritisch, aber ärgerlich,weil sie die Datenübertragung verzögern.Im schlimmsten Falle kann es auch zuBluescreens kommen, wenn die SSD nichtmehr antwortet.Trotz der Extrembelastung, der unsereKandidaten ausgesetzt waren, zeigten sie interessanterweisekaum weitere SMART-Auffälligkeiten,was wiederum ein anderes positivesVorurteil bestätigt: Weil sie ohne beweglicheBauteile auskommen, sind sie robusterals herkömmliche Festplatten. Beiletzteren genügt das versehentliche Rempelnans PC-Gehäuse, um die Schreib-/Leseköpfeaus der Spur zu drängen und Schreibfehlerzu provozieren. Berühren die Köpfenach einem Stoß das Medium, können dieMedienoberfläche und damit die an dieserStelle gespeicherten Daten beschädigt werden.Lösen sich dabei Metallpartikel, die anschließendim Gehäuse herumwirbeln, entstehtschleichend noch ein viel größererSchaden. Um diese Dinge braucht man sichbei SSDs keine Sorgen zu machen.Letzlich gilt aber wie im Zusammenspielmit Festplatten: SMART ist nur ein Frühwarnsystem,das bei der Suche nach hardwarebedingtenProblemen effektiv helfen kann. Esliefert nebenbei auch interessante Informationenüber die Vergangenheit einer SSD, wennman eine solche beispielsweise gebraucht beieBay erwirbt. Man darf davon aber keineWunderdinge erwarten: Nicht alle Fehler werdenvon SMART erfasst. Brennt die Laufwerkselektronikdurch, hilft es genauso wenig wiebei fiesen Firmware-Bugs, die zumindest imSSD-Paläozoikum nicht selten zum Totalausfallführten. Trotz SMART ist die einzige Ver -sicherung gegen Datenverluste daher eineregelmäßige Datensicherung.(boi)Literatur[1]ˇBoi Feddern, Johannes Endres, Clever vorsorgen,Festplattendiagnose mit SMART, c’t 23/04,S. 236[2]ˇChristof Windeck, Theoretisch robust, So zuverlässigsind Solid-State Disks, c’t 22/11, S. <strong>15</strong>0[3]ˇEndlich Platz, c’t 10/13, S. 56[4]ˇBenjamin Benz, SSD-Zerstörung, Solid-StateDisks im Härtest, c’t 3/12, S. 66www.ct.de/13<strong>15</strong><strong>15</strong>2cc’t 2013, Heft <strong>15</strong><strong>15</strong>5
- Seite 1:
magazin fürcomputertechnikwww.ct.d
- Seite 7:
Action-CamsBewegungen in hohemTempo
- Seite 16 und 17:
aktuell | Unsichere Industrieanlage
- Seite 18:
aktuell | Computer Graphics Interna
- Seite 22 und 23:
aktuell | SupercomputerAndreas Stil
- Seite 24 und 25:
aktuell | ProzessorenAndreas Stille
- Seite 26 und 27:
aktuell | Smartphones, Tablets, Not
- Seite 28:
aktuell | Grafik, HardwareMini-ITX-
- Seite 31 und 32:
aktuell | EmbeddedRobuste Mainboard
- Seite 34 und 35:
aktuell | PeripherieRobustes Displa
- Seite 36 und 37:
aktuell | IPv6Marc HeuseDie beste V
- Seite 38:
aktuell | Anwendungen3D-Puppe Genes
- Seite 41 und 42:
aktuell | Technische AnwendungenGü
- Seite 43:
aktuell | ForschungErweiterte Reali
- Seite 47 und 48:
aktuell | LinuxEinsteiger-Linux Zor
- Seite 50 und 51:
aktuell | AppleDetails zu iOS 7 und
- Seite 52:
kurz vorgestellt | Display, Android
- Seite 55 und 56:
kurz vorgestellt | Motorrad-Navigat
- Seite 57 und 58:
kurz vorgestellt | Externe Festplat
- Seite 59 und 60:
kurz vorgestellt | Modellier-App, O
- Seite 62 und 63:
Prüfstand | MacBook AirJohannes Sc
- Seite 64 und 65:
Report | VR-Brille zum Selbstausdru
- Seite 66 und 67:
Prüfstand | 3D-Rendererunbekleidet
- Seite 68 und 69:
Report | Voice-Tools für Linux-Gam
- Seite 70:
Report | Voice-Tools für Linux-Gam
- Seite 73 und 74:
Report | Facebook-RechenzentrumIn l
- Seite 75 und 76:
Report | Service & SupportRobert W.
- Seite 77 und 78:
Report | Glass im Alltagschaltet wa
- Seite 79 und 80:
Prüfstand | SmartphonesApple iPhon
- Seite 81 und 82:
Prüfstand | Smartphonesbeim Q10, b
- Seite 84 und 85:
Prüfstand | SmartphonesSonys Ände
- Seite 86 und 87:
Prüfstand | SmartphonesGrafik-Benc
- Seite 88 und 89:
Prüfstand | SmartphonesSurfenFürs
- Seite 90 und 91:
Prüfstand | SmartphonesSmartphone-
- Seite 92 und 93:
Prüfstand | SmartphonesLeistungsau
- Seite 94 und 95:
Benjamin BenzZu schnellKomplett-PCs
- Seite 96 und 97:
Prüfstand | Komplett-PCsKomplett-P
- Seite 98 und 99:
Prüfstand | Profi-GrafikkartenMart
- Seite 100 und 101:
Prüfstand | Profi-GrafikkartenDie
- Seite 102 und 103:
Prüfstand | Profi-GrafikkartenK Sa
- Seite 104 und 105: Report | Action-Cams - ZubehörPhil
- Seite 106 und 107: Report | Action-Cams - ZubehörKlet
- Seite 108 und 109: Prüfstand | Action-CamsUlrich Hilg
- Seite 110 und 111: Prüfstand | Action-CamsDie Contour
- Seite 112 und 113: Prüfstand | Action-CamsTaschenlamp
- Seite 114 und 115: Prüfstand | Action-CamsDas Farbdis
- Seite 116 und 117: Prüfstand | Action-CamsÜbern Tell
- Seite 118 und 119: Christof WindeckNeu startenLösunge
- Seite 120 und 121: Praxis | UEFI-TroubleshootingSecure
- Seite 122 und 123: Praxis | UEFI-TroubleshootingDer bo
- Seite 124 und 125: Praxis | UEFI-Troubleshooting: Wind
- Seite 126 und 127: Praxis | UEFI-Troubleshooting: Wind
- Seite 128 und 129: Thorsten LeemhuisWeitere Betriebsar
- Seite 130 und 131: Praxis | UEFI-Troubleshooting: Linu
- Seite 132 und 133: Praxis | UEFI-Troubleshooting: Linu
- Seite 134 und 135: Praxis | UEFI-Troubleshooting: Umpa
- Seite 136 und 137: Praxis | UEFI-Troubleshooting: Umpa
- Seite 138 und 139: Know-how | Das leistet UEFIChristof
- Seite 140 und 141: Praxis | iPhone-AkkuwechselChristia
- Seite 142 und 143: Praxis | iPhone-Akkuwechsel5Der dri
- Seite 144: dedizierter1Gbit/sPort
- Seite 147 und 148: Praxis | HotlineHOTLINESie erreiche
- Seite 149 und 150: Praxis | Hotlinedoch parallel auch
- Seite 152 und 153: Praxis | SSD-DiagnoseBoi FeddernGuc
- Seite 156 und 157: Praxis | IPv6-EinführungReiko Kaps
- Seite 158 und 159: Praxis | Content MarketingFrank Pus
- Seite 160: Praxis | Content MarketingDas Keywo
- Seite 164 und 165: Praxis | Bonjour im VPNDušan Živa
- Seite 166 und 167: Praxis | Bonjour im VPNters“ alle
- Seite 168 und 169: Praxis | Hyper-V ReplicaPeter Sieri
- Seite 170: Praxis | Hyper-V ReplicaNur Windows
- Seite 173 und 174: Praxis | Hyper-V ReplicaEin Assiste
- Seite 175 und 176: Know-how | JavaScript-Frameworksvar
- Seite 177 und 178: Know-how | JavaScript-FrameworksKla
- Seite 179 und 180: Know-how | Trusted Computingon 2.0
- Seite 181 und 182: Know-how | Trusted Computingsichert
- Seite 184: Buchkritik | Apple-Dienste, 3D-Soft
- Seite 187 und 188: Spiele | Rundenstrategie, Indie- un
- Seite 190: Kids’ Bits | Rätselsammlung, Leu
- Seite 193 und 194: Illustration: Susanne Wustmann, Dor
- Seite 212 und 213:
Inserentenverzeichnis *1&1 Internet
- Seite 214:
ÖSTERREICH 9,90 ¤ / SCHWEIZ 13,60