Elektroniknet Logo

Zuverlässigkeit von SSDs

Royal Flash

Poker Royal Flash
© seralex | Adobe Stock, Silicon Motion

Mit zunehmender Dichte sinkt die Zuverlässigkeit von Flash-Speichern. Doch Industrie-Anwendungen tolerieren keine Ausfälle. Eine neue SSD ist mit mehreren Mechanismen ausgerüstet, die die Sicherheit der Datenhaltung und Zuverlässigkeit im Betrieb verbessern.

Da Cloud Computing und vor allem das Internet der Dinge (IoT) immer beliebter werden, wächst auch der Bedarf an zuverlässigem Datenzugriff mit immer höheren Übertragungsraten stark. Dieser Anstieg bei der Nachfrage gilt nicht nur für Daten, sondern auch für deren Speicherung. Dadurch ist die SSD mit PCI-Express-Schnittstelle, die schnelle Lese- und Schreibvorgänge unterstützt, zur bevorzugten Lösung für die Datenspeicherung in vielen IoT-Anwendungen geworden.

In Embedded-Systemen wird vor allem für die Datenspeicherung, aber auch für alle übrigen wichtigen Systemfunktionen, eine sehr hohe Zuverlässigkeit gefordert. Doch auch in der Welt des EmbeddedComputing sind Geschwindigkeit und Leistung äußerst wichtige Parameter. Eine SSD mit PCIe/NVME-Schnittstelle (non volatile memory express) bietet das Potenzial, beide Anforderungen abzudecken. Eine solche Schnittstelle verbessert die Leistung der Anwendung, sodass ein Embedded-System in kürzerer Zeit mehr Anweisungen verarbeiten und komplexere Anfragen beantworten kann. In Embedded-Systemen können zugriffsintensive Protokolldateien und häufig abgefragte Tabellen eine Analyse-Engine ausbremsen. Ein Flash-Massenspeicher mit PCI-Express-Anbindung hält die Daten in der unmittelbaren Nähe des Prozessors und erlaubt so, bei deren Abruf schnell zu reagieren.

Der schnelle Zugriff auf die Daten ist natürlich wenig wert, wenn die Daten zerstört wurden oder verloren gegangen sind. Die Zuverlässigkeit der Datenspeicherung kann auf viele Arten beeinträchtigt werden, z. B. durch Spannungsausfall, Versagen des Speichers, Instabilitäten des Systems und sogar durch menschliche Fehler.

Deshalb haben Hersteller von Flash-Speichergeräten spezielle Technologien für den Schutz der Daten entwickelt, um das Risiko von Systemfehlern oder gar eines Gesamtausfalls durch Beschädigung oder Verlust gespeicherter Daten zu vermeiden.

Relevante Anbieter

Temp. SLC: max. P/E MLC: max. P/E
40 °C 75,58 Monate 12 Monate
55 °C 12 Monate 1,88 Monate
70 °C 2,14 Monate 0,34 Monate
85 °C 0,45 Monate 0,07 Monate

Einfluss der Temperatur auf die Datenerhaltung von NAND-Flash-Speicher.

Features für mehr Datensicherheit

Der Schutz der Daten und ihrer Integrität stand auch bei der Einführung der PCIe FerriSSD, einer auf NAND-Flash basierenden Lösung zur Datenspeicherung von Silicon Motion, im Mittelpunkt. Sie eignet sich für Embedded-Anwendungen, in denen hohe Zugriffsgeschwindigkeiten, kompakte Bauform und ein zuverlässiges Medium für Bootcode und Datenspeicherung benötigt werden.

Um anspruchsvolle Vorgaben zur Leistung der SSD beim Bootvorgang zu erfüllen und einen robusten Schutz der Daten zu erreichen, enthält der Speicher verschiedene Technologien, die die Datenintegrität, die Langlebigkeit und die Leistung von SSD-Boot-Loadern verbessern. Dazu gehören:

  • DRAM-Cache mit Datenredundanz,
  • voller Ende-zu-Ende-Schutz des Datenpfads,
  • IntelligentScan & DataRefresh,
  • Hybrid Zone.

Diese Features werden weiter unten näher beleuchtet.

Fehlererkennung bei SSD
Bild 1: Die Fehlererkennung für die SSD erkennt DRAM-, SRAM- und NAND-Flash-Fehler.
© WEKA Fachmedien

Die PCIe FerriSSD enthält eingebettetes DRAM mit ECC-Funktion zur automatischen Fehlererkennung und -korrektur. Dieses DRAM wird als Cache für die Schreib-/Lese-Vorgänge genutzt und speichert Informationen zum Mapping der logischen und physikalischen Adressen. Wenn das Sperichermedium mit dem Hostsystem kommuniziert und Daten aus dem NAND-Flash liest oder schreibt, speichert das DRAM temporär die internen Flash-Mapping-Tabellen sowie die gelesenen bzw. geschriebenen Benutzerdaten.

So entsteht Sicherheit bei einem plötzlichem Defekt im NAND-Flash-Speichermedium während des Schreibprozesses: Die PCIe FerriSSD kann die redundanten Daten im DRAM dazu nutzen, den Schreibvorgang in das NAND-Flash-Array ohne Verzögerung für den Host abzuschließen. Dies schließt also die Gefahr eines Datenverlusts während des Datentransfers zwischen NAND-Flash und Host aus.

So wird eine gefährliche Lücke bei den internen Transferpuffern aus SRAM bzw. DRAM und auf anderen Signalwegen geschlossen. Datenfehler, die zwischen NAND-Schnittstelle und Host auftreten, z. B. Bits mit Soft-Errors, sind häufig nur äußerst schwierig zu erkennen und zu reproduzieren.

Der Algorithmus zur Datenkorrektur der PCIe FerriSSD erkennt die relevanten Fehler auf dem SSD-Datenpfad: Hardwarefehler, Firmwarefehler und Speicherfehler im SRAM, DRAM oder NAND. Die SSD enthält ein zusätzliches redundantes Backup im NAND – das SMI Ferri Group Page RAID –, das den Schutz vor dem Risiko nicht korrigierbarer Fehler im NAND-Speichermedium weiter verstärkt.

Falls das Speichermedium einen Fehler erkennt, der nicht automatisch korrigiert werden kann, sendet es dem Host ein Fehlersignal, damit dieser entsprechend reagieren kann. Im Gegensatz hierzu geben herkömmliche SSD fehlerhafte Daten meist ohne Fehlersignal an den Host weiter. Damit verschärfen sie das ursprüngliche Problem, indem sie den Host nicht auf die Notwendigkeit einer Fehlerbehandlung hinweisen.

Die vorstehend beschriebenen Funktionen schützen vor dem Risiko von Datenverlust oder -fehlern bei ihrem Transfer. Die PCIe FerriSSD enthält auch Funktionen, um die Integrität der Daten in der Speicherschnittstelle zu gewährleisten. Die Funktion IntelligentScan & DataRefresh erreicht dies, indem sie Speicherzellen, deren Inhalt gefährdet ist, erkennt und einen Refresh des Inhalts vornimmt. Das Risiko eines Verlusts gespeicherter Daten steigt mit:

  • der Gesamtzahl der Programmier- und Löschzyklen (P/E) und
  • der Umgebungstemperatur.

In beiden Fällen wird die Funktion IntelligentScan & DataRefresh aktiv.

Auswirkung der Temperatur

Simulation Datenhaltung SSD
Bild 2: Simulation der Datenerhaltung bei 85 °C.
© WEKA Fachmedien

Einer der wichtigsten Einflüsse, die die Datenerhaltung beeinträchtigen, ist eine höhere Temperatur der NAND-Speicherzellen. Je höher die Umgebungstemperatur im Betrieb ist, desto kürzer wird die Datenerhaltung des NAND. Die PCIe FerriSSD enthält einen von Silicon Motion entwickelten Überwachungsalgorithmus, der die kumulierten Temperaturwerte der Sperrschicht, die Anzahl der P/E-Zyklen, die Einschaltzeit der SSD und andere wesentliche Referenzpunkte protokolliert, um den Daten-Refresh der NAND-Zellen dynamisch zu priorisieren. IntelligentScan & DataRefresh wirken zusammen, um die Datenerhaltung bei verschiedenen Temperaturen wesentlich zu erhöhen, bevor die Daten nicht mehr lesbar sind.

Eine übermäßig hohe Anzahl von Lesezyklen bei einer bestimmten Zelle kann zu einer unbeabsichtigten Überladung benachbarter Zellen und dadurch zu nicht mehr korrigierbaren Bitfehlern führen. Dieses Phänomen ist als Lesestörung (Read Disturbance) bekannt. FerriSSD-Produkte vermeiden solche möglichen Fehler durch regelmäßige Ausführung der Funktion IntelligentScan & DataRefresh an NAND-Blöcken, die wiederholt gelesen werden. Die Firmware namens IntelligentScan steuert automatisch die DataRefresh-Zyklen und die Verarbeitungszeit, um Datenverluste durch die Auswirkungen intensiver Leseoperationen auf dem NAND-Flash-Speichermedium zu minimieren.

Bei herkömmlichen SSDs werden die NAND-Chips, aus denen das Speicher-Array besteht, als SLC- (Single Level Cells), MLC- (Multi Level Cells) oder als 3D-TLC-Zellen (Triple Level Cells) konfiguriert. Die Auswahl von SLC, MLC oder TLC erfolgt im Hinblick auf den bestmöglichen Kompromiss zwischen Speicherdichte und Latenz beim Zugriff. SLC hat die niedrigste Latenz und Dichte und TLC die höchste Speicherdichte, aber auch die höchste Latenz. MLC-Zellen liegen bei beiden Faktoren irgendwo dazwischen.

Partitionierung von NAND-Chips
Bild 3: Partitionierung von NAND-Chips in SLC- und MLC-Bereich. Die »FastWrite Area« ist als SLC konfiguriert.
© WEKA Fachmedien

Hybrid Zone, ein weiteres Feature der PCIe FerriSSD, soll die niedrige Latenz der SLC-Zellen mit der hohen Speicherdichte der TLC-Zellen kombinieren. Es partitioniert ein NAND-Die in verschiedene SLC- und MLC/TLC-Bereiche. Ein Medium zu partitionieren ist bei SSDs mit niedriger bis mittlerer Dichte besonders sinnvoll.

Die SSD mit nur einem NAND-Die kann weiterhin SLC-Speicher mit hoher Schreibgeschwindigkeit enthalten, ohne auf die Vorteile bei der Dichte von MLC/TLC zu verzichten. Diese Konfiguration ist besonders vorteilhaft, wenn plötzlich die Spannungsversorgung ausfällt.

Ohne einen als SLC ausgeführten Teil des Speichers würden Kosten und Größe der Batterie für den Fall eines Spannungsausfalls an MLC/TLC ansteigen. Die Implementierung von SLC-Speicher ist auch wichtig für eine hohe Zuverlässigkeit und einen schnellen Zugriff, indem z. B. SLC dem Bootcode zugewiesen wird, während gleichzeitig ein Teil des NAND-Mediums als MLC/TLC mit höherer Dichte genutzt werden kann.

Zuverlässig und sicher

Die neuste Generation von Anwendungen im Embedded-Computing und der Industrie verlangt ganz besonders nach höheren Datenübertragungsraten sowie einer robusteren und zuverlässigeren Datenspeicherung. Die Migration zu einer PCI-Express-SSD ist eine bewährte Lösung, um in Embedded-Speicheranwendungen die benötigte Leistung zu erreichen.

Die PCIe FerriSSD von Silicon Motion bietet nicht nur eine höhere Leistung. Technologien wie Datenredundanz durch eingebettetes DRAM schützen das Speichermedium vor dem Risiko eines Datenverlusts während des Datentransfers. Als 3D-TLC, MLC und SLC sowie mit Speicherkapazitäten von 5 GB bis 240 GB erhältlich, bieten FerriSSDs den Entwicklern ausreichend Flexibilität und erlauben es ihnen, die Spezifikation ihrer Speicherlösung an die Bedürfnisse ihrer Anwendung anzupassen und so die Kosten der SSD zu optimieren. (jk)


Das könnte Sie auch interessieren

Verwandte Artikel

Silicon Motion, HY-LINE Computer Components GmbH