Mitarbeiter der Carnegie Mellon University und von Facebook haben in einer Langzeitstudie, die auch von Samsung und Intel unterstützt wurde, das Verhalten von SSDs in einer Server-Umgebung untersucht. Die Autoren der Feldstudie nutzten für ihre Arbeit Daten aus den Rechenzentren von Facebook, die sie über fast vier Jahre und viele Millionen Betriebsstunden gesammelt hatten. Facebook gehörte zu den ersten Anwendern, die SSDs in großem Stil in Rechenzentren einsetzten.
Den Autoren ging es bei ihrer Studie nicht um die Analyse der Zuverlässigkeit einzelner SSDs - deshalb verzichteten die Autoren, Herstellernamen zu nennen -, sondern vielmehr um grundsätzliche Erkenntnisse, die in die künftige Entwicklung von industriellen SSD-Speicherlösungen und -architekturen einfließen sollen. Die untersuchten SSDs haben eine Speicherkapazität zwischen 720 GB und 3,2 TB und nutzten PCIe der ersten und zweiten Generation.
Die Studie kommt u.a. zu folgenden Ergebnissen:
Die Ausfallrate von SSDs steigt nicht gleichmäßig mit der Zeit an, sondern durchläuft mehrere charakteristische Phasen.
Read-Disturb-Fehler sind im Feld nicht weit verbreitet.
Höhere Temperaturen führen zu einer erhöhten Ausfallrate. Dies ist vor allem bei SSDs ohne automatische Regelung der Schreib-Geschwindigkeit (Thermal Throttling) zu beobachten.
Wer sich in die Studiendaten vertiefen möchte, der findet die komplette Veröffentlichung "A Large-Scale Study of Flash Memory Failures in the Field" hier als PDF zum Download.