Für hohe Zuverlässigkeit Analog-Digital-Umsetzer mit Selbstdiagnose

Eingebettet im Monitoring-Konzept überwachen ADUs  sich selbst.
ADUs können sich selbst überwachen oder - eingebettet in ein Monitoring-Konzept - ganze Systeme.

Moderne ADUs können ihre Funktionsfähigkeit selbst überwachen. Die implementierten Diagnosefunktionen können aber auch genutzt werden, um den Zustand des Gesamtsystems zu überwachen. Eingebettet in ein systemweites Monitoring-Konzept lässt sich so die Zuverlässigkeit auf Systemebene erhöhen.

Risiken und Unsicherheiten einzudämmen ist ein übergreifendes Ziel aller Ingenieure. Folglich gehört die Zuverlässigkeit zu den Grundprinzipien, auf denen sämtliche technischen Disziplinen aufbauen. Dieses Konzept wird im 21. Jahrhundert immer entscheidender werden, da wir uns zur Verbesserung unserer Lebensqualität und der Welt immer mehr auf die Technik verlassen. Überall, von autonom fahrenden Autos über die Energieversorgung bis zur Fabrikautomatisierung, nimmt die Nachfrage nach elektronischen Systemen mit integrierten Zuverlässigkeitsmerkmalen ständig weiter zu.

Entwickler von analogen ICs folgen diesem Trend und statten deshalb die einzelnen Bauelemente mit systemorientierten Zuverlässigkeitsmerkmalen aus. Sie stellen den IC-Anwendern einen neuen Umfang an Informationen zur Verfügung, die – richtig angewandt – dazu beitragen können, die Ausfallwahrscheinlichkeit der Bauelemente zu senken und dadurch ein System als Ganzes zuverlässiger zu machen.

So werden Systeme zuverlässiger

Entwickler, denen an der Zuverlässigkeit liegt, modellieren und prüfen die Ausfallraten ihrer Schaltungen, Geräte und Systeme und stellen fest, welche erwarteten oder angenommenen Bedingungen zu einem unzuverlässigen Verhalten führen können. Sie ermitteln ebenfalls, wie lange es dauert, einen solchen Zustand zu erreichen. ICs beispielsweise werden hierfür einem großen Umfang an Qualitäts- und Zuverlässigkeitsprüfungen unterzogen. Für die Ermittlung der Mindest- und Höchstwerte bestimmter elektrischer Kenndaten können unterschiedliche Methoden angewendet werden – je nachdem, um welche Spezifikation es jeweils geht. Viele Größen wie der Offset- und Verstärkungsfehler, die Gleichtaktunterdrückung und die Versorgungsspannungsunterdrückung werden für jedes IC in der Produktion getestet. Alle Bauteile, die die Anforderungen nicht erfüllen, werden ausgesondert. Andere Bauelemente-Spezifikationen werden anhand zufälliger Stichproben bestimmt – meist 30 oder mehr ICs. Sind diese Daten erhoben und ausgewertet, wird die Standardabweichung oder das Vielfache davon zur Definition einer akzeptablen Toleranz bzw. eines Spielraums herangezogen, auf die sich der Anwender einstellen kann. Bild 1 zeigt einige Parameter, die üblicherweise auf diesem Weg charakterisiert werden.

Trotzdem definieren Qualität und Zuverlässigkeit nicht nur das Minimum und Maximum jedes elektrischen Kennwertes. Vielmehr geht es auch um die Untersuchung, wie die Zuverlässigkeit eines Bauelements durch bestimmte Umgebungsfaktoren beeinflusst wird. Hier geht es um hohe Temperaturen, elektrostatische Entladungen, die Feuchtigkeitsempfindlichkeit und den Wärmewiderstand sowie die Grenzwerte dieser Stressfaktoren. Darüber hinaus liefern Charakterisierung und Qualitätsdaten nützliche Informationen, wie etwa die Frühausfallrate (Early Life Failure Rate – ELFR) und die mittlere Betriebsdauer zwischen Ausfällen (Mean Time Between Failures – MTBF). Anwender erhalten so eine statistisch ermittelte Produktlebensdauer, während der sie von einem zuverlässig funktionierenden Produkt ausgehen können.

Halbleiterhersteller spezifizieren in den Datenblättern ihrer Produkte die Einsatzbedingungen und empfehlen für jeden Parameter auch Grenzwerte mit einer gewissen Fehlertoleranz. Solange sich die Eingangssignale eines Analog-Digital-Umsetzers (ADU) innerhalb dieser Grenzen befinden, kann der Anwender ein vorhersagbares Verhalten des IC über dessen gesamte Lebensdauer erwarten. Im Gegensatz dazu geben die Halbleiterhersteller in den absoluten Maximalwerten die Grenzwerte an, bis zu denen das Bauelement nicht beschädigt wird. Diese Maximalwerte sind zwar weniger restriktiv als die empfohlenen Einsatzbedingungen, geben jedoch keinen praktischen Erwartungswert bezüglich der Zuverlässigkeit des ADU. Wenn ein Bauelement über längere Zeit mit seinen absoluten Maximalwerten betrieben wird, können allerdings irreversible Schäden auftreten. Beim Betrieb innerhalb der empfohlenen Einsatzbedingungen geht es jedoch nur um die Wahrung der Zuverlässigkeit. Methoden zu ihrer Verbesserung werden dabei nicht unbedingt definiert.

Redundanz ist eine Möglichkeit, die Zuverlässigkeit zu verbessern. Damit ist der Einbau von Rückfallebenen gemeint, mit denen die Prozesse beim Eintreten eines definierten Fehlers weiterlaufen können. Bild 2 veranschaulicht Redundanz. In Bild 2 gibt n die Zahl der redundanten Knoten im System an; n = 0 bedeutet, dass keine Redundanz existiert. Was die Abbildung zeigt, wird üblicherweise als kalte Redundanz bezeichnet. Dabei befindet sich ein System im Betrieb, während das andere System – oder die anderen Systeme – abgeschaltet als Reserve dienen. Diese Methode kann die unnötige Beanspruchung von Systemen vermeiden, die zwar mit Energie versorgt, aber nicht genutzt werden, und auch die Energiekosten für die nicht verwendeten Systeme werden vermieden. Eine weitere Redundanz-Methode ist z.B. die heiße Redundanz. Hier sind alle Systeme in Betrieb. Die höhere Energieaufnahme wird dabei in Kauf genommen, um ein schnelleres Umschalten zu erzielen.

Ein entscheidender Vorteil der Redundanz ist, dass die Zuverlässigkeit des gesamten Systems mit ihr größer sein kann als die Zuverlässigkeit der einzelnen Komponenten. Da angenommen werden kann, dass die Zuverlässigkeiten der einzelnen Bauteile voneinander unabhängig sind, kann selbst ein moderates Maß an Redundanz positive Auswirkungen haben. Wirkliche Unabhängigkeit ist allerdings schwierig zu erreichen. Auch bei noch so sorgfältiger Planung und Konstruktion können unvorhergesehene Zusammenhänge dafür sorgen, dass scheinbar unabhängige redundante Systeme gleichzeitig ausfallen. Dieses Phänomen wird als gleichartiger Fehler (CMF – Common Mode Failure) bezeichnet. Bei der Challenger-Katastrophe zum Beispiel gab es zwei O-Ringe an der Verbindung zur Booster-Rakete. Der zweite war für den Fall vorhanden, dass der erste ausfällt. Die niedrigen Temperaturen wirkten jedoch in gleicher Weise auf beide O-Ringe ein, sodass beide gleichzeitig ausfielen.

Um ein System zuverlässiger zu machen, kann es mit Redundanz ausgestattet werden. Es sollten jedoch noch weitere Methoden hinzukommen, die ebenfalls helfen, die Zuverlässigkeit zu verbessern. Beispiele hierfür sind die Strahlungsfestigkeit, höhere Isolationsfestigkeit und eine bessere Versorgungsspanungsunterdrückung. Diese Maßnahmen müssen keineswegs statisch sein und nicht ausschließlich auf der Systemebene angewandt werden. Angesichts des weiter wachsenden Bedarfs an immer umfangreicheren und komplexeren Systemen wird auch die Nachfrage nach „intelligenten“ Komponenten zunehmen, die aktiv zur Gesundheit des Systems beitragen, dessen Bestandteil sie sind.

Die Einführung verteilter dynamischer Zuverlässigkeitsfunktionen bietet die Gewähr, dass jeder Teil eines komplexen Systems über seine gesamte Lebensdauer hinweg wie vorgesehen arbeitet. Dieses Konzept haben IC-Designer in A/D-Umsetzern realisiert. Die 32-bit-ADUs ADS1262 und ADS1263 von Texas Instruments sind einige der ersten industriellen Analog-Digital-Umsetzer, die eine ganze Reihe von Überwachungs- und Schutzfunktionen enthalten.