Elektronikdesign Temperaturüberwachung in SoC-basierten Systemen

Die Wärme, die fortschrittliche Multicore-SoCs und Bauelemente erzeugen, ist mittlerweile zu einem Problem für das Elektronikdesign geworden. Zwar liegen die Versorgungsspannungen unter 1 V, dafür nehmen die Bausteine aber hohe Ströme auf, sobald die Prozessoren mit voller Last arbeiten.

Die in einem SoC anfallende Verlustleistung kann über den Baustein hinweg stark variieren, wenn die verschiedenen Kerne aktiviert werden oder sich die abgerufene Rechenleistung mit der Zeit verändert. Erhöht sich die Software-bedingte Arbeitslast, kann sich auch ein kühler SoC-Chip binnen Sekunden aufheizen. Wird der Chip über längere Zeit mit der maximalen Stromaufnahme betrieben, steigt die lokale Chiptemperatur möglicherweise sogar auf Werte, die den Überhitzungsschutz aktivieren oder sogar die Leistungsfähigkeit und Zuverlässigkeit benachbarter Bauelemente beeinflussen.

Wärmebedingte Probleme lassen sich vermeiden, indem die Chiptemperaturen empfindlicher Bauelemente überwacht und diese dann entsprechend abgekühlt werden, etwa durch ein Anheben der Drehzahl der Lüfter oder ein Absenken der Taktfrequenzen. Eine präzise Temperaturüberwachung ist deshalb wichtig für alle Systeme, in denen fortschrittliche SoCs oder FPGAs (Field Programmable Gate Arrays) zum Einsatz kommen.

Chip-integrierte Temperatursensoren

In den Chip integrierte Temperatursensoren machen sich eine bestimmte Eigenschaft von p-n-Übergängen zunutze, denn der Spannungsabfall an einem p-n-Übergang mit einer bestimmten Fläche hängt neben dem Strom auch von der Temperatur ab. Die Temperaturabhängigkeit ist auf das Vorhandensein thermisch generierter Ladungsträger im Halbleiter zurückzuführen. Wird der Strom konstant gehalten, sind jegliche Änderungen des Spannungsabfalls auf Temperaturänderungen herzuleiten.
Üblicherweise nimmt der Spannungsabfall an einer Sperrschicht mit steigender Temperatur ab. Werden jedoch nacheinander zwei verschiedene Ströme angelegt und die in beiden Fällen abfallenden Spannungen gemessen, ergibt sich eine geringfügige Differenz zwischen beiden Spannungswerten. Ein Ansteigen der absoluten Temperatur führt zu einer nicht linearen Zunahme der Spannungsdifferenz, womit eine verlässliche Grundlage für die Verwendung in Halbleiter-Temperatursensoren geschaffen wird.

Mit den modernen CMOS-Prozessen (Complementary Metal Oxid Semiconductor, CMOS), die zur Herstellung komplexer SoCs verwendet werden, lassen sich leicht geeignete pn-Sperrschichten konstruieren. In der Regel besteht die Temperaturmesssonde dabei aus einem Bipolartransistor, dessen Basis-Emitter-Sperrschicht die Diode darstellt, während der Kollektor mit dem Substrat des Bauelements verbunden wird.

Ohne geht es nicht: Systemisches Wärmemanagement

Obwohl viele Bauelemente – insbesondere auch programmierbare Bausteine – ihre Temperatur selbst überwachen, müssen thermisch verursachte Probleme häufig auf Systemebene gelöst werden. So wirkt sich beispielsweise eine Drehzahlveränderung der Gehäuselüfter auf die Kühlung aller im System enthaltenen Bauelemente aus. Um eine systemische Kontrolle zu erreichen, müssen die jeweiligen Chiptemperaturen mehrere Bauelemente aus der Ferne überwacht werden.

Prinzipiell ist es nicht schwer, für jeden Bereich eines SoC, das nach einer Temperaturüberwachung verlangt, einen vollwertigen Temperatursensor zu konfigurieren. Die Messsonde muss dazu lediglich in der Nähe der fraglichen Schaltungen platziert werden, um anschließend zwischen zwei Quellen mit unterschiedlich hohen Strömen umzuschalten. Die zwei daraus resultierenden Spannungsmesswerte werden dann einem A/D-Wandler (ADC) und entsprechender Logik zugeführt, die die geschätzte Temperatur berechnen.

Weil sie zuverlässiger und genauer sind, entscheiden sich in der Praxis allerdings viele Systemdesigner für Fern-Temperatursensoren. Erfolgt die Implemen­tierung komplett auf dem SoC-Chip, verlangt die Implementierung zweier Stromquellen pro Messsonde vom Hersteller eine präzise Abstimmung der Schaltungen, was sich bei vielen gän­gigen Digitalprozessen schwierig gestaltet. Deutlich zuverlässiger sind die Messungen dagegen, wenn die Stromquellen auf einem Chip gebildet werden, der auf einem präzisen Mixed-Signal-Prozess beruht. In diesem Fall werden auf dem SoC außerdem weniger Pins benötigt, da für jede überwachte Region nur die Verbindung mit einem Transistor anstatt mit zweien erforderlich ist (Bild 1).

Ein weiterer Vorteil von Fern-Temperatursensoren ist, dass diese Bauelemente mehr als einen Punkt in einem IC überwachen und automatisch Alarme auslösen können. Ein normaler Einzel-Fernsensor wie etwa der MAX6642 von Maxim kann zwei Temperaturen überwachen: seine eigene und die eines in der Nähe befindlichen SoC oder FPGA. Andere Fernsensoren sind in der Lage, drei oder mehr Temperaturen zu kontrollieren. Der MAX31730 kann zum Beispiel neben seiner eigenen Temperatur auch die von drei externen Sonden überwachen (Bild 2).

Übersteigt die Temperatur eines dieser Sensoren einen programmierbaren Grenzwert, setzt der Baustein ein Statusbit und zeichnet in einem speziellen Register die Temperatur des heißesten Kanals auf. Per System-Management-Bus (SMbus) leitet der MAX31730 die Informationen dann an einen System-Controller weiter.

Sollen noch mehr Eingänge überwacht werden, kann sich der Designer für einen Baustein wie den MAX6681 entscheiden, der Eingänge für sieben Ferndioden besitzt. Der Baustein eignet sich für die Temperaturüberwachung von zwei FPGAs mit eingebauten Thermodioden, vier Leiterplatten-Hotspots mithilfe diskreter, als Diode angeschlossener Transistoren sowie der Leiterplattentemperatur am Montageort des MAX6681. Als weitere Option lassen sich bis zu acht MAX31730 als Slaves an den SMbus anschließen.

Wie präzise ist die Übewachung der Temperatur?

Ungeachtet der Vorteile, die der Einsatz von Fern-Temperatursensoren in einem Systemdesign hat, müssen Entwicklungsteams auch mögliche Fehlerquellen und Ungenauigkeiten im Auge behalten.

Parasitäre Serienwiderstände etwa, die in allen Systemen unvermeidbar sind, beeinflussen die vom Sensor bereitgestellte Temperaturinformation, sofern keine entsprechende Kompensation erfolgt. Hierzu ein Beispiel, in dem der erste Bias-Strom 100 µA und der zweite 10 µA beträgt: Die Spannungsdifferenz zwischen beiden ist proportional zum natürlichen Logarithmus des Quotienten aus dem ersten und dem zweiten Stromwert. Der absolute Wert ist das Produkt aus diesem Logarithmuswert und einer Idealitätskonstante, die normalerweise in der Nähe von 1 liegt, sowie dem Quationeten kT/q. Dabei ist k die Boltzmann-Konstante und q eine Elektronenladung. Beträgt der Serienwiderstand 1 Ω, resultieren für den höheren Strom ein Spannungsabfall von 100 µV und für den niedrigeren Strom 10 µV. Dementsprechend wird eine Temperaturverschiebung von 0,45 °C gemessen.

Ist der Serienwiderstand bekannt (er kann oft anhand der typischen Leiterbahn­widerstände ermittelt werden), lässt sich die Temperaturverschiebung korrigieren. Einige Sensoren wie der MAX31730, aber auch andere Bauelemente von Maxim, verfügen über eine automatische Widerstandskompensation. So muss die parasitäre Fehlerquelle nicht mehr gesondert ausgeglichen werden.

Obwohl der Idealitätsfaktor normalerweise bei 1,01 liegt, ist sein genauer Wert jedoch vom Prozess und vom Transistordesign abhängig. Das heißt, auch er stellt eine potenzielle Fehlerquelle dar. Die meisten Fernsensoren sind für einen bestimmten Idealitätsfaktor optimiert. Von Maxim gibt es allerdings einige Sensoren, die auf einen Wert von etwa 1,008 abgestimmt sind, wie man ihn bei fortschrittlichen Prozessen, wie sie für moderne FPGAs und SoCs verwendet werden, üblicherweise vorfindet. Geht es um einen Baustein mit abweichendem Idealitätsfaktor, ist es einfach, in der Systemcontroller-Firmware eine entsprechende Korrektur vorzusehen.

Fehler können auch durch SoC-basierte Temperatursensor-Transistoren entstehen, die durch eine geringe Stromverstärkung (β) gekennzeichnet sind. Ist die Stromverstärkung des Transistors sehr gering, entspricht das Verhältnis der Kollektorströme möglicherweise nicht dem Verhältnis der Emitterströme, sodass es zu einem Fehler in der berechneten Temperatur kommt. Eine zehnprozentige Änderung des Kollektorstrom-Verhältnisses kann dabei zu einer Änderung der gemeldeten Temperatur um etwa 12°C führen.

Bei speziellen Fern-Temperatursensor-ICs ist das normalerweise kein Problem, weil bei ihnen Transistoren mit hoher Stromverstärkung eingesetzt werden. SoC-Transistoren aber werden mit Prozessen hergestellt, die für MOS- und nicht für Bipolartransistoren optimiert sind, sodass eine hohe Verstärkung für diese Bauelemente nicht garantiert werden kann. Kommen solche Transistoren zum Einsatz, ist es also möglicherweise besser, einen Fern-Temperatursensor-IC mit Beta-Kompensation zu verwenden. Nötig ist das aber nicht in jedem Fall.

Bleibt der Beta-Wert über den erwarteten Strom- und Temperaturbereich einigermaßen konstant, ist der Effekt unter Umständen vernachlässigbar gering. Bei Tests mit drei Mustern eines Mikroprozessors auf Basis eines 45-nm-Prozesses, bei dem der Beta-Wert für Bipolartransistoren etwa 0,3 beträgt, ergab sich beispielsweise ein Fehler von unter ±1 °C (Bild 3). In Fällen allerdings, in denen niedrige Beta-Werte wahrscheinlich zu größeren Fehlern führen, lassen sich Fernsensoren mit Beta-Kompensation einsetzen.

Höhere Zuverlässigkeit, längere Lebensdauer

Dank der Bauelemente, wie sie beispielsweise von Maxim angeboten werden, die auf unterschied­liche Szenarien der Fern-Temperaturmessung abgestimmt sind, können Systemdesigner gewährleisten, dass die von ihnen implementierten Temperaturregelungen auf die wirkliche thermische Situation innerhalb ihrer Produkte reagieren. Das wiederum führt unter dem Strich zu einer höheren Zuverlässigkeit und einer längeren Produktlebensdauer. Darüber hinaus sinkt das Risiko einer störenden Abschaltung infolge von Überhitzung.

 

 

Die Autorin

Kim Majkowski hat mehr als 20 Jahre Erfahrung im High-Service-Vertrieb. Sie kam als Semiconductor Product Manager zu Farnell. Heute leitet Majkowski die Produktkategorie Power Management Semiconductor und treibt die Markteinführungsstrategie für Farnell, Newark und element14 in der APAC-Region voran.