Startseite > Embedded > Entwicklungstools > Energieeffiziente Orchestrierung

Projekt »GreenICT – EdgeLimit«

Energieeffiziente Orchestrierung

20. Juni 2024, 17:15 Uhr | Von Peter Heusinger, Zekeriya Mansuroglu und Michael Wagner

▶ Diesen Artikel anhören

Fortsetzung des Artikels von Teil 1

Energieeffiziente Orchestrierung

Die energieeffiziente Orchestrierung setzt Technologien ein, die gute Unterstützung für Softwarevirtualisierung und Anwendungsorchestrierung bieten. »Containerd« ist die Lightweight-Implementierung einer Container-Laufzeitumgebung und »K3s« ist die Implementierung des K8s-Frameworks (Kubernetes), ebenfalls ausgerichtet auf ressourcenlimitierte Systeme.

Jobangebote+ passend zum Thema

MACNICA ATD EUROPE - Ihre berufliche Zukunft

MACNICA ATD Europe GmbH, Ingolstadt

Sales Manager / Vertriebsmitarbeiter (m/w/d)

Verifysoft Technology GmbH, Offenburg

Alle Jobangebote im Elektroniknet Karrierebereich anzeigen

Für die Entwicklung und den Test einer energieeffizienten Orchestrierung wurde ein K8s-Cluster aufgebaut, bestehend aus einer Control-Plane, einem Edge-Server und 4 Arm-basierten, in Form von XILINX-Evaluationsboards emulierten Recheneinheiten von 5G-Radio-Units. Die Control-Plane dient als Verwaltungseinheit des Clusters, während der Edge-Server und die Radio-Units die sogenannten Worker-Nodes darstellen. Sie führen die eigentlichen Anwendungen aus. Bild 6 zeigt die einzelnen Komponenten in Form eines Stack.
Im klassischen Multi-Access-Edge-Computing (MEC) werden Anwendungen auf Edge-Servern ausgeführt. Um die Energieeffizienz zu steigern, sollen im Teillastbetrieb freie Ressourcen auf den Embedded-Systemen der Radio-Units zur Ausführung von Anwendungen genutzt werden, die sich auf einem Server befinden.

Bei der Verteilung der Anwendungen sollen Knoten mit niedrigerem Energiebedarf bevorzugt werden. Dadurch verbrauchen die Anwendungen weniger Energie. Durch die Konzentrierung der Anwendungen auf die effizienteren Knoten können weniger effiziente Systeme leergeräumt und abgeschaltet werden.

Die Aufgabe des K8s-Schedulers ist es, einen geeigneten Knoten für eine Anwendung auszuwählen, die aktuell neu installiert oder reorchestriert werden soll. Der Standard-Scheduler in K8s erfüllt diese Aufgabe, indem er nach dem erstbesten Knoten sucht, der die Anforderungen der Anwendung nach Speicher- und Rechenressourcen erfüllt. Dabei werden Aspekte wie Energieeffizienz nicht berücksichtigt.

Der EdgeLimit-Scheduler hingegen bevorzugt Knoten mit dem niedrigsten Energiebedarf. Damit der Scheduler die Energieeffizienz der Knoten beurteilen kann, werden offline ermittelte Parameter als Metadaten an die Knoten angeheftet. Die Leistungsaufnahme abhängig von der CPU-Auslastung wird als linearer Verlauf modelliert, wie es Bild 2 und Bild 3 für das FPGA-SoC und den Intel-Server zeigen.

Die Parameter dieses linearen Verlaufs werden als Metadaten an den Knoten angeheftet. Mithilfe dieser Daten errechnet der EdgeLimit-Scheduler den Leistungsbedarf einer Anwendung entsprechend deren Anforderung nach CPU-Ressourcen. Dann wählt er den Knoten mit dem geringsten Energiebedarf aus, um die Anwendung auszubringen. Dies geschieht, wenn sich im System etwas ändert, also eine Anwendung neu installiert oder verschoben werden soll.

Als zentrale Komponente bei der energieeffizienten Orchestrierung dient der Energiemanager. Er agiert als Supervisor für die energieeffiziente Orchestrierung. Wenn sich die Konfiguration der freien Rechenressourcen im Cluster verändert, errechnet er die günstigste Verteilung der Anwendungen und parametriert den EdgeLimit-Scheduler entsprechend, bevor er eine Reorchestrierung anstößt.

Der Energiemanager bietet eine Schnittstelle für externe Akteure. Diese Akteure können Maschinen wie z. B. ein KI-Agent oder ein Managementmodul auf der Radio-Unit sein. Die gleiche Aufgabe kann ein Administrator an der Mensch-Maschine-Schnittstelle übernehmen.

Über diese Schnittstelle empfängt der Energiemanager Anforderungen wie die Anpassung der Anwendungsverteilung an die aktuellen Rechenkapazitäten im Cluster. Je nach Auslastung des Clusters wählt er eine Untermenge oder alle Anwendungen auf dem Edge-Server und veranlasst deren Verteilung auf die freien Ressourcen der Worker-Knoten.

Weiterhin besteht die Möglichkeit, eine Reorchestrierung von außen zu steuern. Dazu stehen verschiedene Funktionen zur Verfügung, zum Beispiel alle belegten Ressourcen auf einem Knoten zu räumen und diesen anschließend für neue Anwendungen zu sperren oder den Knoten herunterzufahren. Es besteht die Möglichkeit, auf einem Knoten mit sofortiger Wirkung keine weiteren Ressourcen mit Anwendungen zu belegen oder umgekehrt auf diese Weise gesperrte Knoten erneut zu öffnen.

Des Weiteren kann ein Knoten über den Energiemanager geregelt herunter- oder hochgefahren werden. Er besitzt einen Treiber für sogenannte Power-Distribution-Units. Über diese Einheiten werden Knoten ein- bzw. physisch ausgeschaltet und sie ermöglichen die Messung des Energieverbrauchs innerhalb des Clusters.

Weitere Aspekte

Stateful- und Stateless-Applikationen
Bei dem Verteilen von Applikationen wird in zwei verschiedene Arten von Apps unterschieden. Applikationen, die ihre Daten über Kommunikationsschnittstellen von Sensoren holen, daraus ein Ergebnis ermitteln und dieses weiterleiten, besitzen in der Regel keinen internen Speicher.Man spricht von Stateless-Applikationen. Diese Art von Anwendungen können jederzeit von einem System auf ein anderes System geschoben werden. Aufwendiger sind Applikationen zu managen, die Daten speichern und diese für weitere Berechnungen benötigen. In diesem Fall muss beim Verschieben der Funktionalität ebenfalls der interne Zustand transferiert werden. Für diese Art von Applikationen stellt Kubernetes entsprechende Ressourcen zur Verfügung.

Energieaufnahme der Kommunikation und Latenz
Eine Verschiebung von Containern zwischen einzelnen Komponenten ändern die Kommunikationsbeziehungen zwischen diesen SW-Komponenten. Dies gilt insbesondere, wenn Container, die auf einem Prozessorsystem liefen, nach der Orchestrierung auf verschiedenen Komponenten arbeiten. Um die Funktion sicherzustellen, muss auf die Latenzvorgaben geachtet werden. Außerdem wurde die zusätzliche Energieaufnahme der Kommunikationsverbindungen zwischen den Komponenten untersucht. Dabei stellte sich heraus, dass sowohl bei Ethernet als auch WLAN der größte Anteil der aufgenommenen elektrischen Leistung für die Aufrechterhaltung der Kommunikation genutzt wird. Der Vorgang der reinen Kommunikation kann von der Leistungsaufnahme im Vergleich zur Rechenleistung in der Regel vernachlässigt werden.

Designregeln
Damit verschiedene Applikationen in Container innerhalb eines verteilten Prozessorsystem orchestriert werden können, müssen beim Design einige Dinge beachtet werden. So spielt die Größe einer Applikation eine wichtige Rolle. Gut eignen sich sogenannte Microservices zur Verteilung. Bei diesem Konzept entsteht eine größere Applikation durch die Zusammenarbeit vieler kleiner Microservices. Der Designer sollte darauf achten, dass möglichst alle Funktionen in einen gemeinsamen Container gepackt werden, die mit niedriger Latenz miteinander kommunizieren sollen. Bei unkritischer Kommunikation können Funktionen jederzeit auf unterschiedliche Embedded-Systeme orchestriert werden. Viele Messungen in diversen Use Cases haben gezeigt, dass die elektrische Leistungsaufnahme einer Kommunikation in der Regel deutlich weniger Energie aufnimmt als die Rechenvorgänge in den Containern.

Technische Umsetzung und Verifikation

Um die Energieeffizienz der neuartigen energieeffizienten Orchestrierung zu zeigen, wurde ein kleines Testbed aufgebaut. Bild 8 zeigt einen Teil des verteilten Clusters bestehend aus den vier Evaluationsboards für die FPGA-SoCs und einem Raspberry PI, der auf dem Ethernet Switch liegt.

Bild 9 zeigt die Visualisierungsschnittstelle des Energiemanagers. Der Energiemanager verfügt über eine Zeitreihendatenbank, in der die CPU-Auslastung und die Daten zur Leistungsaufnahme der Knoten abgelegt werden und für eine spätere Verwendung jederzeit abgerufen werden können. In der Abbildung sind von oben nach unten die Leistungsaufnahmen der einzelnen Knoten, die CPU-Auslastung derselben und die Gesamtleistungsaufnahme des Clusters aufgetragen.

Es werden verschiedene typische Zustände des Clusters dargestellt. Zu Beginn vor dem Zeitpunkt t1 befindet sich der Edge-Server im ausgeschalteten Zustand, die Radio-Units arbeiten im Idle-Zustand. In dieser Situation besitzt der Cluster eine Leistungsaufnahme von 28 W.
Zum Zeitpunkt t1 fahren die 4 Radio-Units die RAN-Funktionalität hoch. Das führt zu einer Mehraufnahme an Leistung von ca. 4 W.

Zum Zeitpunkt t2 sollen eine Reihe an MEC-Anwendungen in dem Cluster orchestriert werden. Zu diesem Zeitpunkt existieren keine freien Ressourcen auf den Radio Units. Der EdgeLimit Scheduler erkennt, dass ein Worker-Node heruntergefahren ist. Es handelt sich um den Edge-Server. Mithilfe des Energiemanagers veranlasst der Scheduler, dass der Server hochgefahren wird und bringt die Apps auf diesen Knoten aus. Dieser Betriebszustand verursacht ca. 53 W zusätzlich an Leistungsaufnahme.

Zum Zeitpunkt t3 werden Rechenressourcen auf den Radio Units frei und zum Zeitpunkt t4 erhält der Energiemanager das Signal für die Reorchestrierung der Apps. Daraufhin werden alle Apps von dem Server auf die Radio Units verteilt. Allein dieses Vorgehen führt zu einer geringeren Leistungsaufnahme von circa. 14 W. In dieser Situation sind alle MEC-Apps auf die Radio-Units orchestriert worden. Der Edge-Server befindet sich im Idle-Mode. Wenn die Rechenressourcen des Servers nicht unmittelbar benötigt werden, kann der Server im Zuge der Reorchestrierung heruntergefahren werden. Dies passiert zum Zeitpunkt t5. Nach diesen Maßnahmen pendelt sich die Gesamtleistungsaufnahme auf circa 29 W ein.

An dieser Stelle ist ein Vergleich der Zeitabschnitte vor t1 und nach t5 interessant. Der Unterschied sind die 9 MEC-Anwendungen, die nach t5 auf den Radio-Units verteilt sind und eine Leistungsaufnahme von ca. 1 W produzieren. Die gleichen Anwendungen laufen im Zeitabschnitt zwischen t3 und t4 auf dem Edge-Server und haben eine Leistungsaufnahme von ca. 14 W produziert, dabei ist die Serverbereitschaft, die dafür notwendig geworden ist und ca. 39 W benötigt, noch nicht berücksichtigt.

Die Autoren

Peter Heusinger
studierte Elektrotechnik an der Friedrich-Alexander-Universität Erlangen. Seit 1988 arbeitete er in verschiedenen Positionen und Themenbereichen beim Fraunhofer Institut für Integrierte Schaltungen. Seine aktuellen Schwerpunkte sind Multi-Access Edge Computing, Security und Sustain- ability.

Zekeriya Mansuroglu
studierte Elektrotechnik an der Friedrich-Alexander-Universität Erlangen. Seit 2000 arbeitete er beim Fraunhofer Institut für Integrierte Schaltungen. Sein aktueller Schwerpunkt ist Softwarevirtualisierung in den Bereichen Multi-Access Edge Computing und Sofware Defined Networking.

Michael Wagner
studierte an der TU München Elektrotechnik mit Abschluss 1988. Danach war er in einem mittelständischen Unternehmen im Bereich Security tätig in der Entwicklung von Hardware, Software und FPGA-Designs. Seit 2001 arbeitet er am Fraunhofer IIS mit den Schwerpunkten Kommunikation, Security, Energieeffizienz und Virtualisierung.

Energieeffiziente Orchestrierung
Energieeffiziente Orchestrierung

Stromversorgungdiskussion Teil 1

Stromversorgung: Nach verhaltenem Start hellt sich 2024 auf

Katz- und Maus-Spiel mit neuen Namen

Mornsun versucht Maßnahmen der Sanktionsliste zu entziehen

Projekt »GreenICT – EdgeLimit«

Energieeffiziente Orchestrierung

Energieeffiziente Orchestrierung

Jobangebote+ passend zum Thema

Weitere Aspekte

Technische Umsetzung und Verifikation

Lesen Sie mehr zum Thema

Das könnte Sie auch interessieren

Stromversorgungdiskussion Teil 1

Stromversorgung: Nach verhaltenem Start hellt sich 2024 auf

Katz- und Maus-Spiel mit neuen Namen

Mornsun versucht Maßnahmen der Sanktionsliste zu entziehen

Weitere Artikel zu Fraunhofer IIS Inst. f. Integrierte Schaltungen

Überwachung der kognitiven Belastung

Sensor-Netzwerk und KI helfen gestressten Autofahrern

Bewerbung bis 30. September

Fraunhofer IIS: Kostenfreier KI-Booster für produzierende KMUs

women4ew

Mutig gegen das Impostor-Syndrom

Neue Integrationsoptionen für RFicient

Maximale Effizienz bei minimalem Stromverbrauch

Pilotlinie APECS

Sachsen investiert 38 Mio. in Chiplet-Forschung

Weitere Artikel zu Embedded

نجاح مفهوم "embedded worldwide"

مؤتمر "embedded world North America" يشهد نموًا جوهريًا

Konzept „embedded worldwide“ geht auf

embedded world North America mit substanziellem Wachstum

Für IPCs, HMIs, PLCs und Edge-Controller

Neue Industrieprozessoren für mehr Edge-Intelligenz

For IPCs, HMIs, PLCs, and edge devices

New industrial processors for greater edge intelligence

Entwicklungsprozesse werden komplexer

Entwicklung von Embedded-Software managen

Weitere Artikel zu Echtzeit-/Embedded Software

MathWorks zum Thema Model-Based Design

»Die Zukunft der Automatisierung beginnt im Modell«

Wegen CRA, Security- und Funkrichtlinien

»Embedded Designs erfordern neue Herangehensweisen«

Security in modernen Embedded-Systemen

Cybersecurity mit Arm TrustZone als Basis

Toolkombination verkürzt Time-to-Market

Code-Coverage: Mit der richtigen Kombination zum Ziel

Auf der embedded world North America

TrustInSoft Analyzer jetzt auch mit Rust-Unterstützung

Weitere Artikel zu Stromversorgung Sonstige

Neues Leitmotiv »In Everything, Better«

TDK-Lambda: »Wir halten am Ziel der Umsatzverdopplung fest«

M&T-Forum Stromversorgungs-Distribution

»Wir haben 2025 deutlich mehr Design-Aktivitäten gesehen«

Texas Instruments

Rerush-Strom von PFC-Stufen einfach begrenzen

Siemens/Delta

Partnership for prefabricated, modular power solutions

مجال الإلكترونيات الصناعية

أزمة نكسبيريا في سوق الإلكترونيات الصناعية

Weitere Artikel zu Embedded-Systeme

HOSE&SPÖRRLE: Mensch. Maschine. Morgen.

Folge 19: Managing The Unexpected – mit Holger Ruban

HOSE&SPÖRRLE: Mensch. Maschine. Morgen.

Folge 18: Selbstverteidigung analog&digital: mit Faust&Ferstand

HOSE&SPÖRRLE: Mensch. Maschine. Morgen.

Folge 17: „Daten, wollt ihr ewig leben?“ – mit Wojtek Rudko

HOSE&SPÖRRLE: Mensch. Maschine. Morgen.

Folge 16: Algospeak – Wenn sich Sprache den Maschinen anpasst

Edge Computing für die Medizintechnik

Advantech: Kompakte KI-Rechner für medizinische Bildgebung