Siemens EDA/AWS/Amazon Annapurna Labs

Die Cloud kostengünstig für moderne Halbleiterdesigns nutzen

27. Februar 2025, 14:00 Uhr | Christopher Clee, Principal Product Manager, Siemens EDA
© Adobe Stock / ktsdesign

Siemens EDA, AWS und Amazon Annapurna Labs arbeiten gemeinsam an der Optimierung von EDA-Tools in der Cloud. Die Cloud-Bereitstellung bietet einen doppelten Vorteil: Entwicklungsteams müssen nicht mehr auf lokale Ressourcen warten und erhalten die Flexibilität, bei Bedarfsspitzen aufzustocken.

Diesen Artikel anhören

Der Einsatz von Cloud Computing ist für die Benutzer von Tools und Workflows im EDA-Bereich aufgrund der Produktivitätssteigerungen und der damit ermöglichten kürzeren Markteinführungszeiten äußerst attraktiv. Für Siemens EDA-Kunden, die große, hochmoderne Chips im Nanometerbereich entwickeln, erweist sich die Nutzung von Calibre Design Stage und der Freigabeverifikation in der Cloud als vorteilhaft, wie die in diesem Artikel diskutierten Benchmark-Ergebnisse belegen. Workflows in Calibre ermöglichen nicht nur schnelle Designänderungen mit relativ geringen Rechenressourcen, sondern werden auch mit jedem Release kontinuierlich verbessert. Die Cloud-Bereitstellung bietet einen doppelten Vorteil: die Designteams müssen nicht auf lokale Ressourcen warten und erhalten die Flexibilität, in Spitzenbedarfszeiten mehr Ressourcen bereitzustellen sowie die Skalierbarkeit von Calibre für einen höheren Designdurchsatz zu nutzen.

Für eine kostengünstige Lösung müssen die Ressourcen und Infrastrukturen der Cloud jedoch genau auf die individuellen und vielfältigen Anforderungen der zahlreichen Tools zugeschnitten sein, die Teil des Halbleiter-Design-Workflows sind. Wie sieht unter diesen Umständen die optimale Konfiguration für den Betrieb von Calibre-Anwendungen in der Cloud aus? Welche der Dutzenden Klassen an virtuellen Maschinen eignen sich am besten für den Betrieb der Calibre-Anwendungen? Woher wissen die Nutzer der Cloud, dass sie ihr Geld sinnvoll ausgeben und optimale Ergebnisse erzielen? All diese Fragen werden in einem gemeinsamen Projekt von Amazon Web Services (AWS), Amazon Annapurna Labs (Annapurna) und Siemens EDA beantwortet, um die Ergebnisse einer Reihe von Workflow-Benchmarks in Calibre zu bewerten, die innerhalb der von AWS gehosteten virtuellen privaten Cloud (VPC) von Annapurna laufen. Im Anschluss an diese Bewertung wird eine Reihe von bewährten Methoden (Best Known Methods – BKM) vorgestellt, die Siemens EDA basierend auf den Erfahrungen und vorliegenden Ergebnissen entwickelt hat.

Einrichtung der Umgebung

Die Cloud funktioniert am besten, wenn die Umgebung vom Standpunkt des Endbenutzers aus so konfiguriert wird, dass ein nahtloses Erlebnis möglich ist. Das Einrichtungsszenario, mit dem Halbleiterentwickler wahrscheinlich von ihren On-Premise-Systemen her am besten vertraut sind, sieht so aus, dass dem Benutzer exklusiv ein kleiner »Head Node« zugewiesen wird, der zur Übermittlung aller Aufträge an andere Maschinen mit einer Art Warteschlangenmanager verwendet wird. Dieser Head-Node ist auch für Organisationszwecke wie zur Bearbeitung von Dateien, zum Transport von Daten, zur Erfassung von Metriken usw. nützlich.

Die in diesem Dokument näher beschriebenen Calibre nmDRC-Benchmarks machen sich den verteilten Verarbeitungsmodus von Calibre MTFlex zunutze, der auf einer Primärmaschine mit einer Reihe verbundener Remote-Maschinen ausgeführt wird. In den beschriebenen Fällen wurde für den Primär-Host und für die Remote-Hosts derselbe Maschinentyp verwendet. In anderen Tests wird einfach Multithreading auf einer einzigen Maschine verwendet. Die Einrichtung mit einer virtuellen privaten Cloud ist in Bild 1 dargestellt.

Bild 1
Bild 1. VPN-Zugriff von einem VNC-Client auf einen dedizierten Head-Node und anschließend auf Primär- und Remote-Maschinen innerhalb der Cloud-Umgebung.
© Siemens EDA

Benchmark-Ergebnisse von Calibre nmDRC

Bild 2 zeigt die Ergebnisse für die Calibre nmDRC-Laufzeit und die Remote-Speicher-Spitzenauslastung für ein 7-nm-Design von Annapurna unter Verwendung einer zunehmenden Anzahl von Remote-Kernen. Die Laufzeit ist in Stunden und die Remote-Speicher-Spitzenauslastung in GB angegeben. Für alle Durchläufe wurde der verteilte Verarbeitungsmodus MTflex von Calibre und ein homogenes Cluster an Maschinentypen für die Primär- und Remote-Knoten (AWS r6i.32xlarge-Instanzen) eingesetzt. Die Horizontalachse gibt die Anzahl der Remote-Kerne an, die bei jedem nachfolgenden Durchlauf verdoppelt wurde. Bei jedem Durchlauf wurde eine konsistente 64-Core-Primärmaschine verwendet.

Bild 2
Bild 2. Calibre nmDRC-Laufzeit und Remote-Speicher-Spitzenauslastung bei einer zunehmenden Anzahl von Remote-Kernen für das 7-nm-Design von Annapurna.
© Siemens EDA

Die dunkelblaue Linie repräsentiert den Baseline-Durchlauf mit derselben Calibre nmDRC-Version, die Annapurna ursprünglich in der Produktion für diese Designs mit den Bestandsregeln seines Foundry-Partners eingesetzt hat. Die hellgrüne Linie zeigt die Ergebnisse bei Verwendung einer neueren Calibre nmDRC-Version mit optimierten Regeln. Statt die Daten aus einer OASIS-Datei einzulesen, wurden die Designdaten aus einer zuvor gespeicherten wiederverwendbaren hierarchischen Datenbank (RHDB) wiederhergestellt. Diese Konfiguration sparte etwa 20 Minuten pro Durchlauf ein. Mit der hellblauen, gestrichelten Linie wird die prozentuale Zeitersparnis dargestellt, die im Vergleich der beiden Durchläufe erzielt wurde. Die violette Linie stellt den Calibre nmDRC Recon-Durchlauf dar, der automatisch eine Untergruppe von Foundry-Regeln auswählt, um systematische Designabweichungsfehler frühzeitig zu erkennen und zu beheben. Siemens EDA empfiehlt seinen Kunden immer, für grobe Designs zuerst das Calibre nmDRC Recon-Tool laufen zu lassen, bevor sie sich zu einem kompletten Calibre-Durchlauf entschließen. Auf diese Weise können gröbere Designfehler sehr schnell ausfindig gemacht und mit kurzen Zykluszeiten behoben werden.

Die Entscheidung, wie viele Remote-Kerne in der Cloud verwendet werden sollen, hängt von der Größe und Komplexität des Designs, der Prozesstechnologie und der Komplexität der Regeln ab. Der optimale Punkt befindet sich in der Kurve dieser Diagramme um das »Knie« herum (für das Design aus Bild 2 sind das etwa 500 Remote-Kerne). Die Speicher-Spitzenauslastungsdiagramme zeigen, dass noch viel Raum für einen physischen Speicher vorhanden war – jeder Remote-Speicher verfügte über 1 TB RAM. Die Kosten für diese Durchläufe liegen normalerweise im Bereich von einigen hundert Dollar. Calibre-Kunden verwenden typischerweise mindestens 500 Remote-Kerne an erweiterten Knoten für Calibre nmDRC-Durchläufe kompletter Chips. Die Daten bekräftigen das Wertversprechen von Calibre, das bei Nutzung moderater Mengen an Rechenressourcen durchgängig schnelle Durchlaufzeiten in Aussicht stellt. Die Daten zeigen jedoch auch, dass sich die Skalierbarkeit auf eine noch größere Anzahl von Kernen ausweiten lässt. Dies gibt Calibre-Benutzern die Freiheit, bei Bedarf die Zykluszeiten noch weiter zu komprimieren. 

Bild 3 zeigt ähnliche Ergebnisse für einen Calibre nmDRC-Durchlauf eines 5-nm-Designs von Annapurna. Auch hier liegt der optimale Punkt bei rund 500 Remote-Kernen mit einer Laufzeit von weniger als 5 Stunden.

Bild 3
Bild 3. Calibre nmDRC-Laufzeit und Remote-Speicher-Spitzenauslastung bei einer zunehmenden Anzahl von Remote-Kernen für das 5-nm-Design von Annapurna.
© Siemens EDA

Auch in diesem Fall zeigen die Daten, dass das Calibre nmDRC-Tool äußerst ressourceneffizient ist. Deshalb ist es nicht notwendig, zur Erzielung sinnvoller Designzykluszeiten Tausende von Remote-CPUs einzusetzen. Designteams können mit einer geringen Anzahl von Kernen und entsprechen geringen Kosten problemlos mehrere Durchläufe pro Tag durchführen. Falls es sinnvoll oder notwendig sein sollte, ein oder zwei weitere Designdurchläufe pro Tag einzuschieben, können sie die Anzahl auf 1.000 Remote-Kerne erhöhen. Der Vorteil des Betriebs in der Cloud besteht darin, dass zu jedem Zeitpunkt mehr Maschinen als benötigt zur Verfügung stehen, und dass sich weitere Maschinen wahrscheinlich sehr schnell hochfahren lassen.

Ergebnisse von interaktiven Calibre-Durchläufen

Beide Annapurna-Designs wurden mit der Benutzeroberfläche von Calibre DESIGNrev geöffnet, während die Calibre nmDRC- und Calibre nmLVS-Durchläufe aus der grafischen Benutzeroberfläche von Calibre Interactive aufgerufen wurden. Die Calibre Interactive-Integration wurde darüber hinaus mit dem Warteschlangenmanager Altair Accelerator (NC) bewertet und der Calibre RVE-Aufruf sowie das Cross-Probing für das Design wurden in der Calibre DESIGNrev-Schnittstelle evaluiert. Alle Abläufe von Calibre Interactive waren schnell und reaktionsfreudig.

Bewährte Methoden (BKM) für EDA Cloud Computing

Im Anschluss an die Benchmarks wurden die Ergebnisse ausgewertet, um die gewonnenen Erkenntnisse und Beobachtungen zusammenzufassen und daraus BKM für den Betrieb von Calibre-Anwendungen in der Cloud abzuleiten. Es wurden allgemeine BKM zur Optimierung der Cloud-Ausgaben, Verbesserung der Cloud-Performance und Optimierung des allgemeinen Erlebnisses bei der Nutzung cloudbasierter Ressourcen sowie spezielle BKM für den Lauf von Calibre-Workflows in der Cloud zusammengestellt. Diese BKM wurden dann zu Cloud Flight Plans zusammengefasst, die Anweisungen für Workflow-spezifische Optimierungen darstellen. Diese ermöglichen es Siemens EDA-Kunden, die Verfügbarkeit, Skalierbarkeit und Flexibilität des Cloud Computing auf äußerst kostengünstige Weise zu nutzen. Viele dieser Ressourcen stehen den Kunden über Cloud-Landingpages auf der Website von Siemens EDA zur Verfügung. Die Cloud-Referenzumgebung sowie weitere Workflow-spezifische Assets und Ressourcen sind für die Kunden auf der Ressourcen-Website Support Center verfügbar.

Das neueste technische Whitepaper, das BKMs für Amazon Web Services (AWS) beschreibt und sich als Benchmark auf Erfahrungen von Annapurna Labs stützt, steht zum Download zur Verfügung. Betrieb von Calibre-Lösungen in der Cloud: bewährte Methoden (BKM).

Christopher Clee
Autor: Christopher Clee ist Calibre Product Engineer bei Siemens EDA und verantwortlich für Cloud- und High-Performance-Computing-Lösungen. Seine jahrzehntelange EDA-Karriere umfasst das gesamte Spektrum der Branche, vom Design auf Systemebene und der funktionalen Verifizierung bis hin zu Back-End-IC-Tools und PCB-Design.
© Siemens EDA

Fazit

Cloud Computing bietet im Bereich Electronic Design Automation (EDA) eine überzeugende Lösung für das Problem der ständig zunehmenden Größe und Komplexität elektronischer Designs. Mit cloudbasierten Maschinen ausgestattete Designteams können schneller arbeiten und bei Bedarf Aufträge schneller starten, Ressourcen effizienter nutzen und sogar mehrere Aufgaben parallel ausführen. Ob es nun um eine Beschleunigung von Designzyklen oder eine Optimierung der Kosten geht – die Cloud bietet Flexibilität. Für eine optimale Nutzung der Cloud-Landschaft sind gute Kenntnisse über Cloud-Ressourcen und ihre Konfigurationsmöglichkeiten sowie zu deren Optimierung entscheidend. Siemens EDA hat in Zusammenarbeit mit großen Cloud-Anbietern wie AWS unter der Bezeichnung „Cloud Flight Plans“ Anleitungen zur optimalen Cloud-Nutzung entwickelt, um gemeinsame Designkunden im Rahmen ihres Nutzungserlebnisses der Cloud zu unterstützen. Cloud Flight Plans helfen Halbleiterentwicklern als Wegweiser dabei, einen stabilen Kurs in Richtung eines effizienten, cloudbasierten Entwicklungserfolgs einzuschlagen.


Lesen Sie mehr zum Thema


Das könnte Sie auch interessieren

Jetzt kostenfreie Newsletter bestellen!

Weitere Artikel zu Mentor Graphics (Deutschland) GmbH

Weitere Artikel zu Mentor Graphics (Deutschland) GmbH Mechanical Analysis Div.

Weitere Artikel zu EDA (Halbleiterentwicklung)