Das Institute of Science and Technology Austria (ISTA) investiert in ein Rechencluster von mehr als 100 NVIDIA H100 Tensor Core Grafikprozessoren (GPUs), um seine Recheninfrastruktur für Machine Learning in der akademischen Forschung zu erweitern.
Im KI-Zeitalter und mit Generative AI machen KI-Forschung und Machine Learning riesige Sprünge, die vor allem vom Privatsektor vorangetrieben werden. Mit einer Investition von 3,6 Millionen Euro in NVIDIA H100 Tensor Core Grafikprozessoren (GPUs) steigert das ISTA seine Rechenkapazitäten für das Training von Deep-Learning-Algorithmen: Large Language Models (LLMs) werden für Generative AI und Machine Learning in der akademischen Forschung eingesetzt.
»Die Installation des neuen NVIDIA-GPU-Clusters am ISTA bietet leistungsstarke Rechenkapazitäten, um LLMs zu trainieren und Spitzenforschung voranzutreiben«, sagte John Josephakis, Global Vice President of Business Development für High-Performance Computing (HPC) und Supercomputing bei NVIDIA. »Das Cluster wird dazu beitragen, Durchbrüche zum Beispiel in den Biowissenschaften, einschließlich der Strukturbiologie und der Neurowissenschaften, voranzutreiben, um wissenschaftliche Erkenntnisse und Bildung zu fördern.«
Die NVIDIA H100 Grafikprozessoren-(GPU)-Knoten sind Teil einer größeren Modernisierung des ISTA High-Performance Computing (HPC) Clusters. Die aufgerüstete Infrastruktur besteht aus zwei neuen NVIDIA-GPU-Knotentypen mit sich ergänzenden Funktionen zusätzlich zur Modernisierung bestehender CPUs. Der erste neue GPU-Knotentyp besteht aus 13 Knoten, die jeweils acht NVIDIA HGX H100 Systeme enthalten. Zusammen erreichen die H100-Knoten eine Spitzenrechenleistung von 416 petaFLOPS. Mit über 100 starken GPUs ist dieser Teil des Clusters darauf ausgelegt, komplexe KI-Aufgaben zu bewältigen: Das sind zum Beispiel das Training von LLMs ähnlich wie ChatGPT oder von Anwendungen wie dem KI-Programm AlphaFold zur Vorhersage von Proteinstrukturen.
Der zweite neue GPU-Knotentyp besteht aus 12 Knoten, die jeweils vier L40S GPUs von NVIDIA enthalten, und ist auf grafische Anwendungen, die das Training kleinerer Modelle erfordern, spezialisiert. Solche Anwendungen sind zum Beispiel strukturbiologische Berechnungen und Bildanalyse, etwa in der Kryo-Elektronenmikroskopie. Teil dieser zweiten Erweiterung ist der Austausch älterer Grafikprozessorsysteme, in dem mehr als 150 NVIDIA-Grafikprozessoren der vorherigen Generation weiter in Betrieb sein werden.
Zusätzlich zu den beiden neuen GPU-Knotentypen werden die modernisierten CPUs 147 Millionen Kernstunden pro Jahr liefern (eine Stunde CPU-Betrieb entspricht einer Kernstunde). Die 147 Millionen Kernstunden pro Jahr wurden aus den Nutzungsdaten der letzten Jahre, dem zusätzlichen Bedarf der bestehenden Forschungsgruppen und dem erwarteten Bedarf neuer Professor:innen in den kommenden Jahren abgeleitet. Das ISTA hat derzeit über 80 aktive Forschungsgruppen und soll bis 2036 auf 150 Gruppen anwachsen.