Micron Insight

Neue KI-Plattform und chipbasiertes Security-as-a-Service

24. Oktober 2019, 20:45 Uhr | Frank Riemenschneider
Microns Technologiekonferenz "Insight" findet 2019 am Pier 39 in San Francisco statt.
© Frank Riemenschneider, ELEKTRONIK

Auf seiner Technologiekonferenz „Insight“ in San Francisco hat Sanjay Mehrotra, CEO des US-Chipherstellers Micron zwei Ankündigungen im Bereich KI und IoT-Sicherheit gemacht. Eine CEO-Runde fordert neue Speicherarchitekturen, um den gigantischen durch KI und IoT erzeugten Datenmengen Herr zu werden.

Diesen Artikel anhören

In seiner Keynote kündigte Microns CEO Sanjay Mehrotra (Bild 1) die Übernahme von FWDNXT, einem Start-up-Unternehmen für Soft- und Hardware für Deep-Learning-Anwendungen, an. In Kombination mit den hauseigenen Speicherprodukten ermöglicht die KI-Hard- und Softwaretechnologie von FWDNXT (ausgesprochen „forward next“) Micron die Erforschung von Deep-Learning-Lösungen, die für die Datenanalyse, insbesondere im Bereich IoT und Edge Computing, erforderlich sind. Mit dieser Übernahme integriert Micron Computing, Speicher, Tools und Software in eine umfassende KI-Entwicklungsplattform.

FWDNXT ist eine Architektur, die entwickelt wurde, um schnelle Time-to-Market-KI-Lösungen durch ein extrem einfach zu bedienendes Software-Framework mit breiter Modellierungsunterstützung und Flexibilität zu schaffen. Die fünf Generationen der ML- Inferenz-Engine-Entwicklung und neuronalen Netzwerkalgorithmen von FWDNXT kombiniert mit Micron‘s Speicherprodukten sollen komplexeste und anspruchsvollste Edge-Anwendungen ermöglichen.

FWDNXT bietet effiziente und leistungsstarke Hard- und Softwarelösungen auf Basis von Deep Learning und neuronalen Netzwerken an. Da Unternehmen immer komplexere KI- und maschinelle Lernsysteme entwickeln, wird die Hardware, mit der diese Modelle trainiert und ausgeführt werden, immer wichtiger.

Die Micron Deep Learning Accelerator (DLA)-Technologie, basierend auf der KI-Inferenzmaschine von FWDNXT, soll Speicher und Rechenwerke wie CPUs/GPUs/KI-Beschleuniger näher zusammenbringen, was zu höherer Rechenleistung und geringerer Leistungsaufnahme führt. Die DLA-Technologie bietet eine einfach zu bedienende, softwareprogrammierbare Plattform, die eine breite Palette von maschinellen Lernframeworks und neuronalen Netzwerken unterstützt und die schnelle Verarbeitung großer Datenmengen in einer einfach zu bedienenden Oberfläche ermöglicht.

So arbeitet Micron laut Mehrotra beispielsweise mit Ärzten und Forschern der Oregon Health & Science University zusammen, um CNNs auf DLA-Basis zur Verarbeitung und Analyse von 3D-Elektronenmikroskopie-Bildern zu nutzen. Ziel dieser Zusammenarbeit ist es, neue Erkenntnisse für die Behandlung von Krebs zu gewinnen. Micron arbeitet auch mit Physikern führender Kernforschungseinrichtungen zusammen, die mit DLA-basierten CNNs experimentieren, um die Ergebnisse von hochenergetischen Partikelkollisionen in nahezu Echtzeit zu klassifizieren und seltene Partikelinteraktionen zu erkennen, von denen angenommen wird, dass sie in der Natur vorkommen.


Micron Insight
Bild 1. Microns CEO Sanjay Mehrotra hielt die Keynote auf der Insight-Konferenz 2019 in San Francisco.
© Frank Riemenschneider, ELEKTRONIK

Erste Security-as-a-Service Plattform für IoT Edge Devices auf Siliziumbasis

Als zweites stellte Mehtrotra in seiner Keynote die erste siliziumbasierte Security-as-a-Service-Plattform zum Schutz von Internet of Things (IoT)-Edge-Geräten vor. Die sogenannte Micron Authenta Key Management Service (KMS)-Plattform ermöglicht ein Cloud-first-Implementierungsmodell für eine Vielzahl von Industrie- und Automobilanwendungen. Es ermöglicht die Aktivierung installierter Authenta-fähiger Geräte über einen Cloud-basierten Dienst, wodurch einige der größten Herausforderungen im Zusammenhang mit der Sicherung von Devices in einer „everything connected“-Umgebung adressiert wird.

Die Anzahl der angeschlossenen IoT-Devices, die in Märkten wie Automotive, Enterprise, Industrial Control und Connected Home eingesetzt werden, wird voraussichtlich von 23 Milliarden im Jahr 2019 auf 30 Milliarden im Jahr 2020 steigen. Die Sicherung dieser vielfältigen Produkte bleibt ein Anliegen der System-OEMs, die eine einfache Lösung suchen, die kostengünstig und unabhängig von ihrer Wahl der System-On-A-Chip (SoC)-Hardware ist. Authenta KMS und seine in NAND- und NOR-Flash-Speicher eingebettete Hardware-Root-of-Trust können Device-Funktionalität auf Siliziumebene gewährleisten.

Die derzeitigen Methoden zum Schutz vernetzter Devices haben ihre Grenzen und konzentrieren sich typischerweise auf eine von drei gebräuchlichen Methoden: das Hinzufügen von Secure Elements, die kostspielig und schwer zu skalieren sind; die Nutzung der sicheren Key-Injection im SoC, was eine fragmentierte Architektur schafft; oder einfach nichts tun, wie wir auf Arms Entwicklerkonferenz TechCon erst vor kurzem wieder gehört haben und was natürlich überhaupt keine Lösung ist.

Die Sicherung einer Vielzahl von IoT-Edge-Geräten über den gesamten Produktlebenszyklus - von der Lieferkette bis zum In-Field-Management - erfordert laut Micron einen neuartigen, einfachen, skalierbaren und kostengünstigen Ansatz. Authenta KMS bietet einen zuverlässigen Silicon-to-Cloud-Service für alle „vernetzten Dinge“ mit Authenta-fähigen Flash-Speichern. Die Plattform ermöglicht es, installierte sichere Flash-Devices über einen Cloud-basierten Dienst zu aktivieren und zu verwalten. Diese Fähigkeit ermöglicht die Plattform-Härtung und den Schutz von Devices über den gesamten Lebenszyklus, von der Lieferkette in der Fertigung bis hin zur Installation und Verwaltung vor Ort. Authenta KMS und die dazugehörigen Software Development Kits stehen den Kunden ab sofort zur Verfügung.

Last but not least: SSDs mit 3D-NAND-Speicher

Natürlich betreibt der Speicherhersteller Micron neben allen neuen Geschäftsfeldern auch weiterhin sein Kerngeschäft und präsentierte auf der Insights-Konferenz auch zwei neue SSD-Familien. Die 7300-Serie adressiert Rechenzentren mit einem breiten Spektrum an virtualisierten, I/O-sensitiven Workloads und Hochdurchsatzumgebungen wie KI. Sie verwendet 96-Lyer- 3D-TLC-NAND-Speicher, um eine niedrige Leistungsaufnahme zu ermöglichen und die Gesamtbetriebskosten für Enterprise Cloud-Kunden zu senken.

Die 5300-Serie ist eine Familie von SATA-SSDs mit mehr Sicherheit und Zuverlässigkeit, tatsächlich ist es die erste SATA-SSD-Familie am Markt, die auf 96-Layer-3D-TLC-NAND basiert. Laut Micron wird damit die Ausfallzeit reduziert: Gemäß den Spezifikationen des Datenblattes hat die Micron 5300 SSD eine mittlere Ausfallzeit (MTTF) von 3 Millionen Gerätestunden, im Mittel sind es heute 2 Millionen Stunden bei SATA Enterprise-SSDs.

Micron Insight
Bild 2. Waren sich einig, dass radikale Veränderungen hermüssen, um riesigen Datenmengen energieeffizient Herr zu werden (v.l.n.r.): Dr. Lisa Su (CEO AMD), Lip-Bu Tan (CEO Cadence), Steve Mollenkopf (CEO Qualcomm) und Sanjay Mehrotra (CEO Micron).
© Frank Riemenschneider, ELEKTRONIK

Panel Diskussion mit vier CEOs - neue Architekturen notwendig

Neben der Keynote von Microns CEO war sicherlich eine hochkarätig besetzte Panel-Diskussion mit den CEOs von AMD (Dr. Lisa Su), Cadence (Lip-Bu Tan), Qualcomm (Steve Mollenkopf) und erneut Methrotra das Highlight der Konferenz. Das Thema war die Datenexplosion im Internet der Dinge und durch KI-Anwendungen. Heute werden erst 2 Prozent der generierten Daten analysiert, wohin der Weg gehen wird, zeigt der US-Konzern Walmart, der pro Stunde weltweit in seinen Niederlassungen 2,5 Petabyte Daten sammelt und analysiert, um seine Prozesse zu optimieren. Wenn man überlegt, dass heutige Systeme 80 % ihrer elektrischen Energie dafür verbrauchen, Daten vom Speicher zu den Rechenwerken - CPU, GPU, NPU,... - zu transferieren und zurück, ist es einfach zu verstehen, dass dieser traditionelle Ansatz keine Zukunft haben wird. Qualcomms CEO Mollenkopf wies darauf hin, dass alleine 5G so energiehungrig ist, dass die Hersteller von Mobilgeräten massive Probleme mit den Batterielaufzeiten zu erwarten haben, wenn nicht gleichzeitig Architektur-Veränderungen vorgenommen werden. Mollenkopf erklärte weiterhin, dass in China bis Ende 2019 bereits 100.000 5G-Basisstationen installiert sein werden und 5G-Mobilfunk Realität ist (wenn auch nicht in Deutschland, Anmerkung der Redaktion).

Einigkeit herrschte in der Runde darüber, dass die Datenverarbeitung näher an oder in den Speicher wandern muß.

Es gibt verschiedene Möglichkeiten, diese Aufgaben auszuführen. Zum Beispiel hat das Startup Mythic kürzlich eine Matrix-Multiplikator-Speicherarchitektur eingeführt. Es führt die Berechnungen im Speicher mit einer 40-nm-embedded NOR Flash-Technologie durch.

Dies unterscheidet sich von traditionellem Computing mit Prozessoren und Speicher. Wenn man einen Prozessor mit Hunderten von MB SRAM baut, kann man seine gesamte Anwendung darauf aufsetzen. Aber man muss noch das SRAM lesen und diese Daten zu den richtigen Verarbeitungselementen bringen. Mythic vermeidet das, indem die Firma die Verarbeitung direkt im Speicher selbst durchführt. Ziel ist es, diese Datenbewegung so weit wie möglich zu minimieren. Der Ansatz ist, die Daten überhaupt nicht zu verschieben, geschweige denn vom DRAM zum Chip.

Normalerweise speichert NOR-Flash Daten in einem Array von Speicherzellen. Mythic verwendet eine NOR-Bit-Zelle, ersetzt aber die digitale Peripherieschaltung durch Analog. Der Ansatz besteht darin, Analog-Computing innerhalb des Speicher-Arrays durchzuführen, das seinerseits digitale Schnittstellen hat. Mythic macht dies in einem 40-nm-Prozess, während sich diese anderen Systeme in viel kleineren Prozessknoten befinden. Während andere Systementwickler darum kämpfen, von 7 nm auf 5 nm zu kommen, skaliert Mythic auf 28 nm.

Es gibt auch andere neuartige Möglichkeiten, In-Memory-Computing-Aufgaben durchzuführen. Einige haben rein analoge Ansätze, während andere SRAM- und Kondensator-basierte Technologien entwickeln. Alle Technologien befinden sich in verschiedenen Entwicklungsstadien.

Ein weiterer spannender Ansatz ist das neuromorphe Computing, das ein anderes Paradigma mit zahlreichen Herausforderungen aufweist. In der Neuromorphologie können Impulse zu einem bestimmten Zeitpunkt eintreffen. Sie können sie auf bestimmte Weise quantisieren, aber es handelt sich um asynchrone Arten von Berechnungen. Es sind wirklich diese Impulse, die von den verschiedenen Axonen kommen. Sie kommen nicht in den gleichen Taktgrenzen, Die andere Frage ist, wie man es dem Programmierer einfach genug macht, diesen Ansatz zu benutzen. Ein Großteil der Arbeit geht somit in ein Nutzungsmodell im Software-Framework, um diesen Übergang zu vollziehen.

Wenn man sich die von Facebook auf Arms Entwicklerkonferenz TechCon im Oktober präsentierten Zahlen anschaut - ein DRAM-DAtentransfer zur/von der CPU benötigt 12.000x soviel Energie wie eine INT8-Addition in der CPU - wird schnell klar, was mit dem „Speicher-Bottleneck“ gemeint ist. Und wenn man sich dazu vor Augen führt, dass zukünftig 100 TeraOPS an Rechenleistung benötigt werden, um die generierten Datenmengen zu verarbeiten, leuchtet sehr schnell ein, dass die heutigen Speicherarchitekturen nicht dazu geeignet sind, energieeffizient DAtenanalysen und neuronale Netzwerke abzubilden.

Microns sogenannter QLC-NAND-Speicher mit 4 Bits pro Zelle - der einzige seiner Art in Massenproduktion - hilft natürlich durch seine Energieeffizienz weiter, kann aber auch nur ein erster Schritt sein. Radikalere Veränderungen an der Art, wie heutige Computing-Systeme aufgebaut sind, sind mittel- und langfristig unverzichtbar.


Lesen Sie mehr zum Thema


Das könnte Sie auch interessieren

Jetzt kostenfreie Newsletter bestellen!

Weitere Artikel zu MICRON SEMICONDUCTOR (Deutschland) GmbH