Steigerung der Verarbeitungsleistung ermöglicht direkten Anschluss von DDR2-DRAMs Turbo für den Core

Mit einer Reihe von Modifikationen hat ARC die Leistungsfähigkeit des ARC750D-Cores an der Schnittstelle zu DDR2-Speichern signifikant erhöht. Herausgekommen ist dabei ein Core, der bei einer Taktfrequenz von 533 MHz eine Rechenleistung von über 800 MIPS liefert. Welche Veränderungen und Optimierungen die Prozessorarchitekten vorgenommen haben, lesen sie in diesem Artikel.

Steigerung der Verarbeitungsleistung ermöglicht direkten Anschluss von DDR2-DRAMs

Mit einer Reihe von Modifikationen hat ARC die Leistungsfähigkeit des ARC750D-Cores an der Schnittstelle zu DDR2-Speichern signifikant erhöht. Herausgekommen ist dabei ein Core, der bei einer Taktfrequenz von 533 MHz eine Rechenleistung von über 800 MIPS liefert. Welche Veränderungen und Optimierungen die Prozessorarchitekten vorgenommen haben, lesen sie in diesem Artikel.

Eine ganze Serie von Modifikationen hat die Verarbeitungsleistung der konfigurierbaren Cores aus der ARC700-Familie beachtlich erhöht. Die entsprechenden Modifikationen identifizierte ARC durch eine intensive Untersuchung von Code, den Kunden, andere Unternehmen der Branche und ARC selbst geschrieben haben. Dank der Modifikationen steigt die Verarbeitungsleistung der Cores beim Einsatz von realem Kunden-Code um 15 bis 30 %. Die Spitzen-Leistung schießt so auf 813 Dhrystone-MIPS in die Höhe, während die Taktfrequenz auf ein Minimum von 533 MHz in einem generischen 0,13-µm-Prozess ansteigt.

Diese Taktfrequenz reicht aus, um die neueste Generation von DDR-2-Speichern anzuschließen, und ermöglicht den Einsatz der konfigurierbaren Core-Familie in neuen wichtigen Anwendungen.

Die Prozessorfamilie ARC700 ist intern durch eine siebenstufige Pipeline (Bild 1) gekennzeichnet und stützt sich auf „Out-of-Order“-Ausführungs-Einheiten, bei denen jeweils ein Befehl pro Taktzyklus abgearbeitet wird (Single Instruction Issue). Die Cores sind für SoCs (Systems on Chip) konzipiert und bieten sowohl spezielle DSP- und Gleitkomma-Befehle als auch die Möglichkeit, kundenspezifische Befehle zu definieren, um so die Ausführung spezifischer Aufgaben zu beschleunigen. ARCs patentierte Fähigkeiten im Bereich der Konfigurierung von Cores lassen sich nutzen, um die Cores an eine spezifische Anwendung anzupassen, sodass sich ein optimales Verhältnis zwischen Verarbeitungsleistung und Chipfläche ergibt.

Konfigurierbare Cores wurden bisher schon oft für dedizierte Funktionen sowie als Coprozessoren innerhalb von SoCs genutzt. Mit dieser signifikanten Erhöhung der Verarbeitungsleistung kann ein Core aus der Prozessorfamilie 700 auch die Funktionen des Host-Prozessors übernehmen, die zuvor von den schnellsten Cores mit fester Architektur erledigt wurden. Solche Cores mit fester Architektur sind beispielsweise von ARM bzw. MIPS Technologies erhältlich.

Es gibt einige vorkonfigurierte Implementationen für die Core-Familie 700 von ARC, die allesamt von der erhöhten Verarbeitungsleistung profitieren. ARCs Design-Team nutzte die im Rahmen der Untersuchung gewonnenen Daten und durchforstete systematisch alle Elemente des Code, in denen es zu Verzögerungen kam, um anschließend das Design so zu verändern, dass die Verzögerungen behoben wurden. Exakt durch diese Maßnahmen erzielt ARC eine deutliche Steigerung der Verarbeitungsleistung (Bild 2).

Vorkonfigurierte ARC700-Cores

Der ARC-Core 750D (Bild 3) enthält Cache-Speicher sowie eine Memory Management Unit (MMU). Mit seiner höheren Verarbeitungsgeschwindigkeit ist er in der Lage, einen mit 533 MHz getakteten DDR-Speicher direkt zu bedienen, sodass er sich ideal als System-Host-Prozessor eignet, auf dem ein anspruchsvolles Betriebssystem wie beispielsweise Linux läuft. Ein derartiger Core kann beispielsweise in SoCs für Anwendungen wie PDAs, Information-Tablets, High-End-Media-Player und Settop-Boxen sowie in Telematik-Applikationen im Automobil zum Einsatz kommen.

Mit zusätzlichen DSP- oder Gleitkomma-Befehlen ist der Core in der Lage, Funktionen abzuarbeiten, die zuvor nur in Coprozessoren oder mit dedizierter Hardware erledigt werden konnten. Wenn derartige Hardware-Elemente nicht mehr integriert werden müssen, dann verringern sich Größe und Kosten des SoC.

Der ARC-Core 725D umfasst zwar Cache-Speicher, aber keine MMU. Er könnte zum Beispiel in Kombination mit DDR2-Speichern genutzt werden, um ein nichtgeschütztes Betriebssystem wie uCLinux laufen zu lassen. Der ARC-Core 710D nutzt anstelle der Cache-Speicher eng gekoppelte Speicher für Embedded-Anwendungen. Dieser Core lässt sich nicht direkt mit dem Systemspeicher verbinden.