Kann man die Modifizierungen auf der CPU-Seite als moderat bezeichnen, trifft dies für die GPU, in der Vergangenheit oft auch als Schwachstelle der Intel-Produkte angesehen, gar nicht zu. Die stark parallelisierte Verarbeitung in Verbindung mit der höheren Logik-Dichte auf dem Chip führte schon in der Vergangenheit zu großen Fortschritten in einem „Tick“-Jahr und Broadwell ist da keine Ausnahme.
Grundsätzlich handelt es sich bei Broadwells GPU um eine Fortsetzung der Intel-Gen7-Grafikarchitektur, die erstmalig in Ivy Bridge auftauchte und in Haswell als Gen7.5 fortgeschrieben wurde. Es ist dieselbe GPU-Architektur, jedoch mit mehr Features und mehr Optimierungen als jemals zuvor.
Der wichtigste Fortschritt ist aber die Unterstützung der neuesten Grafik-APIs, ein Meilenstein für Intel, um endlich hier mit GPUs von AMD und Nvidia mithalten zu können. Mit DirectX 12.0. hat Intel sogar Nvidias Kepler- und Maxwell-Architektur abgehängt, die beide „nur“ DirectX 11.0. supporten. Die Unterstützung bedeutet auch, dass Intel jetzt auch das HLSL Shader Linking unterstützt. Damit wird es möglich, Shader vorab zu kompilieren und später schnell zu wechseln, je nachdem, welche Routinen gerade benötigt werden. Der Wechsel auf einen zuvor kompilierten Shader soll rund achtmal schneller sein als die Übersetzung zur Laufzeit. Eine andere Verbesserung betrifft die sogenannten Tiled Ressourcen. Diese neue Direct3D-Funktion sorgt dafür, dass immer nur die wirklich benötigten Ressourcen in den Grafikspeicher geladen werden. Statt also z.B. Texturen für einen ganzen Berg zu laden, müssen nur die notwendigen Ressourcen zur Darstellung der Bergspitze vorgehalten werden, wenn nur diese im Bild ist. Die dafür genutzten Ressourcen können dafür deutlich mehr Details enthalten, ohne dass insgesamt mehr Speicher belegt wird.
Boardwells GPU wird weiterhin auch OpenCL 2.0. inklusive dem geteilten virtuellen Speicher unterstützen. Da Intel kein Programmiermodell wie AMDs HSA (wo die CPU- und GPU-Cores gemeinsam universelle Aufgaben abarbeiten sollen) hat, kann man damit jetzt CPU und GPU einfacher kombinieren und besser auslasten, indem komplexe Datenstrukturen geteilt werden können statt sie zwischen CPU- und GPU-Speicher hin- und herkopieren zu müssen.
Wie auch Haswell-GPUs sind die Broadwell-GPUs wieder in verschiedene Unterbereiche organisiert, die Intel als Scheiben (Slices) bezeichnet. Im Gegensatz zu Haswell besteht jedoch die Intel HD Graphics 5300 (so der offizielle Name der 8. Generation) aus einer Slice mit statt 2 jetzt 3 Sub-Slices. Auf jeder Sub-Slice sitzen statt 10 jetzt 8 EUs bestehend aus 2x4 Vektor-SIMDs mit eigenem Local-Thread-Dispatcher, Instruktions-Cache und eigener Textur-Sampler-Einheit samt dedizierten L1- und L2-Caches. Die Lade-/Speichern-Operationen laufen über den Daten-Port, der 64 Bytes pro Taktzyklus lesen und schreiben kann.
Die Erhöhung der EUs um 20 % von 20 auf 24 ist allerdings nicht die einzige Veränderung. Vergößert wurde das Verhältnis von L1-Cache und Sampler relativ zu den EUs. Der Sampler-Durchsatz stieg um 25 % pro EU, in Summe bei gleicher Taktfrequenz also 50 %.
Selbst die Slices selbst hat Intel angefasst. Diese beinhaltet ja ROPs, Rasterung und einen Port für den L3-Cache und bekam Verbesserungen an der Mikroarchitektur spendiert, um die Pixel-Füllrate zu erhöht.
Durch diese Maßnahmen dürfte die Rechenleistung deutlich gesteigert werden. Für Core M steht zunächst im Vordergrund, sie trotz deutlich gesenkter Leistungsaufnahme moderat zu erhöhen. Die sparsamsten Haswells mit 11,5 Watt TDP und 20 EUs bei 850 MHz kommen auf 227 Gflops. Mit derselben Frequenz soll die Broadwell-GPU immerhin 326,4 Gflops erreichen - bei nur 4,5 Watt TDP. Die nächsten passiv gekühlten Tablets werden also eine höhere Grafikleistung haben können als die sparsamsten Ultrabooks des letzten Modelljahrgangs
Über die Jahre hat es Intel geschafft, die GPU-Leistungsaufnahme im Idle-Modus primär durch Absenken der Versorgungsspannung immer weiter zu drücken. Mittlerweile bewegt man sich jedoch nur geringfügig über der Transistor-Schwellenspannung, so dass dieser Weg nicht mehr weitergegangen werden konnte.
Stattdessen hat man das sogenannte Duty-Cycling eingeführt, bei dem die GPU im aktiven Modus nur noch bis 12,5 % der Gesamtzeit läuft und die restliche Zeit komplett abgeschaltet wird. Duty-Cycling ist für die Anwendungen und Nutzer unsichtbar, da der Display-Controller von der GPU-Taktversorgung abgekoppelt wird. Die Steuerung erfolgt von der GPU-Hardware und Intels Grafik-Treibern.
Multimedia mit 4K und H.265
Die Erhöhung der Slices und Sampler hat auch direkte Auswirkungen auf die Video-Ausgabe, konkret die Video-Quality-Engine und QuickSync. Der Durchsatz der Video-Quality-Engine verdoppelt sich sogar. Der Video-Decoder unterstützt beim AVC-Codes eine reine Hardware-basierte Codierung/Dekodierung von 4K bei 60 Frames/s, mit einem Hybrid-Ansatz jetzt auch H.265 bei 30 Frames/s. Dabei werden Teile in dem Dekoder-Hardware-Block und Teile in den Schattierern der GPU dekodiert, was energiehungriger ist als die reine Dekodierung in einem dedizierten Hardware-Block. Diesen Ansatz musste Intel – wie auch Nvidia bei Maxwell – wählen, da H.265 noch nicht fertig war, als Broadwells Entwicklung begann. In zukünftigen Produkten dürfte dann ein vollständiger Hardware-Dekoder implementiert sein. Auch der Display-Contoller erfuhr ein Update. Zwar unterstützt er immer noch nicht HDMI 2.0. oder DisplayPort 2.0., aber HDMI 1.4. und DisplayPort 1.2/eDP 1.3a in 4K-Auflösung (mit 24 respektive 60 Hz).