Autonome Scanner, KI-generierte Befunde und Bestrahlungspläne in Sekunden statt Tagen – Tobias Heimann, Head of AI bei Siemens Healthineers, über aktuelle Medizin-KI, ihr Potenzial und ihre Grenzen. Die Technik läuft: Wenn Vertrauen Designanforderung ist, ist die Integration der schwierigste Teil.
Tobias Heimann: Zuerst einmal hätte ich damals nie gedacht, dass sich das Feld so schnell entwickelt. Mein Chef an der Uni sagte noch, die offenen Probleme reichten für eine ganze Forschergeneration. Viele davon sind heute gelöst – und das in einem Tempo, das mich ehrlich überrascht hat. Was mich am meisten beeindruckt: Probleme, die wir jahrelang als extrem schwer oder unlösbar betrachtet haben, sind mit dem Aufkommen der Deep-Learning-Technologie quasi über Nacht gefallen – es gab Fälle, da wurden rund 20 Jahre Forschungsarbeit einer ganzen Gruppe schlagartig obsolet.
Das illustriert ganz gut, welchen Sprung wir erlebt haben. Dass ein Modell heute ein medizinisches Bild analysiert, den Inhalt präzise beschreibt und dabei klinischen Kontext einbezieht – das wäre vor 25 Jahren undenkbar gewesen. Die grundsätzliche Frage, ob KI medizinische Bildgebung revolutionieren kann, stellt sich für mich längst nicht mehr. Die Frage ist jetzt eine andere: Wie bringen wir das robust, sicher und wirklich nützlich in den klinischen Alltag?
Wir sind als »KI Deutschland« innerhalb der Technologiesparte von Siemens Healthineers angesiedelt und Teil des weltweiten »Healthcare AI Centers«. Zum einen beobachten wir sehr früh, was sich technologisch am Horizont abzeichnet – auf akademischen Konferenzen, in Forschungsprogrammen, in EU-Projekten, an denen wir mitwirken. Was für uns interessant werden könnte, evaluieren wir gemeinsam mit klinischen Partnern und Universitäten.
Zweitens arbeiten wir eng mit den jeweiligen Geschäftsbereichen zusammen – also CT, MRT, Röntgen oder Ultraschall –, um eine potenziell reife Technologie in die nächste Produktgeneration zu bringen. Man kann sich das so vorstellen: Wir sind das zentrale Kompetenzzentrum für KI und maschinelles Lernen im Unternehmen. Unsere Experten sind zum Großteil promovierte Wissenschaftler, die wirklich an den Modellen und den Methoden arbeiten. Wir liefern die technologische Grundlage, auf der dann die Translation in konkrete Produkte in den jeweiligen Geschäftsbereichen aufbaut.
KI ist längst kein Hype-Thema mehr, die erste Euphorie ist vorbei. Ich werte das als gutes Zeichen, denn jetzt verändern sich die Fragen: Es geht nicht mehr darum, was ein System kann, sondern was es im täglichen Betrieb wirklich bringt. Effizienter arbeiten, mehr Bilder begutachten, weniger Fehler machen. Das sind die Maßstäbe, an denen KI jetzt gemessen wird.
Und wirklich breit angekommen ist die Technologie in der Radiologie trotzdem noch nicht. Es gibt Kliniken und Praxen, die ganz vorne dabei sind und KI vollumfänglich nutzen – aber global betrachtet sind die Zahlen dennoch überschaubar. Wir haben den Test- und Prototypenstatus hinter uns gelassen, aber die eigentliche Frage »Was bringt die Technologie konkret im Arbeitsalltag?« wird erst seit Kurzem ernsthaft gestellt. Und diesen Beweis müssen wir als Industrie noch erbringen – gemeinsam mit klinischen Partnern. Ich bin überzeugt: Je mehr belastbare Evidenz vorliegt, desto stärker wird die Adaption.
Die Praxen, die bei KI vorn dabei sind, würden den Buddy-Begriff sicher unterschreiben – nur ist das eben noch längst nicht überall so. Trotzdem würde ich sagen, die Prognose ist immer noch »on track«: Immerhin liegen noch zwei bis sieben Jahre vor uns, und der Druck in den Radiologien wächst. Mehr Fälle, mehr Bilder, aber nicht annähernd so viele neue Radiologen. Je stärker dieser Druck wird, desto größer wird auch die Bereitschaft, Aufgaben abzugeben. Das ist kein schlechter Treiber für den flächendeckenden Einsatz der Künstlichen Intelligenz.
Der Weg ist immer länger, als man denkt – auch wenn die Technologie eigentlich bereit scheint. Der Kern unserer Arbeit ist, KI nicht als Feature zu entwickeln, sondern von einem konkreten klinischen Problem her zu denken: Was wollen wir erreichen, was braucht der Kunde? Das ist ein wichtiger Filter. Bei einem Unternehmen unserer Größe und Verantwortung muss man sehr nüchtern und sicherheitsbedacht herangehen. Als Forscher sehe ich technologisch noch deutlich mehr Möglichkeiten, als wir aktuell ausschöpfen.
Doch die eigentliche Hürde liegt in der Validierung und der Integration. Einen Prototypen zu bauen, der funktioniert, ist eine Sache. Ein zertifiziertes Produkt, das in verschiedensten klinischen Umgebungen stabil und robust läuft, ist eine andere. Dazwischen liegt viel Arbeit – technisch, regulatorisch, klinisch. Und die Workflows, in die KI eingebettet werden muss, sind überall anders. Auch wenn es vielen zu langsam geht: Das ist keine Bremse, die wir wegdiskutieren können. Das ist die eigentliche Integrationsarbeit.
Dieser Eindruck täuscht ein wenig. Unsere Plattformen sind offen – externe Anbieter sind willkommen, und wir arbeiten dort, wo es sinnvoll ist, mit Drittanbietern zusammen. Bei der Mammografie etwa integrieren wir die Systeme von ScreenPoint direkt in unsere Produkte. Und über unseren Marktplatz können passende Anbieter wie in einem App-Store andocken.
Der Unterschied liegt eher im Fokus: Wir sehen KI als Werkzeug, um die CT-, MRT-, Röntgen- und Ultraschallgeräte, die wir bauen, besser und zugänglicher zu machen – nicht als Plattformstrategie um ihrer selbst willen. Das mag von außen wie ein geschlossenes Ökosystem wirken. Aber dahinter steckt eine andere Priorität: Wir fragen zuerst, wo der höchste klinische Bedarf ist – und setzen KI genau dort ein.
Nehmen Sie unsere 0,55-Tesla-MRT-Scanner. Die können wir - auch dank der KI-basierten Bildrekonstruktion - so kompakt bauen, dass sie in Räume passen, wo baulich bisher kein MRT möglich war. Das weitet die Versorgung grundsätzlich aus. In der Praxis scheitert moderne Technologie aber oft daran, dass vor Ort geschultes Personal fehlt, das das Gerät wirklich beherrscht – egal ob in Schwellenländern, den USA oder hier in Europa. Sollte die geschulte Fachkraft den Job wechseln, steht da ein Hightech-Gerät und wird nur noch auf Basisniveau genutzt.
Das ist zumindest der Ansatz. Wir arbeiten daran, den Scanvorgang so weit zu automatisieren, dass tiefes Spezialwissen keine Voraussetzung mehr ist. Beim CT haben wir als erster Hersteller eine 3D-Kamera eingeführt, die den Patienten auf dem Tisch vermisst und die Position automatisch optimal einstellt – denn der Patient muss möglichst präzise im Iso-Zentrum liegen, damit die Bildqualität stimmt. Inzwischen gibt es ein äquivalentes System auch für den MRT. Der nächste Schritt ist das Verstehen der Scan-Indikation, und der ist wesentlich komplexer: Im klinischen Alltag steht oft nur eine kurze Freitextnotiz dabei, warum ein Patient gescannt wird. Damit der Scanner das, zusammen mit der Patientenhistorie und vielleicht auch früheren Aufnahmen, interpretieren und sich selbst optimal einstellen kann, brauchen wir Sprachmodelle, die diesen Freitext wirklich verstehen. Das Ziel ist ein System, das funktioniert wie eine moderne Kamera: einmal auf den Auslöser drücken, den Rest erledigt die Maschine.
Das ist unser zweiter große Arbeitsbereich. Mit dem »AI-Rad Companion« haben wir seit einigen Jahren ein Produkt, das bei der Befundung unterstützt – das System erkennt auffällige Befunde, markiert sie und legt dem Radiologen eine Liste vor: Hier könnte ein Lungenknoten sein, hier eine Verkalkung in den Koronarien. Der Radiologe bestätigt oder verwirft. Das sichert eine gewisse Mindestqualität – auch bei weniger erfahrenem Personal.
Was diese Generation aber noch nicht leistet, ist echte Effizienzsteigerung. Wir messen rund 20 Prozent Zeitersparnis; das ist nicht schlecht, aber weit von dem entfernt, was möglich ist. Denn der eigentliche Zeitfresser ist nicht das Bildschauen, sondern die Dokumentation. Die nächste Generation wird den Bericht gleich vorschreiben, der Radiologe prüft nur noch: Passen Bild und Text zusammen?
Technisch haben wir Prototypen, die das heute schon können. Wir evaluieren dafür unter anderem verschiedene Sprachmodelle – auch offene – und prüfen, ob sie robust genug sind oder noch nachtrainiert werden müssen. Bis zur Produktreife bleibt aber noch Arbeit: Validierung, Zertifizierung, stabile Integration in unterschiedlichste klinische Umgebungen.
Das ist nicht nur eine sehr wichtige ethische, sondern vor allem eine sehr konkrete Designfrage. Human Oversight bedeutet nicht, dass der Arzt jeden Algorithmusschritt nachvollziehen muss – aber er muss jederzeit eingreifen, prüfen und überschreiben können, möglichst einfach. Das muss als Grundprinzip in der Software verankert sein. Beim Thema Erklärbarkeit unterscheide ich gerne zwei Ebenen. Die akademische Frage, wie ein neuronales Netz intern zu einem Ergebnis kommt, ist im klinischen Betrieb meist nicht entscheidend.
Was zählt, ist: Warum schlägt das System diesen Befund vor – und wie kann ich das als Arzt nachvollziehen und gegebenenfalls korrigieren? Das ist der Unterschied zwischen einer Blackbox-Technologie und einem Produkt, das wirklich klinisch einsetzbar ist. Wir haben dafür ein eigenes Team, das sich nur mit User Experience beschäftigt – also mit der Frage: Wie stellen sich Nutzer das ideale System vor, und wie können wir das technisch umsetzen? Das ist schlussendlich entscheidend für die Akzeptanz.
Das ist für mich einer der spannendsten Bereiche, weil der Hebel so groß ist. Eine Bestrahlungsplanung dauert heute je nach Fall mehrere Tage – Simulation, Abstimmung zwischen Experten, Korrekturen, wieder Simulation. Das kostet Zeit, die der Patient nicht hat. Unser Ziel ist, das mit KI radikal zu verkürzen: interaktive Planung in Echtzeit, sofortige Berechnung, alle Beteiligten synchron am Tisch, ob nun virtuell oder vor Ort. Statt Tagen sprechen wir dann über Minuten oder vielleicht bald sogar Sekunden. Für den Arzt ergibt sich damit ein völlig anderer Workflow. Weg von sequenziellen Abstimmungsschleifen, hin zu einer gemeinsamen, dynamischen Entscheidungssituation.
Auf jeden Fall, und es wäre auch für die Patienten ein wirklicher Fortschritt: Bei Tumoren im Abdomen etwa verändert sich die Anatomie schnell – je kürzer der Weg von der Bildgebung zur Therapie, desto präziser der Plan. Und psychologisch macht es einen großen Unterschied, ob jemand nach der Diagnose tagelang wartet oder ob Diagnose und Therapiebeginn unmittelbar zusammenrücken.
Wir beobachten das sehr genau, intern wie extern. Das Potenzial ist offensichtlich: Genau diese mehrstufigen Prozesse, wo verschiedene Informationsquellen zusammenlaufen und koordiniert werden müssen, sind der natürliche Einsatzbereich für agentische Systeme. Für die Therapieplanung oder eine komplexe Entscheidungsunterstützung ist das langfristig sehr interessant.
Aber große Sprachmodelle und agentische Systeme passen in die stark regulierte Medizinproduktewelt noch nicht so einfach hinein. In Dokumentation oder Abrechnung sind solche Systeme schon deutlich weiter. Im klinischen Kernbereich, wo Entscheidungen unmittelbar patientenrelevant sind, braucht es noch Zeit, belastbare Validierung und vor allem eine klare regulatorische Einordnung.
In fünf Jahren werden KI-generierte Befundvorschläge in der Radiologie keine Ausnahme mehr sein, sondern die Normalität. Scanner werden deutlich autonomer arbeiten. Und die Strahlentherapie wird sich weg von tagelangen Planungsschleifen hin zu validen Sofortentscheidungen fundamental verändern. Die Technologie dafür haben wir heute bereits – weitere inkrementelle Sprünge sind da noch gar nicht mitgedacht.
Die Grenze liegt für mich nicht in der Technologie selbst, sondern im Vertrauen. Künstliche Intelligenz wird in der Medizin nur dann wirklich wirksam, wenn Ärzte ihr vertrauen. Klare Nachvollziehbarkeit und echte Kontrollmöglichkeiten sind harte Designanforderungen. Systeme, die dieses Vertrauen nicht verdienen, werden sich nicht durchsetzen – egal wie leistungsfähig sie sind. Die eigentliche Arbeit der nächsten Jahre ist nicht die Technologie: Es ist die Integration – in Systeme, in Workflows, in Köpfe.