DLR-Querschnittsprojekt Nutzung von großen wissenschaftlichen Datensätzen

Erst effektive Datenanalysen oder intelligente Vernetzungen ermöglichen die systematische Auswertung und Nutzung von Daten.
Erst effektive Datenanalysen oder intelligente Vernetzungen ermöglichen die systematische Auswertung und Nutzung von Daten.

Große Datenmengen sind nicht nur ein Thema des IoTs sondern auch der Raumfahrt. Satelliten und Forschungsprojekte generieren eine unzählbare Anzahl an Daten. Um diesen Berg an Informationen sinnvoll zu nutzen, hast das DLR ein interdisziplinäres Projekt gestartet: Big Data Plattform.

Wie können immer größere wissenschaftliche Datenmengen verarbeitet und ausgewertet werden? Und wie kann man Erdbeobachtungsdaten mit Messungen am Boden sinnvoll kombinieren und damit neue Informationsquellen erschließen?

Im Querschnittsprojekt Big-Data-Plattform erarbeiten Wissenschaftler des Deutschen Zentrums für Luft- und Raumfahrt (DLR) Methoden für den Zukunftsbereich Big Data Science. In dem interdisziplinären Forschungsprojekt arbeiten 21 DLR-Institute aus den Forschungsbereichen Raumfahrt, Luftfahrt, Verkehr, Energie und Sicherheit zusammen. Das Projekt hat eine Laufzeit von vier Jahren und ein Finanzvolumen von über 21 Millionen Euro.

Zusammenführen von unterschiedlichen Datensätzen

»Wir verfügen bereits in vielen Bereichen über große Erfahrungen im Bereich Big-Data-Science, zum Beispiel in der Fernerkundung, in der Verkehrsforschung und bei detaillierten Computersimulationen in der Luftfahrt. Mit dem breit aufgestellten Projekt Big-Data-Plattform können wir Synergieeffekte aus unseren unterschiedlichen Forschungsbereichen hervorragend nutzen.« sagte Prof. Pascale Ehrenfreund, Vorstandsvorsitzende im DLR über Big-Data-Plattform.

Ein wichtiges Ziel des Projekts ist die Entwicklung von Methoden zur Analyse großer Datensätze. Zudem arbeiten die Forscher an Datenmanagementtechniken, die das Zusammenführen von heterogenen Datensätzen ermöglichen. Durch die Verknüpfung unterschiedlicher Datensätze, etwa von Satellitenbildern mit Gebäudeaufnahmen, die in den Sozialen Medien veröffentlicht wurden, können neue, bislang nicht erkennbare Informationen abgeleitet werden. Dadurch lassen sich zum Beispiel unterschiedliche Stadtgebietstypen viel besser voneinander unterscheiden.

Data-Mining und maschinelles Lernen

Ein weiterer Fokus liegt auf der Erforschung von Analyseverfahren, die Data-Mining und maschinelles Lernen nutzen. Data-Mining umfasst dabei die Analyse von Daten mit dem Ziel, Informationen und Gesetzmäßigkeiten »aufzuspüren«. Beim maschinellen Lernen sollen hingegen nicht nur Muster und Gesetzmäßigkeiten erkannt werden - das System soll vielmehr seine Fähigkeiten durch Verarbeitung von Trainingsdatensätzen weiterentwickeln.

In der Erdbeobachtung beispielsweise können Datensätze mit selbstlernenden Systemen besser und schneller interpretiert werden. Dadurch lassen sich Gebäude, Straßen oder auch Vegetationstypen aus Luft- und Satellitenbildern wesentlich genauer ableiten. Maschinelle Lernverfahren bilden ferner einen wichtigen Baustein zum Aufbau von Systemen im Bereich autonomes Fahren und intelligente Mobilität.

Ein konkretes Anwendungsbeispiel ist die hochgenaue Ableitung von Straßen und Straßenmarkierungen, mit der in einer Echtzeit-Analyse freie Parkplätze in einer Stadt herausgefiltert werden können.