LeddarTech: Datensatz PixSet

»Ohne Zusammenarbeit funktioniert es nicht«

21. Mai 2021, 10:17 Uhr | Iris Stroh

Fortsetzung des Artikels von Teil 1

Pixset enthält Messdaten von unterschiedlichsten Sensoren

Beispiele der in PixSet enthaltenen Bilder, auf denen einzelne Objekte manuell mit 3D-Rahmen versehen wurden
Beispiele der in PixSet enthaltenen Bilder, auf denen einzelne Objekte manuell mit 3D-Rahmen versehen wurden
© LeddarTech

Erwarten Sie, dass LeddarTech im Gegenzug von den akademischen Forschungen selbst profitieren kann?

Das halte ich für ziemlich wahrscheinlich. Es gibt einige Aufgabenstellungen, die bislang noch keiner zufriedenstellend gelöst hat. Dazu zählt beispielsweise die Unterscheidung von festen, harten Objekten gegenüber weichen Objekten wie Blättern oder Plastiktüten oder auch eine Lokalisierung bei winterlichen Bedingungen mit Schnee auf der Straße. PixSet ist zwar eine längerfristige Investition, aber natürlich hoffen wir, dass auf Basis dieses Datensatzes im akademischen Umfeld technische Entwicklungen angestoßen werden, die uns in der Industrie weiterbringen.

Labeled Data sind rar. Wie war die Reaktion auf Ihren Datensatz?

Sehr gut, und stimmt, ein Grund dafür liegt in der Tatsache, dass es sich um Labeled Data handelt. Es kommt aber noch eine weitere Besonderheit hinzu: Der Datensatz basiert nicht nur auf Daten von LeddarTech-Sensoren, sondern umfasst Messdaten von ganz verschiedenen Sensoren. Und diese Punkte stehen im Gegensatz zu den bislang verfügbaren Datensätzen. Bei den einen sind die Objekte nicht gelabelt, bei den anderen sind nur Messdaten beispielsweise von Lidarsensoren enthalten. Unser Datensatz umfasst Daten von ganz unterschiedlichen Sensoren, verschiedenen Kameras, Radardaten und Daten von verschiedenen Lidar-Sensoren, auch von Nicht-LeddarTech-Lidar-Sensoren.

Können Sie das bitte etwas konkretisieren?

Unser Datensatz ist mit einer kompletten AV-Sensor-Suite erstellt worden, sprich: mit Kameras, Lidars, Radar und IMUs (Beschleunigungssensoren). Wie gesagt, wir haben unterschiedliche Lidarsensoren benutzt. Das heißt aber auch, dass in dem Datensatz auch Full-Waveform-Daten von unserem Leddar Pixell, einem 3D-Solid-State-Flash-Lidar-Sensor, enthalten sind. Full-Waveform-Lidar-Sensoren liefern eine vollständige, digitale Darstellung des eingehenden Lichtsignals, also deutlich mehr Informationen als herkömmliche Lidarsensoren bieten. Und diese zusätzlichen Informationen ermöglichen eine höhere Leistung bei der Objekterkennung, Klassifizierung usw.

Zusammengefasst lässt sich sagen: Unser Datensatz ist viel umfassender als von anderen kommerziellen Anbietern. Und wir stellen auch die Tools als Open Source zur Verfügung, mit denen die Daten manipuliert und visualisiert werden können. Ich denke, das macht PixSet einzigartig.

Für das akademische Umfeld ist der Datensatz kostenfrei, es besteht aber auch für kommerzielle Anbieter die Möglichkeit, den Datensatz zu lizenzieren. Wen sprechen Sie hier konkret an? Große OEMs ja wohl eher nicht, denn sie haben ihre eigenen riesigen Datensätze.

Nein, hier geht es nicht um OEMs, die haben natürlich ihre eigenen Datensätze, die mit hunderttausenden gefahrenen Kilometern erstellt wurden. Wir richten uns mehr an Startup-Unternehmen, die entsprechende Technologien entwickeln, beispielsweise eine Fußgängererkennung. Für diese Firmen ist unser Datensatz sicherlich hilfreich. Denn bislang sind solche Unternehmen typischerweise auf öffentlich zugängliche Datensätze angewiesen, und die weisen, wie gesagt, einen beschränkten Umfang auf. Und die Option, eigene Daten zu erfassen, besteht für diese Unternehmen meistens auch nicht, denn das ist zu kostenintensiv. Jetzt können sie mit PixSet einen umfassenden Datensatz zu einem vernünftigen Preis lizenzieren, das ist sehr hilfreich.

Reicht der Datensatz aus, um komplexe Algorithmen auszuprobieren?

Ja, der Datensatz ist ziemlich umfangreich. Wir sprechen hier von rund 30.000 Bildern in 97 Sequenzen und von mehr als 1,3 Mio. gelabelten Objekten. Das ist mehr als doppelt so groß wie der Kitti-Datensatz, den wir selbst sehr effektiv in unserer eigenen Entwicklung genutzt haben. Damit können die Möglichkeiten unterschiedlicher Algorithmen getestet werden. Wenn die Algorithmen in Produktion gehen sollen, dann wird man den Datensatz sicherlich noch mit deutlich mehr Daten erweitern. Dann reden wir von Millionen von Bildern. Aber um die Möglichkeiten zu demonstrieren, reicht der Datensatz sicherlich aus.

Soll diese Art der Unterstützung ausgebaut werden, also beispielsweise mit Datensätzen für die Verkehrsüberwachung?

Um ehrlich zu sein, wir verfolgen in diesem Fall keine feste Roadmap. Wenn es sich innerhalb eines internen Projekts für die Autobahnüberwachung ergäbe, einen Datensatz zu erstellen, dann würden wir aber sicherlich erwägen, auch den öffentlich zur Verfügung stellen.

Anbieter zum Thema

zu Matchmaker+

  1. »Ohne Zusammenarbeit funktioniert es nicht«
  2. Pixset enthält Messdaten von unterschiedlichsten Sensoren
  3. Infos zu Leddar PixSet

Das könnte Sie auch interessieren

Verwandte Artikel

LeddarTech Inc.