Startseite > Embedded > Software > Schutz vor faulen Daten

Taint-Analyse

Schutz vor faulen Daten

18. Dezember 2014, 14:57 Uhr | Dr. Paul Anderson

▶ Diesen Artikel anhören

Fortsetzung des Artikels von Teil 1

Gefahrenstellen identifizieren

In der Terminologie der Taint-Analyse bezeichnet eine Taint Source (Quelle) einen Ort im Programm, wo Daten aus einer gefährlichen Quelle eingelesen werden. Im oben angeführten Code-Beispiel ist es der Aufruf an getenv(). Eine Taint Sink (Senke) ist ein Ort, wohin potenziell fehlerhafte Daten keinesfalls fließen sollten, es sei denn, sie wurden auf Gültigkeit geprüft, wie im Beispiel der Aufruf von strcpy(). Wurde ein Wert überprüft, spricht man davon, dass er vom Taint gereinigt wurde.

Die meisten Programme beziehen ihren Input aus vielen Quellen, und die Umgebung, in der das Programm ausgeführt wird, bestimmt die Gefahrenstufe jeder Quelle. Zu Taint-Quellen gehören

Umgebungsvariable,
Dateiinhalte,
Datei-Metadaten, z.B. Berechtigungen oder Datenstempel einer Datei,
das Netzwerk,
Netzwerk-Dienste, z.B. die Inhalte einer DNS-Anfrage,
System Clock, die Registry (auf Windows-Systemen).

Jedes Programm kann andere Arten von potenziell gefährlichem Input haben. Beispielsweise sollte ein Programm, das Input aus einem Gerät mit Infrarotsensor erhält, diesen Kanal als gefährlich betrachten. Sicherheitsanalysten definieren die Schwachstellen für potenzielle Angreifer als „Angriffsfläche eines Programms“. Um das Risiko eines Programms zu bewerten, ist es hilfreich, zunächst ein Verständnis einer Angriffsoberfläche aufzubauen. Dies ist den Taint Sources des Programms sehr ähnlich. Das Auffinden von Programmierfehlern, die empfänglich für Tainted-Daten sind, kann sehr aufwendig sein. Deshalb ist ein automatisierter Suchvorgang der beste Ansatz.

Automatisierte Taint-Analyse

Die Taint-Analyse ist eine Form der statischen Analyse. Grob gesagt funktionieren moderne statische Analyse-Tools wie folgt: Zuerst müssen sie ein Modell des gesamten Programms erstellen; dazu zergliedern und analysieren sie jede Eingabedatei. Das Modell besteht aus Darstellungen wie „Abstract Syntax Trees“ für jede Kompilierungseinheit, Kontrollfluss-Diagrammen für jedes Unterprogramm, Symboltabellen und dem Call Graph. Prüfroutinen finden dann Fehler in Bezug auf verschiedene Anfragearten an diese Darstellungen. Oberflächliche Fehler werden durch Musterabgleich mit dem Abstract Syntax Tree oder den Symboltabellen aufgedeckt.

Die wirklich ernsten Fehler, die das Programm zum Ausfall bringen, wie Null-Pointer und Buffer Overruns, lassen sich nur über anspruchsvolle Abfragen finden. Man kann sich diese als abstrakte Simulationen vorstellen – der Analysator simuliert die Ausführung des Programms, aber anstelle konkreter Werte werden den abstrakten Programmstatus darstellende Gleichungen eingesetzt. Bei Unregelmäßigkeiten erfolgt eine Warnung.

Jobangebote+ passend zum Thema

MACNICA ATD EUROPE - Ihre berufliche Zukunft

MACNICA ATD Europe GmbH, Ingolstadt

Sales Manager / Vertriebsmitarbeiter (m/w/d)

Verifysoft Technology GmbH, Offenburg

Projektmanager* in (m/w/d) im technischen Vertrieb / Kunststofftechnik

N&H Technology GmbH, Willich

Alle Jobangebote im Elektroniknet Karrierebereich anzeigen

Bild 1 zeigt ein Beispiel einer Buffer-Overrun-Warnung von CodeSonar. Der Weg durch den Code zur Ansteuerung des Fehlers ist dargestellt, interessante Punkte entlang des Wegs sind hervorgehoben. Eine Erklärung, was schieflaufen kann, erfolgt am Punkt des Überlaufs. Es kann schwierig sein, den Fluss fehlerhafter Daten durch ein Programm zu verfolgen. Denn dazu muss der Wert zurückverfolgt werden, wie er von einer zur nächsten Variablen kopiert wurde, möglicherweise über Prozedurgrenzen und mehrere Ebenen indirekter Aufrufe hinweg.Ein Beispiel: Ein Programm liest eine Zeichenkette aus einem risikoreichen Netzwerkport aus. Weil Strings in C normalerweise durch Pointer verwaltet werden, muss die Analyse sowohl die Inhalte des String als auch den Wert aller Pointer, die auf den String verweisen, nachverfolgen. Die Zeichen bzw. der Inhalt des String selbst gelten als „tainted“ (fehlerhaft), während man vom Pointer sagt, er zeigt auf die „Taintedness“. Kopiert man den Inhalt des String, z.B. durch strcpy(), führt das zur Übertragung der fehlerhaften Daten auf den neuen String. Werden die Pointer kopiert, dann muss die Übertragung der Point-to-Taint-Eigenschaft auf den neuen Pointer erfolgen.

Natürlich kann es Pointer auf diese Pointer geben, und sogar Pointer auf diese, und die Analyse muss auch diese prüfen. Letztendlich läuft das Problem auf eine Art Alias-Analyse hinaus, also eine Analyse, die sagen kann, welche Variablen dieselben Speicherorte erreichen. Eine Erklärung der ‚Alias-Analyse‘ würde in diesem Artikel zu weit reichen; eine gute Einführung in das Thema ist hier zu finden: www.wikipedia.org/wiki/Alias_analysis.

Schutz vor faulen Daten
Gefahrenstellen identifizieren
Die Wege der Daten verstehen

Software development

Finding run-time errors made easy

Security

Sicherheitspaket für industrielles Internet

Sicherheit Embedded Automotive Software

Schnittstellen erhöhen das Risiko

Mikroprozessor-Entwicklungstools

Neues Analysewerkzeug für Hardware/Software-Debugging

Taint-Analyse

Schutz vor faulen Daten

Gefahrenstellen identifizieren

Jobangebote+ passend zum Thema

Lesen Sie mehr zum Thema

Das könnte Sie auch interessieren

Software development

Finding run-time errors made easy

Security

Sicherheitspaket für industrielles Internet

Sicherheit Embedded Automotive Software

Schnittstellen erhöhen das Risiko

Mikroprozessor-Entwicklungstools

Neues Analysewerkzeug für Hardware/Software-Debugging

Weitere Artikel zu pls Programmierbare Logik & Systeme GmbH

UDE 2026 debug and trace tool from PLS

PLS simplifies operation of the UDE with new functions

Debug- und Trace-Tool UDE 2026 von PLS

PLS vereinfacht Bedienung der UDE durch neue Funktionen

Trends in Entwicklung, Debugging + Test

Cross-Debugging von Steuergeräten auf virtuellen Prototypen

PLS

UDE 2025 für virtuelle RISC-V-Prototypen von Infineon

Fürs Generic Timer IP Module von Bosch

UDE unterstützt GTM-Simulationsmodell von Coside

Weitere Artikel zu Cyber-Security

الإيثرنت الصناعي الآمن سيبرانياً

بروفنيت يُحقق الامتثال لقانون الصمود السيبراني الأوروبي

الأمن السيبراني للبنى التحتية الحساسة

كلورتي تؤمن 150 مليون دولار لتعزيز حماية الأنظمة السيبرانية

Kosten und Risiken des DiY vermeiden

Cybersecurity für IoT-Geräte mit Embedded-KI

Cyber-secure Industrial Ethernet

Profinet already ensures CRA compliance

Cybersicheres Industrial Ethernet

Profinet ermöglicht schon jetzt CRA-Konformität

Weitere Artikel zu Software (M2M)

أعجوبة تقنيات (الاستشعار)

رادار 140 جيجاهرتز يعزز ذكاء السيارات وسلامتها

Harte Echtzeitanforderungen mit Linux

Latenzen bei der Interprozessorkommunikation mit OpenAMP

IAR Systems

Im August übernimmt die neue CEO

Open-Source-Compiler

Großartige Tools, aber mit Vorsicht zu benutzen

Riedel Networks / Faller Packaging

Managed SD-WANs für die Verpackungsindustrie

Weitere Artikel zu Entwicklungswerkzeuge

dSPACE/MathWorks

RoadRunner-Integration mit ASM OpenX

Entwicklungs-Tools und Embedded-Software

Hitex feiert 50-jähriges Bestehen

eIQ Agentic AI Framework

New framework from NXP for agentic AI at the edge

eIQ Agentic AI Framework

Neues Framework von NXP für agentische KI an der Edge

Embedded Vision für die Medizintechnik

Vision Components integriert MIPI-Kamera in Adlinks NXP-Dev-Kit