Grundlagen der Videotechnik I Menschliches Sehen, Videosignale, Auflösung und Fernsehtechnik

Um Video-Systeme entwickeln zu können, muss der Entwickler verstehen, wie das menschliche Auge arbeitet. Das menschliche Sehvermögen ist die Grundlage für die Entwicklung der Fernsehübertragung, der Bildverarbeitung und der digitalen Video-Signalverarbeitung.

Das menschliche Auge enthält zwei Typen von Sehzellen: Zapfen und Stäbchen. Die Stäbchen sind helligkeitsempfindlich und ermöglichen das Sehen bei Dunkelheit. Die Zapfen dagegen sind nicht auf Helligkeit abgestimmt, sondern empfindlich auf Wellenlängen im Bereich von 400 nm (Violett) bis 770 nm (Rot). Somit bilden die Zapfen die Grundlage für die Farbwahrnehmung.

Es gibt drei Typen von Zapfen, die - jeweils mit einem anderen Pigment - am empfindlichsten auf rotes, grünes oder blaues Licht reagieren. Die Empfindlichkeitsbereiche der drei Zapfentypen überschneiden sich stark. Die Empfindlichkeit aller drei Zapfentypen zusammen ergibt einen Spitzenwert im Grün-Bereich bei etwa 555 nm. Deshalb kann man z.B. Kompromisse bei LC-Displays machen und dem Grün-Kanal mehr Bits an Auflösung zuordnen als den Rot- oder Blau-Kanälen, ohne dass es dem Betrachter auffällt. Die Entdeckung der Rot-, Grün- und Blau-Zapfen knüpft an die Entwicklung der "Trichromatischen Farbtheorie" an. Diese besagt, dass sich durch die Kombination von monochromatischem Licht mit Rot-, Grün- und Blau-Wellenlängen fast jede beliebige Lichtfarbe erzeugen lässt.

Da das menschliche Auge wesentlich mehr Stäbchen als Zapfen enthält, ist es gegenüber Lichtintensität empfindlicher als gegenüber Farbe. Dies ermöglicht es, in Video- und Bild-Darstellungen Bandbreite zu sparen, z.B. durch Bandbegrenzung oder "Subsampling" der Farbinformation.

Das Helligkeitsempfinden des menschlichen Auges verläuft logarithmisch, nicht linear. Anders ausgedrückt bedeutet dies, dass die tatsächliche Intensität, die zur Erzeugung eines 50-prozentigen Grau-Bildes - genau zwischen Schwarz und Weiß - erforderlich ist, lediglich 18 % der Intensität beträgt, die man zur Erzeugung von Weiß benötigt. Dieses Verhalten ist extrem wichtig für die Entwicklung von Kamera-Sensoren und Bildschirmen. Auch führt dieser Effekt zu einer reduzierten Empfindlichkeit gegenüber Quantisierungsverzerrungen (Quantization Distortion) bei hohen Intensitäten - eine Eigenschaft, die viele Multimedia-Codieralgorithmen zu ihrem Vorteil nutzen.

Weiterhin passt sich das menschliche Auge an die Umgebung an und schafft sich stets eine eigene Referenz für Weiß; dies erfolgt auch bei schwachen Lichtverhältnissen oder bei künstlichem Licht. Da sich Kamera-Sensoren von Haus aus anders verhalten, ist ein Weißabgleich erforderlich, bei dem die Kamera ihren Referenzpunkt für absolutes Weiß wählt.

Das menschliche Auge ist gegenüber hochfrequenten Informationen weniger empfindlich als gegenüber niederfrequenten. Hinzu kommt, dass das Auge feine Details und Farbauflösungen in stehenden Bildern erkennen kann. Bei schnell bewegten Bildern ist dies nicht möglich. Deshalb können "Transform Coding" - Diskrete Cosinus Transformation (DCT), Fast Fourier Transformation (FFT) usw. - und Tiefpass-Filterung verwendet werden, um die Bandbreite zu reduzieren, die zur Darstellung eines Bildes oder einer Video-Sequenz erforderlich ist.

Das menschliche Auge kann bei Bildwiederholfrequenzen von 50 Hz bis 60 Hz in hellem Licht ein Flimmern wahrnehmen. Bei dunklerem Licht sinkt diese Rate auf etwa 24 Hz. Darüber hinaus neigt das menschliche Auge dazu, Flimmern in großen, einheitlichen Bildbereichen stärker wahrzunehmen als in kleinen Bildteilen. Diese Eigenschaften haben wichtige Auswirkungen auf Zeilensprung-Video-Signale, Bildwiederholfrequenzen und Display-Techniken.