MEMS-Mikrofone

Wenn Technik aufs Wort hört

9. Juli 2019, 10:30 Uhr | Julian Kornprobst, Infineon Technologies
Diesen Artikel anhören

Fortsetzung des Artikels von Teil 1

MEMS-Mikrofone in realen Anwendungsfällen

Bisher waren wie erwähnt VUI-Systeme meist für eine normale Sprachlautstärke von 60 dBSPL und Entfernungen von 1 m bis 3 m zur Sprachquelle ausgelegt (Bild 3). Im Labor ist diese Situation einfach nachzubilden, aber in realen Umgebungen gibt es viele Situationen, in denen das Eingangssignal schnell unter 60 dBSPL fällt. Gründe dafür können größere Entfernungen zwischen Anwender und der VUI, Flüstern oder variierender Schalldruck sein. Damit kommen Mikrofone mit niedrigerem SNR-Wert schnell an ihre Grenzen und bieten in VUI-Systemen keine ausreichende, praxistaugliche Leistung.

Will man nur flüsternd mit dem VUI-System kommunizieren (Schlafzimmer, Kinderzimmer, etc.) dann kann ein geringer SNR-Wert schnell zu Fehlern führen, wenn das erfasste Sprachsignal nahe am Eigenrauschen des Mikrofones ist. Selbst eine sehr leistungsfähige Signalverarbeitung kann nichts mehr korrigieren, wenn die Rohdaten zu sehr rauschen. Mikrofone mit sehr geringem Eigenrauschen lassen dagegen noch genügend Spielraum, um auch Sprachsignale mit geringem Schalldruck (SPL) noch erkennen, verstärken und verarbeiten zu können.

Infineon Technologies, MEMS Microphone
Bild 3: Verschiedene VUI-Anwendungsfälle mit unterschiedlichen Schalldrücken und Entfernungen zur Sprachquelle.
© Infineon Technologies

Auch bei Situationen, in denen man sich zum Beispiel in einem benachbarten Raum mit einer Entfernung von 7 m bis 10 m befindet, kann die Sprachaufforderung schnell unter den Wert von 60 dBSPL fallen. Auch hier entscheidet wiederum die Qualität der Mikrofones über die Leistung der Sprachsteuerung. Je niedriger das Eigenrauschen des Mikrofones, desto größer kann der Abstand zwischen dem Anwender und dem VUI-Gerät für eine zuverlässige Spracheingabe sein (Bild 3).

In Umgebungen mit starken Störgeräuschen lässt sich die Spracherkennung erheblich verbessern, wenn das verwendete Mikrofon sehr linear ist, also möglichst wenig verzerrt. Ein hoher AOP-Wert (Acoustic Overload Point) trägt dazu bei, Verzerrungen gering zu halten und die Unterdrückung von Störgeräuschen und Echos zu verbessern, denn manchmal ist das Sprachsignal selbst nicht laut genug und es sind andere Geräusche vorhanden, die Störungen verursachen.

Erstklassige MEMS-Mikrofone und modernste Audioverarbeitung sind die Schlüsselelemente, um sprachgesteuerte Geräte wirklich alltagstauglich zu machen. Daher nutzen Infineon und seine Partner für Sprachbenutzeroberflächen spezielle Technologieplattformen und vordefinierte Sprachbenutzerlösungen der nächsten Generation, um sicherzustellen, dass man auch gehört wird.

Werden unerwünschte Geräusche aus dem Signal ausgeblendet, so verbessert sich nicht nur ein Gespräch von Mensch zu Mensch, sondern auch von Mensch zu Sprachassistent. Ziel ist es, den Signal-Rausch-Abstand zu vergrößern, also in diesem Fall das Verhältnis zwischen dem erwünschten Tonsignal und unerwünschten Umgebungsgeräuschen (Rauschen). Durch geeignete Algorithmen und den Einsatz mehrerer Mikrofone lässt sich Rauschen leichter unterdrücken und eine Richtcharakteristik implementieren.

Richtmikrofonsysteme, die beispielsweise mit Strahlformungsalgorithmen ar-beiten, können die Empfindlichkeit der Mikrofone in der gewünschten Richtung erhöhen und die gewünschten Schallquellen hervorheben. Eine ausgefeilte Methode zur Unterdrückung von Störgeräuschen sind »Blind Source Separation«-Algorithmen. Mit ihnen lassen sich Störgeräusche unabhängig von der Richtung, von der Entfernung und vom Entstehungsort ausblenden.

Alle diese Verfahren profitieren von der Genauigkeit und Qualität des Signals, das sie empfangen. Denn was am Beginn der Signalkette verloren geht, lässt sich nachträglich nicht wiedergewinnen. Das Mikrofon sollte daher einen möglichst großen Signal-Rausch-Abstand, eine geringe Verzerrung, einen linearen Frequenzgang (der auch den Phasengang verbessert) und eine geringe Gruppenlaufzeit aufweisen.

Verkapselte Dual-Membran

Ein typisches MEMS-Mikrofon kombiniert einen MEMS-Sensor und ein ASIC. Dieser Sensor ist im Grunde ein Kondensatormikrofon, bei dem die Bewegung einer Membran durch den Schalldruck die Spannung einer oder mehrerer Kondensatorplatten ändert. Vibriert die Membran aufgrund des ankommenden Schalldrucks, ändert sich der Abstand zwischen diesen Platten und damit die Kapazität zwischen Membran und Gegenelektrode (Backplate). MEMS-Mikrofone wandeln diese Änderungen in elektrische Signale um.

Das Hauptproblem bei lauten Geräuschen und hohem Schalldruck ist das entstehende Druckniveau und damit die relativ große mechanische Bewegung der Membran. Dies kann bei extremer Beanspruchung Verzerrungen verursachen. Da Audioverarbeitungsalgorithmen von einem linearen Signal ausgehen, können Verzerrungen über 1 % die Audioqualität schon erheblich verschlechtern. Eine leistungsstarke Audioverarbeitung ist jedoch gerade auf hohe Audioqualität angewiesen.

In einem neuen Designansatz für ein MEMS-Sensorelement platziert man die sich bewegende Membran zwischen zwei Kondensatorplatten (Dual-Backplate). Dies ergibt ein reines differenzielles Ausgangssignal, also nicht wie üblich ein asymmetrisches Ausgangssignal. Dies hat mehrere Vorteile. Ein MEMS-Mikrofon mit Dual-Backplate minimiert aufgrund seiner symmetrischen Konstruktion Verzerrungen. Den gleichen Effekt erzielt man mit zwei beweglichen Membranen, zwischen denen die Kondensatorplatte angeordnet ist (Dual-Membran-Bauweise).

Gegenüber MEMS-Mikrofonen mit Single-Backplate verbesserte die Einführung von Dual-Backplates die Linearität des aufgezeichneten Signals deutlich. Den nächsten Entwicklungsschritt vollzieht Infineon nun mit kapazitiven MEMS-Mikrofonen mit einer versiegelten Doppelmembran. Die »Einkapselung« des Kondensators ermöglicht eine nahezu rauschfreie Erfassung von Audiosignalen.

Infineon Technologies, MEMS Microphone
Bild 4: Verkapselte Doppel-Membran-Technologie von Infineon ermöglicht bisher unerreichte SNR/AOP-Spezifikationen für MEMS-Mikrofone.
© Infineon Technologies

Im Vergleich zu MEMS-Mikrofonen mit nur einer Backplate konnten mit der Dual-Backplate-Technologie die SNR- und AOP-Werte bereits deutlich verbessert werden. Die verkapselte Dual-Membran-Technologie bringt einen weiteren Leistungsschub. Erste Versuche zeigen, dass der SNR-Wert von 70 dB auf 75 dB stieg, der AOP-Wert auf bis zu 140 dBSPL (Bild 4).

Darüber hinaus ist die neue verkapselte Technologie auch robust gegenüber Feuchtigkeit bzw. Schmutz und bietet IP57-Schutz für raue Umgebungen. Für Systemlösungen entstehen keine höheren Kosten, da für das Mikrofon selbst keine externen Schutzvorkehrungen mehr zu treffen sind.

Premium-MEMS-Mikrofone mit dem neuen versiegelten Doppelmembran-Design sollen Ende des Jahres 2019 verfügbar sein. Für verschiedene Kunden sind bereits Entwicklungsmuster für erweiterte Audioaufnahmen, aktive Geräuschunterdrückung, Kommunikations- und Sprachbenutzeroberflächen verfügbar.

Die Mikrofone messen insgesamt nur 4,00 mm × 3,00 mm und der Sensorchip allein nur 1,7 mm × 1,7 mm. Für die Implementierung in Smartphones sind noch kleinere Varianten geplant.


  1. Wenn Technik aufs Wort hört
  2. MEMS-Mikrofone in realen Anwendungsfällen

Lesen Sie mehr zum Thema


Das könnte Sie auch interessieren

Jetzt kostenfreie Newsletter bestellen!

Weitere Artikel zu INFINEON Technologies AG Neubiberg

Weitere Artikel zu MEMS- und Halbleitersensoren