Lehrstuhl für
Multimediakommunikation und Signalverarbeitung
Prof. Dr.-Ing. André Kaup

Nichtlineare akustische Echokompensation

Arbeitsgebiet: Audiosignalverarbeitung
Schwerpunkt: Signalverbesserung und -erkennung
Mitarbeiter: Prof. Dr.-Ing. Walter Kellermann

Die akustische Echokompensation (engl. "Acoustic Echo Cancellation", AEC) ist eine typische Anwendung der Systemidentifikation. Das Problem rückgekoppelter Echos tritt zumeist in Freisprechszenarien auf, bei denen auf der Empfangsseite eine starke Einkopplung des Lautsprechersignals (y) in das aufgenommenen Mikrophonsignal (d) vorliegt (siehe Abb. 1). Auf Grund ihrer leichten und offenen Bauweise ergeben sich diese Rückkopplungen heutzutage allerdings auch immer stärker beim "normalen" Betrieb moderner Mobilfunkgeräte. Da die typischen Laufzeiten in paketvermittelten Kommunikationsnetzen ca. 200ms betragen, ergibt sich durch diese Verzögerung ein sehr störender Höreindruck beim Teilnehmer der entfernten Seite. Um dies zu unterbinden und somit die Qualität der Duplex-Kommunikation zu verbessern, wird ein digitaler Echokompensator parallel zum Echopfad eingesetzt. Dessen Aufgabe ist eine möglichst gute Nachbildung der akustischen Ausbreitungseigenschaften des lokalen Raums, so dass letztlich eine passende Echoschätzung (y') am Filterausgang zur Verfügung steht und vom Mikrophonsignal (d) abgezogen werden kann.

[AEC]

Abb. 1: Nichtlineare akustische Echompensation (NLAEC) auf Grund nichtidealer Bauteile

Berücksichtigung nichtlinearer Einflüsse

Das herkömmlicherweise verwendete Signalmodell der Echokompensation geht dabei stets von einem rein linearen Übertragungspfad vom Eingang (x) zum Mikrophonsignal (d) aus. Da in den letzten Jahren allerdings ein verstärkter Trend zu immer kostengünstigeren und kleineren Kommunikationsgeräten (z.B. Mobilfunkgeräte inkl. Videotelefonie) festzustellen ist, müssen zunehmend auch nichtlineare Einflüsse in Betracht gezogen werden. Neben nichtidealen Eigenschaften der vorhandenen DA/AD-Wandler stellen hauptsächlich an der Sättigungsgrenze operierende Verstärker und miniaturisierte Kleinlautsprecher in mobilen Endgeräten potentielle Nichtlinearitäten dar. Dementsprechend weist dann auch die Ein-/Ausgangsbeziehung des Gesamtsystems von (x) zu (d) nichtlineare Verzerrungen auf (siehe Abb. 1).

In einem solchen Fall einer nichtlinearen akustische Echokompensation (NLAEC), muss auch der verwendete Echokompensator durch ein entsprechendes adaptives nichtlineares Filtermodell realisiert werden, um eine ausreichende Unterdrückung des Echos zu erzielen. Dies ist umso wichtiger, da vorhandene nichtlinearen Signalverzerrungen ansonsten nicht nur nicht effektiv entfernt werden können, sondern darüber hinaus als zusätzliche Störung auch die Leistungsfähigkeit herkömmlicher linearen Kompensatoren behindern. Geeignete nichtlineare Filterstrukturen für den Kompensator stellen beispielsweise Kaskaden von Sättigungskennlinien und linearen Filtern (sog. Wiener-Hammerstein-Modelle oder Power-Filter) dar. Aus Gründen der Robustheit werden die blockweise Komponenten aus Abb. 1 allerdings meist nicht als Kaskade, sondern als äquivalentes Gesamtmodell in Form eines Volterra-Filters endlicher Ordnung realisiert. In allen Fällen müssen die Koeffizienten der nichtlinearen adaptiven Filter jedoch (wie auch bei der linearen AEC) wegen der schnell zeitveränderlichen Impulsantwort des Raumes fortlaufend angepasst werden. Darüber hinaus müssen in praktischen Implementierungen weiterhin noch Komponenten zur Messung der Sprachaktivität, Rauschleistungsschätzung, Steuerung der Adaptionsschrittweite und Detektion von Anteilen des lokalen Sprechers in ein Gesamtsystem integriert werden.

Volterra-Filter

Als sog. Volterra-Filter (VF) werden gedächtnisbehaftete Modelle bezeichnet, die eine weite Klasse nichtlinearer Verzerrungen geeignet modellieren können und daher im Fokus der Forschungsarbeit stehen. Diese Filterstrukturen stellen einen sehr weitgefassten und vielversprechenden Ansatz zur nichtlinearen Systembeschreibung dar, da sie sowohl als eine Erweiterung der linearen Transversalfilterung hin zu Faltungsprodukten höherer Ordnung, als auch als gedächtnisbehaftete Erweiterung von Taylor-Reihen interpretiert werden können. Wie aus Abb. 2 zu erkennen ist, ist die Struktur solcher Filter dabei durch eine parallele Anordnung mehrerer Volterra-Kerne unterschiedlicher Ordnung gegeben, die (beginnend mit der zweiten Ordnung) jeweils auf unterschiedliche Produkte aus Eingangswerten wirken. Da in dieser Beschreibung stets auch ein linearer Kern (Impulsantwort) enthalten ist, stellen diese Strukturen somit eine Verallgemeinerung der gewöhnlichen FIR-Filter dar. Jedes lineare Filter kann daher auch als Volterra-Filter erster Ordnung interpretiert werden. Die nachfolgende Abb. 3 visualisiert den linearen (links) und den quadratischen Kern (rechts) eines VF zweiter Ordnung, das dem gemessenen Modell eines Kleinlautsprechers entspricht.

[VF]

Abb. 2: Volterra-Filter der Ordnung P
 
[h1] [h2]

Abb. 3: Linear (links) und quadratischer Kern (rechts) eines gemessenen VF zweiter Ordnung


Nachdem die Problemstellung einer nichtlinearen Systemidentifikation entsprechende zeitveränderliche Filterstrukturen benötigt, müssen hierbei adaptive Implementierungen betrachtet werden. Da die Anzahl der durch die einzelnen Kerne repräsentierten Koeffizienten exponentiell mit der Ordnung der Nichtlinearität wächst, ist die Anwendung dieser Modelle aus Komplexitätsgründen bislang allerdings auf relativ niedrige Ordnungen beschränkt. Auf der anderen Seite resultiert diese große Anzahl potentieller Freiheitsgrade auch in einer relativ langsamen Konvergenz, die zudem durch die oftmals nur schwache Anregung der nichtlinearen Bestandteile zusätzlich erschwert wird.

Um diesen Herausforderungen zu begegnen, wurden im Zuge der Forschung am LMS in den letzten Jahren effiziente Systembeschreibungen im Zeit- und Frequenzbereich (DFT) untersucht und weiterentwickelt, die auf Erweiterungen des linearen LMS-Algorithmus basieren. Desweiteren wurden verschiedene Ansätze zur Beschleunigung der Konvergenzgeschwindigkeit, sowie zur effizienteren Beschreibung durch selbstkonfigurierende Filtermodelle vorgeschlagen. Für die jeweils vorliegende Anwendung können somit die spezifischen Vor- und Nachteile, sowie die benötigte Rechenkomplexität abgewogen werden. Die entwickelten Strukturen und Algorithmen sind dabei auch stets von allgemeinerem Interesse und können zur Identifikation beliebiger nichtlineare Systeme eingesetzt werden. Im akustischen Bereich wird die Leistungsfähigkeit dennoch am Beispiel der NLAEC evaluiert, da diese auf Grund der vorliegenden herausfordernden Rahmenbedingungen (stark nichtstationäre Eingangssignale, schnell zeitveränderliche Systeme sowie lange Systemgedächtnisse) als eines der anspruchsvollsten Szenarien der nichtlinearen Modellierung gesehen werden kann.

Leistungsvergleich unterschiedlicher Kompensatoren

Um einen Eindruck von der unterschiedlichen Leistungsfähigkeit adaptiver linearer bzw. adaptiver nichtlinearer Filter zu vermitteln, ist in Abb. 4 die erreichbare Echounterdrückung in Form des ERLE-Maßes (engl. "Echo Return Loss Enhancement") für verschiedene adaptive Filter und weißes Rauschen bwz. Musik/Sprache am Eingang (x) dargestellt. Der "unbekannte" Echopfad selbst ist dabei durch ein Volterra-Modell zweiter Ordnung gegeben und weist ein Signal-Rausch-Verhältnis von 40dB auf. Die Ergebnisse machen insbesondere die nur unzureichende Kompensationsleistung rein linear adaptiver Filter deutlich, die kaum über das Verhältnis der Leistung von linearen zu nichtlinearen Signalanteilen (hier ca. 10dB) hinaus kommt.

[ERLE]

Abb. 4: Echounterdrückung verschiedener adaptiver Filter für weißes Rauschen (links) und Musik/Sprache (rechts)

Förderung

Die Forschungsarbeiten zur Kompensation nichtlinearer akustischer Echos am LMS wurden dankenswerterweise seit einigen Jahren von der Deutschen Forschungsgemeinschaft (DFG) unter den Projektnummern KE 890/1-1 bis KE 890/1-3 unterstützt und werden auch weiterhin in dem Projekt KE 890/5-1 gefördert.

Veröffentlichungen

2015-8 A. Schwarz, C. Hofmann, W. Kellermann
   [bib]

Nonlinear acoustic echo cancellation apparatus and method thereof (비선형 음향 에코 소거 장치 및 그 방법)
1020150012752, Feb. 2015
2014-51 A. Schwarz, W. Kellermann, Jae-Hoon Jeong
   [bib]

An audio signal processing system and method for removing an echo signal
CN103546839, Jan. 2014
2014-30
CRIS
A. Schwarz, C. Hofmann, W. Kellermann
   [pdf]   [link]   [bib]

Combined Nonlinear Echo Cancellation and Residual Echo Suppression
ITG Conference on Speech Communication, Seiten: 1--4, Erlangen, Germany, Sep. 2014
2014-22
CRIS
R. Maas, C. Hümmer, A. Schwarz, C. Hofmann, W. Kellermann
   [bib]

A Bayesian Network View on Linear and Nonlinear Acoustic Echo Cancellation
IEEE China Summit and International Conference on Signal and Information Processing (ChinaSIP), Seiten: 495--499, Xi'an, China, Jul. 2014
2014-14
CRIS
C. Hofmann, C. Hümmer, W. Kellermann
   [bib]

Significance-Aware Hammerstein Group Models for Nonlinear Acoustic Echo Cancellation
IEEE Int. Conf. on Acoustics, Speech and Signal Processing (ICASSP), Seiten: 5934--5938, Florence, Italy, Mai 2014
2014-11
CRIS
C. Hümmer, C. Hofmann, R. Maas, A. Schwarz, W. Kellermann
   [bib]

The elitist particle filter based on evolutionary strategies as novel approach for nonlinear acoustic echo cancellation
IEEE Int. Conf. on Acoustics, Speech and Signal Processing (ICASSP), Seiten: 1315--1319, Florence, Italy, Mai 2014
2014-8 Jae-Hoon Jeong, A. Schwarz, W. Kellermann
   [pdf]   [link]   [bib]

Audio signal processing system and Method for removing echo signal thereof (오디오 신호 처리 시스템 및 이의 에코 신호 제거 방법)
1020120074629, Jan. 2014
2014-7 Jae-Hoon Jeong, A. Schwarz, W. Kellermann
   [pdf]   [bib]

Audio signal processing system and echo signal removing method thereof
US20140010382 A1, Jan. 2014
2013-58
CRIS
M. Zeller
   [bib]

Generalized Nonlinear System Identification using Adaptive Volterra Filters with Evolutionary Kernels
Dr. Hut Verlag, München, 2013
2013-50
CRIS
A. Schwarz, C. Hofmann, W. Kellermann
   [link]   [bib]

Spectral Feature-based Nonlinear Residual Echo Suppression
IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA), Seiten: 1--4, New Paltz, NY, USA, Okt. 2013
2007-70
CRIS
F. Küch, W. Kellermann
   [pdf]   [bib]

Nonlinear residual echo suppression using a power filter model of the acoustic echo path
IEEE Int. Conf. on Acoustics, Speech and Signal Processing (ICASSP), Vol. I, Editor(en): IEEE, Seiten: I73-I76, Honolulu, Hawaii, Apr. 2007