Lehrstuhl für
Multimediakommunikation und Signalverarbeitung
Prof. Dr.-Ing. André Kaup

Akustisches Front-End für interaktives Fernsehen

In diesem Projekt geht es um das akustische Frontend eines Fernsehgerätes für Sprachsteuerung und Sprachkommunikation. Der Benutzer soll den Fernseher durch Sprachbefehle steuern und ihn als Terminal für Videotelefonie verwenden können. Dabei soll sich der Benutzer frei im Raum bewegen können.

Die besondere Herausforderung für die akustische Signalverarbeitung liegt darin, dass der Nutzer nicht direkt in ein Mikrofon spricht, sondern die Mikrofone am Fernsehgerät angebracht sind und sich der Nutzer frei im Raum bewegen kann. Durch die Nähe der Lautsprecher zu den Mikrofonen kommt die Sprache des Nutzers mit einen geringeren Pegel an den Mikrofonen an als das für die Spracherkennung störende Lautsprechersignal, was eine leistungsfähige akustische Echokompensation (AEC) erfordert. Außerdem ist es nötig Nachhall und sonstige Störgeräusche im Mikrofonsignal zu unterdrücken, um die Erkennungsrate des Spracherkenners bzw. die Sprachverständlichkeit für den Kommunikationspartner zu verbessern.

Bei der Auswahl der Algorithmen ist die Recheneffizienz ein wichtiger Faktor, da die Implementierung in Echtzeit auf in Consumergeräten üblichen Signalprozessoren möglich sein soll.

Das Projekt ist eine Fortführung der im EU-Projekt DICIT begonnenen Arbeiten.


Veröffentlichungen:

2014-19
CRIS
Y. Zheng, K. Reindl, W. Kellermann
   [link]   [doi]   [bib]

Analysis of dual-channel ICA-based blocking matrix for improved noise estimation
EURASIP Journal on Advances in Signal Processing (JASP) Vol. 2014, Online-Publikation, Num. 2014 :26, Seiten: 1--24, Mär. 2014
2013-20
CRIS
K. Reindl, W. Kellermann
   [link]   [doi]   [bib]

Linearly-constrained multichannel interference suppression algorithms derived from a minimum mutual information criterion
IEEE China Summit and International Conference on Signal and Information Processing (ChinaSIP 2013), Seiten: 283--287, Beijing, China, Jul. 2013
2012-34
CRIS
K. Reindl, Y. Zheng, S. Meier, A. Schwarz, W. Kellermann
   [link]   [doi]   [bib]

On the Impact of Signal Preprocessing for Robust Distant Speech Recognition in Adverse Acoustic Environments
IEEE Int. Conf. on Signal Processing, Communications and Computing (ICSPCC), Seiten: 131--135, Hong Kong, China, Aug. 2012
2011-57 W. Kellermann, Y. Zheng
   [bib]

Method and apparatus for blind source separation improving interference estimation in binaural Wiener filtering
EP 00 0002 211 563 B1, Aug. 2011
2010-80 W. Kellermann, Y. Zheng
   [bib]

Method and apparatus for blind source separation improving interference estimation in binaural Wiener filtering
EP 00 0002 211 563 A1, Jul. 2010
2010-69 W. Kellermann, Y. Zheng
   [bib]

Blind Source Separation Method and Acoustic Signal Processing System For Improving Interference Estimation In Binaural Wiener Filtering
US 20100183178 A1, Jul. 2010
2010-52
CRIS
K. Reindl, Y. Zheng, A. Lombard, A. Schwarz, W. Kellermann
   [link]   [doi]   [bib]

An Acoustic Front-End for Interactive TV Incorporating Multichannel Acoustic Echo Cancellation and Blind Signal Extraction
Proc. 44th Asilomar Conference on Signals, Systems, and Computers, Seiten: 1716--1720, Pacific Grove, CA, USA, Nov. 2010
2001-39
CRIS
H. Schüßler, P. Steffen
   [bib]

Recursive Halfband-Filters
Int. Journal of Electronics and Communications (AEÜ) Vol. 55, Num. 6, Seiten: 377 - 388, Jun. 2001
1998-5
CRIS
H. Schüßler, P. Steffen
   [bib]

Halfband Filters and Hilbert Transformers
Circuits, Systems and Signal Processing Vol. 17, Num. 2, Seiten: 137-164, 1998