[ 3. November 2019 ]

DEGEM News – BERLIN – Einladung zum Forschungskolloquium

Von: Steffens, Jochen via aka discourse
Datum: Sat, 2 Nov 2019
Betreff: [ak-discourse] Einladung zum Forschungskolloquium

Liebe Kollegen und Studierende, liebe Interessenten an Veranstaltungen am Fachgebiet Audiokommunikation,

Am kommenden Dienstag (5.11., 16.15Uhr, Raum EN 324) wird Alexander Pusch seine Masterarbeit zum Thema Evaluierung von Mikrofonanordnungen für ein sprachgestütztes Selbstbedienungs-Kassensystem vorstellen. Dazu möchte ich Sie sehr herzlich einladen. Der Vortrag erfolgt in deutscher Sprache, und eine Kurzzusammenfassung darüber finden Sie, wie immer, am Ende dieser E-Mail.

Herzliche Grüße

Jochen Steffens

***

PD Dr. Jochen Steffens
Wissenschaftlicher Mitarbeiter
Fachgebiet Audiokommunikation (Sekr. EN-8)

Technische Universität Berlin
Einsteinufer 17c
10587 Berlin

Büro: +49 30 314 29161

Self-Checkout Systeme (kurz SCO) sind Kassensysteme im Retailbereich, bei denen der Kunde den Bezahlvorgang selbst vollführt. Das beinhaltet das Scannen, wiegen oder auch die Auswahl von Artikeln im System mit abschließender Bezahlung dieser. Sprachsteuerung an solchen Systemen stellt eine Neuerung dar, die aktuell auf dem Markt noch keinen Einsatz findet. In dieser Arbeit wurden drei Beamformer des Typs AMA bzw. DMA, basierend auf ECM und MEMS Technologie evaluiert. Zu diesem Zwecke wurden akustische Messungen durchgeführt, weitere Eigenschaften aller Anordnungen analysiert und ausgewertet. Ziel ist es, den Aufnahmebereich vor dem Gerät so anzupassen, dass Nebengeräusche frontend-seitig bestmöglich isoliert und mögliche Interferenzen zu benachbarten Geräten vermieden werden. Die Spracheingabe und -verarbeitung in einer geräuschbehafteten, feldähnlichen Umgebung wurde anhand von Spracherkennungstests untersucht. Dafür kam eine Standalone Variante eines Spracherkenners, basierend auf der Speech-Engine der Microsoft Speech API zum Einsatz. Das Vokabular beschränkte sich auf einen 68 Worte umfassenden Katalog englischer Begriffe für verschiedene Obst- und Gemüsesorten. Die Ergebnisse zeigen, dass bestimmte Mikrofonkonfigurationen in Verbindung mit bestimmten Beamforming Algorithmen zu Verbesserungen bzgl. der Spracherkennung führen und Sprache eine neue mögliche Form der Informationseingabe an SCO-Systemen darstellt.