Von: Steffens, Jochen via ak discourse
Datum: Sat, 27 Apr 2019
Betreff: [ak-discourse] Einladung zum Forschungskolloquium
Liebe Kollegen und Studierende, liebe Interessenten an Veranstaltungen am Fachgebiet Audiokommunikation,
einmal mehr möchte ich Sie zu unserem Forschungskolloquium am kommenden Dienstag, 30.4., um 16.15Uhr im Raum E-N 324 einladen. Als „wissenschaftlichen Tanz in den Mai“ haben wir diesmal drei vorgestellte Abschlussarbeiten für Sie im Programm:
16:15Uhr: Entwicklung eines Samplers für Live-Anwendungen (Manuel Weber, Präsentation Masterarbeit)
16:50Uhr: Assessing the Authenticity of Individual Dynamic Binaural Synthesis (Martina Vrhovnik, Präsentation Masterarbeit)
17.25Uhr: Language Identification Using Rhythm Attributes and Neural Networks (Diana Nyugen, Präsentation Bachelorarbeit).
Kurzzusammenfassungen über die drei Vorträge finden Sie, wie immer, am Ende dieser E-Mail.
Wir freuen uns sehr auf Ihr Kommen.
Herzliche Grüße und Ihnen allen ein schönes Wochenende
Jochen Steffens
***
PD Dr. Jochen Steffens
Wissenschaftlicher Mitarbeiter
Fachgebiet Audiokommunikation (Sekr. EN-8)
Technische Universität Berlin
Einsteinufer 17c
10587 Berlin
Büro: +49 30 314 29161
–
Entwicklung eines Samplers für Live-Anwendungen (Manuel Weber, Präsentation Masterarbeit)
Der Sampler ist aus dem heutigen Tonstudiobetrieb nicht mehr wegzudenken. Sei es als Hardwaregerät oder als Plug-In in den gängigen Musikprogrammen – vor allem für Musikgenres der sogenannten U-Musik ist er für diverse Musikrichtungen stilprägendes Werkzeug und Instrument. Doch auch in der sogenannten E-Musik ist der Sampler bzw. die Manipulation von aufgenommenen Klängen und Geräuschen von Bedeutung, zu erwähnen seien hier die Arbeiten von Pierre Schaeffer und allgemeiner gefasst der Musique Concrète. In der vorgestellten Masterarbeit wurde zum einen eine kurze medienhistorische Betrachtung des Samplers vollzogen. Hierbei wurden Vorläufer, verwandte Instrumente als auch klassische Sampler vorgestellt. Außerdem wurde eine Eigenentwicklung eines Samplers durchgeführt. Die Idee zur Entwicklung eines neuen Samplers ergab sich aus der Aufführungspraxis live samplebasierte Musik darzubieten. Hierbei wurde die Erfahrung gemacht, dass alle auf dem Markt existierenden Sampler nicht speziell für jenen Zweck konzipiert wurden. Es wurde so ein Sampler entwickelt, der keine technische Revolution, sondern viel eher eine Evolution des Musikinstrumentes Sampler in Richtung live Darbietung sample-basierter Musik darstellt. Abschließend wurde eine kurze technische Evaluation des entwickelten Samplers vollführt, aus welcher auf weitere mögliche Entwicklungsschritte hin gearbeitet wurde.
Assessing the Authenticity of Individual Dynamic Binaural Synthesis (Martina Vrhovnik, Präsentation Masterarbeit)
Due to receivables of an indinstinguibility between an actual sound event and its re-synthesis, authenticity is the strictest criterion of all possible perceptual qualities. It demands for a technical implementation of preferably all spatial cues, which the hearing system evaluates simultaneously. In theory, an authentic simulation would be realized by reconstructing the sound pressure at a listener’s ear. In practice, indispensable errors in regard to the measurement, rendering and reproduction of the binaural signals arise and are perceivable. In contrast to former studies, which aimed to assess authenticity for a fixed head-above-torso orientation, the current master thesis examined the authenticity of dynamic binaural simulations with individual and non-individual binaural room impulse responses and for four test conditions. A highly sensitive listening test was developed to identify even smallest flaws in the simulation. The results display that, for the pink noise stimulus, all subjects could detect differences. However, for the male speech stimulus and source one, less than one half could reliably detect differences. Moreover, with the ’Spatial Auditory Qualitative Inventory’ (SAQI) a qualitative evaluation of the synthesis aimed to reveal and rate those attributes, which remain to create perceptual differences in regard to the acoustic reality. The evaluation suggests that differences are rather found in timbral attributes than in spatial, temporal or dynamical qualities.
Language Identification using rhythm attributes and neural networks (Diana Nyugen, Präsentation Bachelorarbeit)
Each language has its characteristic sound patterns and differs in the inventory of phonological sound units. Decoding the “acoustic signature” of a language requires analysis of different properties such as the acoustic phonetic, prosodics, phonotactics and vocabulary. Most approaches to identifying spoken language are based on acoustic modeling. Generally features are derived from representations of the signal in the frequency domain e.g. spectrograms are widely utilized in digital signal processing for capturing speech information. However, the detection and exploitation of the significant differences in prosodic patterns between languages should not be overlooked. Rhythmic attributes have proven useful for music-related tasks i.e. in the sub-field of music genre classification therefore leads to the hypothesis they would also be valuable for language discrimination. This assumption is examined in this thesis. Language identification with rhythmic attributes of speech and neural networks is investigated. In particular, tempograms and different convolutional neural networks architectures are utilized. Additionally, data augmentation methods are employed to learn from a limited amount of speech excerpts. In doing so, I evaluate how well tempograms serve as an effective representation of language-specific cues in speech signals and hence their suitability for spoken language identification. The results indicate that tempograms can indeed be informative for the task of rhythm-based language identification, when used in combination with convolutional neural networks and slightly surpass the performance other methods using hand-crafted features.