Die Nadel im Heuhaufen finden

Bei Audioaufnahmen kann es schwierig sein, verschiedene natürliche Geräusche, die mit Hintergrundgeräuschen überlagert sind, voneinander zu trennen. Wissenschaftler des von der EU finanzierten BLISS-Projekts haben dieses Problem aus unterschiedlichen Perspektiven analysiert, bevor sie hierfür einige statistische Methoden der Signalverarbeitung vorschlugen.

Digitale Wirtschaft

Cocktailpartys und andere ähnlich geräuschvolle Umgebungen stellen extreme Beispiele für die Herausforderungen, die der Trennung von akustischen Signalen innewohnen, dar. Die Zuhörer versuchen gewöhnlich, inmitten von verschiedenen Konversationen, klirrenden Gläsern und Musik einer einzelnen Stimme zu folgen. Dieses Problem ist nicht nur auf Menschen beschränkt, die Erkennung bestimmter spezieller akustischer Signale in einem Mix von unterschiedlichsten Klängen und Geräuschen ist auch für Algorithmen, die solche Signale verarbeiten, eine zentrale Herausforderung. Moderne Programme zur Spracherkennung beispielsweise funktionieren nahezu fehlerlos, wenn sich der Sprecher alleine in einer geräuscharmen Umgebung befindet, die Leistungsfähigkeit dieser Programme unter realen Bedingungen mit simultan auftretenden akustischen Quellen ist allerdings weitaus schlechter. Eine Lösung ist die Verwendung verschiedener Mikrofone, um die Stimmen mehrerer Menschen, die gleichzeitig sprechen, aufzuzeichnen. Die Stimme eines bestimmten Sprechers könnte dann aufgrund der voneinander unabhängigen Audiosignale ausgewählt werden. In der Praxis jedoch stellt die Annahme voneinander unabhängiger Signale eine, wenn überhaupt, mehr oder weniger grobe Annäherung dar. Interessanterweise können vorher gesammelte Informationen über die Signalquellen, beispielsweise der Abstand zwischen den Signalen, die Komplexität der Lösung verringern und zu vereinfachten Algorithmen führen. Das Problem reduziert sich dann auf eine Frage: Wie ist die genaue Bestimmung möglich, welche Stimmsignale zusammengefasst, und welche individuell betrachtet werden sollten? Die sogenannte Bayessche Statistik, mit gegebenen Kosten für verschiedene denkbare Ergebnisse, ermöglichte es den Partnern des BLISS-Projekts, basierend auf den verfügbaren Informationen die bestmögliche Entscheidung zu treffen. Zuerst fand durch Aufstellung einer mathematischen Gleichung eine Annäherung der Abhängigkeiten zwischen den Signalquellen statt. Die resultierenden Modelle wurden verwendet, um Abhängigkeiten zu entfernen oder zu unterdrücken, damit die Trennung der restlichen Signale einfacher vorgenommen werden kann. Der größte Nachteil der Bayesschen Methode ist ihre Berechnungskomplexität, wodurch ihre Anwendung in der Vergangenheit auf einfache Probleme der blinden Trennung beschränkt blieb. Der vorgeschlagene Ansatz ist weiterhin nicht an einen bestimmten Signaltyp gebunden. Seine Anwendungsmöglichkeit reicht von der Trennung von Stereoaufnahmen für Hörhilfen oder von Hirnströmen für medizinische Sensoren bis hin zur Trennung der Funksignale von Telekommunikationsnetzen.

Blind Source Separation and Applications

Die Nadel im Heuhaufen finden

Entdecken Sie Artikel in demselben Anwendungsbereich

Diese Seite teilen

Herunterladen