Encontrar una aguja en un pajar

Al grabar audio puede resultar difícil separar distintos sonidos naturales mezclados con el ruido de fondo. Los científicos del proyecto comunitario BLISS abordaron este problema desde distintas perspectivas y propusieron métodos de procesamiento de señales basados en la estadística.

Economía digital

Las fiestas multitudinarias y otros acontecimientos de nivel sonoro comparable son ejemplos extremos de las dificultades inherentes a la separación de sonidos. Es habitual que cada oyente tenga que esforzarse por atender a una voz concreta en medio de una plétora de conversaciones, el tintineo de vasos y música de fondo. Pero estos obstáculos no sólo afectan a los humanos; el reconocimiento de sonidos en medio de un bullicio también constituye un reto fundamental para los algoritmos mecánicos dedicados a la interpretación de sonidos. Los programas más avanzados de reconocimiento de voz, por ejemplo, suelen estar próximos a la perfección si el hablante se encuentra a solas en una habitación silenciosa, pero su rendimiento disminuye considerablemente en situaciones cotidianas en las que existen otras fuentes sonoras superpuestas. Una de las soluciones posibles a este problema consiste en utilizar varios micrófonos para grabar la voz de distintas personas que hablan al mismo tiempo. A continuación se podría seleccionar la voz de un oyente en particular gracias a la independencia de las señales de audio recogidas. Lamentablemente, muy pocas veces, por no decir ninguna, se obtiene un material de estas características con el que trabajar. Curiosamente, la disponibilidad de información sobre las fuentes de señales, tales como la distancia entre las mismas, puede reducir la complejidad de la solución y propiciar algoritmos más simples. Entonces el problema se reduce a una cuestión: cómo determinar con precisión qué señales de voz se deben agrupar y cuáles deben interpretarse por separado. Basándose en un método en función de costes y resultados posibles, la estadística bayesiana brindó a los socios del proyecto BLISS la oportunidad de tomar la decisión más adecuada a partir de la información disponible. En primer lugar, estudiaron las dependencias entre las fuentes de las señales por medio de ecuaciones matemáticas. Los modelos resultantes sirvieron para eliminar o suprimir dependencias para que las señales restantes resultaran más fáciles de separar. La principal desventaja de los métodos bayesianos radica en su complejidad computacional, motivo por el que hasta ahora su aplicación se ha limitado a problemas simples de separación ciega. Sin embargo, el método propuesto no está restringido a ningún tipo concreto de señal. Sus aplicaciones posibles van desde la separación de grabaciones en estéreo para audífonos, ondas cerebrales de sensores médicos y señales de radio de redes de telecomunicaciones.

Blind Source Separation and Applications

Encontrar una aguja en un pajar

Descubra otros artículos del mismo campo de aplicación

Compartir esta página

Descargar