CORDIS - Resultados de investigaciones de la UE
CORDIS

An Artificial Intelligence Enhancing Video Quality Locally to Limit Internet Traffic Tied to Video Streaming

Article Category

Article available in the following languages:

Una nueva tecnología para transmitir vídeo de alta calidad sin quedarse sin datos

El ancho de banda actual tiene dificultades para hacer frente al rápido crecimiento de la demanda de los servicios de transmisión de vídeo. ENHANCEplayer permite a los radiodifusores transmitir archivos más pequeños, al posibilitar que los propios dispositivos de los usuarios aumenten la resolución de vídeo a una calidad mayor.

Economía digital icon Economía digital

La transmisión de vídeo por internet, ya sea como televisión a la carta para contenido ya existente o como transmisiones en directo de eventos, es un sector en auge. Sin embargo, la transmisión de alta calidad no está universalmente disponible, ya que algunas zonas carecen de las conexiones de ancho de banda necesarias. El coste de la conectividad móvil también es prohibitivo para muchos: un estudio descubrió que el coste impide que casi el 50 % de las personas con acceso a la red 4G a nivel mundial utilicen teléfonos inteligentes para internet. El proyecto ENHANCEplayer, financiado con fondos europeos, se propuso reducir la carga de la infraestructura causada por el envío por internet de vídeos de menor resolución o menor velocidad binaria con el reproductor de vídeo receptor habilitado para aumentar la calidad. Ely Loew, coordinador del proyecto, explica: «Mientras los enfoques tradicionales aumentan la eficiencia de la codificación del vídeo, a riesgo de incompatibilidades con un “hardware” más antiguo, nosotros empezamos con la calidad de la experiencia del espectador, no con métricas técnicas».

Mejora de la red neuronal

Los miembros del consorcio, Artomatix y THEO Technologies, compartieron sus infraestructuras tecnológicas para desarrollar un prototipo de tecnología. El punto de partida de ENHANCEplayer fue que la resolución de vídeo mínima necesaria para los radiodifusores es 540 p para dispositivos móviles. Según la hipótesis de Artomatix, su tecnología de superresolución podría optimizarse para una serie de dispositivos y demostrar ser lo suficientemente rápida para aumentar la resolución de los fotogramas de vídeo en tiempo real, a 25-30 fotogramas por segundo. THEO Technologies rediseñó su reproductor de vídeo universal THEOplayer para incluir los módulos de ampliación de Artomatix. El prototipo resultante de ENHANCEplayer funciona al entrenar a una red neuronal con dos versiones de una serie de imágenes, por ejemplo, una resolución fuente de 360 p y una resolución final de, digamos, 720 p. A continuación, el modelo añade píxeles a la versión de 360 p de forma que la calidad se corresponda con la de la imagen de 720 p. Para seguir probando el sistema, el proyecto creó un modelo de prueba de concepto personalizado para vídeos enviados por socios de radiodifusión: VRT en Bélgica, NPO en los Países Bajos y RTP (sitio web en portugués) en Portugal. El primer éxito fue la transmisión de un vídeo de 360 p con su resolución aumentada a 540 p en un iPhone 11. Loew comenta: «En ese momento desaparecieron todas las dudas sobre la tecnología. Nuestro entusiasmo se vio reforzado con las pruebas de radiodifusión y los espectadores encuestados, quienes confirmaron el aumento de la calidad del vídeo». Este gran avance fue posible porque el iPhone 11 cuenta con nuevos chips de red neuronal que pueden ejecutar el aprendizaje automático. Estos chips están cobrando cada vez más importancia en los nuevos dispositivos móviles. A pesar de que los teléfonos Android más nuevos también cuentan con chips de redes neuronales, su arquitectura ralentizó el procesamiento de los fotogramas individuales del vídeo, lo que impidió que el modelo funcionase en tiempo real. Loew observa: «Así que, en la actualidad, esta tecnología depende del “hardware”».

Mayores oportunidades

Según una encuesta, se estima que el mercado global de servicios de transmisión libre crezca de los 81 600 millones USD en 2019 a los 156 900 millones USD de aquí a 2024, con una cuadruplicación proyectada en el ancho de banda entre 2017 y 2022. Se prevé que la porción de transmisión de vídeo en directo crezca en un factor de quince. Al disminuir el ancho de banda necesario, ENHANCEplayer minimiza la presión sobre la infraestructura de comunicaciones, al mismo tiempo que reduce el consumo de energía. También mejora el acceso para aquellos privados de él por motivos técnicos o de coste, como las comunidades rurales o los países en desarrollo. Además, abre oportunidades para el contenido generado por no profesionales que utilizan equipo básico. En la actualidad, el equipo trabaja, además de en las opciones de revisión para las capacidades del “hardware” de Android, en la visualización a través del navegador web. Loew añade: «Estimamos que faltan entre uno y dos años para disponer del “hardware” y la infraestructura del navegador necesarios para gestionar los modelos de red neuronal para la ampliación de resolución en tiempo real». El equipo también estudia una serie de futuras direcciones, incluida la integración de la ampliación en un códec de vídeo o como parte del dispositivo reproducción de vídeo, como una televisión, o habilitar la ampliación parcial en dispositivos más antiguos.

Palabras clave

ENHANCEplayer, transmisión, vídeo, velocidad binaria, internet, iPhone, móvil, ancho de banda, países en desarrollo

Descubra otros artículos del mismo campo de aplicación