CORDIS - Risultati della ricerca dell’UE
CORDIS

Personalised Content Creation for the Deaf Community in a Connected Digital Single Market

Article Category

Article available in the following languages:

I Realatars si faranno presto strada sui nostri schermi

I ricercatori dell’UE stanno gettando le basi per trasmissioni televisive in lingua dei segni che siano anche economicamente vantaggiose.

Economia digitale icon Economia digitale
Società icon Società

Garantire che le persone della comunità di non udenti abbiano accesso all’informazione, alla comunicazione e alla conoscenza è vitale per la loro piena ed equa partecipazione alla società. La direttiva sui servizi di media audiovisivi mira a garantire che gli Stati membri dell’UE si assicurino che i servizi di media contribuiscano all’uguaglianza e all’accessibilità in materia di distribuzione e accessibilità dei contenuti. Tuttavia, produrre contenuti in lingua dei segni è costoso: molte aziende offrono solo uno scarso numero di programmi in tal forma, di solito trasmessi a tarda notte. Il progetto Content4All, finanziato dall’UE, si prefigge di mutare questa situazione e di rendere i contenuti più accessibili alla comunità dei non udenti attraverso un flusso di lavoro di traduzione automatica dei segni con un avatar umano 3D fotorealistico per le trasmissioni televisive. «Avevamo due obiettivi principali. Il primo era quello di fornire una soluzione a basso costo per creare versioni dei contenuti prodotti per il pubblico udente interpretate con i segni, senza impattare sull’esperienza visiva degli utenti attuali. Il secondo era quello di creare set di dati e algoritmi per esplorare la creazione automatica di contenuti interpretati dai segni», spiega Giacomo Inches, coordinatore del progetto ed esperto di tecnologia dell’innovazione presso Fincons Group.

Alla scoperta del realatar, l’avatar

L’avatar è realizzato attraverso un innovativo studio multicamera dove i movimenti di persone reali sono catturati e poi elaborati con l’aiuto di algoritmi di IA. Il risultato finale è un avatar fotorealistico in 3D, chiamato realatar, che può essere distribuito tramite streaming video. Inches prosegue: «Mentre la generazione automatica della lingua dei segni era un’esplorazione tecnologica in laboratorio, non destinata al mercato, abbiamo studiato un nuovo concetto di “studio remoto” per le emittenti, in cui gli interpreti della lingua dei segni svolgono il loro lavoro senza bisogno di recarsi nella sede principale dell’emittente». Il tempo risparmiato potrebbe poi essere impiegato per generare più contenuti firmati. Le tecnologie utilizzate nel progetto si sono basate su algoritmi avanzati di apprendimento profondo e apprendimento automatico. Esse permettono a un computer di osservare una grande quantità di dati e, grazie a istruzioni tramite esempi, forniscono il risultato desiderato. «Nel progetto, gli algoritmi hanno aiutato a riprodurre una persona reale come un umano virtuale in tempo reale, su un’applicazione HbbTV dedicata», sottolinea Inches. Questa soluzione offre alle emittenti televisive un modo economico e sostenibile per sviluppare programmi in lingua dei segni, aprendo in definitiva le porte a un aumento della produzione.

Andare ancora oltre con risultati notevoli

«La natura innovativa di questo concetto è stata premiata con il prestigioso Premio NAB per l’innovazione tecnologica alla Broadcast Engineering and Information Technology Conference del 2020», riferisce Inches. Inoltre, con l’aiuto delle loro organizzazioni partner rappresentative, il progetto è stato in grado di coinvolgere i membri della comunità di non udenti in Belgio e Svizzera per convalidare le componenti tecnologiche. Le discussioni scaturite da questo coinvolgimento hanno permesso al progetto di lanciare un’iniziativa sotto l’egida dell’azione COST, LEAD-ME, che riunisce gli attori europei nel campo dell’accessibilità dei media. Altri due progetti, EASIER e SignON, sfrutteranno ed estenderanno i risultati del progetto Content4All, utilizzando direttamente la collezione firmata. Inoltre, il Fincons Group, coordinatore e partner industriale principale, sta esplorando modi concreti per sfruttare i risultati del progetto per la propria rete. Inches conclude: «Nel lungo termine, un risultato concreto del progetto potrebbe essere l’impiego della collezione di testi allineati con i video della lingua dei segni per scopi di ricerca e pre-commerciali, contribuendo così agli sviluppi futuri di tutti gli algoritmi di riconoscimento della lingua dei segni».

Parole chiave

Content4All, linguaggio dei segni, avatar, comunità di non udenti, servizi media, realatar, avatar umano 3D, trasmissione TV, accessibilità dei media

Scopri altri articoli nello stesso settore di applicazione