CORDIS - Risultati della ricerca dell’UE
CORDIS

TrustwOrthy model-awaRE Analytics Data platfORm

Article Category

Article available in the following languages:

Analisi dei megadati per principianti

I megadati sono ancora una cosa per pochi: soltanto le aziende più esperte nel campo dell’informatica e ricche hanno una possibilità di scalfire la superficie del loro potenziale. Tutto questo potrebbe presto cambiare grazie a una piattaforma di analisi dei megadati sviluppata nell’ambito del progetto TOREADOR, che gestirà in modo automatico tutti i principali problemi relativi alla preparazione dei dati su richiesta.

Economia digitale icon Economia digitale

«Ci si aspetta moltissimo dai megadati, ma il divario tra ambizione e realizzazione è ancora ampio, in particolare per le PMI», recrimina il dott. Ernesto Damiani. E lui lo dovrebbe sapere: dall’inizio del 2016, il dott. Damiani ha guidato un consorzio forte di 10 membri che esamina le ragioni per queste alterne fortune e le possibili soluzioni. Se relativamente poche PMI hanno inserito l’analisi dei megadati nelle loro offerte o processi interni, questo avviene principalmente per due ragioni. La prima è una carenza di competenze nell’analisi dei megadati, come spiega il dott. Damiani. Un’azienda che voglia, per esempio, adattare le proprie offerte al comportamento del consumatore utilizzando un’applicazione gratuita dovrebbe fare ricorso a una consulenza molto costosa. Si tratta al momento dell’unico modo per associare gli obiettivi aziendali a una classe di soluzioni della scienza e della tecnologia dei dati. «Concretamente, il progetto potrebbe essere riassunto con una simile frase: “raccogliere gli eventi generati dalle applicazioni dei clienti di base e utilizzarli per addestrare un classificatore scalabile a foresta casuale multi-categoria del loro comportamento da schierare su servizio cloud pubblico”», egli afferma. La seconda ragione è il lungo tempo di lancio e, nuovamente, il costo proibitivo delle campagne di raccolta di megadati, anche quando l’approccio alla scienza dei dati è già stato identificato. Insieme, questi problemi hanno tenuto lontane le PMI e le aziende non esperte nel settore TIC dall’analisi dei megadati, anche se esse rappresentano una parte considerevole della spina dorsale manifatturiera dell’UE. La metodologia e il kit di strumenti di TOREADOR (TrustwOrthy model-awaRE Analytics Data platfORm) offrono una soluzione a entrambi i problemi: essi rendono automatica e disponibile a basso costo l’analisi dei megadati, rendendo al contempo più facile rispetto a prima il suo adattamento alle esigenze settoriali specifiche del cliente. La struttura di TOREADOR supporta due trasformazioni automatizzate. La prima inizia da un modello dichiarativo leggibile dal computer che raccoglie gli obiettivi del titolare dei dati e finisce in un modello procedurale sensibile alla semantica e indipendente dalla tecnologia che descrive il calcolo da effettuare. In seguito, la seconda trasformazione sviluppa il modello procedurale per computare un modello di implementazione dipendente dalla tecnologia. Quest’ultimo può essere eseguito su una piattaforma Apache, negli uffici del cliente, su servizi cloud commerciali quale AWS, come eseguibile in codice Python sulla piattaforma Azure o come contenitore Docker. «I nostri modelli dichiarativi possono raccogliere in modo interattivo gli obiettivi aziendali delle campagne di raccolta dei megadati e consentono al kit di strumenti di TOREADOR di fornire consigli automatici sulla fattibilità delle soluzioni. I nostri modelli procedurali forniscono poi una descrizione innovativa del calcolo dell’analisi dei megadati negli standard OWL/S sensibili alla semantica, e i nostri compilatori traducono questi modelli procedurali in flussi di lavoro del tutto eseguibili o persino in codice Python originariamente in parallelo. Stiamo osservando un processo di sviluppo iterativo, dove utenti non esperti di informatica possono creare velocemente una campagna generando un flusso di lavoro eseguibile su un servizio cloud pubblico, e poi (se necessario) chiamare sviluppatori per generare un codice Python autonomo», spiega il dott. Damiani. I partner del progetto hanno già identificato quattro progetti pilota industriali nei settori della manutenzione predittiva dei motori aeronautici, della gestione predittiva delle centrali solari, dell’analisi dei registri delle applicazioni aziendali e dell’analisi dei flussi di click per applicazioni nel commercio elettronico. «La piattaforma TOREADOR è disponibile ed è stata implementata nei siti dei quattro progetti pilota. È stata inoltre resa disponibile come un’anteprima gratuita a membri selezionati della comunità TOREADOR, che è composta da aziende europee (molte di queste PMI) reclutate con l’aiuto di TAIGER (Spagna), una PMI innovativa nel consorzio di TOREADOR. Dettagli di questi primi utilizzatori sono disponibili sul nostro sito web. Inoltre, la metodologia di TOREADOR è stata distribuita ad altri progetti europei avvalendosi di campagne sui megadati come EVOTION», sostiene il dott. Damiani. La conclusione del progetto è prevista alla fine del 2018. Fino ad allora, il consorzio intende continuare ad ampliare il catalogo di servizi disponibili sulla piattaforma e fornire esempi delle campagne di raccolta di megadati rese possibili da TOREADOR, inclusi l’addestramento e l’implementazione di modelli avanzati di apprendimento automatico.

Parole chiave

TOREADOR, PMI, megadati, analisi, azienda, kit di strumenti, cloud

Scopri altri articoli nello stesso settore di applicazione