Con Marco Calautti
Ad oggi, si ha sempre più la necessità di dover gestire grandi quantità di dati dai quali estrapolare informazioni chiare e rilevanti. Tuttavia, al fine di ottenere tali risultati, è necessario affrontare diverse sfide, che non hanno a che fare solo con l’elevato volume dei dati, ma anche con la velocità con cui questi dati cambiano nel tempo, con la varietà delle sorgenti che mettono a disposizione i dati, e con l’affidabilità delle sorgenti stesse. Le problematiche descritte sopra si sono guadagnate negli ultimi anni l’appellativo di “4 V dei Big Data”, e cioè Volume, Velocità, Varietà e Veridicità.
Si è recentemente osservato che la maggior parte del tempo investito in attività relative ai Big Data è dedicato alla gestione della Varietà dei dati, e cioè, il problema di integrare dati eterogenei provenienti da più sorgenti all’interno di una base di conoscenza unificata e di facile accesso.
Lo scopo di questa presentazione sarà quello di discutere come le tecnologie del semantic web possano essere utilizzate per aiutarci a gestire questo tipo di problemi. In particolare, si discuterà del cosiddetto approccio Ontology-Based Data Access (OBDA). Vedremo dei tipici casi d’uso di questo approccio, e i progressi più rilevanti della ricerca in tale ambito, inclusi alcuni dei contributi del relatore. Infine, discuteremo di possibili sviluppi futuri e delle principali sfide che ci attendono in questo campo.
Relatore
Marco Calautti è ricercatore senior presso il Dipartimento di Ingegneria e Scienza Dell’Informazione dell’Università di Trento. Ha ottenuto il suo dottorato in Ingegneria dei Sistemi e Informatica nel 2016, presso l’Università della Calabria. Nel periodo tra il suo dottorato e la posizione attuale, ha lavorato all’estero come ricercatore, collaborando con diversi istituti di ricerca di fama internazionale, quali l’Università di Oxford e l’Università di Edimburgo, con le quali tutt’ora intrattiene collaborazioni.
I sui interessi di ricerca ricadono nell’intersezione tra il data management e l’intelligenza artificiale (in particolare, tecnologie di web semantico). Questo nuovo campo di ricerca, denotato recementemente come “Knowledge-enriched data management”, ha come obiettivo quello di abilitare un uso efficace delle grandi quantità di dati di cui oggi disponiamo tramite l’utilizzo di approcci di intelligencza artificiale basati sul ragionamento automatico e la rappresentazione di conoscenza.