Il progetto mira a creare una mappatura della copertura mediatica su temi politici prodotta dai media italiani in vista delle elezioni politiche del 2018 analizzando il livello di engagement prodotto intorno a queste notizie su Facebook e Twitter, stimando la tendenza politica delle diverse fonti e misurando il livello di polarizzazione delle audience online rispetto a tali fonti. Al termine della campagna, saranno inoltre individuati cinque casi di informazione problematica che hanno avuto un impatto significativo sul clima della campagna o che sono riusciti a manipolare in modo efficace l’attenzione dei media saranno analizzati in profondità con l’obiettivo di ricostruire l’intera catena di propagazione di una storia a partire dalla fonte originale.
Il progetto sarà realizzato presso il Dipartimento di Scienze della Comunicazione, Studi Umanistici e Internazionali dell’Università di Urbino Carlo Bo da un team guidato da ricercatori di forte e riconosciuta esperienza nel campo dell’analisi dei social media e della comunicazione politica.
Abbiamo progettato e prototipato una infrastruttura tecnologica, basata sul software open source Huginn, allo scopo di collezionare in tempo reale un dataset di notizie con il loro rispettivo livello di engagement sui social media, in particolare Facebook (in termini di commenti, reaction e condivisioni) e Twitter (retweets e favorites).
Le notizie sono collezionate da tre fonti: Google News, il Global Database of Society (GDELT) e Twitter. Un set di agenti periodicamente raccoglie notizie da feed RSS di Google News relative alla politica italiana, utilizzando uno specifico set di parole chiave. Infine, inviano una richiesta all’API di GDELT per gli ultimi articoli pubblicati da fonti di informazione italiane, situate in Italia e utilizzano l’API streaming di Twitter per filtrare i tweet, includendo il link e la menzione a un candidato o a un partito politico. Un altro agente è responsabile della deduplicazione dell'elenco di URL raccolti, poi utilizzato per richiedere a Facebook Graph API e all’API di Twitter di raccogliere periodicamente sia il numero totale di commenti, reazioni e condivisioni di Facebook che i retweet e i favorite di Twitter. Il ciclo di vita di una notizia sui social media viene seguito ogni due ore per un'intera settimana, a partire dal momento in cui è stato pubblicato. Tutto il dataset è salvato su un database Mysql. Infine abbiamo costruito tre step differenti di analisi dei dati:
Activity | Deadline |
Progettare e sviluppare un sito web pubblico con informazioni statistiche. | 15 dicembre 2017 |
Progettare e implementare l'infrastruttura; migrare il prototipo. | 31 dicembre 2017 |
Implementare il sito Web con tabelle e grafici in tempo reale che mostrino le notizie politiche con maggiore engagement, quelle più discusse e condivise del momento, un trend alert, un set di dati giornaliero e dei brevi report settimanali. | 12 gennaio 2018 |
Data delle elezioni. | 4 marzo 2018 |
Evento pubblico in cui sarà presentato il report finale della ricerca. | 16/17 maggio 2018 |
Tutti gli output del progetto (ivi inclusi i report settimanali e di ricerca e i dati aperti) sono rilasciati sotto Licenza Creative Commons.
Il progetto è co-finanziato da un grant della Fondazione Open Society Institute in collaborazione con l'Information Program di Open Society Foundations.