Mancano ormai pochi giorni al voto. Dopo il referendum sulla Brexit, e gli appuntamenti elettorali negli Stati Uniti, Francia, Germania e Regno Unito, il 4 Marzo 2018 è il turno dell’Italia. Come accade ormai regolarmente per ogni consultazione popolare, dubbi e preoccupazioni sono stati sollevati circa il possibile impatto dell’informazione problematica (propaganda, false informazione diffuse in buona o cattiva fede, pubblicità ingannevole, etc) (Jack, 2017) sulla campagna elettorale (Horowitz, 2017; Nardelli & Silverman, 2017). Il progetto MINE 2018 nasce per rispondere a questi dubbi provando a offrire risposte alle preoccupazioni sollevate attraverso una mappatura completa della copertura informativa creata dai media online italiani in vista delle elezioni politiche del 2018. Nel momento in cui scriviamo queste righe, il dataset Mine raccoglie 89.425 notizie provenienti da 4.329 fonti diverse.
In questo post descriviamo la metodologia che abbiamo messo a punto per misurare la tendenza politica delle fonti informative presenti nel nostro dataset.
Dopo aver passato in rassegna i principali metodi utilizzati per caratterizzare la tendenza politica di un utente Twitter in un contesto multi-partitico (Barberá, 2015; Gu, Chen, Sun, & Wang, 2017), abbiamo optato per costruire il nostro sistema di misurazione a partire dal Media Partisanship Attention Score sviluppato da Yochai Benkler, Robert Faris, Hal Roberts, e Ethan Zuckerman per il loro studio sulla copertura mediatica delle elezioni Presidenziali americane del 2015 (Faris et al., 2017).
Sviluppato per il contesto politico bipolare americano, la versione originale del Media Partisanship Attention Score si basa sulla frequenza di condivisione di fonti informative tra gli utenti che hanno retwittato i messaggi dei candidati in lizza (@realdonadtrump e @hillaryclinton). L’idea è quella di caratterizzare in un primo tempo gli utenti (in base alla proporzione dei retweet fatti per l’uno o l’altro candidato) e, a cascata, caratterizzare le fonti che questi utenti condividono nei loro profili Twitter. Una fonte che è linkata solo da utenti che hanno retwittato unicamente @realdonadtrump è una considerata una fonte vicina a questo candidato.
A questo scopo, abbiamo raccolto due dataset. Il primo raccoglie tutti i retweet degli account dei principali partiti e attori politici italiani durante il mese di novembre 2017 (N=172.046, 32,936 contributors unici). Il secondo include invece tutti i tweet pubblicati dai 5.000 utenti più attivi del primo dataset, durante il mese di gennaio 2018 (N=3.231.715 di cui 1.049.388 contenente un link). Abbiamo utilizzato questi due dataset come banco di prova per sviluppare, testare e affinare la metodologia di mappatura che abbiamo progettato. I dati della mappatura che presenteremo nel report finale saranno basati su un dataset di retweet del mese di gennaio 2018 e di tweet dei 5.000 utenti più attivi in questo dataset dal primo di febbraio al 4 marzo 2018, giorno delle elezioni.
Abbiamo dunque proceduto calcolando (su una scala 0.0-1.0) la vicinanza di ciascun utente a ciascuno dei cinque principali partiti politici (Movimento 5 Stelle - M5S, Partito Democratico - PD, Forza Italia - FI, Lega - LN, Liberi e Uguali - LeU) in base alla proporzione dei retweet fatti. Usando questa misura di prossimità dell’utente abbiamo provveduto a calcolare, per ciascuna fonte e ciascun partito, il Media Source Partisanship Attention Score (MSPAS). A differenza del punteggio originale, il nostro adattamento a sistemi politici multi-partito consiste in un set di punteggi, espressi si una scala 0.0-1.0, per ciascuna fonte e partito. La peculiarità del caso italiano, caratterizzato dalla presenza del Movimento 5 Stelle che non si riconosce nelle e non è riconducibile alle classiche dimensioni ideologiche, ha inoltre reso impossibile mappare i partiti e dunque le fonti su una scala sinistra-destra.
La procedura usata per calcolare questi punteggi è stata testata con un approccio di face-validity basato sull’osservazione dei punteggi attribuiti ai siti ufficiali di ciascun partito politico (Tabella 1).
Usando il valore massimo del MSPAS e una soglia di 0.33, abbiamo poi assegnato a ciascuna fonte uno dei cinque principali partiti politici. Le fonti per cui il valore massimo era inferiore a 0.33 sono state assegnate alla categoria neutrali (Tabella 2).
La categoria delle fonti neutrali include, come prevedibile, la maggior parte dei media tradizionali quali La Repubblica, Corriere.it e La Stampa ma anche il popolare sito satirico Lercio. Le fonti di destra popolari come Panorama, Il Giornale e Libero sono incluse nella categoria Lega. Nella stessa categoria troviamo un variegato gruppo di fonti che pubblicano contenuti problematici che variano da forme di iper-partigianeria a vera e propria disinformazione. Il sito web del popolare show televisivo Le Iene figura tra le fonti più popolari della categoria Movimento 5 Stelle. Alla stessa categoria appartengono il sito web de Il Fatto Quotidiano, gli organi di comunicazione ufficiali dei Movimento (beppegrillo.it e ilblogdellestelle.it) e diversi siti hyper-partisan che pubblicano varia tipologia di contenuti problematici.
Seguendo questa categorizzazione, abbiamo infine calcolato il volume totale di commenti, reazioni e condivisioni raccolti dagli articoli pubblicati da ogni fonte. Allo scopo di misurare il volume di engagement raccolto su Facebook dalle fonti appartenenti a ciascuna categoria abbiamo infine sommato i valori ottenuti da ciascuna fonte appartenente a quella categoria.
I risultati mostrati in Tabella 3, evidenziano chiaramente che il volume complessivo di engagement sui social media originato attorno ad alcune fonti partigiane (in particolare per il Movimento 5 Stelle) rivaleggia e talvolta supera il coinvolgimento ottenuto dalle fonti nella categoria neutrale che include le maggiori fonti di informazione del nostro Paese.
Riferimenti bibliografici
Faris, R., Roberts, H., Etling, B., Bourassa, N., Zuckerman, E., & Benkler, Y. (2017). Partisanship, Propaganda, and Disinformation: Online Media and the 2016 U.S. Presidential Election. Retrieved from https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3019414
Horowitz, J. (2017, November 24). Italy, Bracing for Electoral Season of Fake News, Demands Facebook’s Help. The New York Times. Retrieved from https://www.nytimes.com/2017/11/24/world/europe/italy-election-fake-news.html
Jack, C. (2017). Lexicon of Lies: Terms for Problematic Information. Data & Society. Retrieved from https://datasociety.net/output/lexicon-of-lies/
https://www.buzzfeed.com/albertonardelli/one-of-the-biggest-alternative-media-networks-in-italy-is
Credits
Photo by Kaboompics // Karolina from Pexels https://www.pexels.com/photo/man-reading-newspaper-6053/