Questo articolo esplora e descrive un possibile uso combinato dei dati MINE2018 con quelli disponibili nella piattaforma Media Cloud.
Media Cloud è un progetto congiunto del Center for Civic Media dell’MIT e del Berkman Klein Center for Internet & Society di Harvard. Gli autori lo definiscono una piattaforma open source per studiare gli ecosistemi mediali. Si tratta, in pratica, di un set di strumenti che monitorano costantemente milioni di siti web recuperando il full-text degli articoli e consentendo a ricercatori di tutto il mondo di utilizzare gratuitamente strumenti avanzati per aggregare, analizzare e visualizzare informazioni sui contenuti raccolti dalla piattaforma.
La piattaforma consiste di tre strumenti principali: la dashboard, il topic mapper e il source manager. Un insieme di fonti è chiamato, nel gergo di Media Cloud, una collection. Fino a pochi mesi fa le collection di fonti in Media Cloud del nostro Paese erano largamente incomplete con la conseguenza che realizzare studi sull’Italia era difficile se non impossibile. Di recente tuttavia le cose sono cambiate anche, ma non solo, grazie a MINE2018.
Il team di Media Cloud ha infatti reso disponibili a inizio dicembre una collection di fonti a partire da un elenco di fonti da noi fornito. Si tratta di Italy - 2018 election study e consiste di 1.153 fonti che generano nel complesso centinaia di migliaia di frasi (unità usata per l’analisi del testo degli articoli) al giorno.
Di recente, oltre a questa collection, il team della piattaforma ha inoltre annunciato la disponibilità di Italy - National, Italy - State & Local e numerose altre collection regionali. Sfruttando queste collection, è possibile costruire ricerche nella dashboard e mappature di temi che restituiscano il volume delle notizie nel tempo intorno ai principali partiti o movimenti politici, i principali termini utilizzati in relazione a ciascuno di questi attori, l’elenco completo delle notizie e la rilevanza e relazioni fra le fonti.
Grazie a questi dati, e in particolare grazie all’elenco delle notizie (complete di titolo, url e id) è possibile combinare il dataset di MINE2018 con i risultati di una ricerca su Media Cloud usando l’URL della notizie come comune identificativo univoco. In questo modo sarà possibile leggere i dati di engagement anche alla luce del testo del titolo e del testo della notizia restituendo un quadro ancora più completo dei temi rilevanti per la campagna elettorale 2018.
Photo by brotiN biswaS from Pexels https://www.pexels.com/photo/advertisements-batch-blur-business-518543/