A cura di Giada Marino
English version @ Social Media Snacks
Questo articolo esplora le possibilità di connettere Google BigQuery con Tableau al fine di analizzare un dataset di grandi dimensioni e/o in continuo aggiornamento e fornire alcune visualizzazioni grafiche.
Prima di tutto, cos'è Google BigQuery? Google BigQuery è un servizio web RESTful basato su Google Storage che funziona su grandi moli di dati, presenta funzioni diverse come la possibilità di interrogare il dataset attraverso il linguaggio di codifica SQL; supporta l’importazione di dati in diversi formati (CSV o JSON) tramite Google Storage; l'integrazione con altre applicazioni Google, ecc.
Tableau, invece, è un software statistico e consente di analizzare e visualizzare un dataset, anche di grandi dimensioni, in una matrice casi per variabili in formato .csv o .txt. Ha un'interfaccia facile da usare che non richiede particolari background nella codifica.
Perché connettere Google BigQuery con Tableau potrebbe essere utile? Google BigQuery è uno strumento potente per analizzare un dataset con un elevato numero di record in costante aggiornamento, come nel caso del dataset del progetto MINE2018. D'altra parte, ha anche alcuni svantaggi, ad esempio richiede una conoscenza di base del linguaggio SQL, non fornisce una visualizzazione grafica all'interno della stessa piattaforma - per aggiungere questa funzionalità è necessario utilizzare un altro strumento esterno, come ad esempio Google Data Studio -. Tableau, invece, consente di gestire un dataset di Google BigQuery, anche in costante aggiornamento, direttamente dalla sua interfaccia, fornendo una migliore usabilità, molte funzioni statistiche e anche diverse possibili visualizzazioni grafiche dei dati.
La guida
Passando alla fase operativa, prima di tutto è essenziale avere un account su Google BigQuery e essere invitati dall'admin - se non lo siete direttamente - a prendere parte al progetto. E’ possibile trovare ulteriori informazioni sulla procedura nella Guida rapida di Google BigQuery.
Per connettere Google BigQuery a Tableau, è sufficiente aprire il menu “Data”, cliccare su “New Data Source” e quindi selezionare "to a server Google BigQuery" dall'elenco a tendina denominato "Connect".
Dopo aver completato questa procedura, si viene reindirizzati alla pagina di accesso a Google BigQuery e si viene invitati ad accedere con le proprie credenziali per connettere l’account Google BigQuery a Tableau. Quindi, l'interfaccia di Tableau apparirà come nelle seguenti immagini.
Immagini 1 & 2
Come mostrato dalle immagini, è necessario selezionare il progetto con il suo nome - il primo campo, invece, può essere lasciato in bianco - e il dataset specifico contenuto in quel progetto che si vuole utilizzare per l’analisi. Alla fine, si è in grado di selezionare "Archive", che in realtà è la matrice contenente i dati. Una volta connesso, Tableau aggiornerà costantemente il dataset, quindi se si desidera salvare una visualizzazione grafica, bisogna fare attenzione a mettere in pausa la funzione in esecuzione oppure salvare la visualizzazione in formato .JPEG o .png.
Terminata questa prima fase di connessione, sarà possibile visualizzare il seguente schema Measure per Dimension, (in questo caso ho utilizzato i dati MINE2018), che mostra le variabili in cui è organizzato il dataset. All'interno del menu “Analytics”, invece, è possibile trovare alcune funzioni statistiche utili per analizzare i dati.
Immagine 3
To be continued....