Glossario

Glossario: Google BigQuery

Ti anticipo che in questo glossario ti parlerò di un argomento abbastanza complesso e tecnico, ma non ti preoccupare: eviterò di fare lo spiegone e cercherò di farlo in modo semplice 😀

Cos’è Google BigQuery

Google BigQuery è un data warehouse cloud di Google che consente di archiviare e recuperare dati utilizzando un ambiente SQL.

‘Spetta ho già usato un po’ troppi termini tecnici 🙂

Riproviamo.

La definizione “parla come mangi” sarebbe: Google BigQuery è un magazzino di dati in cloud messo a disposizione da Google che consente di archiviare dati, tanti dati.

Tieni presente che si parla di 5 petabyte di informazioni (no, non è una parolaccia. Un petabyte corrisponde a 1000 terabyte), quindi siamo nell’ambito dei big data.

E come si fa a recuperare questi dati? Grazie al linguaggio SQL che permette di interrogare direttamente il database.

Ci sono alcune differenze tra database e data warehouse che è bene sottolineare.

Il database è una banca dati e il suo scopo è raccogliere le informazioni (dai non dirmi che non hai mai usato il vecchio Microsoft Access e no, Excel non è un database). Il data warehouse è sì un database, ma diciamo più ciccione. Ha, infatti, volumi e complessità di dati di gran lunga più vasti.

La differenza principale tra i due concetti sta nel fatto che le informazioni immagazzinate in un data warehouse vengono organizzate, perfezionate e passate al setaccio dai sistemi di business intelligence con lo scopo di produrre un’analisi.

In sostanza, il database registra i dati; il data warehouse li organizza per effettuare un’analisi.

Mi rendo conto che solo fin qui ho dovuto usare termini leggermente complessi. Ma tieni duro che siamo a buon punto 😉

Ricapitolando, Google ha deciso di mettere a disposizione (a pagamento, ovviamente) il suo potente data warehouse ai data scientist. Non solo: grazie all’utilizzo di semplici comandi SQL, sarà possibile interrogare direttamente il database, senza bisogno di un amministratore.

Il tutto è serverless, il che significa che l’utente non dovrà gestire l’infrastruttura.

Le aziende potranno acquisire e analizzare i dati in tempo reale, sfruttando le funzionalità avanzate di importazione di flussi (di dati) e avere informazioni sempre aggiornate, senza acquistare costosi macchinari e senza creare reti ad hoc.

Oltre a offrire la possibilità di utilizzare questo immenso database, Google ha implementato un ulteriore servizio: BigQuery ML (ancora in beta), in cui “ML” sta per machine learning.

BigQuery ML permette ai data scientist di creare, testare e lanciare modelli di machine learning personalizzati grazie ai comandi SQL.

Inoltre, sarà possibile addestrare gli algoritmi all’interno della piattaforma stessa in pochissimo tempo rispetto ai sistemi convenzionali; una volta testati gli algoritmi, si potranno archiviare in BigQuery e condividerli con altri utenti.

Integrazione nativa con Google Analytics 4

Con l’arrivo del nuovissimo Google Analytics 4, ora BigQuery è integrato gratuitamente e nativamente con GA4. Questo sicuramente è una funzionalità che aumenterà l’utilizzo di GA4 per clienti non enterprise!

Se non hai dimestichezza con GA4 e desideri imparare a padroneggiare nel modo corretto questo strumento, nel mio ultimo libro “Google Analytics 4 per chi inizia” ti guido passo passo per imparare a utilizzare GA4 in maniera semplice e pratica.

Utilizzi di BigQuery

Google BigQuery è alla portata di chiunque abbia grandi set di dati da analizzare, ad esempio, le aziende di medie/grandi dimensioni che utilizzano sistemi di business intelligence.

Grazie alla potenza di calcolo di BigQuery, le tempistiche per l’analisi vengono ridotte al minimo, anche nel caso in cui la complessità e la quantità di dati aumenti.

Facciamo un esempio.
Un’azienda deve testare alcuni parametri di una rete di computer effettuando dei ping tra le macchine. Alla fine di questo test, l’azienda si ritroverà con miliardi di record da analizzare.
È proprio in questi casi che uno strumento come Google BigQuery diventa indispensabile, soprattutto per la sua potenza, ma anche per il rapporto prezzo/prestazioni.

Funzionalità e vantaggi di Google BigQuery

Importazione dati e condivisione

Si possono trasmettere a BigQuery migliaia di righe di dati al secondo per l’analisi in tempo reale ed è possibile condividere queste informazioni con altri utenti.

Serverless

Come abbiamo già anticipato, non serve preoccuparsi di gestire l’infrastruttura o dei costi di manutenzione: i server e la sicurezza dei dati sono affidati all’azienda che gestisce il servizio, ossia Google.

SQL standard

Il linguaggio SQL standard evita di far riscrivere codice ed è più facile da utilizzare rispetto ad altri linguaggi di programmazione.

Backup e ripristino

Le informazioni sono salvate su diversi data center, di cui esistono svariati backup: i dati sono in buone mani. E il ripristino è semplice e rapido.

Data Transfer Service

BigQuery trasferisce automaticamente i dati da strumenti esterni come Google Marketing Platform, Google Ads e YouTube.

Piattaforma per l’intelligenza artificiale

È una potente piattaforma per l’intelligenza artificiale: al suo interno si potranno testare gli algoritmi di machine learning.

Piattaforma per la business intelligence

Grazie alla trasformazione e all’analisi dei dati, BigQuery è uno strumento indispensabile per la business intelligence.

Controllo dei costi

I costi sono flessibili e personalizzabili in base al tipo di azienda e al consumo. E il rapporto costo/prestazione è davvero insuperabile.

Link Utili

Matteo Zambon

View Comments

  • La mia domanda è:
    Potrebbe fare un altro esempio concreto di utilizzo dei dati presenti su BigQuery da parte di un'azienda?
    Per esempio l'azienda xxx ha bisogno di storare i dati su BigQuery in modo tale da analizzarli ed avere yyy oppure zzz

    • Ciao Ernesto, i motivi possono essere diversi. Grazie a BigQuery hai la possibilità di analizzare i dati e integrarli con altre sorgente di dati (es: Google Analytics 4, CRM, vendite offline etc). BigQuery ti permette di ottenere i dati in tabelle e poter analizzare quei dati con Data Studio.

      Fammi sapere

Recent Posts

Attribuzioni errate in GA4: cause e soluzioni al problema

Negli ultimi mesi hai notato in Google Analytics 4 un calo improvviso e inspiegabile nelle…

3 mesi ago

Come creare una Dashboard Ecommerce per analizzare i dati degli acquisti Nuovi e di Ritorno

Se ti trovi su questa guida è perché hai compreso che solo attraverso la Data…

4 mesi ago

Consent Mode v2 e calo dei dati delle audience e del traffico in Google Ads: cause e soluzioni

Da quando hai configurato la Consent Mode v2 (CM v2) hai notato cali improvvisi o…

6 mesi ago

Data Leak Google: Chrome e le implicazioni per la Privacy e la Digital Analytics

Premesso che non è possibile conoscere l'esatto funzionamento né di Chrome, né degli algoritmi di…

6 mesi ago

Come creare Report in GA4 per analizzare campagne advertising e marketing con UTM

Da quale canale di marketing arriva il maggior numero di conversioni? Quale campagna di marketing…

6 mesi ago