Glossario

Glossario: Espressioni Regolari (Regular Expressions)

Le Espressioni Regolari (in inglese “Regular Expressions” e abbreviate anche con “RegEx”) possono esserti di grande aiuto nella web analytics permettendoti di creare dei filtri.

Tipicamente le espressioni regolari sono pane quotidiano per i programmatori ma un grande incubo per i “markettari”.

Ciao Markettaro in ascolto, lo so che stai sudando freddo, ma ti prometto che anche tu puoi imparare le RegEx di base, te le spiegherò in modo molto semplice 🙂

Ma perchè devo conoscere le espressioni regolari? Che ho fatto di male?

Beh, devi conoscerle innanzitutto perchè sia in Google Analytics che in Google Tag Manager le Regular Expressions svolgono un importantissimo ruolo. Ad esempio in GTM servono da filtro per gli attivatori: indicano in pratica quando il tag deve attivarsi.

Quindi calma e sangue freddo, impariamo insieme quelle basilari 🙂

 

Punto (.)

Il punto significa “sostituiscimi con qualsiasi carattere alfanumerico”.

Esempio:

Ci.o può essere ciao, ma anche Cieo, Ci8o, Ci@o e così via.

 

Asterisco (*)

L’asterisco significa “sostituiscimi con zero o più del segno viene prima”.

Ad esempio:

Ciao* vuol dire Cia, Ciao, Ciaoo, Ciaooo, Ciaoooo eccetera.

Allo stesso modo Cia*o vuol dire Ciao, Ciaao, Ciaaao e così via.

Questa espressione regolare è veramente utile, puoi usarla per fare un sacco di cose bellissime.

Ad esempio poniamo il caso di avere un sito strutturato così:

/prodotti/uomo/scarpe/
/prodotti/donna/scarpe/
/prodotti/bambino/scarpe/

Se scrivi /prodotti/*/scarpe/ stai includendo tutti e tre questi percorsi.

Ti faccio un esempio pratico: se volessi filtrare tutte le pagine contenenti le guide, su Tag Manager Italia, potrei andare su: Comportamento > Contenuti del sito > Tutte le pagine e digitare nel filtro /guida*.

Punto-asterisco (.*)

Ecco, ora che abbiamo capito il significato del punto (.) e dell’asterisco (*), possiamo capire meglio cosa significa la combinazione di questi due caratteri.
Questa espressione regolare ti servirà spesso (soprattutto in Google Tag Manager 🙂 ), perché vuol dire “tutto”, inteso come “qualsiasi carattere alfanumerico”.

Ad esempio quando crei un attivatore devi inserire un filtro, poniamo caso:

“Page URL corrisponde all’espressione regolare .*

Questo vorrà dire “attivati in tutte le pagine” (nello specifico: in corrispondenza di TUTTE le page URL del sito).

Backslash (\)

Questo carattere ti sarà di enorme aiuto! Infatti serve per “annullare” l’effetto di un carattere che altrimenti, in sintassi regex, darebbe un comando preciso.

Infatti, posto prima di un carattere speciale regex, serve a considerarlo come un carattere normale. Vedrai che sarà una mano santa nei casi di ambiguità.

Poniamo l’esempio degli indirizzi IP:

IP address = 131\.45\.78\.994

Il punto che separa i numeri nell’indirizzo IP, nel caso delle espressioni regolari, verrebbe considerato un carattere speciale e manderebbe in tilt il filtro. Usando il backslash invece stiamo comunicando che si tratta di caratteri normali.

Se ad esempio vuoi creare una vista su Google Analytics che escluda un indirizzo IP, vai su:

Amministrazione > Vista > Filtri > Aggiungi Filtro

Scegli Tipo di filtro: personalizzato > Escludi: Indirizzo IP e digita l’indirizzo IP con i Backslash.

Un altro esempio di uso dei Backslash è questo:

www\.miosito\.it

Capisci quanto può essere utile? 🙂

 

Caret (^)

Vuol dire “inizia con…”

Esempio: ^scarpe

potrebbe voler dire scarpette, scarpe da corsa, scarpe rosse, etc…

 

Simbolo del dollaro ($)

E’ come l’opposto del caret (^) perchè vuol dire “finisce con…”, escludendo qualsiasi cosa possa venire dopo.

Salut$ esclude quindi Salutare, Salute, Salutista, Saluterò, eccetera.

 

Punto interrogativo (?)

Vuol dire che l’ultimo carattere è facoltativo.

Cia?o può essere sia Ciao che Cio.

Può essere utilizzato anche per aggirare errori di battitura.

 

Parentesi tonde ()

Le parentesi sono facili da capire perché funzionano proprio come nella matematica: raggruppano caratteri.

 

Pipe (|)

Il pipe, ovvero quell’asticella lunga lunga, significa “OR” (“oppure” in italiano) e mette in relazione il carattere che precede con quello che viene dopo, in questo modo:

Ci|ao vuol dire Cio OPPURE Cao

Se vogliamo includere più segni nella relazione OR, possiamo usare le parentesi, così:

Barb(at|ru)cco vuol dire Barbatcco oppure Barbrucco

Capito? Beh, magari usalo in modo che abbia più senso 😛

 

Parentesi quadre ([])

Spesso utilizzate insieme al trattino, servono a creare delle liste semplici, ad esempio:
Ciao[15] vuol dire Ciao1, Ciao2, Ciao3, Ciao4 e Ciao5.

Anche in abbinamento ai numeri, quindi:

201[57] vuol dire 2015, 2016, 2017.

Senza il trattino, per ottenere l’effetto qui sopra dovremmo scrivere: 201[567]

 

Trattino breve (-)

Abbiamo già capito più o meno a cosa serve, ma osserviamolo meglio: usato insieme alle parentesi quadre serve a creare delle corrispondenze fra intervalli di caratteri. Ad esempio:

 

  • [az] vuol dire “tutte le lettere dalla a alla z minuscole”
  • [AZ] vuol dire “tutte le lettere dalla a alla z maiuscole”
  • [09] vuol dire “tutti i numeri” (molto usato ad esempio per gli e-commerce con prodotti che hanno modelli numerati)

 

Segno più (+)

Vuol dire “uno o più del segno precedente”. Potrebbe essere confuso con l’asterisco, ma a differenza sua non comprende lo zero.

Esempio:

Ciao+ può essere Ciao, Ciaoo, Ciaooo, Ciaoooo, eccetera (ma non Cia, per quello dovremmo usare l’asterisco).

 

Parentesi graffe ({ })

{2} vuol dire “ripeti l’ultimo segno 2 volte”.

Barbatruc{2}o quindi vorrebbe dire Barbatrucco
mentre Barbatruc{4}o quindi vorrebbe dire Barbatrucccco.

{1,2} definisce il numero minimo e massimo di volte in cui il carattere che precede si può ripetere.

Vuol dire in pratica “ripeti l’ultimo segno almeno una volta ma non più di due”.
Esempio:

“cia{1,2}o” vuol dire “ciao” oppure “ciaao”.
Fiuuuu… le espressioni regolari principali sono già finite! Non era così difficile, vero? 😀

Hai paura di aver pasticciato con le espressioni regolari? Non ti preoccupare: esistono dei tool online che ti permettono di verificarle prima di usarle. Ti lascio un link qua sotto 🙂

LINK UTILI:

Matteo Zambon

View Comments

  • Ciao Matteo.
    Devo tracciare una conversione che sta su un sottodominio in GA Universal;
    La landing page è del tipo:
    venderepremium.miosito.com ( dove ho impostato la vista)
    la ths page è del tipo:
    tutorialvenderepremium.miosito.com

    In entrambi i casi le url finiscono con dati parametrici

    Come posso fare?
    NOn riesco a capire che espressione regolare settare

    Grazie mille

Recent Posts

Attribuzioni errate in GA4: cause e soluzioni al problema

Negli ultimi mesi hai notato in Google Analytics 4 un calo improvviso e inspiegabile nelle…

3 mesi ago

Come creare una Dashboard Ecommerce per analizzare i dati degli acquisti Nuovi e di Ritorno

Se ti trovi su questa guida è perché hai compreso che solo attraverso la Data…

4 mesi ago

Consent Mode v2 e calo dei dati delle audience e del traffico in Google Ads: cause e soluzioni

Da quando hai configurato la Consent Mode v2 (CM v2) hai notato cali improvvisi o…

6 mesi ago

Data Leak Google: Chrome e le implicazioni per la Privacy e la Digital Analytics

Premesso che non è possibile conoscere l'esatto funzionamento né di Chrome, né degli algoritmi di…

6 mesi ago

Come creare Report in GA4 per analizzare campagne advertising e marketing con UTM

Da quale canale di marketing arriva il maggior numero di conversioni? Quale campagna di marketing…

6 mesi ago