I Big data sono informazioni aggregate che permettono di descrivere e predire i comportamenti degli utenti. Vengono utilizzati dalle imprese per ottimizzare i processi di vendita, la comunicazione verso e con i clienti, ma anche per orientare mosse future come lo sviluppo di nuovi prodotti o servizi per i quali si percepisce una domanda più o meno esplicita.
Descrivere nello specifico
come si ricavano i big data è sempre più difficile, perché negli ultimi anni la quantità di informazioni estraibili dal web come dati comportamentali - click, tempi di lettura, carrelli d’acquisto portati a conclusione oppure no - cresce esponenzialmente con il moltiplicarsi delle piattaforme, con il loro sviluppo tecnologico e con l’aumento della popolazione collegata alla rete.
Come si raccolgono i Big Data
Esistono fonti diverse da cui è possibile ricavare Big Data. Si fa principalmente riferimento a 4 macro categorie:
- Dati ricavati dal web: studio analitico dei comportamenti degli utenti sui siti web aziendali, sui social network, sui blog;
- Dati esterni: accessibili a tutti, sono gli Open Data come https://www.dati.gov.it/, una delle principali fonti italiane per questo tipo di informazioni;
- Dati interni: ricavati dall’utilizzo di CRM o altri sistemi appunto privati;
- Dati smart: ricavati in modo aggregato dagli oggetti che troviamo nell’ “Internet of Thing” (IoT)
Queste quattro tipologie di fonti possono produrre una enorme quantità di dati che andranno organizzati a seconda degli obiettivi strategici delle aziende che adottano l’approccio analitico al proprio business. Queste aziende sceglieranno di volta in volta quali tipi di dati utilizzare, come trattarli e perché.
Tipologie di analisi collegate dei big data
Queste gigantesche basi di dati vengono raccolte in prima battuta come dati grezzi e poi elaborate dai
data scientist, figure professionali ormai sempre più richieste dalle aziende e dai loro decision makers. In questo contesto la disciplina che prende il nome di Business Analytics si occupa di produrre le seguenti tipologie di resoconto:
- Descriptive Analytics
- Predictive Analytics
- Prescriptive Analytics
- Automated Analytics
Il primo step, quello
descrittivo, è il più diffuso e rappresenta il punto zero dell’analisi dei dati. Le analisi descrittive sono importantissime per capire dove ci si trova, quali pagine sono le più viste, quali i prodotti più acquistati o comunque visitati, quali comportamenti in particolare configurano uno stato di cose da cui è possibile dire “succede questa cosa per questo motivo”.
Il secondo passaggio è possibile in virtù di una buona analisi descrittiva. La
predizione è un primo livello di inferenza importante sui big data, perché consente di tracciare linee di andamento su base statistica. L’analisi predittiva utilizza i big data per fare stime sul futuro prossimo, solitamente muovendosi per intervalli dai due ai sei mesi.
Il terzo ambito di interesse della business analytics è l’analisi
prescrittiva, che rispetto alla predittiva compie un ulteriore passo in avanti spingendosi a prescrivere mosse e azioni precise da mettere in campo. Solitamente le prescrizioni sono conseguenti ad attività di test sul comportamento di grandi quantità di utenti a cui vengono somministrate variazioni di uno stesso messaggio testuale, visivo, audio, multimediale o transmediale.
Processi automatizzati di analisi dei dati
Quando ci si trova a “combattere” con basi di informazioni già di per sé molto ampie che per di più vanno ricombinate tenendo conto dei percorsi, delle piattaforme e dei device, diventa importante impostare processi automatizzati tali da mettere i data scientist in condizione di leggere tutto correttamente, o quantomeno di ridurre gli errori di interpretazione. I dati vanno letti e compresi, dunque la variabile umana rimane imprescindibile, ma le modalità con cui gli stessi dati vengono aggregati e perfino sgrezzati, può in diversi casi essere soggetta ad automazioni.
Un esempio di analisi prescrittiva: i test A/B
Per fare un esempio di analisi prescrittiva, puoi immaginare un
test A/B in cui decine di migliaia di utenti vengono fatti atterrare su due versioni diverse della stessa landing page. La differenza può consistere esclusivamente in un elemento come il colore di alcuni elementi del layout. Se su un numero molto alto di utenti abbiamo differenze nette di comportamento rispetto alla presenza di un singolo elemento differenziante, allora sarà opportuno prescrivere la presenza dell’elemento che ha fornito il riscontro più utile - rispetto agli obiettivi di business - come tratto da servire in tutte le pagine web dello stesso tipo.