I Big Data sono set di dati troppo grandi (in volume) e complessi per essere analizzati dai normali software per elaborazione dati. Tali dati richiedono nuove specifiche tecnologie e metodi analitici per poter essere trasformati in risultati e informazioni utili. Come siamo arrivati al punto di avere a disposizione così tante informazioni? Con l’avvento degli smartphone, e di qualsiasi altro dispositivo definito smart*, la mole di dati che ogni giorno compagnie ma anche singoli individui producono, raccolgono e archiviano, e la velocità con cui lo fanno, sono andate crescendo esponenzialmente.
Dati vengono continuamente creati sotto forma di testi, immagini, video, anche grazie alla popolarità e l’uso massivo dei social media.
Si è calcolato che nel 2016 circa 3 miliardi di persone nel mondo avranno accesso alla rete. Le loro attività e preferenze – terabyte di dati – verranno in larga parte raccolte per poter in seguito essere esplorate ed utilizzate, quantificando e misurando comportamenti collettivi per comprendere e predire il funzionamento della nostra società e le tendenze del mercato.
Cosa accade ai nostri dati?
La maggior parte delle app sui nostri smartphone colleziona una serie di informazioni personali, come la lista dei nostri contatti e chiamate, la nostra posizione geografica, o le nostre foto. L’uso dei servizi di una banca online raccoglie informazioni sui nostri movimenti finanziari. Il motore di ricerca della Google, largamente utilizzato anche in Italia, si riserva il diritto di salvare le parole chiave delle nostre ricerche e di utilizzare una piccola percentuale di questi dati per condurre analisi: a cosa sono interessate le persone e cosa ricercano con maggior frequenza?
Amazon registra i nostri acquisti in modo da suggerire prodotti che saranno, più probabilmente, di nostro gradimento. Facebook fa lo stesso quando analizza i nostri “like”, facilitando la creazione della nostra rete sociale online.
Le app sono usate per raccogliere Big Data in una serie di contesti diversi:
Nella sanità (ad esempio, per sondare la diffusione di una malattia), nell’industria pubblicitaria (per ricevere efficaci annunci personalizzati, anche su Facebook), nel controllo del traffico (i segnali dai GPS degli automobilisti sono usati per comporre una mappa del traffico ed identificare code e incidenti), nel settore automobilistico (vetture che imparano a guidarsi da sole, di cui esistono già dei prototipi creati dalla Google), nell’assistenza al cliente (con lo studio ed in seguito la previsione delle esigenze specifiche dei clienti), così come nelle campagne politiche (la probabilità che un candidato vinca le elezioni può essere estrapolata dalla sua popolarità , misurata in termini di sostenitori su Twitter). Un bel cambiamento rispetto al passato, quando i dati venivano raccolti principalmente attraverso questionari e sondaggi.
Con l’accesso ad enormi quantità di dati si è andata anche delineando, negli ultimi anni, una nuova figura professionale: quella del data scientist, definito “il lavoro più attraente del XXI secolo”, per il quale, però, fino all’anno scorso non esisteva un corso di formazione specifico**. L’esperienza va fatta sul campo, in azienda, e richiede conoscenze trasversali di informatica, matematica e un occhio attento per i trend nascosti nelle informazioni. In alcuni casi lo studio e l’interpretazione dei Big Data diventa un problema non solo di analisi ma anche di condivisione e visualizzazione creativa. Metodi moderni come le dashboard, dove il lettore può esaminare i dati interattivamente, sono adesso preferiti ai resoconti statici e presentazioni.
E sono decisamente più accattivanti, come se volessero invitare il lettore ad una incredibile scoperta.
* Ossia in grado di operare più o meno autonomamente e collegarsi ad altri dispositivi
**Primo in Italia il corso di laurea magistrale in Data Science della Sapienza di Roma
- Link sul lavoro del data scientist: Date Scientist