Pur essendo tra le figure più ricercate nel mondo del lavoro, c’è grande confusione sulle definizioni di Data Analyst, Data Scientist e Data Engineer.

Si tratta infatti di figure che, soprattutto nelle aziende piccole e poco strutturate, tendono spesso a sovrapporsi e ad intrecciarsi.

La base comune è rappresentata, ça va sans dire, dai dati che vengono prodotti e raccolti in ogni realtà economica e che sono analizzati ed utilizzati in differenti fasi, con modalità e per scopi diversi dalle tre figure menzionate.

Clive Humby, data scientist e matematico inglese, nell’ormai lontano 2006 coniò lo sloganI dati sono il nuovo petrolio”.

Nell’epoca della quarta rivoluzione industriale, i dati rappresentano di fatto una risorsa strategica per lo sviluppo economico. Da ciò l’importanza di professionisti che siano in grado di “scavare” a fondo in questa mole di informazioni e di “estrarne” il loro intrinseco valore.

Cerchiamo allora di fare chiarezza:

Data Analyst:

La figura del Data Analyst (detto anche Business Analyst) può essere inserita tra gli “utilizzatori” dei dati, ovvero coloro che rispondono alle domande del business relative al momento presente/passato (“Come vanno le vendite? Qual è stato il trend degli ultimi anni?…”) attraverso l’analisi, la pulizia e la visualizzazione dei dati raccolti.

I principali step dell’attività del Data Analyst sono:

  • screening e cleaning dei dati grezzi raccolti;
  • preparazione dei dati (data wrangling/munging);
  • comprensione delle metriche e dei problemi del business;
  • visualizzazione dei dati attraverso report e grafici;
  • individuazione di trend e suggerimenti utili per le decisioni strategiche del business.

Quali sono le competenze richieste per questa figura?

Sicuramente un Data Analyst deve possedere una formazione statistica/matematica/economica utile a comprendere le dinamiche del business e la lettura dei dati.

Quali tools vengono utilizzati?

E’ essenziale conoscere Excel e SQL (linguaggio di interrogazione che serve a gestire i dati in un database relazionale).

Possono essere utilizzati anche strumenti di Business Intelligence, come Tableau, Power BI, QlikView (e molti altri) per la creazione di dashboard, oppure Python e R per pulire ed analizzare i dati in maniera più approfondita.

Data Scientist:

Anche la figura del Data Scientist appartiene alla schiera degli utilizzatori dei dati. A differenza del Data Analyst, però, il Data Scientist si occupa di trovare risposte riguardanti l’andamento futuro del business.

Attraverso tecniche di Machine Learning, Deep Learning e Modellistica Inferenziale, il Data Scientist può trovare correlazioni tra i dati e creare dei modelli predittivi sulla base dei quali può sviluppare dei sistemi di raccomandazione utili per il business.

Quali sono le competenze richieste per questa figura?

Per ricoprire questo ruolo è necessario avere conoscenze approfondite di statistica, matematica e di programmazione. Sono molto importanti anche conoscenze di Natural Language Processing (NLP), prescriptive e predicting modelling e di statistica multivariata.

Quali tools vengono utilizzati?

Anche il Data Scientist utilizza SQL, oltre ad avere una conoscenza avanzata di Python e R. Sono certamente utili anche conoscenze di software development e dei Cloud Services.

Data Engineer:

Il flusso dei dati che vengono utilizzati dai Data Scientists e dai Data Analyst per le loro attività è strutturato dalla figura del Data Engineer.

I Data Engineers, infatti, costruiscono le pipeline dalle quali è possibile importare le informazioni che provengono dai dispositivi degli utenti, progettando l’infrastruttura dei dati che vengono raccolti nel database. In sostanza, tutto quello che accade ai dati prima che arrivino al database è curato dal Data Engineer.

Quali sono le competenze richieste per questa figura?

Per diventare un Data Engineer è richiesta una conoscenza approfondita dei linguaggi di programmazione e degli strumenti di architetture di dati, proprie di chi proviene da Informatica o Ingegneria informatica E’, inoltre, importante avere competenze di cloud computing e di software development.

Quali tools vengono utilizzati?

Questa figura utilizza strumenti legati a SQL, come MySQL, PostgreSQL, ecc…; conosce anche tecnologie legate a database non relazionali (NoSQL), quali MongoDB, Cassandra, ecc…; utilizza data tool quali Hive, Spark, Kafka, Pig, Map Reduce, ecc…; per quanto riguarda le tecnologie cloud, sono usati strumenti quali, tra i tanti, AWS, Google Cloud e Microsoft Azure.

Da questa breve analisi emerge chiaramente l’ampia sovrapponibilità delle tre figure in termini di competenze e strumenti, che sono tutt’altro che esclusivi ed in continua evoluzione.

Autore: Claudia Paniconi | Responsabile Marketing DMBI
Photo by Campaign Creators on Unsplash

Articoli correlati

DMBI consultants

via Candido Galli, 5 – Frascati
00044 – Roma
info@dmbi.org
Fax | Tel +39 06 9422 421
Part. IVA 09913981008