Corso data scientist torino

Corso Data Science: impara ad analizzare i tuoi dati con SQL e Python

Il mio corso per Data Scientist nasce da una lunga riflessione per condensare in una durata ragionevole un programma che permetta di avere una panoramica il più possibile completa sul mondo dell’analisi dei dati e della data science. L’obiettivo è di offrire una formazione a trecentosessanta gradi che possa creare professionisti pronti per lavorare nell’ambito della Data Science. Con questo corso ti insegnerò ad analizzare i dati tramite approcci descrittivi e predittivi, a programmare con i linguaggi più richiesti in questo settore per imparare a trasformare i dati grezzi in preziosissime fonti di informazione.

Per individuare i contenuti didattici più importanti, sono partito da quelle che sono solitamente le fasi necessarie per lo sviluppo concreto di un database locale, costruito al fine di estrarre informazioni a partire da fonti data eterogenee.

  • Progettazione e creazione di un database: partendo dall’analisi dei dati a disposizione, questi devono essere raccolti in un database centralizzato. A tal fine occorrerà configurare le procedure di import in un database di Staging, progettare e creare un database di reportistica e infine popolarlo effettuando nelle Staging le necessarie trasformazioni e controlli di Data Quality (a questo link trovi un articolo per approfondire il tema della Data Quality).
  • Estrazione delle informazioni dal database con analisi dichiarative: lo sviluppatore deve essere in grado di interrogare il database, effettuando query che permettano di filtrare, raggruppare, aggregare, combinare e calcolare i dati.
  • Estrazione delle informazioni da un database con analisi predittive: le analisi precedenti possono essere ampliate utilizzando tecniche più fini che permettano di estendere le capacità predittive del database con la creazione di modelli di machine learning
  • Reportistica: gli output delle analisi possono infine essere portati su un software specifico di reportistica con il quale sarà possibile creare facilmente dashboard, grafici significativi e interfacce per interagire con i dati.

Ognuno di questi quattro punti può essere oggetto di specializzazione ed effettuato con diverse modalità. Dallo studio e dalla mia esperienza pratica in ognuno di essi, ho elaborato questo programma con l’intento di guidare lo studente in un percorso graduale, scandito da obiettivi intermedi chiari e tangibili, che mattone dopo mattone permetta di espandere le proprio conoscenze. 

 

Programma del corso Data Science

Ho diviso il programma in quattro sezioni.

Il linguaggio SQL e i database

Nell’ottica di una didattica che fornisca fin da subito delle competenze utilizzabili e tangibili, anche a profili con un background scientifico ma non prettamente informatico, il secondo tema dell’elenco precedente “Estrazione delle informazioni da un database con analisi dichiarative” risulta a mio parere il punto focale da cui partire.

Per quanto il database possa essere creato seguendo sia uno schema relazionale che non relazionale, l’iniziale scelta di un database relazionale ci aprirà la strada all’apprendimento del linguaggio di programmazione SQL. Per la sua natura dichiarativa e le peculiarità della sua sintassi english-like, l’SQL risulta avere una curva di apprendimento generalmente più ripida rispetto ad altri linguaggi. Tramite la sua conoscenza diventerà possibile effettuare fluentemente tutta una serie di analisi dati di tipo dichiarativo e raggiungere subito un primo fondamentale check point nel percorso di apprendimento.

Progettare il database e le procedure di import dei dati

Nella sezione precedente del corso lavoreremo su un database preesistente, creato ad hoc da me per racchiudere delle casistiche variegate e complete con le quali esercitarsi con l’SQL. Vedremo inoltre come seguire delle semplici procedure guidate, da ripetere ogni volta che si desidera lavorare su dati diversi. La fase di acquisizione dei dati verrà esplorata e approfondita in questa seconda sezione.

Per importare dati provenienti da svariate fonti utilizzeremo anche il linguaggio di programmazione Python. Questa sarà una buona occasione per introdurre Python e iniziare ad utilizzarlo, in visto della sezione di Machine Learning dove sarà l’assoluto protagonista.

Studieremo inoltre come efficientare la progettazione del database, risolvendo i classici problemi legati alla struttura delle tabelle, alle relative colonne, alla storicizzazione dei dati e alla gestione dei log delle modifiche. Estenderemo dunque le nostre conoscenze dell’SQL per utilizzare costrutti più avanzati e imparare a incapsulare il codice in stored procedere atte al popolamento del database.

Statistica e tecniche di machine learning

Non è obiettivo del corso quello di trattare approfonditamente le teorie statistico-matematiche alla base degli algoritmi di Machine Learning. Tuttavia un breve excursus teorico sarà necessario per consolidare quelle conoscenze statistiche fondamentali che ogni analista dei dati deve possedere e per spianare la strada alla successiva fase di programmazione in Python.

Programmazione in Python

Consolidati i concetti dei primi tre moduli, riprenderemo lo studio del linguaggio di programmazione maggiormente usato oggi in ambito Data Science: Python. Questa volta lo utilizzeremo in congiunzione con le sue più importanti librerie per creare dei concreti modelli di machine learning, grazie ai quali potremo espandere le tipologie di analisi condotte sui dati.

Impareremo ad utilizzare le principali librerie di Python nell’ambito dei dati come Pandas, Numpy, Scikit-Learn e Pycaret. In particolare con Pycaret avremo modo di fare esperimenti con numerosi classi di algoritmi: classificazione supervisionata, regressione, clusterizzazione, ricerca di valori anomali e regole di associazioni.

Data visualization

I risultati delle analisi devono essere presentati correttamente, utilizzato modalità moderne ed efficienti di rappresentazione dei dati. Per far questo può essere utile collegare al database un software di reportistica e business intelligence.

Informazioni generali sul corso

Seguendo il corso di data science in modalità one-to-one, dove saremo presenti soltanto io e te, la durata necessaria per trattare adeguatamente tutti gli argomenti descritti in questa pagina è di 64 ore, meglio se suddivisi in sessioni di due ore ciascuna. In questo caso il costo è di 2240€, pari a 35€ orari.

Spesso mi viene chiesto di erogare il corso contemporaneamente a più colleghi della stessa azienda. In questo caso il costo è di 50€ orari. Ovviamente l’aggiunta di partecipanti rende le lezioni meno personalizzabili e cucibili sulle singole esigenze, anche se restano assolutamente proficue e beneficiano inoltre dell’interazione e della condivisione di più persone. Di volta in volta potremo valutare insieme come ricalibrare la durata.

Le lezioni si tengono in diretta on line, solitamente con il software di videochiamata Zoom. Gli studenti hanno la possibilità di registrare sul proprio pc le lezioni, in modo da poter accedere a vita ai contenuti.

La docenza del corso è tenuta da me, Nicola Iantomasi, qui trovi la pagina del sito con la mia biografia.

 

Materiale didattico del Corso Data Science

Il database d’esempio, gli script in Sql e Python, gli esercizi con le soluzioni e tutto il materiale didattico del corso per Data Scientist saranno consegnati puntualmente alla fine di ogni lezione. Al termine del corso verrà rilasciato un certificato di frequenza con profitto.

 

Corsi correlati

Se sei interessato ad una formazione che tocchi anche temi funzionali e di management, visita la pagina del corso sul data management.

 

Le recensioni di alcuni miei studenti

Nicola è un consulente IT eccezionale! Nicola è stato per me una guida eccezionale. Fin da subito è riuscito a spiegarmi concetti e ad introdurmi nozioni di basi di dati in modo fluido, chiaro, lineare e diretto. Sono contenta di essermi rivolta ad un professionista come Nicola che, non solo è oltremodo preparato nelle materie che insegna, ma che soprattutto mette passione e trasporto nel suo lavoro. Tutto ciò è risultato molto positivo, perchè grazie a lui ho acquisito in pochissimo tempo la capacità per poter proseguire nelle mie pratiche autonomamente e con successo. Ho avuto piena fiducia in Nicola fin dal primo minuto, e questo per me è rassicurante perchè, ogni qualvolta avrò la necessità di ricevere consulenze informatiche, so che posso contare su Nicola. Lo raccomando pienamente al 100%! Non esitate a contattarlo!!

Roberta Diamanti
17/01/21

Nicola è un gran formatore, metta la sua competenza al servizio delle persone cercando sempre la migliore soluzione e scalando il lavoro sulle esigenze formative. È attento e aiuta a comprendere e a crescere. Lavorare con lui è sempre un piacere ed uno stimolo a migliorarsi.

Enzo La Rosa
01/09/20
Torna su