Power BI può connettersi a moltissimi formati di file oltre che a tutti i principali tipi di database. In questo articolo partiremo analizzando uno dei formati dato più comuni, ossia un CSV. In seguito vedremo anche i primi esempi di trasformazione e pulizia dei dati.
Import dei dati su Power BI
Apriamo quindi Power BI Desktop, ci troveremo nella sua Home mostrata in figura.

In alto a sinistra c’è una sezione Recupera dati: tramite questa sezione potete importare i vostri dati in Power BI. Cliccando su Get Data verranno mostrate tutte le opzioni di connessione, andando nella sezione File vedremo l’opzione “Text/Csv”, clicchiamoci sopra e scegliamo in basso “Connetti”.

A questo punto dobbiamo soltanto cercare il nostro file tramite file system e poi cliccare su “Apri”. Verrà mostrata un’anteprima del file (se il file è molto piccolo verrà mostrato per intero). Nel mio esempio ho preso i dati dal sito https://people.sc.fsu.edu/~jburkardt/data/csv/csv.html disponibili sotto la licenza GNU LGPL license. Dall’anteprima si potrebbero già notare eventuali problema di qualità dei dati. Se per noi è tutto ok e non vogliamo eseguire ulteriori trasformazioni oltre a quelle effettuate di default da Power BI (ci torneremo nel prossimo paragrafo) clicchiamo direttamente su “Load”. Se invece vogliamo lavorare ulteriormente sui dati clicchiamo su “Transforma dati”. Questa è sicuramente l’opzione consigliata che useremo la maggior parte delle volte.

Introduzione a Power Query
Una volta cliccato su “Transforma dati” in basso a destra, ci troveremo di fronte a una interfaccia diversa dalla precedente: siamo all’interno di PowerQuery, cioè lo strumento messo a disposizione da Power BI per effettuare le trasformazioni. Possiamo fare la gran parte delle trasformazioni di nostro interesse utilizzando l’interfaccia, ma va tenuto a mente che questo strumento è basato sul linguaggio M, che in caso di necessità avanzate può essere adoperato.
L’interfaccia di trasformazione è costituito da 4 sezioni:
- lista delle query (a sinistra): tramite questa sezione possiamo vedere tutte le nostre query (di solito una per ogni file importato);
- anteprima della query selezionata (al centro): da qui posso vedere semplicemente lo stato della mia query in forma tabellare;
- trasformazioni (in alto): tramite questa sezione possiamo effettuare le trasformazioni sulla query selezionata;
- lista delle trasformazioni applicate alla query (a destra): qui sono listate le trasformazioni attualmente applicate alla mia query.

Osserviamo che Power BI spesso applica autonomamente alcune trasformazioni. Ad esempio in questo caso abbiamo questi tre passaggi:
- Origine: primo step che troveremo sempre e che rappresenta il collegamento con il file stesso
- Intestazioni alzate di livello: di default Power BI chiama le colonne “colonna1”, “colonna2” ecc. Lo step “Intestazioni alzate di livello” nomina le colonne con il nome che queste avevano nel file originale
- Modifica Tipo: di default Power BI effettua dei controlli e stabilisce dei tipi di dato per le vostre colonne, se per esempio avete un file con degli importi di cui volete fare una media questi importi dovranno essere impostati con tipo numerico. Facciamo attenzione però a questo passaggio! Non sempre i tipi scelti in autonomia da Power Query sono corretti.
Queste trasformazioni vengono lanciate nuovamente da Power BI Desktop ogni qual volta decido di effettuare un refresh dei miei dati, questa operazione su Power BI desktop è manuale e la effettuiamo ad esempio quando i dati sui nostri file sono cambiati e vogliamo aggiornare il mio report.
Primi esempi di trasformazioni dei dati
Normalmente le prime trasformazioni importanti riguardano appunto la qualità dei dati, per esempio nella figura successiva vedrete che è stata importata una tabella contenente il numero di dipendenti per anno e per nazione. Tuttavia questo file presenta almeno due problemi: ha una colonna vuota e alcuni anni sono scritti in modo incorretto ossia “2022_” anziché “2022”.

Cominciamo con l’eliminare la colonna: per far questo ci basta cliccare sull’intestazione della colonna stessa e poi cliccare o su Rimuovi colonna in alto oppure sul tasto della tastiera canc. Una volta effettuata l’operazione noterete che a destra sarà spuntato un nuovo step di trasformazione chiamato appunto “colonne rimosse”. Se (sempre dalla destra) decideremo di eliminare questo step, ci troveremo nella situazione di partenza, ovvero con la colonna 4 presente.
Per eliminare il secondo problema dovremo cliccare sulla colonna dell’anno e poi in alto su “Sostituisci valori”: a questo punto verrà fuori un pop-up con due box, in uno dovremo inserire il valore che vogliamo sostituire, nell’altro il valore con cui lo vogliamo sostituire. Nel nostro caso vogliamo sostituire il trattino basso con nulla, quindi inseriremo il trattino basso nel box in alto e nulla nel box in basso, alla fine premeremo “Ok”.
A questo punto possiamo rinominare le nostre colonne in modo appropriato, dal momento che fino ad ora si sono chiamate colonna 1,2 e 3. Per fare questo basta fare un doppio click sul nome della colonna e poi modificarlo.
Alla fine, clicchiamo in alto a sinistra su “Chiudi e Applica”. Partirà una schermata di caricamento (che per tabelle piccole dura un paio di secondi) che porterà i nostri dati sul modello ed a quel punto saremo pronti per utilizzare i dati importati, effettuare delle analisi e creare delle visualizzazioni.
Continua a imparare
- Visita la pagina del mio videocorso su Power BI
- Segui la lezione successiva sulla Data Quality su Power Query
- Torna all’indice delle lezioni