Quartili

Quartili statistici

In statistica i quartili sono degli indici di posizione che dividono un insieme di dati ordinati in quattro parti uguali. In questo articolo, definiremo che cosa sono e come si calcolano manualmente e con Excel.

Che cosa sono i quantili

Per conoscere la posizione che un valore occupa all’interno di una distribuzione di frequenza vengono utilizzati i quantili, che si suddividono in:

  • quartili
  • decili
  • percentili

Al fine di utilizzare i quantili, è essere necessario che la distribuzione di valori sia ordinata, ovvero, la nostra variabile deve essere misurata su una scala ordinale. A questo punto, definiamo quartili quei valori tali per cui la distribuzione viene suddivisa in quattro parti uguali:

  • Quartile Q1 o inferiore: il 25% dei valori è inferiore o uguale a Q1
  • Quartile Q2 o mediano: il 50% dei valori è inferiore o uguale a Q2
  • Quartile Q3 o superiore: il 75% dei valori è inferiore o uguale a Q3

Ecco la rappresentazione grafica dei quartili e la loro collocazione su una distribuzione di valori:

quartili

Un caso d’uso dei quartili

Supponiamo di essere dei data analyst e di lavorare per un’e-commerce. Ci viene chiesto di investigare meglio sui nostri clienti e di capire qual è stata la loro spesa in tutto l’arco dei mesi estivi e di collocarli in una fascia di cluster di acquisto.  Che cosa significa? Significa che, per il mio intero insieme di dati, voglio stimare le fasce medie di acquisto dei miei utenti: fascia bassa, medio-bassa, medio-alta e fascia alta. Da che range di valori parte una certa fascia?

La domanda che dobbiamo porci è quindi: come si posizionano gli acquisti nel mio set di dati? Questa analisi mi permetterà di conoscere meglio chi sono i miei clienti e targetizzare meglio offerte commerciali dedicate a loro, quindi in pratica, migliorare il mio business. Per farlo, dobbiamo dividere il nostro set di dati in quattro parti uguali, utilizzando proprio i quartili.

Come calcolare i quartili manualmente

Se vogliamo calcolare manualmente i quartili, gli step che dobbiamo seguire sono i seguenti:

  1. ordinare i dati in ordine crescente;
  2. calcolare la posizione del quartile;
  3. data la distribuzione, individuare il valore corrispondente alla posizione trovata.

Procediamo per gradi, con un esempio. Vogliamo conoscere il valore dei quartili di una classe di dieci studenti delle superiori al compito di matematica. I voti conseguiti sono:

6, 7, 8, 5, 4, 4, 6, 8, 8, 3

Per prima cosa, ordiniamo i valori in ordine crescente:

3, 4, 4, 5, 6, 6, 7, 8, 8, 8

A questo punto individuiamo la posizione dei quartili. Purtroppo non esiste una formulazione universale per calcolare questa posizione. Su libri e software diversi potresti trovare formule differenti e il risultato finale varierà leggermente. Vi faccio vedere la formula attualmente utilizzata da molti strumenti di analisi dei dati come la libreria Pandas di Python:

k = (N-1)*P + 1

dove N corrisponde al numero di osservazioni, mentre P dipende dal particolare quartile scelto. Nel nostro esempio abbiamo N = 10 perché sono dieci i voti che dobbiamo esaminare, mentre P corrisponderà rispettivamente a

  • P1 = 0.25 per il primo quartile
  • P2 = 0.5 per il secondo quartile (detto anche mediana)
  • P3 = 0.75 per il terzo quartile

Con i miei dati avrò quindi k = (10-1) * 0.25 + 1 = 3.25

Una volta trovato k, se esso è un numero intero allora avremo individuato univocamente la posizione del quartile. Se invece non fosse un intero, anche in questo caso in letteratura statistica sono presenti più formulazioni, nessuna delle quali può essere considerata universalmente corretta. Fai attenzione dunque a capire nel tuo contesto quale sia la formula da utilizzare. Nel nostro caso ho ottenuto k=3.25, potrei allora:

  • considerare semplicemente la posizione successiva, scegliendo dunque l’elemento in posizione 4
  • effettuare una media aritmetica dei valori nelle posizioni 3 e 4
  • effettuare un’interpolazione considerando la parte decimale della posizione. Per k=3.25 il calcolo sarebbe:

elemento in posizione 3 + 0,25 * (elemento in posizione 4 – elemento in posizione 3)

Il metodo a mio parere più accurato è il terzo, che continuerò ad usare nel nostro esempio:

  • l’elemento in posizione 3 è il voto 4
  • l’elemento in posizione 4 è il voto 5
  • calcolo l’interpolazione 4 + 0,25 * (5 – 4) = 4.25

Analogamente per il secondo quartile otterrei k = (10-1)*0.5 +1 = 5.5 e quindi:

  • l’elemento in posizione 5 è 6
  • l’elemento in posizione 6 è 6
  • calcolo l’interpolazione 6 + 0,5 * (6-6) = 6

Con calcoli analoghi troverai il valore 7.75 per il terzo quartile. Un’altra formula spesso proposta per individuare la posizione dei quartili è la seguente

k = (N+1)*P

Risulta interessante osservare che per P=0.5, cioè il valore relativo alla mediana, le due formule restituiranno sempre lo stesso risultato.

corso di analisi dei dati
Visita la mia piattaforma didattica realizzata con l’obiettivo di creare un percorso unico e completo nella formazione per Data Analyst.

Come calcolare i quartili con Excel

Per calcolare su Excel i quartili con la formula k = (N-1)*P + 1 possiamo scrivere

=INC.QUARTILE(intervallo o matrice, quarto)

dove:

  • l’uguale chiede al programma di inserire una funzione;
  • INC.QUARTILE è la funzione che il programma deve elaborare;
  • (intervallo o matrice) seleziona l’intervallo o la tabella su cui elaborare l’operazione;
  • quarto corrisponde al quartile ed è un numero che va da 0 a 4, dove 0 corrisponde al valore minimo e 4 al valore massimo.
Esempio di calcolo dei quartili su Excel con la funzione INC.QUARTILE

Tramite la funzione ESC.QUARTILE avremmo ottenuto i risultati relativi alla formula della posizione k = (N+1)*P. Il valore della mediana non cambia, ma il primo e il terzo quartile sarebbero diventati rispettivamente 4 e 8.

 

Continua a imparare

Torna in alto
Torna su