P-value

Il p-value (o valore p) viene definito in statistica come il livello di significatività osservato e rappresenta la probabilità che il possibile rifiuto dell’ipotesi nulla sia solo dovuto al caso. Un concetto che detto così sembra molto complicato, ma che può essere compreso nella maniera corretta con le giuste conoscenze di statistica inferenziale (qui trovi una nostra introduzione sul tema) e dei test d’ipotesi, di cui parleremo nei primi paragrafi di questo articolo.

Test d’ipotesi e ipotesi nulla

Un’ipotesi è una formulazione di un’assunzione sulla popolazione che deve essere verificata e può essere vera o falsa. Il test di ipotesi è la procedura che ci permette di stabilire se l’ipotesi è vera o falsa.

Nei test di ipotesi, le ipotesi sono due: l’ipotesi nulla e l’ipotesi alternativa. L’ipotesi nulla è l’affermazione iniziale su una popolazione, o processo di generazione di dati. Generalmente, essa non evidenzia nessun effetto o differenza ed è l’ipotesi che si cerca di confutare. Al contrario, l’ipotesi alternativa evidenza un effetto o svariate differenze.

Facciamo un esempio: vogliamo verificare se una moneta è truccata. Questo in termini statistici si traduce come: la probabilità che esca testa o croce non sarà identifica. Formuleremo l’ipotesi in questo modo:

  • Ipotesi nulla: P(testa) = P(croce)
  • Ipotesi alternativa: P(testa) ≠ P(croce)

O in termini matematici:

  • Ipotesi nulla: P(testa) = 0.5  ossia il 50% di probabilità che accada
  • Ipotesi alternativa: P(testa) ≠ 0.5

L’obiettivo del test d’ipotesi è cercare se ci sono abbastanza evidenze contro l’ipotesi nulla.

Verifica delle ipotesi di un test statistico

Nel ragionamento che sta alla base dei test statistici ci si chiede cosa succederebbe se ripetessimo molte volte il campionamento effettuato per ottenere i dati che sono stati raccolti per effettuare l’analisi statistica. Si ipotizza quindi che la popolazione da cui è stato estratto il campione abbia una certa caratteristica (questa sarà l’ipotesi nulla) e si vede se i dati rappresentano una prova evidente contro questa ipotesi.

Il p-value è quindi quel valore che determina se i risultati sono statisticamente significativi, rifiutando quindi l’ipotesi nulla, oppure se non sono statisticamente significativi (in questo caso non rifiutiamo l’ipotesi nulla). Per convenzione, si definisce H0 l’ipotesi nulla e H1 l’ipotesi alternativa. Attenzione: non rifiutare H0 non significa che la condizione descritta dall’ipotesi nulla sia vera, ma significa che non abbiamo abbastanza evidenza per rifiutarla.

A questo proposito, ci viene in soccorso la statistica test. Essa ha lo scopo di determinare se rifiutare o non rifiutare l’ipotesi test, e si calcola così:

T = ( stima – valore supposto ) / errore

Per capire se rifiutare o non rifiutare l’ipotesi nulla dobbiamo vedere se il valore assunto dalla statistica test appartiene alla regione di accettazione o alla regione di rifiuto:

  • la regione di accettazione è l’insieme di valori per cui non rifiutoH0;
  • la regione di rifiuto è l’insieme di valori per cui rifiuto H0.

Significatività di un test statistico

Il livello di significatività α definisce l’insieme dei valori che appartengono alla regione di rifiuto e di accettazione. Il livello di significatività è una probabilità, cioè la probabilità di rifiutare l’ipotesi nulla quando questa è vera. α viene detto anche errore del 1° tipo e, in genere, assume valore 0.05, ma può assumere anche valore 0.10 o 0.01 in base all’entità dell’errore che siamo disposti a commettere.

La collocazione di α segue l’ipotesi alternativa, perciò abbiamo tre opzioni:

  • se nell’ipotesi alternativa troviamo il ≠ posizioneremo metà errore nella coda sinistra e metà nella coda destra;
  • se è presente il < allora α è tutto a sinistra, con il α a destra come nell’immagine;
  • se il valore della statistica test ricade nell’area bianca allora non rifiutiamo l’ipotesi nulla. Se, invece, ricade nella zona violetta rifiutiamo l’ipotesi nulla.
significativita test statistico

Come interpretare il p-value

Per stabilire se accettare o rifiutare l’ipotesi nulla possiamo anche calcolare il p-value. Anche il p-value viene posizionato in base all’ipotesi alternativa. Nello specifico, il p-value deve essere confrontato con α e se:

  • p < α   allora rifiutiamo l’ipotesi nulla;
  • p ≥ α  allora non rifiutiamo l’ipotesi nulla.

I grafici seguenti sono relativi a un test in cui:

  • l’ipotesi nulla è che la media di una popolazione sia maggiore o uguale di un certo valore u0;
  • l’ipotesi alternativa è che la media sia minore di u0.
p value in caso di rifiuto dell'ipotesi nulla
p value in caso di non rifiuto dell'ipotesi nulla

Ad esempio, se α = 0.05, allora p-value ≥ 0,05 implica che il test non è statisticamente significativo (cioè, può trattarsi di un effetto casuale del campionamento) e l’ipotesi è accettata, mentre p value < 0,05  implica che l’ipotesi è rifiutata e il test è, più in particolare:

  • statisticamente significativo se 0.01 ≤ p value < 0.05;
  • molto significativo se 0.01 ≤ p value <0.01;
  • estremamente significativo se p value < 0.001.

In generale, possiamo dire che più è basso il p value, maggiore è la significatività statistica della differenza osservata.

Un p value pari o inferiore a 0,05 è generalmente considerato statisticamente significativo.

Il valore p può essere un’alternativa o un’aggiunta ai livelli di confidenza preselezionati per i test di ipotesi.

Come si calcola il p-value?

Il p value viene solitamente calcolato utilizzando specifiche tabelle di valori P o fogli di calcolo, software statistici o ancora linguaggi di programmazione statistica, come R o Python. Queste tabelle mostrano, in base alla statistica del test e ai gradi di libertà (che corrisponde al numero di osservazioni meno il numero di variabili indipendenti) del test, la frequenza con cui ci si aspetta di vedere quella statistica del test nell’ipotesi nulla.

Questi calcoli si basano sulla distribuzione di probabilità presunta o nota della specifica statistica testata. Il p value viene calcolato in base alla deviazione tra il valore osservato e un valore di riferimento scelto, data la distribuzione di probabilità della statistica, con una differenza maggiore tra i due valori corrispondente a un valore p più basso.

Matematicamente, invece, il p value viene calcolato utilizzando il calcolo integrale dall’area sotto la curva di distribuzione di probabilità per tutti i valori della statistica che sono lontani dal valore di riferimento almeno quanto il valore osservato, rispetto all’area totale sotto la curva di distribuzione di probabilità.

Il calcolo del p value varia in base al tipo di test eseguito ed è necessario scegliere il test statistico che meglio si adatta ai dati e che corrisponde all’effetto o alla relazione che si desidera verificare. I tre tipi di test descrivono la posizione sulla curva di distribuzione delle probabilità: test a coda inferiore, test a coda superiore o test a due lati. In poche parole, maggiore è la differenza tra due valori osservati, minore è la probabilità che la differenza sia dovuta al semplice caso, e questo si riflette in un p value più basso.

Accorgimenti quando si utilizza il p value

Uno degli errori più comuni nell’interpretazione del p value è il rischio di rifiutare l’ipotesi nulla del test quando l’ipotesi nulla sia effettivamente vera. In realtà, il rischio di rifiutare l’ipotesi nulla è spesso superiore al p value, soprattutto quando si esamina un singolo studio o quando si utilizzano campioni di piccole dimensioni. Questo perché più piccolo è il tuo quadro di riferimento, maggiore è la possibilità di imbatterti in un modello statisticamente significativo completamente per caso.

Continua a imparare

Torna in alto
Torna su