SMOG:regressione

Cos’è la retta di regressione

La retta di regressione è una delle tecniche statistiche piu’ semplici e piu’ usate.

Con questa tecnica si riassume la relazione tra due variabili, usandone una per spiegare
l’altra.

Più precisamente, questo strumento statistico restituisce una equazione che permette
di prevedere il valore di una grandezza a partire dal valore di un’altra grandezza.

Un esempio classico è la dipendenza tra l’altezza di una persona ed il suo peso.
E’ intuitivo pensare che più una persona è alta, maggiore sarà il suo peso. Con la regressione
è possibile quantificare questa relazione intuitiva.
Per applicare la regressione, e trovare quindi la legge che esprime come varia il peso in funzione
dell’altezza, si deve misurare un campione significativo di persone, rilevandone appunto altezza e peso.

Applicando la tecnica della regressione a questo insieme di misure si ottiene la legge che lega il peso
all’altezza per il campione misurato:

regressione peso altezza

Nel grafico qui sopra si riportano dei dati fittizi per dimostrare l’esempio:
i punti corrispondono alle coppie altezza-peso di ciascun individuo misurato,
mentre la linea rappresenta le legge
trovata che si esprime in termini matematici con:

peso = altezza * 1.08 – 116.9

e che mi dice che il peso di una persona è ottenibile dall’altezza moltiplicando questa misura per 1.08 e sottraendo 116.9.

Questa legge mi permette quindi di prevedere quanto dovrebbe pesare una persona conoscendone l’altezza:
ad esempio una persona alta 170 cm ,secondo la relazione esposta, dovrebbe pesare 66,7 kg.

Qual’è la validit&agrave di questa legge?

La legge trovata è tanto più vera quanto più rappresentativo è il campione usato.

Una misura della bontà della regressione è data dall’indice R2 (r quadro) che varia tra
0 e 1 ed esprime quanto della variabilità complessiva di Y (il peso) è spiegabile tramite X (l’altezza).
Nell’esempio qui sopra, l’R2 di 0.94 indica che il 94% della variabilità del peso è spiegabile tramite l’altezza.

PM10

Tornando ai PM10, le stime applicate nelle pagine del sito www.legambientepadova.it
sono state ottenute applicando le equazioni riportate dall’Arpav nel documento
Report Qualità
Aria – Polveri PM10 nel Veneto
.

In questo rapporto, vengono riportate le regressioni che legano le misure di PM10 eseguite con la stazione mobile
in varie località con misure di PM10 rilevate, negli stessi giorni, dalle stazioni fisse
nei capoluoghi di provincia.

A titolo di esempio, nel grafico seguente tratto dal rapporto ARPAV di cui sopra, si riportano le misure sperimentali
(i punti) e la retta di regressione trovate tra la stazione fissa di Padova (Mandria) e la stazione mobile situata a Montegrotto.

L’ equazione trovata:

y = 0.95*x-0.3

ci dice che la misura di Montegrotto (y) è prevedibile a partire da quella
della Mandria (x) moltiplicandola per 0,95 e togliendo 0,3.

La bontà espressa dal valore R2 di 0.95 ci dice che il 95% della varibilità
dei dati di Montegrotto sono spiegabili usando i dati della Mandria (o per contro
solo il 5% della varibilità di Montegrotto non è spiegabile usando i dati della Mandria).

Per quanto riguarda la rappresentatività dei dati si rimanda al rapporto ARPAV.

Nelle pagine del sito di www.legambientepadova.it
dedicate alle provincie del Veneto, si applicano queste regressioni
ai dati giornalieri delle centraline fisse di riferimento per estrapolare le concentrazioni
attribuibili alle varie località di provincia monitorate con le stazioni mobili.
I dati così simulati vengono poi usati per esprimere le concentrazioni giornaliere e per calcolare
le statistiche caratteristiche quali il numero di superamento del limite giornaliero
e le medie mobili.