CLIMI, ACQUE E GHIACCIAI
TRA GRAN PARADISO E CANAVESE
NOTE SUI
DATI STATISTICI
In ogni tabella, oltre al riepilogo dei dati mensili, si propone
questo schema statistico:
Media: è la media del parametro eseguita sui dati mensili e annuali
«per colonna»; potrebbero dunque esserci lievi differenze tra il
calcolo eseguito sui valori medi «per riga», dovuto alle
approssimazioni e ad eventuali valori mancanti nelle colonne che
causano la mancanza del dato annuale.
Dev.St = deviazione standard sui valori delle colonne (vedi
approfondimento);
Min (Anno) = valore minimo assunto dalla grandezza mensile o annuale
e anno di occorrenza (quindi se si tratta per esempio di Media di Tmin, esso sarà riferito alla più bassa media delle temperature
minime nel periodo di osservazione, mentre per cercare il minimo
giornaliero assoluto bisognerà utilizzare la tabella Minimo di Tmin);
Max (Anno) = come per Min, ma riferito ai valori massimi;
P0,1, P0,2, P0,4, P0,5, P0,6, P0,8, P0,9 = valori dei percentili,
(decimo, ventesimo ... novantesimo, ovvero primo, secondo ... nono
decile); P0,5 corrisponde alla mediana (vedi approfondimento)
Media 1971-00 = è la media del parametro riferita a un trentennio
standard OMM. Il trentennio attualmente in vigore è il 1971-2000, ma
non sempre è disponibile in ogni stazione; viene quindi presentato
il trentennio più recente che disponga della maggior continuità e
affidabilità per ogni singola stazione. Per serie brevi o estinte
non è stato calcolato.
CV% = coefficiente di variazione (rapporto percentuale tra la
deviazione standard e la media, vedi approfondimento); è indicato
solo per i giorni di gelo e, in seguito, per precipitazioni e neve.
La deviazione standard
E’ un indice statistico che descrive la variabilità di un campione
di osservazioni, ovvero il grado di dispersione dei casi. E’
calcolata facendo la somma di tutti i quadrati degli scarti di
ciascun dato rispetto alla media, dividendo questa somma per il
numero dei dati ed estraendone la radice quadrata. In pratica,
associare a una temperatura media mensile (frutto di un lungo
periodo di osservazioni) di 1.0 °C una deviazione standard di 2.1
°C, significa che mediamente le temperature medie dei singoli mesi
si discostano dal valor medio di circa 2 °C in più o in meno, cioè
che la media oscilla con elevata probabilità tra 1.0 + 2.1 = 3.1 °C
e 1.0 – 2.1 = -1.1 °C.
I percentili e la mediana
Una serie ordinata in senso crescente può essere suddivisa in h
intervalli tali che ciascun intervallo contenga 1/h del campione,
ovvero n/h dati. I decili, tipo particolare di percentili,
identificano settori contenenti ciascuno il 10% dei dati, quindi
nelle tabelle seguenti, P0,1 è il valore al di sotto del quale ci
sono solo il 10% di osservazioni e al di sopra del quale ve ne sta
il 90%, ciòè identifica un limite che separa dati molto anomali, che
si verificano solo 1 anno su 10, da tutti gli altri. Analogamente,
P0,2 separa il 20%, quindi è una soglia con minor carattere di
anomalia (2 anni su 10, ovvero 1 su 5), P=0,4 separa il 40% di dati
dal resto della serie, P0,5, più noto come mediana, è il valore che
divide a metà la serie ordinata, e che quindi ha una frequenza di 5
casi su 10, cioè in altre parole 1 anno su 2: è quindi un valore
molto probabile, o «normale» La mediana, al contrario della media, è
un indice di tendenza centrale poco influenzato dall’entità dei
valori estremi della serie, Quando si hanno serie di pochi dati e
pure molto dispersi, la differenza tra media e mediana può essere
rilevante.
Le serie di misure considerate in questo lavoro sono in genere <100
anni. Si tratta dunque di serie che, dal punto di vista statistico,
possiamo considerare molto piccole, sia per la loro effettiva mole,
sia per il fatto che seguono distribuzioni di tipo Normale (Gaussiano)
solo approssimativamente e in intervalli limitati attorno al valor
medio. A causa di questo andamento non è in generale possibile
estrapolare da serie così brevi stime riguardanti eventi rari, se
non con ampi margini di errore. E' di per sé già chiaro che una
stima su quale sia la dimensione di un evento che può accadere ogni
cento anni, fatta basandosi su poche decine di anni, sia di per sé
affetta da gravi incertezze, tanto più non conoscendo la
distribuzione teorica. Il programma da noi utilizzato calcola i
percentili basandosi sulla distribuzione in classi dei dati
osservati. Può capitare talvolta che esso vada a stimare per il
primo o nono decile valori esterni ai valori estremi effettivamente
misurati: ciò dipende dal tipo di distribuzione che assumono i dati
in ciascuna serie: si tratta come al solito di stime indicative,
utili per farsi un’idea della struttura interna della serie di
osservazione.
Il coefficiente di variazione
Per confrontare la variabilità di diverse serie di dati, non è
possibile mettere a confronto direttamente le deviazioni standard,
poiché queste assumono importanza differente in base al valore
numerico della media del campione di osservazione. Ad esempio, una
deviazione standard pari a 2 è da considerarsi molto grande se
riferita a una media delle osservazioni di 0.5, mentre è molto
piccola se riferita a una media di 500. Si usa quindi il
coefficiente di variazione, un valore adimensionale espresso come
rapporto percentuale tra la deviazione standard e la media del
campione di osservazioni. Se Dev. St. = 25 mm e media = 78 mm, CV% =
(25/78)*100 = 32%. Questo coefficiente tuttavia non può essere
utilizzato per le temperature, in quanto l’uso di una scala con
origine arbitraria (lo zero per i °C) genera valori di CV% privi di
significato.
Torna
all'elenco stazioni |