Abbiamo visto come definire, attraverso il metodo
dei minimi quadrati, i parametri di una retta (retta di regressione)
che approssimi al meglio i dati delle risposte
Yi agli
ingressi xi evidenziabili in un diagramma di dispersione
come quello di Fig. 1.
Fig. 1 - Diagramma di dispersione. Retta interpolatrice
lineare
La retta
interpolatrice pare ben rappresentare la relazione fra i dati.
Vediamo invece Il diagramma di dispersione di Fig. 2. La retta
interpolatrice lineare in questo caso non pare adatta. Piuttosto si
evidenzia una relazione polinomiale, in questo caso quadratica.
Applichiamo ancora
il metodo dei minimi quadrati.
La relazione
ipotizzata è la seguente:
Dove “e” rappresenta
come al solito l’errore causale, variabile aleatoria normale di
media nulla. Per determinare i valori
B0, B1,
B2, stima dei corrispondenti β0, β1,
β2 , rendiamo minima la somma dei quadrati dei residui
SSR (n = numero di coppie di valori):
Ponendo = 0 le
rispettive derivate parziali rispetto a
B0, B1
B2, otteniamo:
Sistema di tre
equazioni lineari nelle tre incognite
B0, B1,
B2, immediatamente determinabili.
Fig. 2 - Diagramma di dispersione.
La retta interpolatrice lineare non rappresenta bene la
relazione fra i dati
Valori estremi. Teoria
di Gumbel
Si abbiano ora n
eventi meteorologici od idrologici (denotanti ad esempio la pioggia
massima nelle 24 ore in un anno o la portata massime di piena
annuale di un corso d’acqua) e sia m l’ordine (o rango) dei loro
valori ordinati in senso decrescente tale che ad es. ad
m = 1
corrisponda il valore più grande.
In un tale
ordinamento al valore di rango m si attribuisce (secondo Weibull)
una probabilità di superamento
p = m/n+1 cui si fa corrispondere un
tempo di ritorno Tr = 1/p = (n+1)/m. Tr
rappresenta il tempo stimato entro il quale si può ritenere che
avvenga, in media, un evento avente un valore uguale o superiore a
quello indicato.
La probabilità di
non superamento che ne deriva è pari a:
1) P = 1-p= 1-1/Tr
La probabilità che tutti gli n eventi
osservati (statisticamente indipendenti) e quindi anche il più
grande di essi abbiano un valore minore od uguale ad z è dato, per
il pricipio delle probabilità composte, da F(z)
= [P(z) ]nche costituisce la distribuzione del
valore estremo tra n valori indipendenti.
La densità di
probabilità che ne consegue è:
f(z) =
F(z)’= n Pn-1(z)
P(z)’
A partire da tale
costatazione Gumbel ha potuto dedurre la sua teoria sulla frequenza
dei valori estremi (tra le più usate in idrologia e climatologia)
che porta alla curva di durata o frequenza di non superamento (pari
a 1-1/Tr) seguente (funzione a doppio esponenziale):
2)
F(y)
= 1 -1/Tr = exp(-exp(-y))
Dove y è la
variabile ridotta data da :
3)
y = α (z-N)
Con
N = valore più probabile o
norma della distribuzione ed α un parametro dipendente dal numero
delle osservazioni e dalla distribuzione stessa.
Dalla 2) si ha :
4) y = -ln[-ln(F(y))]
Dunque dato un dato
valore del tempo di ritorno Tr,attraverso la 2) e la 4) si determina
y ed attraverso la 3)
il valore di z
Risulta che:
N = M - 0,45
σ
Essendo
M la media e σ
lo scarto quadratico medio dei valori di
x
In definitiva si ha
sostituendo tali valori nella 3) e ricavando
z+:
4) z = M + (0,77y – 0,45)
σ
Per
y = 0 risulta che
z = N da cui
F(0) = exp(-1) = 1/e = 0,3679
che è la probabilita di non superamento della norma della
distribuzione (sarebbe = 0,5 se essa fosse normale gaussiana).
I valori dati dalla
4) rappresentano una retta in un diagramma cartesiano
z, y mentre
M e σ si possono
dedurre dai dati delle osservazioni di
z = zi mediante
lerelazioni:
α
ed N si potrebbero
anche dedurre utilizzando il metodo dei minimi quadrati,
linearizzando i dati osservati
z in funzione di y
fornito dai tempi di ritorno
Tr = (n+1)/m
dell’ordinamento di Gumbel. Ma le due rette non coincidono, ad es.
il coefficiente di y
per Gumbel è proporzionale allo scarto quadratico medio
σ delle osservazioni
mentre nel caso dei minimi quadrati esso è dato da:
, essendo lo scarto quadratico =
La 2) prende anche
il nome di distribuzione del valore estremo di tipo
I
Come esempio
applichiamo il metodo Gumbel, alle precitazioni massime in 24 h alla
stazione di Genova – Albaro collocata presso il dipartimento DICAT
dell’Università.
Di questa stazione possediamo una statistica di 22 anni dal 1990 al
2011 riassunta nella tabella seguente:
Tab. 1 - Piogge max in 24 h a Genova –Albaro. Anni 1990-2011
Anno
Data inizio
mm in 24h
Rango
Probabilità p = m/(n+1)
Tempo di ritorno anni
1990
03-ott
306
4
0,17
5,75
1991
11-set
97
18
0,78
1,28
1992
27-set
429
1
0,04
23,00
1993
23-set
374
3
0,13
7,67
1994
04-nov
120
14
0,61
1,64
1995
10-nov
190
6
0,26
3,83
1996
15-ott
146
9
0,39
2,56
1997
07-ott
120
16
0,70
1,44
1998
31-dic
127
13
0,57
1,77
1999
23-ott
132
10
0,43
2,30
2000
26-mar
152
8
0,35
2,88
2001
08-mar
115
17
0,74
1,35
2002
26-nov
229
5
0,22
4,60
2003
28-dic
84
21
0,91
1,10
2004
29-nov
80
23
1,00
1,00
2005
02-dic
82
22
0,96
1,05
2006
14-set
173
7
0,30
3,29
2007
22-nov
126
14
0,61
1,64
2008
29-ott
128
12
0,52
1,92
2009
29-nov
112
17
0,74
1,35
2010
07-set
136
10
0,43
2,30
2011
04-nov
395
2
0,08
11,50
I valori della
media M e dello scarto quadratico medio
σ risultano:
M = 175 mm, σ = 105
mm
Ordinando i dati in
ordine crescente con il rango abbiamo ancora la tabella seguente:
Tab. 2 - Piogge
max in 24 h a Genova –Albaro per gli anni 1990-2011ordinate in senso
crescente
Rango m
Data inizio
Pioggia in 24
h ril.
Tempo Tr =
(n+1)/m
Prob. p
1 - p
Variabile
ridotta Y
Pioggia in 24 h
da Gumbel
1
27/09/1992
429
23,00
0,04
0,957
3,11
382,26
2
04/09/2011
395
11,50
0,09
0,913
2,40
323,84
3
23/09/1993
374
7,67
0,13
0,870
1,97
288,81
4
04/10/1990
306
5,75
0,17
0,826
1,66
263,30
5
26/11/2002
229
4,60
0,22
0,783
1,41
242,97
6
20/11/1995
190
3,83
0,26
0,739
1,20
225,87
7
14/09/2006
173
3,29
0,30
0,696
1,01
210,96
8
26/03/2000
152
2,88
0,35
0,652
0,85
197,61
9
15/10/1996
146
2,56
0,39
0,609
0,70
185,40
10
07/09/2010
136
2,30
0,43
0,565
0,56
174,05
11
23/10/1999
132
2,09
0,48
0,522
0,43
163,34
12
31/12/1998
130
1,92
0,52
0,478
0,30
153,10
13
29/10/2008
128
1,77
0,57
0,435
0,18
143,19
14
22/11/2011
127
1,64
0,61
0,391
0,06
133,47
15
04/11/1994
120
1,53
0,65
0,348
-0,05
123,82
16
07/10/1997
120
1,44
0,70
0,304
-0,17
114,11
17
08/03/2001
115
1,35
0,74
0,261
-0,30
104,17
18
29/11/2009
112
1,28
0,78
0,217
-0,42
93,79
19
11/09/1991
97
1,21
0,83
0,174
-0,56
82,65
20
28/12/2003
84
1,15
0,87
0,130
-0,71
70,23
21
02/12/2005
82
1,10
0,91
0,087
-0,89
55,42
22
29/11/2004
80
1,05
0,96
0,043
-1,14
35,04
Da questi dati si
sono ricavate le curve delle precipitazioni rilevate e previste
dalla teoria di Gumbel con estrapolazione fino a 400 anni.
Si ha:
6) z = 175 + (0,77y –
0,45) 105
Per
Tr = 100
anni abbiamo F(y)
= 1 -1/Tr = 0,99 ed y = 4,6 da cui z = 400mm/24h
Per Tr = 200 anni abbiamo
F(y)
= 1 -1/Tr = 0,995 ed y = 5,29 da cui z = 555/24h
PerTr = 400 anni abbiamo
F(y)
= 1 -1/Tr = 0,9975 ed y = 5,99 da cui z = 612/24h
Si
puo notare che l’evento del 27/9/1992 con 429 mm/24h secondo la
statistica di Gumbel avrebbe un tempo di ritorno plurisecolare
Fig. 3 - Piogge
massime a Genova – Albaro in 24 h secondo la teoria di Gumbel