La statistica è una disciplina che avvalendosi di
metodi induttivi e deduttivi provvede a ricercare e documentare
numericamente le frequenze e le regolarità che si verificano in
natura e nelle collettività umane. Il termine nacque alla fine del
cinquecento per indicare valutazioni relative alle caratteristiche
(sociali, economiche..) degli stati, ma la disciplina vera e propria
si può far risalire agli inglesi J. Graunt e W. Pettey, fondatori
dell' "aritmetica politica", nella seconda metà del 1600. Col
progredire delle scienze l’indagine statistica fu estesa anche ai
fenomeni naturali e con la nascita della meccanica quantistica essa
si rivela il migliore, se non l’unico, approccio per la comprensione
e la descrizione del microcosmo.
La statistica si presenta sotto due aspetti : come statistica
descrittiva e come statistica deduttiva.
La statistica descrittiva è lo studio della variabilità di un
fenomeno a partire da dati rilevati sull’intera popolazione (ad
esempio: determinazione della temperatura media delle massime di un
determinato anno), per contro la statistica induttiva, consiste
nell’analisi dell’inferenza, cioè della possibilità di descrivere un
fenomeno a partire dai dati di un campione, insieme parziale di dati
di un’intera popolazione
Il calcolo delle probabilità
La statistica descrittiva nasce anche dalla
necessità di prevedere dei fenomeni aleatori per confermare altresì
dei modelli probabilistici via via definiti nel corso dello sviluppo
della matematica.
I concetto di probabilità fu affrontato a partire dal cinquecento da
Girolamo Cardano nel suo libro "Liber de ludo aleae",
successivamente e più approfonditamente da Huygens nel suo "De ratiocinis in ludo aleae" primo libro stampato sulla materia (1657),
da Bernoulli e De Moivre che introdussero il concetto di probabilità
come limite, successivamente da P. Laplace nel suo "Théorie analitique des probabilités" in cui prefigurò l’applicazione dei
concetti di probabilità alle scienze applicate. A Gauss ed a Laplace
si deve la celebre curva "normale" o gaussiana. Nel secolo scorso
fondamentali contributi dettero, tra gli altri, Markov, Von Mises,
Kolmagorov, De Finetti.
Definizioni della probabilità
Della probabilità esistono tre definizioni:
La definizioni classica o logicista: la
probabilità del verificarsi di un fenomeno è dato dal rapporto tra
il numero dei casi favorevoli e quelli possibili. Così,
classicamente, la probabilità di avere "testa" nel lancio di una
monetina è esattamente ½ = rapporto tra i casi possibili (2) e
quelli favorevoli, (1), nel lancio di un dado quella di ottenere ad
esempio 4 è esattamente1/6. In questa definizione i casi favorevoli
sono ritenuti equiprobabili. Il calcolo combinatorio è il fondamento
per la determinazione di tali probabilità
La definizione frequentista: la probabilità di accadimento di
un fenomeno è la frequenza limite con la quale si presenta quando il
numero delle prove di verifica n , tende all’infinito:
P = lim fn quando n
E’ una definizione introdotta da Von Mises per superare il problema
dell’equiprobabilità della definizione classsica.
La
definizione soggettivista: la probabilità è la posta che un
giocatore sarebbe disposto a pagare per ottenere la vincita di 1 .
Oppure: la probabilità di un evento è p se è indifferente ricevere
la somma = p con certezza oppure la somma = 1 solo se l’evento si
verificherà. Ad esempio, se mi è indifferente ricevere 100 euro od
un biglietto (di 1000 venduti) di una lotteria per una vincita di
100000 euro, ritengo che la probabilità di vincita P sia 1/1000 =
0,001 . E’ questa la definizione base di tutta la teoria
probabilistica di Bruno de Finetti.
La definizione assiomatica: l’impostazione assiomatica di
Kolmogorov non dice cosa sia l’ essenza della probabilità ma si
propone di definirne i postulati ed i teoremi che ne derivano
applicabili tanto nell’impostazione classicista che in quella
frequentista costruendo così un’algebra rigorosa della probabilità.
Calcolo combinatorio
Nella definizione classica della probabilità è necessario
calcolare il rapporto trai casi favorevoli e quelli possibili, il
calcolo combinatorio sviluppato nel corso del 17° secolo può
consentire tale determinazione.
Permutazioni
Siano dati n oggetti diversi (ad es. lettere o numeri) e
chiamiamoli a1, a2, a3,… an
. Il numero di disposizioni distinte di tali oggetti chiamate
permutazioni è dato da:
1) Pn = 1x2x3x…xn
= n! = fattoriale di n
La dimostrazione è elementare ricorrendo ad uno
degli strumenti più potenti della matematica: l’induzione completa
formalizzata da Peano nel suo quinto postulato dell’algebra: se una
proposizione, chiamiamola P(n) è vera relativamente all’indice n
dimostrando che è vera per l’indice n+1 è vera per tutti gli indici
> di n.
Ora la 1) è ovviamente vera per n = 1 , ed anche
per n = 2, per es. se gli elementi sono a e b abbiamo le
permutazioni a,b e b,a e P2 = 2! = 2 , ora ammettiamo che
sia vera per l’indice n dimostriamo che è vera per l’indice n+1: in
effetti ad ogni singola permutazione di n elementi corrisponderanno
n+1 nuove permutazioni nelle quali il nuovo elemento a n+1 occuperà
la prima, o la seconda,… o l’ n+1na posizione.
Se gli elementi sono ora : a, b, c abbiamo da a,
b : c,a,b ; a,c,b; a,b,c e da b, a: c,b,a; b,c,a; b,a,c; in totale
3! = 6 permutazioni.
Disposizioni senza
ripetizioni
Siano dati ancora n elementi (ad es. lettere o
numeri) differenti, chiediamoci quante disposizioni diverse di k
elementi ciascuna (in cui conti anche l’ordine) si possono definire
con gli elementi dati (disposizioni di n k a k). Utilizziamo ancora
l’induzione matematica su k e dimostriamo che tale numero è dato da
:
2) Akn
= n (n-1)(n-2) …(n-k+1)
Tale relazione è vera per k =1 : le disposizioni
sono gli n elementi a1, a2, …
che sia vera per k , proviamo che è vera per k+1.
A partire da ogni singola disposizione k a k
costruiamone n-k di classe k+1 aggiungendovi in coda via via gli n-k
elementi che non sono contenuti in essa. Otteniamo cosi in totale
n (n-1)(n-2) …(n-k+1)(n-k) = n (n-1)(n-2) …(n-(k+1)+1) = Ak+1n
disposizioni come da 2).
In effetti l’insieme costruito è completo e non
ha ripetizioni. Completo per costruzione e non ha ripetizioni perche
ogni diposizione è diversa dall’altra: se l’elemento aggiunto in
coda è uguale in 2 disposizioni le disposizioni dei suoi primi k
elementi sono diverse per costruzione ed ipotesi induttiva, se i due
elementi aggiunti sono diversi le due disposizioni risultanti sono
diverse perché diverso l’ultimo elemento di esse
La relazione 2) può anche essere scritta come:
3 ) Akn
= n! /(n-k)!
Disposizioni con ripetizioni
Si abbiano n elementi diversi (ad es. le 10 cifre
del nostro sistema decimale, 0,1,2…,9), chiediamoci quante siano le
disposizioni con ripetizione degli n elementi k a k , cioè di classe
k. La risposta è immediata, utilizzando l’induzione ed il fatto che
per k=1 le disposizioni sono ovviamente n.
Siano infatti nk tali diposizioni, le
disposizioni di classe k+1 si ottengono semplicemente aggiungendo in
testa ad ognuna di quelle di classe k , gli n elementi. Avremo
perciò n x nk = nk+1 disposizioni. Così nel
nostro sistema decimale per la classe 2 avremo 102=100
elementi, per la classe 3 103=1000 elementi e così via.
Combinazioni senza ripetizioni (Combinazioni
semplici)
Dati n oggetti diversi (ad es. esempio lettere,
numeri..) a1, a2, …, an , cerchiamo
quali siano le combinazioni k a k di questi elementi cioè gli
insiemi di k elementi diversi di n dove non conti l’ordine secondo
il quale essi si presentano.
La soluzione è immediata tenendo conto che nelle disposizioni Akn
ogni insieme (o classe) distinto di k oggetti appare k! volte,
stante la definizione stessa di disposizione che assume come
differenti tutte le permutazioni di una stessa classe. Si ha dunque
per il numero di combinazioni che indichiamo Cnk
Le combinazione di n elementi k a k entrano come
coefficienti nello sviluppo del binomio di Newton - Tartaglia
Si ha:
termini dei simboli e sommando. Essa rappresenta quella esistente
tra i termini del triangolo di Tartaglia di riga n e colonna k
rispetto a quelli di riga n-1 e colonna k-1
Combinazioni con
ripetizione
Il numero di
combinazioni di n oggetti di classe k cioè k a k dove sono possibili
le ripetizioni ma non conti l’ ordine è dato da :
Cioè pari alle
combinazioni senza ripetizione di n+k+1 elementi k a k
Si possono reperire
in letteratura diverse dimostrazioni , riportiamone una di brevità
eccezionale ma che comporta la conoscenza di alcuni concetti:
a) Dati 2 insiemi A
e B , essi hanno gli stessi elementi se si può stabilire una
corrispondenza biunivoca tra i loro elementi: ad ogni elemento di A
corrisponde uno ed uno solo elemento di B e viceversa.
b) Gli oggetti
possono sempre essere, senza perdere generalità, considerati dei
numeri attribuendo loro degli indici numerici: ad elementi diversi
indici diversi e lavorare sugli indici piuttosto che sugli oggetti
Orbene consideriamo
una combinazione qualsiasi con ripetizioni dei numeri 1,2,…n di
classe k, ordiniamola in modo che i k numeri di ogni classe, alcuni
dei quali possono essere ripetuti, si susseguano in modo non
decrescente cioè a1≤a2…≤ak (ciò è
possibile perché l’ordine non conta in una combinazione che
rappresenta tutte le disposizioni possibili con quei determinati
numeri a prescindere dall’ordine) aggiungiamo ora ai suoi elementi
rispettivamente i numeri 0,1,2,…k-1 avremo la classe formata dai
numeri:
a1, a2+2, a3+3 …+an+k-1.
Tutte queste classi
sono formate da elementi diversi perché somme di una successione di
numeri non decrescenti con una di numeri strettamente crescenti e
sono tra di loro diverse perché somma termine a termine di una
stessa successione dei termini crescenti 0, 1,2,3,…k-1 con
successioni, non decrescenti, tra loro differenti per definizione.
Ogni classe di composizione di n+k-1 numeri k a k viene
rappresentata, a partire da quella composta dei termini minori:
(1+0, 1+1, 1+3,…,1+k-1) a quella dei termini maggiori:
(n, n+1, n+2, n+3,…, n+k-1). Vi è così stabilita una corrispondenza
univoca tra le composizioni con ripetizioni Pnk
di n elementi k a k e le composizioni semplici di n+k-1 elementi k a
k, Cn+k-1k. Ragionamenti analoghi,
partendo dalle composizioni semplici (senza ripetizione) Cn+k-1k ,
ordinando in modo crescente gli elementi di ogni classe e sottraendo
0,1,2,3,4,5,.., k-1, conducono alla corrispondenza univoca tra le
due composizioni, stabilendosi così la corrispondenza biunivoca a),
che conferma la tesi. In particolare per ogni combinazione
(semplice) di n+k-1 elementi ordinata in modo crescente, i termini a1-
0, a2-1, a3-2, …, an-(k-1) sono tutti
positivi, non decrescenti, alcuni o tutti potendo essere uguali tra
di loro.