Variabili casuali e Distribuzioni di Probabilità
Variabili casuali e
Distribuzioni di Probabilità
Variabili Casuali (v.c.)
Una variabile casuale X e’ una funzione definita
sullo spazio campionario Ω che associa ad ogni
evento E ⊂⊂⊂⊂ ΩΩΩΩ un unico numero reale.
9E
1E
2E
8E
7E4E
6E5E
3E
1x
6x
4x
5x
2x3x
X
Ω
Variabili casuali discrete e continue
• Una variabile casuale discreta può assumere un insieme discreto (finito o numerabile) di numeri reali.
• Una variabile casuale continua può assumere tutti i valori compresi in un intervallo reale.
ΩΩΩΩ discreto V.C. discreta
ΩΩΩΩ continuo V.C. discreta o continua
Variabili casuali discrete
P(X=xi) Probabilità che la v.c. X assuma il valore xi
La funzione di probabilità di una variabile casuale discreta X associa ad ognuno dei valori xi la corrispondente probabilità P(X=xi)
Proprietà
0
1
≥
=∑)x(P
)x(P
i
i i
Esempio
Corrispondenza tra eventi e valori della variabile casuale X “somma dei punteggi”, nella prova “lancio di due dadi”
Data una v.c discreta X, la funzione che fa corrispondere ai valori x le probabilità cumulate
viene detta funzione di ripartizione ed indicata con
Funzione di Ripartizione
( )xXP ≤
( ) ( ) ( )∑≤
==≤=xw
wXPxXPxF
Esempio
X 2 3 4 5 6 7 8 9 10 11 12
P(x)
F(x) 136
136
236
336
436
536
636
536
436
336
236
1
361
363
366
3610
3615
3621
3626
3630
3633
3635
0
0,2
0,4
0,6
0,8
1
1 2 3 4 5 6 7 8 9 10 11 12 13 x
F(x)
Funzione di Ripartizione: proprietà
( ) 0=−∞→
xFlimx
( ) 1=∞→
xFlimx
( ) ( )00
xFxFlimxx
=+→
• è non decrescente, ossia:
• è continua a destra, ossia
( ) ( )2121 xFxFxx ≤⇒<
• Inoltre
Variabili casuali continue
Chiameremo Funzione di densità, la funzione matematica f(x) per cui l’area sottesa alla funzione, corrispondente ad un certo intervallo, è uguale alla probabilità che X assuma un valore in quell’intervallo.
• f(x)≥≥≥≥0 sempre
• L’area totale sottesa alla funzione =1, ossia
Proprietà delle funzioni di densità
∫∞+
∞−= 1dx)x(f
• La probabilità che la v.c. assuma un particolare valore dell’intervallo è zero.
Funzione di Ripartizione
Data una v.c. continua X, la funzione che fa corrispondere ai valori x le probabilità cumulate P(X≤≤≤≤ x) viene detta funzione di ripartizione.
∫∞−
=≤=x
dw)w(f)xX(P)x(F
Variabili casuali continue
Esempio:
0,0
0,5
1,0
1,5
2,0
0,0 0,5 0,7 1,0
0,229
xf
X
[ ]
1)()(
229,0)(
1;0
)1(12)(
)(~
1
0
7,0
5,0
2
∫∫
∫
==
=
∈−=
∞+
∞−
dxxfdxxf
dxxf
x
xxxf
xfX
P(0,5<X<0,7)
Esempio
Funzioni di densità e corrispondenti funzioni di ripartizione
0,00
0,50
1,00
1,50
2,00
1,5 3,00,0
0,2
0,4
0,6
0,8
1,0
0,0 1,5 3,0 0,0
( )xF
( )xF
( )xf
( )xf
x
x x
x
Valore atteso di una v.c.
Il valore medio di una v.c. X, è definito come
( ) ( )∑=i
ii xPxXE Se la v.c. è discreta
Se la v.c. è continua( ) ( )∫∞+
∞−= dxxfxXE
Esempio: v.c. discreta
( )
7 361
12362
11363
10
364
9365
8366
7365
6364
5363
4362
3361
2
=+++
+++++++=XE
X 2 3 4 5 6 7 8 9 10 11 12
P(x)
F(x) 136
136
236
336
436
536
636
536
436
336
236
1
361
363
366
3610
3615
3621
3626
3630
3633
3635
Esempio: v.c. continua
Consideriamo la v.c.
con lambda una costante positiva e (Esponenziale). Il valore atteso è dato da
0≥x
xe~X λ−λ
( )λ
=λ= ∫∞+
∞−
λ− 1dxexXE x
0,0 0,5 1,0 1,5 2,0 2,5 3,00,0
0,4
0,8
1,2
1,6
2,0
La varianza di una v.c.
La varianza V(X) di una variabile casuale X è definita da
( ) ( )( ) ( )∑ −=i
ii xPXExXV 2Se la v.c. è discreta
Se la v.c. è continua( ) ( )( ) ( )∫∞+
∞−−= dxxfXExXV 2
Varianza di una v.c.
Notazioni alternative:
( ) ( )[ ] 2 XEXEXV −=
( ) ( ) ( )[ ] 2 2 XEXEXV −=
( ) ( )XVXSD =
oppure, dopo alcuni passaggi
La deviazione standard è definita
V.c. Standardizzate
I valori standardizzati esprimono la distanza tra ivalori osservati e la media in termini di deviazionestandard.
Se X è una v.c. con valore E(X) e SD(X) allora:
)X(SD)X(EX
Y−=
È una v.c. standardizzata con E(Y)=0 e V(Y)=1
Teorema di Chebyshev
Sia X una variabile casuale e k un valore reale positivo, allora vale la seguente disuguaglianza:
( ) ( )( )2
1
kXSDkXEXP ≤⋅≥−
Indipendentemente dalla distribuzione della v.c. , la probabilità che X assuma valori distanti dalla media piùdi k deviazioni standard è al più 1/k2
Distribuzioni di probabilità
• Sono una estensione delle distribuzioni di frequenza
• Il caso più semplice da trattare è relativo a distribuzioni di probabilità di variabili discrete– Variabili discrete:
• Fenomeni di conteggio• Esperimenti con modalità limitate
– Variabili continue:• Misurazioni• Esperimenti con modalità nel continuo
Metodi di sintesi delle distribuzioni• In analogia con quanto detto circa le distribuzioni
di frequenze, anche per le distribuzioni di probabilità abbiamo la necessità di sintetizzare i dati
• In particolare ci interessa una sintesi di centralità– Valore atteso
• Ed una sintesi della variabilità– Varianza– Scarto quadratico medio– Coefficiente di variazione
Modelli probabilistici• Per modello si intende una legge di probabilità
in grado di misurare l’incertezza circa ilfenomeno reale sotto studio
Fenomeno realeFenomeno reale:
Numero di figli per famiglia
Modello matematicoModello matematico:
Distribuzione di probabilità da associare al fenomeno di interesse
per analizzarloRisultati dal lancio di un dado
• In funzione del fenomeno reale sotto studio, si cerca di associare un modello opportuno a descriverne la variabilità
• I modelli si dividono in:– Modelli discreti, alcuni dei quali sono:
• Modello uniforme discreto• Modello binomiale• Modello poisson
– Modelli continui• Modello normale• Modello esponenziale
Modello uniforme (1)
• Si tratta della distribuzione più semplice• Consente di valutare la probabilità di un
fenomeno per il quale ognuno degli kpossibili risultati sia equamente probabile.
• Ad esempio, la probabilità che un numero sia estratto al lotto è descritta dal modello Uniforme, perché ciascuno dei 90 numeri ha una probabilità pari a 1/90 di essere estratto.
Modello bernoulliano (1)• Questo particolare modello è adatto a descrive la probabilità
associata a variabili dicotomiche, cioè fenomeni che assumono soltanto uno tra due possibili valori: x = 1 (si verifica un certo evento di interesse E, ed x = 0 se non si verifica l’evento E).
• Esempio: (morto vs vivo, maschio vs femmina; presenza di un evento di interesse contrapposto a tutti gli altri)
•
)1()var()(
1)0()1(
ppXpXE
pXPpXP
−==
−====
Distribuzione di Bernoulli
Una v.c. di Bernoulli può assumere il valore 1 con probabilità ππππ e il valore 0 con probabilità 1-ππππ
La sua funzione di probabilità può essere espressa come
( ) ( ) 10 1 1 ,per xxXP xx =π−π== −
Tutte le prove che producono solo due possibili risultati generano v.c. di Bernoulli: il lancio di una moneta, il sesso di un nascituro, il superamento o meno di un certo livello di inflazione….
Modello Binomiale
• Il modello binomiale, descrive la probabilità il numero x di successi ottenuti in un campione di n prove (osservazioni):
)1()var()(
)1(
)1()!(!
!)|Pr(
pnpXnpXE
ppxn
ppxnx
npxX
xnx
xnx
−==
−
=
−−
==
−
−
Modello Binomiale (2)• La formulazione Pr(X = x) indica che su n osservazioni si
sono verificati esattamente x successi e, di conseguenza, n – x insuccessi
• Poiché le prove sono indipendenti e la probabilità di successo è costante pari a p per ogni prova, osserveremo su n tentativi:– x con probabilità p– n – x con probabilità 1 – p
• Rimane da considerare il fatto che l’ordine in cui le prove sono osservate è variabile e noi siamo interessati solo al totale dei successi-insuccessi, non all’ordine
Modello Binomiale (3)• Infatti, si potrebbero verificare:
– tutti i successi e poi tutti gli insuccessi– oppure un successo e un insuccesso in sequenza– oppure tutti gli insuccessi e poi tutti i successi …
• Per tenere conto di queste possibilità, le probabilità sono moltiplicate per il numero di possibili combinazioni di k
12...)1(!con )!(!
!×××−×=
−=
nnnxnx
nxn
N=10 p=0.4
Calcolo delle probabilità nel modellobinomiale
• Calcolare Pr(X = 3|n = 4, p = 0.1)
003609000104
901011231234
10110343
43X
13
343
...
..
).(.)!(!
!)Pr(
=××=
××××××××
=
−−
== −
• Calcolare Pr(X ≥ 3) con n = 4 prove e p = 0.1
00370000100036010001019000104
901011234
1234901011231234
10110444
410110343
44X3X3X
0413
444343
......
....
).(.)!(!
!).(.)!(!
!)Pr()Pr(
=+=××+××=
××××××
×××+××
××××××
=
−−
+−−
=
=∪==≥
−−
Poiché le prove sono indipendenti per Hp
Perché 0! = 1 per definizione
• Calcolare Pr(X < 3) con n = 4 prove e p = 0.1
∑=
==
=+=+===∪=∪==<
2
0i
iX
2X1X0X2X1X0X3X
)Pr(
)Pr()Pr()Pr()Pr()Pr(
6561010110040
40X 040 .).(.)!(!
!)Pr( =−−
== −
2916010110141
41X 141 .).(.)!(!
!)Pr( =−−
== −
0486010110242
42X 242 .).(.)!(!
!)Pr( =−−
== −
N=4 p=0.1
Esempi di Binomiale
0,000
0,050
0,100
0,150
0,200
0,250
0,300
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Binomiale(20;0,5)
Binomiale(7;0,5)
Modello Poisson (1)
• Il modello Poisson si adatta a rappresentare esperimenti aleatori che danno luogo ad un numero discreto di eventi in un intervallo continuo (es. arrivi in un aeroporto in un’ora di tempo, )
• Le realizzazioni degli eventi devono avere le seguenti caratteristiche:– L’intervallo (di tempo o di spazio) è suddivisibile in n sotto-
intervalli all’interno dei quali la probabilità di manifestarsi di un evento è piccola e la probabilità di manifestarsi di più eventi tende a zero
– La probabilità di manifestarsi degli eventi nei sottointervalli è costante
– Eventi relativi a sotto intervalli differenti sono stocasticamente indipendenti (processo senza memoria)
Modello Poisson (2)
• In termini matematici il modello è specificato come:
• Il parametro λ rappresenta il numero medio di eventi che si verificano nell’intervallo (numero atteso di successi)
Pr( | )!
xeX xx
λλλ−
= =
Distribuzione di Poisson
Una v.c. di Poisson, è una v.c. discreta che può assumere qualsiasi valore intero non-negativo. La distribuzione di probabilità della Poisson è data da
K 2 1 0 ,,,xe!x
)x(Px
=λ= λ− ∞<λ<0
( ) λ=XE
( ) λ=XV
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
Poisson(1)
Poisson(3)
Poisson(7)
Modello Poisson (3)
• L’esperimento aleatorio di interesse è il “numero di arrivi di clienti presso una banca”
• Supponiamo che mediamente arrivino 3 clienti ogni minuto
• Ci interessa calcolare: – la probabilità che nello stesso intervallo arrivino
esattamente 2 clienti– la probabilità che nello stesso intervallo arrivino più
di 2 clienti
Modello Poisson (4)
• Utilizzando la funzione della distribuzione Poisson, si ha che:
224012
718282923e2X
323
.)(
).(!
)Pr(
=×
×===
−−
Modello Poisson (5)
• Invece, per determinare
è più comodo notare che:
dove queste tre probabilità sono “semplici” da calcolare
∑∞
=
==>3i
iX2X )Pr()Pr(
)Pr()Pr()Pr()Pr()Pr(
2X1X0X2X12X
=+=+==≤−=>
Modello Poisson (6)
049801
71828210
3e0X303
.
).(!
)Pr(
=
×===
−−
149401
718282313e1X
313
.
).(!
)Pr(
=
×===
−−
224012
718282923e2X
323
.)(
).(!
)Pr(
=×
×===
−−
57702X .)Pr( =>
Modello Poisson (7)• NB nel modello Poisson, il parametro λ
rappresenta anche la varianza oltre che il numero atteso di eventi
• Dunque, all’aumentare della media, aumenta anche la varianza della distribuzione
• Questo fa sì che nella pratica si possa ricorrere a formulazioni alternative del modello Poisson, che permettono di “modellare” in modo indipendente il termine di variabilità