Distribuzioni di Probabilita

Variabili casuali e

Distribuzioni di Probabilità

Variabili Casuali (v.c.)

Una variabile casuale X e’ una funzione definita

sullo spazio campionario Ω che associa ad ogni

evento E ⊂⊂⊂⊂ ΩΩΩΩ un unico numero reale.

9E

1E

2E

8E

7E4E

6E5E

3E

1x

6x

4x

5x

2x3x

X

Ω

Variabili casuali discrete e continue

• Una variabile casuale discreta può assumere un insieme discreto (finito o numerabile) di numeri reali.

• Una variabile casuale continua può assumere tutti i valori compresi in un intervallo reale.

ΩΩΩΩ discreto V.C. discreta

ΩΩΩΩ continuo V.C. discreta o continua

Variabili casuali discrete

P(X=xi) Probabilità che la v.c. X assuma il valore xi

La funzione di probabilità di una variabile casuale discreta X associa ad ognuno dei valori xi la corrispondente probabilità P(X=xi)

Proprietà

0

1

≥

=∑)x(P

)x(P

i

i i

Esempio

Corrispondenza tra eventi e valori della variabile casuale X “somma dei punteggi”, nella prova “lancio di due dadi”

Data una v.c discreta X, la funzione che fa corrispondere ai valori x le probabilità cumulate

viene detta funzione di ripartizione ed indicata con

Funzione di Ripartizione

( )xXP ≤

( ) ( ) ( )∑≤

==≤=xw

wXPxXPxF

Esempio

X 2 3 4 5 6 7 8 9 10 11 12

P(x)

F(x) 136

136

236

336

436

536

636

536

436

336

236

1

361

363

366

3610

3615

3621

3626

3630

3633

3635

0

0,2

0,4

0,6

0,8

1

1 2 3 4 5 6 7 8 9 10 11 12 13 x

F(x)

Funzione di Ripartizione: proprietà

( ) 0=−∞→

xFlimx

( ) 1=∞→

xFlimx

( ) ( )00

xFxFlimxx

=+→

• è non decrescente, ossia:

• è continua a destra, ossia

( ) ( )2121 xFxFxx ≤⇒<

• Inoltre

Variabili casuali continue

Chiameremo Funzione di densità, la funzione matematica f(x) per cui l’area sottesa alla funzione, corrispondente ad un certo intervallo, è uguale alla probabilità che X assuma un valore in quell’intervallo.

• f(x)≥≥≥≥0 sempre

• L’area totale sottesa alla funzione =1, ossia

Proprietà delle funzioni di densità

∫∞+

∞−= 1dx)x(f

• La probabilità che la v.c. assuma un particolare valore dell’intervallo è zero.

Funzione di Ripartizione

Data una v.c. continua X, la funzione che fa corrispondere ai valori x le probabilità cumulate P(X≤≤≤≤ x) viene detta funzione di ripartizione.

∫∞−

=≤=x

dw)w(f)xX(P)x(F

Variabili casuali continue

Esempio:

0,0

0,5

1,0

1,5

2,0

0,0 0,5 0,7 1,0

0,229

xf

X

[ ]

1)()(

229,0)(

1;0

)1(12)(

)(~

1

0

7,0

5,0

2

∫∫

∫

==

=

∈−=

∞+

∞−

dxxfdxxf

dxxf

x

xxxf

xfX

P(0,5<X<0,7)

Esempio

Funzioni di densità e corrispondenti funzioni di ripartizione

0,00

0,50

1,00

1,50

2,00

1,5 3,00,0

0,2

0,4

0,6

0,8

1,0

0,0 1,5 3,0 0,0

( )xF

( )xF

( )xf

( )xf

x

x x

x

Valore atteso di una v.c.

Il valore medio di una v.c. X, è definito come

( ) ( )∑=i

ii xPxXE Se la v.c. è discreta

Se la v.c. è continua( ) ( )∫∞+

∞−= dxxfxXE

Esempio: v.c. discreta

( )

7 361

12362

11363

10

364

9365

8366

7365

6364

5363

4362

3361

2

=+++

+++++++=XE

X 2 3 4 5 6 7 8 9 10 11 12

P(x)

F(x) 136

136

236

336

436

536

636

536

436

336

236

1

361

363

366

3610

3615

3621

3626

3630

3633

3635

Esempio: v.c. continua

Consideriamo la v.c.

con lambda una costante positiva e (Esponenziale). Il valore atteso è dato da

0≥x

xe~X λ−λ

( )λ

=λ= ∫∞+

∞−

λ− 1dxexXE x

0,0 0,5 1,0 1,5 2,0 2,5 3,00,0

0,4

0,8

1,2

1,6

2,0

La varianza di una v.c.

La varianza V(X) di una variabile casuale X è definita da

( ) ( )( ) ( )∑ −=i

ii xPXExXV 2Se la v.c. è discreta

Se la v.c. è continua( ) ( )( ) ( )∫∞+

∞−−= dxxfXExXV 2

Varianza di una v.c.

Notazioni alternative:

( ) ( )[ ] 2 XEXEXV −=

( ) ( ) ( )[ ] 2 2 XEXEXV −=

( ) ( )XVXSD =

oppure, dopo alcuni passaggi

La deviazione standard è definita

V.c. Standardizzate

I valori standardizzati esprimono la distanza tra ivalori osservati e la media in termini di deviazionestandard.

Se X è una v.c. con valore E(X) e SD(X) allora:

)X(SD)X(EX

Y−=

È una v.c. standardizzata con E(Y)=0 e V(Y)=1

Teorema di Chebyshev

Sia X una variabile casuale e k un valore reale positivo, allora vale la seguente disuguaglianza:

( ) ( )( )2

1

kXSDkXEXP ≤⋅≥−

Indipendentemente dalla distribuzione della v.c. , la probabilità che X assuma valori distanti dalla media piùdi k deviazioni standard è al più 1/k2

Distribuzioni di probabilità

• Sono una estensione delle distribuzioni di frequenza

• Il caso più semplice da trattare è relativo a distribuzioni di probabilità di variabili discrete– Variabili discrete:

• Fenomeni di conteggio• Esperimenti con modalità limitate

– Variabili continue:• Misurazioni• Esperimenti con modalità nel continuo

Metodi di sintesi delle distribuzioni• In analogia con quanto detto circa le distribuzioni

di frequenze, anche per le distribuzioni di probabilità abbiamo la necessità di sintetizzare i dati

• In particolare ci interessa una sintesi di centralità– Valore atteso

• Ed una sintesi della variabilità– Varianza– Scarto quadratico medio– Coefficiente di variazione

Modelli probabilistici• Per modello si intende una legge di probabilità

in grado di misurare l’incertezza circa ilfenomeno reale sotto studio

Fenomeno realeFenomeno reale:

Numero di figli per famiglia

Modello matematicoModello matematico:

Distribuzione di probabilità da associare al fenomeno di interesse

per analizzarloRisultati dal lancio di un dado

• In funzione del fenomeno reale sotto studio, si cerca di associare un modello opportuno a descriverne la variabilità

• I modelli si dividono in:– Modelli discreti, alcuni dei quali sono:

• Modello uniforme discreto• Modello binomiale• Modello poisson

– Modelli continui• Modello normale• Modello esponenziale

Modello uniforme (1)

• Si tratta della distribuzione più semplice• Consente di valutare la probabilità di un

fenomeno per il quale ognuno degli kpossibili risultati sia equamente probabile.

• Ad esempio, la probabilità che un numero sia estratto al lotto è descritta dal modello Uniforme, perché ciascuno dei 90 numeri ha una probabilità pari a 1/90 di essere estratto.

Modello bernoulliano (1)• Questo particolare modello è adatto a descrive la probabilità

associata a variabili dicotomiche, cioè fenomeni che assumono soltanto uno tra due possibili valori: x = 1 (si verifica un certo evento di interesse E, ed x = 0 se non si verifica l’evento E).

• Esempio: (morto vs vivo, maschio vs femmina; presenza di un evento di interesse contrapposto a tutti gli altri)

•

)1()var()(

1)0()1(

ppXpXE

pXPpXP

−==

−====

Distribuzione di Bernoulli

Una v.c. di Bernoulli può assumere il valore 1 con probabilità ππππ e il valore 0 con probabilità 1-ππππ

La sua funzione di probabilità può essere espressa come

( ) ( ) 10 1 1 ,per xxXP xx =π−π== −

Tutte le prove che producono solo due possibili risultati generano v.c. di Bernoulli: il lancio di una moneta, il sesso di un nascituro, il superamento o meno di un certo livello di inflazione….

Modello Binomiale

• Il modello binomiale, descrive la probabilità il numero x di successi ottenuti in un campione di n prove (osservazioni):

)1()var()(

)1(

)1()!(!

!)|Pr(

pnpXnpXE

ppxn

ppxnx

npxX

xnx

xnx

−==

−

=

−−

==

−

−

Modello Binomiale (2)• La formulazione Pr(X = x) indica che su n osservazioni si

sono verificati esattamente x successi e, di conseguenza, n – x insuccessi

• Poiché le prove sono indipendenti e la probabilità di successo è costante pari a p per ogni prova, osserveremo su n tentativi:– x con probabilità p– n – x con probabilità 1 – p

• Rimane da considerare il fatto che l’ordine in cui le prove sono osservate è variabile e noi siamo interessati solo al totale dei successi-insuccessi, non all’ordine

Modello Binomiale (3)• Infatti, si potrebbero verificare:

– tutti i successi e poi tutti gli insuccessi– oppure un successo e un insuccesso in sequenza– oppure tutti gli insuccessi e poi tutti i successi …

• Per tenere conto di queste possibilità, le probabilità sono moltiplicate per il numero di possibili combinazioni di k

12...)1(!con )!(!

!×××−×=

−=

nnnxnx

nxn

N=10 p=0.4

Calcolo delle probabilità nel modellobinomiale

• Calcolare Pr(X = 3|n = 4, p = 0.1)

003609000104

901011231234

10110343

43X

13

343

...

..

).(.)!(!

!)Pr(

=××=

××××××××

=

−−

== −

• Calcolare Pr(X ≥ 3) con n = 4 prove e p = 0.1

00370000100036010001019000104

901011234

1234901011231234

10110444

410110343

44X3X3X

0413

444343

......

....

).(.)!(!

!).(.)!(!

!)Pr()Pr(

=+=××+××=

××××××

×××+××

××××××

=

−−

+−−

=

=∪==≥

−−

Poiché le prove sono indipendenti per Hp

Perché 0! = 1 per definizione

• Calcolare Pr(X < 3) con n = 4 prove e p = 0.1

∑=

==

=+=+===∪=∪==<

2

0i

iX

2X1X0X2X1X0X3X

)Pr(

)Pr()Pr()Pr()Pr()Pr(

6561010110040

40X 040 .).(.)!(!

!)Pr( =−−

== −

2916010110141

41X 141 .).(.)!(!

!)Pr( =−−

== −

0486010110242

42X 242 .).(.)!(!

!)Pr( =−−

== −

N=4 p=0.1

Esempi di Binomiale

0,000

0,050

0,100

0,150

0,200

0,250

0,300

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Binomiale(20;0,5)

Binomiale(7;0,5)

Modello Poisson (1)

• Il modello Poisson si adatta a rappresentare esperimenti aleatori che danno luogo ad un numero discreto di eventi in un intervallo continuo (es. arrivi in un aeroporto in un’ora di tempo, )

• Le realizzazioni degli eventi devono avere le seguenti caratteristiche:– L’intervallo (di tempo o di spazio) è suddivisibile in n sotto-

intervalli all’interno dei quali la probabilità di manifestarsi di un evento è piccola e la probabilità di manifestarsi di più eventi tende a zero

– La probabilità di manifestarsi degli eventi nei sottointervalli è costante

– Eventi relativi a sotto intervalli differenti sono stocasticamente indipendenti (processo senza memoria)

Modello Poisson (2)

• In termini matematici il modello è specificato come:

• Il parametro λ rappresenta il numero medio di eventi che si verificano nell’intervallo (numero atteso di successi)

Pr( | )!

xeX xx

λλλ−

= =

Distribuzione di Poisson

Una v.c. di Poisson, è una v.c. discreta che può assumere qualsiasi valore intero non-negativo. La distribuzione di probabilità della Poisson è data da

K 2 1 0 ,,,xe!x

)x(Px

=λ= λ− ∞<λ<0

( ) λ=XE

( ) λ=XV

0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

Poisson(1)

Poisson(3)

Poisson(7)

Modello Poisson (3)

• L’esperimento aleatorio di interesse è il “numero di arrivi di clienti presso una banca”

• Supponiamo che mediamente arrivino 3 clienti ogni minuto

• Ci interessa calcolare: – la probabilità che nello stesso intervallo arrivino

esattamente 2 clienti– la probabilità che nello stesso intervallo arrivino più

di 2 clienti

Modello Poisson (4)

• Utilizzando la funzione della distribuzione Poisson, si ha che:

224012

718282923e2X

323

.)(

).(!

)Pr(

=×

×===

−−

Modello Poisson (5)

• Invece, per determinare

è più comodo notare che:

dove queste tre probabilità sono “semplici” da calcolare

∑∞

=

==>3i

iX2X )Pr()Pr(

)Pr()Pr()Pr()Pr()Pr(

2X1X0X2X12X

=+=+==≤−=>

Modello Poisson (6)

049801

71828210

3e0X303

.

).(!

)Pr(

=

×===

−−

149401

718282313e1X

313

.

).(!

)Pr(

=

×===

−−

224012

718282923e2X

323

.)(

).(!

)Pr(

=×

×===

−−

57702X .)Pr( =>

Modello Poisson (7)• NB nel modello Poisson, il parametro λ

rappresenta anche la varianza oltre che il numero atteso di eventi

• Dunque, all’aumentare della media, aumenta anche la varianza della distribuzione

• Questo fa sì che nella pratica si possa ricorrere a formulazioni alternative del modello Poisson, che permettono di “modellare” in modo indipendente il termine di variabilità

Distribuzioni di Probabilita

Education