Top Banner
Variabili casuali e Distribuzioni di Probabilità
44

Distribuzioni di Probabilita

Jul 01, 2015

Download

Education

clickonhit

slide dell'universita di pisa dipartimento di statistica
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Distribuzioni di Probabilita

Variabili casuali e

Distribuzioni di Probabilità

Page 2: Distribuzioni di Probabilita

Variabili Casuali (v.c.)

Una variabile casuale X e’ una funzione definita

sullo spazio campionario Ω che associa ad ogni

evento E ⊂⊂⊂⊂ ΩΩΩΩ un unico numero reale.

9E

1E

2E

8E

7E4E

6E5E

3E

1x

6x

4x

5x

2x3x

X

Ω

Page 3: Distribuzioni di Probabilita

Variabili casuali discrete e continue

• Una variabile casuale discreta può assumere un insieme discreto (finito o numerabile) di numeri reali.

• Una variabile casuale continua può assumere tutti i valori compresi in un intervallo reale.

ΩΩΩΩ discreto V.C. discreta

ΩΩΩΩ continuo V.C. discreta o continua

Page 4: Distribuzioni di Probabilita

Variabili casuali discrete

P(X=xi) Probabilità che la v.c. X assuma il valore xi

La funzione di probabilità di una variabile casuale discreta X associa ad ognuno dei valori xi la corrispondente probabilità P(X=xi)

Proprietà

0

1

=∑)x(P

)x(P

i

i i

Page 5: Distribuzioni di Probabilita

Esempio

Corrispondenza tra eventi e valori della variabile casuale X “somma dei punteggi”, nella prova “lancio di due dadi”

Page 6: Distribuzioni di Probabilita

Data una v.c discreta X, la funzione che fa corrispondere ai valori x le probabilità cumulate

viene detta funzione di ripartizione ed indicata con

Funzione di Ripartizione

( )xXP ≤

( ) ( ) ( )∑≤

==≤=xw

wXPxXPxF

Page 7: Distribuzioni di Probabilita

Esempio

X 2 3 4 5 6 7 8 9 10 11 12

P(x)

F(x) 136

136

236

336

436

536

636

536

436

336

236

1

361

363

366

3610

3615

3621

3626

3630

3633

3635

0

0,2

0,4

0,6

0,8

1

1 2 3 4 5 6 7 8 9 10 11 12 13 x

F(x)

Page 8: Distribuzioni di Probabilita

Funzione di Ripartizione: proprietà

( ) 0=−∞→

xFlimx

( ) 1=∞→

xFlimx

( ) ( )00

xFxFlimxx

=+→

• è non decrescente, ossia:

• è continua a destra, ossia

( ) ( )2121 xFxFxx ≤⇒<

• Inoltre

Page 9: Distribuzioni di Probabilita

Variabili casuali continue

Chiameremo Funzione di densità, la funzione matematica f(x) per cui l’area sottesa alla funzione, corrispondente ad un certo intervallo, è uguale alla probabilità che X assuma un valore in quell’intervallo.

Page 10: Distribuzioni di Probabilita

• f(x)≥≥≥≥0 sempre

• L’area totale sottesa alla funzione =1, ossia

Proprietà delle funzioni di densità

∫∞+

∞−= 1dx)x(f

• La probabilità che la v.c. assuma un particolare valore dell’intervallo è zero.

Page 11: Distribuzioni di Probabilita

Funzione di Ripartizione

Data una v.c. continua X, la funzione che fa corrispondere ai valori x le probabilità cumulate P(X≤≤≤≤ x) viene detta funzione di ripartizione.

∫∞−

=≤=x

dw)w(f)xX(P)x(F

Page 12: Distribuzioni di Probabilita

Variabili casuali continue

Esempio:

0,0

0,5

1,0

1,5

2,0

0,0 0,5 0,7 1,0

0,229

xf

X

[ ]

1)()(

229,0)(

1;0

)1(12)(

)(~

1

0

7,0

5,0

2

∫∫

==

=

∈−=

∞+

∞−

dxxfdxxf

dxxf

x

xxxf

xfX

P(0,5<X<0,7)

Page 13: Distribuzioni di Probabilita

Esempio

Funzioni di densità e corrispondenti funzioni di ripartizione

0,00

0,50

1,00

1,50

2,00

1,5 3,00,0

0,2

0,4

0,6

0,8

1,0

0,0 1,5 3,0 0,0

( )xF

( )xF

( )xf

( )xf

x

x x

x

Page 14: Distribuzioni di Probabilita

Valore atteso di una v.c.

Il valore medio di una v.c. X, è definito come

( ) ( )∑=i

ii xPxXE Se la v.c. è discreta

Se la v.c. è continua( ) ( )∫∞+

∞−= dxxfxXE

Page 15: Distribuzioni di Probabilita

Esempio: v.c. discreta

( )

7 361

12362

11363

10

364

9365

8366

7365

6364

5363

4362

3361

2

=+++

+++++++=XE

X 2 3 4 5 6 7 8 9 10 11 12

P(x)

F(x) 136

136

236

336

436

536

636

536

436

336

236

1

361

363

366

3610

3615

3621

3626

3630

3633

3635

Page 16: Distribuzioni di Probabilita

Esempio: v.c. continua

Consideriamo la v.c.

con lambda una costante positiva e (Esponenziale). Il valore atteso è dato da

0≥x

xe~X λ−λ

( )λ

=λ= ∫∞+

∞−

λ− 1dxexXE x

0,0 0,5 1,0 1,5 2,0 2,5 3,00,0

0,4

0,8

1,2

1,6

2,0

Page 17: Distribuzioni di Probabilita

La varianza di una v.c.

La varianza V(X) di una variabile casuale X è definita da

( ) ( )( ) ( )∑ −=i

ii xPXExXV 2Se la v.c. è discreta

Se la v.c. è continua( ) ( )( ) ( )∫∞+

∞−−= dxxfXExXV 2

Page 18: Distribuzioni di Probabilita

Varianza di una v.c.

Notazioni alternative:

( ) ( )[ ] 2 XEXEXV −=

( ) ( ) ( )[ ] 2 2 XEXEXV −=

( ) ( )XVXSD =

oppure, dopo alcuni passaggi

La deviazione standard è definita

Page 19: Distribuzioni di Probabilita

V.c. Standardizzate

I valori standardizzati esprimono la distanza tra ivalori osservati e la media in termini di deviazionestandard.

Se X è una v.c. con valore E(X) e SD(X) allora:

)X(SD)X(EX

Y−=

È una v.c. standardizzata con E(Y)=0 e V(Y)=1

Page 20: Distribuzioni di Probabilita

Teorema di Chebyshev

Sia X una variabile casuale e k un valore reale positivo, allora vale la seguente disuguaglianza:

( ) ( )( )2

1

kXSDkXEXP ≤⋅≥−

Indipendentemente dalla distribuzione della v.c. , la probabilità che X assuma valori distanti dalla media piùdi k deviazioni standard è al più 1/k2

Page 21: Distribuzioni di Probabilita

Distribuzioni di probabilità

• Sono una estensione delle distribuzioni di frequenza

• Il caso più semplice da trattare è relativo a distribuzioni di probabilità di variabili discrete– Variabili discrete:

• Fenomeni di conteggio• Esperimenti con modalità limitate

– Variabili continue:• Misurazioni• Esperimenti con modalità nel continuo

Page 22: Distribuzioni di Probabilita

Metodi di sintesi delle distribuzioni• In analogia con quanto detto circa le distribuzioni

di frequenze, anche per le distribuzioni di probabilità abbiamo la necessità di sintetizzare i dati

• In particolare ci interessa una sintesi di centralità– Valore atteso

• Ed una sintesi della variabilità– Varianza– Scarto quadratico medio– Coefficiente di variazione

Page 23: Distribuzioni di Probabilita

Modelli probabilistici• Per modello si intende una legge di probabilità

in grado di misurare l’incertezza circa ilfenomeno reale sotto studio

Fenomeno realeFenomeno reale:

Numero di figli per famiglia

Modello matematicoModello matematico:

Distribuzione di probabilità da associare al fenomeno di interesse

per analizzarloRisultati dal lancio di un dado

Page 24: Distribuzioni di Probabilita

• In funzione del fenomeno reale sotto studio, si cerca di associare un modello opportuno a descriverne la variabilità

• I modelli si dividono in:– Modelli discreti, alcuni dei quali sono:

• Modello uniforme discreto• Modello binomiale• Modello poisson

– Modelli continui• Modello normale• Modello esponenziale

Page 25: Distribuzioni di Probabilita

Modello uniforme (1)

• Si tratta della distribuzione più semplice• Consente di valutare la probabilità di un

fenomeno per il quale ognuno degli kpossibili risultati sia equamente probabile.

• Ad esempio, la probabilità che un numero sia estratto al lotto è descritta dal modello Uniforme, perché ciascuno dei 90 numeri ha una probabilità pari a 1/90 di essere estratto.

Page 26: Distribuzioni di Probabilita

Modello bernoulliano (1)• Questo particolare modello è adatto a descrive la probabilità

associata a variabili dicotomiche, cioè fenomeni che assumono soltanto uno tra due possibili valori: x = 1 (si verifica un certo evento di interesse E, ed x = 0 se non si verifica l’evento E).

• Esempio: (morto vs vivo, maschio vs femmina; presenza di un evento di interesse contrapposto a tutti gli altri)

)1()var()(

1)0()1(

ppXpXE

pXPpXP

−==

−====

Page 27: Distribuzioni di Probabilita

Distribuzione di Bernoulli

Una v.c. di Bernoulli può assumere il valore 1 con probabilità ππππ e il valore 0 con probabilità 1-ππππ

La sua funzione di probabilità può essere espressa come

( ) ( ) 10 1 1 ,per xxXP xx =π−π== −

Tutte le prove che producono solo due possibili risultati generano v.c. di Bernoulli: il lancio di una moneta, il sesso di un nascituro, il superamento o meno di un certo livello di inflazione….

Page 28: Distribuzioni di Probabilita

Modello Binomiale

• Il modello binomiale, descrive la probabilità il numero x di successi ottenuti in un campione di n prove (osservazioni):

)1()var()(

)1(

)1()!(!

!)|Pr(

pnpXnpXE

ppxn

ppxnx

npxX

xnx

xnx

−==

=

−−

==

Page 29: Distribuzioni di Probabilita

Modello Binomiale (2)• La formulazione Pr(X = x) indica che su n osservazioni si

sono verificati esattamente x successi e, di conseguenza, n – x insuccessi

• Poiché le prove sono indipendenti e la probabilità di successo è costante pari a p per ogni prova, osserveremo su n tentativi:– x con probabilità p– n – x con probabilità 1 – p

• Rimane da considerare il fatto che l’ordine in cui le prove sono osservate è variabile e noi siamo interessati solo al totale dei successi-insuccessi, non all’ordine

Page 30: Distribuzioni di Probabilita

Modello Binomiale (3)• Infatti, si potrebbero verificare:

– tutti i successi e poi tutti gli insuccessi– oppure un successo e un insuccesso in sequenza– oppure tutti gli insuccessi e poi tutti i successi …

• Per tenere conto di queste possibilità, le probabilità sono moltiplicate per il numero di possibili combinazioni di k

12...)1(!con )!(!

!×××−×=

−=

nnnxnx

nxn

Page 31: Distribuzioni di Probabilita

N=10 p=0.4

Page 32: Distribuzioni di Probabilita

Calcolo delle probabilità nel modellobinomiale

• Calcolare Pr(X = 3|n = 4, p = 0.1)

003609000104

901011231234

10110343

43X

13

343

...

..

).(.)!(!

!)Pr(

=××=

××××××××

=

−−

== −

Page 33: Distribuzioni di Probabilita

• Calcolare Pr(X ≥ 3) con n = 4 prove e p = 0.1

00370000100036010001019000104

901011234

1234901011231234

10110444

410110343

44X3X3X

0413

444343

......

....

).(.)!(!

!).(.)!(!

!)Pr()Pr(

=+=××+××=

××××××

×××+××

××××××

=

−−

+−−

=

=∪==≥

−−

Poiché le prove sono indipendenti per Hp

Perché 0! = 1 per definizione

Page 34: Distribuzioni di Probabilita

• Calcolare Pr(X < 3) con n = 4 prove e p = 0.1

∑=

==

=+=+===∪=∪==<

2

0i

iX

2X1X0X2X1X0X3X

)Pr(

)Pr()Pr()Pr()Pr()Pr(

6561010110040

40X 040 .).(.)!(!

!)Pr( =−−

== −

2916010110141

41X 141 .).(.)!(!

!)Pr( =−−

== −

0486010110242

42X 242 .).(.)!(!

!)Pr( =−−

== −

Page 35: Distribuzioni di Probabilita

N=4 p=0.1

Page 36: Distribuzioni di Probabilita

Esempi di Binomiale

0,000

0,050

0,100

0,150

0,200

0,250

0,300

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Binomiale(20;0,5)

Binomiale(7;0,5)

Page 37: Distribuzioni di Probabilita

Modello Poisson (1)

• Il modello Poisson si adatta a rappresentare esperimenti aleatori che danno luogo ad un numero discreto di eventi in un intervallo continuo (es. arrivi in un aeroporto in un’ora di tempo, )

• Le realizzazioni degli eventi devono avere le seguenti caratteristiche:– L’intervallo (di tempo o di spazio) è suddivisibile in n sotto-

intervalli all’interno dei quali la probabilità di manifestarsi di un evento è piccola e la probabilità di manifestarsi di più eventi tende a zero

– La probabilità di manifestarsi degli eventi nei sottointervalli è costante

– Eventi relativi a sotto intervalli differenti sono stocasticamente indipendenti (processo senza memoria)

Page 38: Distribuzioni di Probabilita

Modello Poisson (2)

• In termini matematici il modello è specificato come:

• Il parametro λ rappresenta il numero medio di eventi che si verificano nell’intervallo (numero atteso di successi)

Pr( | )!

xeX xx

λλλ−

= =

Page 39: Distribuzioni di Probabilita

Distribuzione di Poisson

Una v.c. di Poisson, è una v.c. discreta che può assumere qualsiasi valore intero non-negativo. La distribuzione di probabilità della Poisson è data da

K 2 1 0 ,,,xe!x

)x(Px

=λ= λ− ∞<λ<0

( ) λ=XE

( ) λ=XV

0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

Poisson(1)

Poisson(3)

Poisson(7)

Page 40: Distribuzioni di Probabilita

Modello Poisson (3)

• L’esperimento aleatorio di interesse è il “numero di arrivi di clienti presso una banca”

• Supponiamo che mediamente arrivino 3 clienti ogni minuto

• Ci interessa calcolare: – la probabilità che nello stesso intervallo arrivino

esattamente 2 clienti– la probabilità che nello stesso intervallo arrivino più

di 2 clienti

Page 41: Distribuzioni di Probabilita

Modello Poisson (4)

• Utilizzando la funzione della distribuzione Poisson, si ha che:

224012

718282923e2X

323

.)(

).(!

)Pr(

×===

−−

Page 42: Distribuzioni di Probabilita

Modello Poisson (5)

• Invece, per determinare

è più comodo notare che:

dove queste tre probabilità sono “semplici” da calcolare

∑∞

=

==>3i

iX2X )Pr()Pr(

)Pr()Pr()Pr()Pr()Pr(

2X1X0X2X12X

=+=+==≤−=>

Page 43: Distribuzioni di Probabilita

Modello Poisson (6)

049801

71828210

3e0X303

.

).(!

)Pr(

=

×===

−−

149401

718282313e1X

313

.

).(!

)Pr(

=

×===

−−

224012

718282923e2X

323

.)(

).(!

)Pr(

×===

−−

57702X .)Pr( =>

Page 44: Distribuzioni di Probabilita

Modello Poisson (7)• NB nel modello Poisson, il parametro λ

rappresenta anche la varianza oltre che il numero atteso di eventi

• Dunque, all’aumentare della media, aumenta anche la varianza della distribuzione

• Questo fa sì che nella pratica si possa ricorrere a formulazioni alternative del modello Poisson, che permettono di “modellare” in modo indipendente il termine di variabilità