Top Banner
Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha¨ a TU Delft 30 januari, 2015 Rik Lopuha¨ a (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 1 / 28
45

Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Aug 08, 2020

Download

Documents

dariahiddleston
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Het schatten van de Duitse oorlogsproductie:maximum likelihood versus de momentenmethode

Rik Lopuhaa

TU Delft

30 januari, 2015

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 1 / 28

Page 2: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Inleiding

Begin 1943: Economische Oorlogsafdeling van de Amerikaanse ambassade inLonden begint met het analyseren van merktekens en serienummers opbuitgemaakt Duits oorlogsmateriaal

Doel: beter inzicht te verkijgen in de Duitse oorlogsproductie (hoeveel,wanneer en waar) en oorlogsterkte

Eerst banden van trucks, auto’s en vliegtuigenLater tanks, trucks, kanonnen, raketten

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 2 / 28

Page 3: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Maandcodes

Jan Feb Mar Apr Mei Jun Jul Aug Sep Okt Nov Dec

Dunlop T I E B R A P O L N U DFulda F U L D A M U N S T E RPhoenix F O N I X H A M B U R GSempirit A B C D E F G H I J K L

De serienummers werden gedecodeerd en vertaald naar een steekproef van ngetallen uit 1, 2, . . . ,K

De onbekende K interpreteren we als het totaal aantal banden

Doel: schat K op basis van de n buitgemaakte serienummers.

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 3 / 28

Page 4: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Achtergrond Literatuur

Richard Ruggles and Henry Brodie,An Empirical Approach to Economic Intelligence in World War II,Journal of the American Statistical Association, Vol 42, nr 237 (March 1947),pp.72-91

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 4 / 28

Page 5: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Statistisch schattingsprobleem

Gegeven een vaas met ballen genummerd 1, 2, . . . ,K

K is onbekend

Trek willekeurig n ballen uit vaas

Schat K op basis van de nummers op de getrokken ballen

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 5 / 28

Page 6: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Schattingsmethode 1

Idee: het gemiddelde x van de getrokken nummers is ongeveer gelijk aan hetgemiddelde van de nummers in de vaas

Gemiddelde van de nummers in de vaas is

1 + 2 + · · ·+ K

K=

12K (K + 1)

K=

1

2(K + 1)

Kortom x ≈ K + 1

2zodat 2x − 1 ≈ K

Conclusie: schat het aantal ballen in de vaas door

2x − 1

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 6 / 28

Page 7: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Schattingsmethode 1

Idee: het gemiddelde x van de getrokken nummers is ongeveer gelijk aan hetgemiddelde van de nummers in de vaas

Gemiddelde van de nummers in de vaas is

1 + 2 + · · ·+ K

K=

12K (K + 1)

K=

1

2(K + 1)

Kortom x ≈ K + 1

2zodat 2x − 1 ≈ K

Conclusie: schat het aantal ballen in de vaas door

2x − 1

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 6 / 28

Page 8: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Schattingsmethode 1

Idee: het gemiddelde x van de getrokken nummers is ongeveer gelijk aan hetgemiddelde van de nummers in de vaas

Gemiddelde van de nummers in de vaas is

1 + 2 + · · ·+ K

K=

12K (K + 1)

K=

1

2(K + 1)

Kortom x ≈ K + 1

2zodat 2x − 1 ≈ K

Conclusie: schat het aantal ballen in de vaas door

2x − 1

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 6 / 28

Page 9: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Schattingsmethode 2

Idee: de n getrokken nummers liggen min of meer gelijkmatig verspreidtussen 0 and K + 1, zodat voor het grootste nummer m geldt:

m ≈ n

n + 1× (K + 1) zodat

n + 1

n×m − 1 ≈ N

Conclusie: schat het aantal ballen in de vaas door

n + 1

n×max−1

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 7 / 28

Page 10: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Intermezzo

Welke schatter is beter?

S1 = 2x − 1 of S2 =n + 1

nmax−1

A. Schatter S1 is beter

B. Schatter S2 is beter

C. Beide schatters zijn even goed

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 8 / 28

Page 11: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Intermezzo

Welke schatter is beter?

S1 = 2x − 1 of S2 =n + 1

nmax−1

A. Schatter S1 is beter

B. Schatter S2 is beter

C. Beide schatters zijn even goed

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 8 / 28

Page 12: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

MomentenmethodeStel dat stochastische variabele X eenkansverdeling heeft met onbekende parametersen dat we op grond van waargenomengegevens (steekproef) een schattingmoeten geven voor de onbekende parameters.

Momentenmethode (Karl Pearson, 1857 - 1936)

Druk de momenten van X (zoals E[X ], E[X 2], etc.) uit in de onbekendeparameters

Stel deze gelijk aan de corresponderende steekproefmomenten

(zoals 1n

∑xi ,

1n

∑x2i , etc.)

Los de onbekende parameter op uit de vergelijkingen

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 9 / 28

Page 13: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Momentenmethode voor het schatten van het aantal ballen

als X het nummer is op een willekeurig getrokken bal uit de volle vaas, danis X een stochastische variabele met verwachting (eerste moment van X)

E[X ] = 1× P(X = 1) + 2× P(X = 2) + · · ·+ K × P(X = K )

= 1× 1

K+ 2× 1

K+ · · ·+ K × 1

K

=1 + 2 + · · ·+ K

K=

1

2(K + 1)

Stel x gelijk aan E[X ] en los K op uit deze vergelijking

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 10 / 28

Page 14: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Momentenmethode voor het schatten van het aantal ballen

als X het nummer is op een willekeurig getrokken bal uit de volle vaas, danis X een stochastische variabele met verwachting (eerste moment van X)

E[X ] = 1× P(X = 1) + 2× P(X = 2) + · · ·+ K × P(X = K )

= 1× 1

K+ 2× 1

K+ · · ·+ K × 1

K

=1 + 2 + · · ·+ K

K=

1

2(K + 1)

Stel x gelijk aan E[X ] en los K op uit deze vergelijking

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 10 / 28

Page 15: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Maximum LikelihoodInleiding: kiezen uit 2 dobbelstenen

Twee dobbelstenen:

- D1 met 5 WIT en 1 ROOD- D2 met 1 WIT en 5 ROOD

Iemand kiest een van de twee dobbelsteen en doet drie keer hetzelfdeexperiment: gooien tot ROOD boven komt

Informatie:

- gekozen dobbelsteen onbekend- bekend zijn benodigde aantallen worpen in de drie experimenten

7, 4 en 10

VRAAG: Met welke dobbelsteen is er gegooid?

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 11 / 28

Page 16: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Maximum LikelihoodInleiding: kiezen uit 2 dobbelstenen

Twee dobbelstenen:

- D1 met 5 WIT en 1 ROOD- D2 met 1 WIT en 5 ROOD

Iemand kiest een van de twee dobbelsteen en doet drie keer hetzelfdeexperiment: gooien tot ROOD boven komt

Informatie:

- gekozen dobbelsteen onbekend- bekend zijn benodigde aantallen worpen in de drie experimenten

7, 4 en 10

VRAAG: Met welke dobbelsteen is er gegooid?

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 11 / 28

Page 17: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Kiezen uit 2 dobbelstenen

Kans op 7, 4 en 10 met dobbelsteen D1:(5

6

)61

6×(

5

6

)31

6×(

5

6

)91

6=

518

621= 0.0001738937.

Kans op 7, 4 en 10 met dobbelsteen D2:(1

6

)65

6×(

1

6

)35

6×(

1

6

)95

6=

53

621= 5.7× 10−15.

Kans op 7, 4, en 10 is 515 keer groter voor dobbelsteen D1!

De waargenomen data zijn het meest waarschijnlijk bij dobbelsteen D1

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 12 / 28

Page 18: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Maximum Likelihood

Stel dat we op grond van waargenomengegevens, kortweg data genoemd, een schattingmoeten geven voor een onbekende parameter.

Het principe van Maximum Likelihood (Ronald A. Fisher, 1890-1962)

Volgens het principe van maximum likelihood nemen we als schatting die waardevan de onbekende parameter waarvoor de kans op de data het grootst is.

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 13 / 28

Page 19: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Maximum Likelihood schatting voor het aantal ballen

Uit de vaas met nummers 1, 2, . . . ,K trekken we vijf ballen:

40, 28, 7, 44 en 18

Wat is maximum likelihood schatting voor K?

De kans op de data (Likelihood)

L(N) =

0 , voor K = 1, 2, . . . , 43;1

K (K − 1)(K − 2)(K − 3)(K − 4), voor K = 44, 45, . . . .

De kans op de data is maximaal voor K = 44

In het algemeen: de ML schatting is voor het aantal ballen het grootstenummer in de steekproef

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 14 / 28

Page 20: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Maximum Likelihood schatting voor het aantal ballen

Uit de vaas met nummers 1, 2, . . . ,K trekken we vijf ballen:

40, 28, 7, 44 en 18

Wat is maximum likelihood schatting voor K?

De kans op de data (Likelihood)

L(N) =

0 , voor K = 1, 2, . . . , 43;1

K (K − 1)(K − 2)(K − 3)(K − 4), voor K = 44, 45, . . . .

De kans op de data is maximaal voor K = 44

In het algemeen: de ML schatting is voor het aantal ballen het grootstenummer in de steekproef

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 14 / 28

Page 21: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Maximum Likelihood schatting voor het aantal ballen

Uit de vaas met nummers 1, 2, . . . ,K trekken we vijf ballen:

40, 28, 7, 44 en 18

Wat is maximum likelihood schatting voor K?

De kans op de data (Likelihood)

L(N) =

0 , voor K = 1, 2, . . . , 43;1

K (K − 1)(K − 2)(K − 3)(K − 4), voor K = 44, 45, . . . .

De kans op de data is maximaal voor K = 44

In het algemeen: de ML schatting is voor het aantal ballen het grootstenummer in de steekproef

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 14 / 28

Page 22: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Zuiverheidscorrectie van de ML schatter

Als M het grootste nummer is van een steekproef zonder teruglegging uit denummers 1, 2, . . . ,K , dan is de verwachtingswaarde

E[M] = n × P(M = n) + · · ·+ K × P(M = K )

=K∑j=n

j ×(j−1n−1

)(Kn

) = · · · =n

n + 1(K + 1)

Kies constanten a and b (onafhankelijk van K ) zodat aM + b een zuivereschatter is voor K , d.w.z.

E[aM + b] = K .

Dit levert

a =n + 1

nen b = −1

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 15 / 28

Page 23: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Zuiverheidscorrectie van de ML schatter

Als M het grootste nummer is van een steekproef zonder teruglegging uit denummers 1, 2, . . . ,K , dan is de verwachtingswaarde

E[M] = n × P(M = n) + · · ·+ K × P(M = K )

=K∑j=n

j ×(j−1n−1

)(Kn

) = · · · =n

n + 1(K + 1)

Kies constanten a and b (onafhankelijk van K ) zodat aM + b een zuivereschatter is voor K , d.w.z.

E[aM + b] = K .

Dit levert

a =n + 1

nen b = −1

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 15 / 28

Page 24: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Twee schattingsmethoden

Schatten van het aantal ballen in een vaas met nummers 1, 2, . . . ,K :

Momentenmethode-schatting:

s1 = 2x − 1

Aangepaste maximum likelihood-schatting:

s2 =n + 1

nmax−1

Welke is nu beter?

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 16 / 28

Page 25: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Intermezzo

Welke schatter is nu beter?

S1 = 2x − 1 of S2 =n + 1

nmax−1

A. Schatter S1 is beter, want de momentenmethode gebruikt alle gegevens

B. Schatter S2 is beter, want maximum likelihood is een beter principe

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 17 / 28

Page 26: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Intermezzo

Welke schatter is nu beter?

S1 = 2x − 1 of S2 =n + 1

nmax−1

A. Schatter S1 is beter, want de momentenmethode gebruikt alle gegevens

B. Schatter S2 is beter, want maximum likelihood is een beter principe

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 17 / 28

Page 27: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Simulatie

We kiezen K = 1000 en n = 10 en voer uit op de computer

Stap 1 Trek 10 getallen zonder teruglegging uit {1, 2, . . . , 1000}Stap 2 Bereken

s1 = 2x − 1

s2 =n + 1

nmax−1

Stap 3 Herhaal 5000 keer stappen 1 en 2.

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 18 / 28

Page 28: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Intermezzo

Welke schatter is nu beter?

S1 = 2x − 1 of S2 =n + 1

nmax−1

A. Schatter S1 is beter, want zijn kansverdeling is beter gespreid rond K = 1000

B. Schatter S2 is beter, want zijn kansverdeling is scheef richting K = 1000

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 19 / 28

Page 29: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Intermezzo

Welke schatter is nu beter?

S1 = 2x − 1 of S2 =n + 1

nmax−1

A. Schatter S1 is beter, want zijn kansverdeling is beter gespreid rond K = 1000

B. Schatter S2 is beter, want zijn kansverdeling is scheef richting K = 1000

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 19 / 28

Page 30: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Nog wat theorie

Beide schatters zijn zuiver:

E[S1] = E[2X − 1] = K

E[S2] = E[n + 1

nmax−1

]= K

Schatter S1 heeft een grotere variantie dan schatter S2:

V(S1)

V(S2)=

n + 2

3

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 20 / 28

Page 31: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Tabel: Gemiddelde maandelijkse productie banden in 1943.

Type band schatting werkelijk

Truck en auto 147 000 159 000Vliegtuig 28 500 26 400

——— ———Totaal 175 500 186 100

geheime dienst

900 000 – 1 200 000

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 21 / 28

Page 32: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Tabel: Gemiddelde maandelijkse productie banden in 1943.

Type band schatting werkelijk

Truck en auto 147 000 159 000Vliegtuig 28 500 26 400

——— ———Totaal 175 500 186 100

geheime dienst

900 000 – 1 200 000

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 21 / 28

Page 33: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Tabel: Productie van trucks in 1942.

Type truck schatting werkelijk

Lichte truck 16 500 14 436Medium truck 62 300 53 439Zware truck 18 500 11 952

——— ———Totaal 97 300 79 827

geheime dienst

200 000

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 22 / 28

Page 34: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Tabel: Productie van trucks in 1942.

Type truck schatting werkelijk

Lichte truck 16 500 14 436Medium truck 62 300 53 439Zware truck 18 500 11 952

——— ———Totaal 97 300 79 827

geheime dienst

200 000

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 22 / 28

Page 35: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Tabel: Gemiddelde maandelijkse productie van tanks in 1940-1942.

Datum schatting werkelijk

Juni 1940 169 122Juni 1941 244 271Augustus 1942 327 342

geheime dienst

100015501550

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 23 / 28

Page 36: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Tabel: Gemiddelde maandelijkse productie van tanks in 1940-1942.

Datum schatting werkelijk

Juni 1940 169 122Juni 1941 244 271Augustus 1942 327 342

geheime dienst

100015501550

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 23 / 28

Page 37: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Schatten van de kans op zwangerschap

Beschouw aantal cycli tot en met zwangerschap

Als p is kans op zwangerschap tijdens een cyclus, dan is

P(zwangerschap in k-de cyclus) = (1− p)k−1p, voor k = 1, 2, . . .

Schat p, apart voor rokers en niet-rokers, aan de hand van de data

Aantal cycli 1 2 3 4 5 6 7 8 9 10 11 12 >12

Rokers 29 16 17 4 3 9 4 5 1 1 1 3 7

Niet-rokers 198 107 55 38 18 22 7 9 5 3 6 6 12

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 24 / 28

Page 38: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Schatten van de kans op zwangerschap

Beschouw aantal cycli tot en met zwangerschap

Als p is kans op zwangerschap tijdens een cyclus, dan is

P(zwangerschap in k-de cyclus) = (1− p)k−1p, voor k = 1, 2, . . .

Schat p, apart voor rokers en niet-rokers, aan de hand van de data

Aantal cycli 1 2 3 4 5 6 7 8 9 10 11 12 >12

Rokers 29 16 17 4 3 9 4 5 1 1 1 3 7

Niet-rokers 198 107 55 38 18 22 7 9 5 3 6 6 12

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 24 / 28

Page 39: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Maximum Likelihood schatting voor kans op zwangerschap

Merk opP(zwangerschap na de 12-de cyclus) = (1− p)12.

Dan geldt

Gebeurtenis Kans

29 keer zwangerschap in cyclus 1 p29

16 keer zwangerschap in cyclus 2{(1− p)p

}16

17 keer zwangerschap in cyclus 3{(1− p)2p

}17

......

7 keer zwangerschap na cyclus 12{(1− p)12

}7

Zodat de likelihood (de kans op de data) wordt gegeven door

L(p) = C × p29 ×{(1− p)p

}16 ×{(1− p)2p

}17 × · · · ×{(1− p)12

}7

= C × p93 × (1− p)322.

Oplossen van L′(p) = 0 geeft maximum likelihood schatting p = 0.224.

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 25 / 28

Page 40: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Maximum Likelihood schatting voor kans op zwangerschap

Merk opP(zwangerschap na de 12-de cyclus) = (1− p)12.

Dan geldt

Gebeurtenis Kans

29 keer zwangerschap in cyclus 1 p29

16 keer zwangerschap in cyclus 2{(1− p)p

}16

17 keer zwangerschap in cyclus 3{(1− p)2p

}17

......

7 keer zwangerschap na cyclus 12{(1− p)12

}7

Zodat de likelihood (de kans op de data) wordt gegeven door

L(p) = C × p29 ×{(1− p)p

}16 ×{(1− p)2p

}17 × · · · ×{(1− p)12

}7

= C × p93 × (1− p)322.

Oplossen van L′(p) = 0 geeft maximum likelihood schatting p = 0.224.

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 25 / 28

Page 41: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Maximum Likelihood schatting voor kans op zwangerschap

Merk opP(zwangerschap na de 12-de cyclus) = (1− p)12.

Dan geldt

Gebeurtenis Kans

29 keer zwangerschap in cyclus 1 p29

16 keer zwangerschap in cyclus 2{(1− p)p

}16

17 keer zwangerschap in cyclus 3{(1− p)2p

}17

......

7 keer zwangerschap na cyclus 12{(1− p)12

}7

Zodat de likelihood (de kans op de data) wordt gegeven door

L(p) = C × p29 ×{(1− p)p

}16 ×{(1− p)2p

}17 × · · · ×{(1− p)12

}7

= C × p93 × (1− p)322.

Oplossen van L′(p) = 0 geeft maximum likelihood schatting p = 0.224.

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 25 / 28

Page 42: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Maximum Likelihood schatting voor kans op zwangerschap

Merk opP(zwangerschap na de 12-de cyclus) = (1− p)12.

Dan geldt

Gebeurtenis Kans

29 keer zwangerschap in cyclus 1 p29

16 keer zwangerschap in cyclus 2{(1− p)p

}16

17 keer zwangerschap in cyclus 3{(1− p)2p

}17

......

7 keer zwangerschap na cyclus 12{(1− p)12

}7

Zodat de likelihood (de kans op de data) wordt gegeven door

L(p) = C × p29 ×{(1− p)p

}16 ×{(1− p)2p

}17 × · · · ×{(1− p)12

}7

= C × p93 × (1− p)322.

Oplossen van L′(p) = 0 geeft maximum likelihood schatting p = 0.224.

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 25 / 28

Page 43: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Maximum Likelihood schatter voor dalende kansdichtheid

Men observeert x1, x2, . . . , xn ∈ [0,∞)

Realisaties van onafhankelijke stochasten met dalende kansdichtheid f .

De (niet-parametrische) maximum likelihood schater voor f is de functie fndie de likelihood

L(f ) =n∏

i=1

f (xi )

maximaliseert over alle dalende kansdichtheden f op [0,∞).

Grenander (1956):

fn is de linker-afgeleide van de kleinste concave majorant van de empirischeverdelingsfunctie

Fn(t) =aantal xi ≤ t

n

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 26 / 28

Page 44: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

0 1 2 3 4 5

0.0

0.2

0.4

0.6

0.8

1.0

↖empirical cdf Fn

....................................................

.......

.......

..........

.......

.......

...........................................................................................................................................................................................................

.......

.......

........................................................................................................................................................................................

.......

.......

................................................................................................................................................................................................................

LCM Fn ↘

.......................................................................................................................................................................................................................................................................................................................................

..............................................

..............................................

..............................................................................................................................................................

0 1 2 3 4 5

0.0

0.2

0.4

0.6

0.8

1.0

1.2

↙ Grenander estimator fn

.................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

1

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 27 / 28

Page 45: Het schatten van de Duitse oorlogsproductie: maximum ...Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuha a TU Delft 30 januari,

Hartelijke dank vooruw aandacht

Rik Lopuhaa (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari, 2015 28 / 28