Top Banner
Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr orsaal: Aula am Aasee Prof. Dr. Bernd Wilfling Westf¨ alische Wilhelms-Universit¨ atM¨unster
365

Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

May 16, 2019

Download

Documents

vannhan
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Folien zur Vorlesung

Statistik I(Deskriptive Statistik)

Wintersemester 2010/2011Donnerstag, 10.00 - 11.30 Uhr

Horsaal: Aula am Aasee

Prof. Dr. Bernd Wilfling

Westfalische Wilhelms-Universitat Munster

Page 2: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Inhalt

1 Einleitung1.1 Was ist Statistik und warum ist Statistik wichtig?1.2 Beispiele fur statistische Fragestellungen in der Okonomik1.3 Deskriptive und schließende Statistik

2 Mathematische Grundlagen

2.1 Endliche Summen und Produkte2.2 Exponentialfunktion und Logarithmus

3 Merkmale und Daten3.1 Grundgesamtheiten3.2 Merkmale

3.3 Daten und ihre Erhebung3.4 Amtliche und nichtamtliche Statistik

4 Auswertung eindimensionaler Daten4.1 Beliebig skalierte Daten

4.2 Mindestens ordinal skalierte Daten4.3 Metrisch skalierte Daten4.3.1 Lagemessung4.3.2 Weitere Mittelwerte

4.3.3 Streuungsmaße4.3.4 Additionssatze fur arithmetische Mittel und Varianzen

4.3.5 Stetig klassierte Daten4.3.6 Schiefemessung

5 Verhaltniszahlen, Messzahlen und Indexzahlen

5.1 Verhaltniszahlen5.2 Messzahlen des zeitlichen Vergleichs5.2.1 Umbasierung und Verkettung von Messzahlen

5.2.2 Zuwachsraten und Zuwachsfaktoren5.2.3 Logarithmische Zuwachsraten

5.3 Indexzahlen5.3.1 Preisindizes

5.3.2 Mengenindizes

i

Page 3: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

5.3.3 Wertindizes5.3.4 Umbasierung und Verkettung von Indizes

5.3.5 Formale Indexkriterien (Fisher-Proben)

6 Auswertung mehrdimensionaler Daten6.1 Grundbegriffe6.1.1 Kontingenztafel und Haufigkeiten

6.1.2 Bedingte Verteilungen

6.1.3 Deskriptive Unabhangigkeit

6.1.4 Arithmetische Mittel und Varianzen6.2 Zusammenhangsmaße6.2.1 Metrische Daten: Korrelationskoeffizient6.2.2 Ordinale Daten: Rangkorrelationskoeffizient6.2.3 Nominale Daten: Kontingenzkoeffizient

6.3 Deskriptive Regression6.3.1 Regression 1. Art6.3.2 Regression 2. Art: Die lineare Einfachregression

6.4 Lineare Mehrfachregression

7 Konzentrations- und Disparitatsmessung

7.1 Disparitat und Konzentration

7.2 Konzentrationsmessung7.2.1 Konzentrationsraten und Konzentrationskurve

7.2.2 Konzentrationsindizes7.3 Disparitatsmessung

7.3.1 Lorenzkurve7.3.2 Der Gini-Koeffizient

ii

Page 4: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Literatur

EViews:

EViews 7 User Guide (2009). Estimation, Forecasting, Statistical Analysis, Graphs, Data

Management, Simulation. QMS Quantitative Micro Software, Irvine, California.

Statistik:

Hartung, J. (2005). Statistik – Lehr- und Handbuch der angewandten Statistik (14. Aufla-

ge). Oldenbourg Verlag, Munchen.

Mosler, K. und F. Schmid (2009). Beschreibende Statistik und Wirtschaftsstatistik (4. Auf-

lage). Springer Verlag, Heidelberg.

iii

Page 5: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

1. Einleitung

Ziel der Vorlesung:

• Einfuhrung in deskriptive Statistik + Wirtschaftsstatistik

Internet-Seite der Vorlesung:

• http://www1.wiwi.uni-muenster.de/oeew/

−→ Studium −→ Veranstaltungen im Wintersemester 2010/2011

−→ Bachelor −→ Statistik I

1

Page 6: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Vorlesungsstil:

• Freier Vortrag anhand von Projektor-Folien

• Folien stehen als PDF-Dateien auf Internetseite zur Verfugung(Beschaffung der Folien wird unbedingt empfohlen)

Literatur:

• K. Mosler und F. Schmid (2009). Beschreibende Statistikund Wirtschaftsstatistik (4. Auflage), Springer-Verlag

• Formelsammlung ”Definitionen, Formeln und Tabellen zurStatistik” (6. Auflage) von Bomsdorf/Grohn/Mosler/Schmid(notwendiges Hilfsmittel, in der Klausur zugelassen)

2

Page 7: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Klausurvorbereitung:

• Stoff der Vorlesung

• Aufgaben des Tutoriums

Ansprechpartner: Herr Sascha Leweling

• Klausurtraining durch Ferienarbeitsgruppen

3

Page 8: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Zugelassene Hilfsmittel in der Klausur:

• Taschenrechner (nicht programmierbar)

• Formelsammlung ”Definitionen, Formeln und Tabellen zurStatistik” von Bomsdorf/Grohn/Mosler/Schmid, 6. (aktuelleund fruhere) Auflage(n)Akzeptierte außere Form fur die Klausur:

– Zulassig sind nur Unter- bzw. Uberstreichungen, Verweiseauf Seiten bzw. Nummern

– Nicht zulassig sind somit z.B. verbale Erlauterungen, math-ematische Umformungen, grafische Darstellungenu.a., die als Losungshilfen fur Klausuraufgaben angese-hen werden konnen

4

Page 9: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Ansprechpartner:

• Herr Sascha Leweling(Koordinator der Tutorien)

• Tutorinnen und Tutoren(Adressen und Nummern: siehe Tutorien)

5

Page 10: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

1.1 Was ist Statistik und warum ist Statistik wichtig?

Typischer Lexikon-Eintrag fur den Begriff ’Statistik’:

• Methode zur Untersuchung von Massenerscheinungen

• Versuch, den Umfang, die Gliederung oder Struktur einerMasse, die zeitliche Entwicklung einer oder das Verhaltnismehrerer Massenerscheinungen zueinander zu erkennen

• Aufgabe der Statistik besteht in der Darstellung, Analyse undDeutung von Daten

6

Page 11: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Anwendungsbereiche fur statistische Methoden:

• heutzutage in allen Wissenschaftsbereichen, z.B. in

der Biologie / Medizin (Biometrie)

den Ingenieurswissenschaften (Technometrie)

den Verhaltenswissenschaften (Psychometrie)

Besonders wichtig fur WiWis:

• Empirische Wirtschaftsforschung

• Okonometrie

7

Page 12: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Ziele der Statistik: [I]

• Aufdeckung von Zusammenhangen, z.B.

Zusammenhang Arbeitslosigkeit ←→ InflationZusammenhang Arbeitslosigkeit ←→ WachstumAuswirkungen von Geldpolitik auf wirtschaftliche Aktivitat

• Uberwachung okonomischer Aktivitat, z.B.

ArbeitslosenquoteWachstumsraten (BIP, Konsum)Aktienkurse, Wechselkurse, Zinssatze, Rohstoff- und Im-mobilienpreise

8

Page 13: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Ziele der Statistik: [II]

• Uberprufung von WiWi-Theorien anhand von Daten, z.B.

Zusammenhang zwischen verfugbarem Einkommen undKonsumausgaben

Einfluss demokratischer Strukturen auf wirtschaftliche Ak-tivitat

Bedeutung des Wahrungssystems fur den wirtschaftlichenErfolg

9

Page 14: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

1.2 Beispiele fur statistische Fragestellungen inder Okonomik

(a) Preis eines Gutes:

• Preis einer Feinunze Gold auf verschiedenen Markten

Kurse (in US-$) vom 11.10.2010

Marktplatz KursFrankfurt 1348.30

Luxemburg 1347.95London 1348.65Zurich 1348.38Paris 1347.89

10

Page 15: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Aufgaben der Statistik:

• Charakterisierung der Datenreihe durch Kennzahlen

• Grafische Darstellung der Daten

• Eventuell Bereinigung der Daten (Ausreißer etc.)

11

Page 16: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

(b) Kursverlaufe von Aktien, Wahrungen, Immobilien:

• Wechselkurs der griechischen Drachme zum Euro

Aufgabe der Statistik:

• Messung der unterschiedlichen Schwankungen

12

94

96

98

100

102

15/12/98 3/07/99 19/01/00 6/08/00

Greek Drachme (GRD / EURO)ERM parity (100): 340.75

24/09/200025/09/2000

-1.5

-1.0

-0.5

0.0

0.5

1.0

15/12/98 3/07/99 19/01/00 6/08/00

Greek Drachme (daily changes in %)24/09/200025/09/2000

Page 17: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

(c) Anstieg des ’allgemeinen Preisniveaus’

Wichtige Frage fur die Wirtschaftspolitik:

• Um wieviel Prozent ist das Preisniveau in der BRD im MonatOktober 2010 gegenuber dem Vorjahresmonat gestiegen?

Aufgaben der Statistik:

• Welche Preise sind gemeint?

• Bestimmung eines geeigneten Preisindexes

13

Page 18: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

(d) Entwicklung der Arbeitslosigkeit

Wichtige Frage fur die Wirtschaftspolitik:

• Ist die Arbeitslosenquote innerhalb des letzten Monats ge-sunken?

Aufgaben der Statistik:

• Beschaftigungssituation ist jahreszeitlichen Fluktuationenausgesetzt

• Bestimmung der ’Saisonfigur’

• Bereinigung der AL-Quote um die ’Saisonfigur’

14

Page 19: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

1.3 Deskriptive und schließende Statistik

Unterteilung der Statistik in 2 Saulen:

• Deskriptive Statistik (Statistik I)(Wie bringe ich die Daten zum Sprechen?)

• Wahrscheinlichkeitsrechnung und induktive Statistik(Was konnen mir die Daten wirklich sagen?)

Weitere gebrauchliche Ausdrucke fur ’induktive Statistik’:

• schließende Statistik

• statistische Inferenz

15

Page 20: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Ziele der induktiven Statistik:

• Datenanalyse auf der Basis von Wahrscheinlichkeitsmodellen

• Verifikation theoretischer Modelle anhand von Daten

Methoden der induktiven Statistik:

• Schatzen von unbekannten Parametern

• Testen von Hypothesen uber unbekannte Parameter

16

Page 21: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiel:

• Die Wirkung von Werbemaßnahmen auf den Absatz von Un-ternehmen

Stichprobe:

• 84 Unternehmen eines bestimmten Sektors in den USA imJahre 1990

17

Page 22: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Stichprobenergebnisse der 84 Unternehmen

18

480

500

520

540

560

0 20 40 60 80 100

Werbeausgaben in Mill. US-$

Abs

atz

in M

ill. U

S-$

Schätzung: Absatz = 502.92 + 0.218 * Werbeausgaben

Page 23: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Offensichtlich:

• ’Hohere Werbeausgaben’ bewirken ’hohere Absatze’(moglicherweise auch umgekehrte Beziehung)

• Zusammenhang ist nicht exakt(vgl. eingezeichnete Regressionslinie)

Theoretisches Modell:

Y = β0 + β1 ·X + Fehler

mit

• Y = Absatz, X = Ausgaben fur Werbung

• β0, β1 unbekannte Parameter

19

Page 24: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Aufgaben der induktiven Statistik:

• ’Gute’ Schatzungen fur die Parameter β0 und β1

• Testen der Hypothese β1 = 0 gegen β1 6= 0(Variable X hat keinerlei Einfluss auf Y

gegen

X hat einen signifikanten Einfluss auf Y )

20

Page 25: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

2. Mathematische Grundlagen

Erforderliche mathematische Hilfsmittel:

• Summen und Produkte

• Exponential- und Logarithmusfunktionen

21

Page 26: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

2.1 Endliche Summen und Produkte

Betrachte n reelle Zahlen a1, a2, . . . , an ∈ R. Die Summe derZahlen notiert man wie folgt:

a1 + a2 + . . . + an =n

i=1ai =

i∈Iai

Bezeichnungen:

• i heißt Summationsindex

• I = {1, . . . , n} heißt Indexmenge

22

Page 27: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bemerkungen:

• Die Indexmenge I darf eine beliebige Menge ganzer Zahlensein (I ⊂ Z), z.B. I = {−4,−3,−2,−1,0,1,2,3}. Fur dieSumme gilt dann:

i∈Iai =

3∑

i=−4ai = a−4 + a−3 + a−2 + a−1 + a0 + a1 + a2 + a3

• Die Indexmenge I kann auch leer sein, d.h. I = {}. Fur dieSumme definiert man dann

i∈Iai = 0.

23

Page 28: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Fragen:

• Warum ist das Summenzeichen wichtig?

• Wie kann man formal mit Summen rechnen?

Antworten:

• Das Summenzeichen vereinfacht die Schreibweise in der ge-samten Statistik

• Es gibt Rechenregeln fur Summen, die allesamt formal be-wiesen werden mussen(Aufgabe der Mathematik)

24

Page 29: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Rechenregeln fur endliche Summen: [I]

Dazu seien a1, . . . , an sowie b1, . . . , bn reelle Zahlen

• Mit den beliebigen reellen Zahlen α, β gilt:n

i=1(α · ai + β · bi) =

n∑

i=1α · ai +

n∑

i=1β · bi

= α ·n

i=1ai + β ·

n∑

i=1bi

• Falls a1 = a2 = . . . = an ≡ a, so folgt:n

i=1ai =

n∑

i=1a = n · a

25

Page 30: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Rechenregeln fur endliche Summen: [II]

• Fur jedes (ganzzahlige) m mit 0 ≤ m ≤ n gilt:

n∑

i=1ai =

m∑

i=1ai +

n∑

i=m+1ai

• Fur jedes ganzzahlige m gilt:

n∑

i=1ai =

n+m∑

i=1+mai−m

26

Page 31: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Spezielle endliche Summen: [I]

•n

i=1i = 1 + . . . + n =

n · (n + 1)2

•n

i=1i2 =

n · (n + 1) · (2n + 1)6

•n

i=1i3 =

n2 · (n + 1)2

4

27

Page 32: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Spezielle endliche Summen: [II]

• Es seien a1, b ∈ R, ai = a1 + (i − 1) · b fur i = 2, . . . , n. Dannheißt a1, a2, . . . , an endliche arithmetische Folge 1. Ordnungund es gilt:

n∑

i=1ai =

n2· (2a1 + (n− 1) · b)

• Es seien a1, q ∈ R, ai = a1 · qi−1 fur i = 2, . . . , n. Dann heißta1, a2, . . . , an endliche geometrische Folge und es gilt fur q 6=1:

n∑

i=1ai = a1 ·

qn − 1q − 1

28

Page 33: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Doppelsummen: [I]

• Es sei

a11 a12 · · · a1ma21 a22 · · · a2m... ... . . . ...

an1 an2 · · · anm

eine Matrix (Tabelle) reeller Zahlen

29

Page 34: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Doppelsummen: [II]

• Die Summe uber alle diese Zahlen notiert man als Doppel-summe:

n∑

i=1

m∑

j=1aij = a11 + a12 + . . . + a1m

+ a21 + a22 + . . . + a2m...

+ an1 + an2 + . . . + anm

• Es gilt:n

i=1

m∑

j=1aij =

m∑

j=1

n∑

i=1aij

30

Page 35: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Weiteres Beispiel fur eine Doppelsumme:

n∑

i=1

n∑

j=iaij = a11 + . . . + . . . + . . . + a1n

+ a22 + . . . + . . . + a2n

+ a33 + . . . + a3n

...

+ ann

(Der Laufbereich des 2. Index hangt vom 1. Index ab)

31

Page 36: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Endliche Produkte

Betrachte n reelle Zahlen a1, a2, . . . , an ∈ R. Mit der IndexmengeI = {1,2, . . . , n} notiert man das Produkt der Zahlen wie folgt:

a1 · a2 · . . . · an =n∏

i=1ai =

i∈Iai

Bemerkung:

• Die Indexmenge I kann wiederum leer sein, d.h. I = {}. Furdas Produkt definiert man dann

i∈I ai = 1

32

Page 37: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Rechenregeln fur endliche Produkte:

Es seien a1, . . . , an sowie b1, . . . , bn reelle Zahlen

• Mit den beliebigen reellen Zahlen α, β gilt:

n∏

i=1α · ai · β · bi = αn · βn ·

n∏

i=1ai ·

n∏

i=1bi

• Falls a1 = a2 = . . . = an ≡ a, so folgt:

n∏

i=1ai =

n∏

i=1a = an

33

Page 38: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

2.2 Exponentialfunktion und Logarithmus

Zwei wichtige mathematische Funktionen:

• Naturliche Exponentialfunktion

• Naturlicher Logarithmus

Hier:

• Mathematische Definition und Eigenschaften

34

Page 39: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Anwendung in der gesamten Wirtschaftstheorie, z.B.

• in der Wachstumstheorie (VWL)

• in Mikro- und Makromodellen (VWL)

• im gesamten Finance-Bereich (BWL)

• im Operations-Research (BWL)

• in der Statistik / Okonometrie

35

Page 40: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Definition der Exponentialfunktion: [I]

• Betrachte die unendliche Reihe∞∑

k=0

xk

k!= 1 + x +

x2

2+

x3

6+

x4

24+ · · ·

(k! bezeichnet das Produkt der ersten k ganzen Zahlen, alsok! = 1 · 2 · . . . · k)

• Man kann zeigen, dass die Summe fur jedes x ∈ R gegen eineendliche Zahl konvergiert

36

Page 41: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Definition der Exponentialfunktion: [II]

• Fur jedes x ∈ R definiert man

exp(x) =∞∑

k=0

xk

k!

• Die Funktion exp : R → R heißt naturliche Exponentialfunk-tion

37

Page 42: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Graph der naturlichen Exponentialfunktion

38

0

5

10

15

20

25

-2 -1 0 1 2 3

x

exp(

x)

Page 43: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Eigenschaften der Exponentialfunktion: [I]

• Es gilt:

exp(0) = 1exp(1) = e ≈ 2.71828 (Eulersche Zahl)

• Fur alle x ∈ R gilt:

exp(x) > 0

• Fur alle x ∈ R gilt:

exp′(x) ≡d exp(x)

d x= exp(x)

(Ableitung ist gleich der Funktion selbst)

39

Page 44: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Eigenschaften der Exponentialfunktion: [II]

• Die Funktion exp ist streng monoton wachsend

• Fur beliebige x, y ∈ R gilt die Beziehung:

exp(x + y) = exp(x) · exp(y)

(Funktionalgleichung)

• Fur alle x ∈ R gilt

exp(x) = limn→∞

(

1 +xn

)n

(Aquivalente Darstellung zur Summendefinition)

40

Page 45: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Jetzt:

• Die exp-Funktion besitzt eine eindeutig bestimmte Umkehrfunk-tion

• Diese Umkehrfunktion ist definiert auf (0,∞)

Definition des naturlichen Logarithmus

Die Umkehrfunktion der naturlichen Exponentialfunktion

exp : R→ (0,∞)

heißt naturlicher Logarithmus und wird bezeichnet mit

ln : (0,∞) → R

41

Page 46: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Graph des naturlichen Logarithmus

42

-6

-4

-2

0

2

4

0 2 4 6 8 10

x

ln(x

)

Page 47: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Eigenschaften des naturlichen Logarithmus:

• Die Funktion ln ist streng monoton wachsend

• Fur x > 0 gilt:

ln′(x) =d ln(x)

d x=

1x

• Fur beliebige x, y > 0 gilt die Beziehung

ln(x · y) = ln(x) + ln(y)

(Funktionalgleichung)

43

Page 48: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Weitere Definitionen und Eigenschaften: [I]

• Die allgemeine Potenz ist fur alle x > 0, y ∈ R definiert durch

xy = exp(y · ln(x))

Insbesondere ist fur x ∈ R

ex = exp(x)

• Es sei a > 0 und a 6= 1. Der allgemeine Logarithmus vonx > 0 zur Basis a ist definiert durch

y = loga(x) ⇐⇒ x = ay

44

Page 49: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Weitere Definitionen und Eigenschaften: [II]

• Es gelten die folgenden Beziehungen:

ln(x) = loge(x)

ln(x) = loga(x) · ln(a)

loga(x) =ln(x)ln(a)

• Es sei f : R → (0,∞) eine differenzierbare Funktion. Furjedes x ∈ R heißt die Ableitung

(ln(f(x))′ =d ln(f(x))

d x=

f ′(x)f(x)

die logarithmische Ableitung von f an der Stelle x(auch: stetige Wachstumsrate)

45

Page 50: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

3. Merkmale und Daten

Ziel dieses Kapitels:

• Vermittlung des statistischen Grundvokabulars

Zu klarende Begriffe:

• Grundgesamtheit

• Merkmale (Skalenniveau etc.)

• Stichprobe

46

Page 51: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

3.1 Grundgesamtheiten

Definition 3.1: (Grundgesamtheit, Merkmalstrager)

Die Grundgesamtheit ist die Gesamtheit aller Einheiten, die statis-tisch untersucht werden sollen. Die Grundgesamtheit ist eineMenge und wird mit G bezeichnet. Ihre Elemente heißen Unter-suchungseinheiten oder Merkmalstrager. Wir schreiben

G = {e1, e2, . . . , en}.

Die Anzahl n der Elemente von G bezeichnet den Umfang derGrundgesamtheit. Wir notieren die Anzahl der Elemente von Gmit |G| = n.

47

Page 52: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Weitere Begriffe:

• Bestandsmasse:GG, die durch einen Zeitpunkt abgegrenzt wird

• Bewegungsmasse:GG, die durch einen Zeitraum abgegrenzt wird

Beispiele fur Bestandsmassen:

• Lagerbestand eines Unternehmens am 31.12.2010

• Handwerksbetriebe im Munsterland am 01.01.2010

48

Page 53: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiele fur Bewegungsmassen:

• Neugegrundete Betriebe in Munster im Jahr 2010

• Studierende an der Uni Munster im WS 2010/2011

Offensichtlich:

• Bestands- und Bewegungsmassen hangen zusammen, undzwar uber die sogenannte Bestandsveranderung

49

Page 54: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

3.2 Merkmale

Definition 3.2: (Merkmal, Merkmalsauspragung)

Unter einem Merkmal versteht man eine Eigenschaft der Merk-malstrager, die statistisch untersucht werden soll. Ein Merkmalhat gewohnlich verschiedene Merkmalsauspragungen. Merkmalenotieren wir meist mit Großbuchstaben (X, Y etc.). Merkmal-sauspragungen notieren wir meist mit indizierten griechischenBuchstaben (z.B. ξ1, ξ2 etc.).

50

Page 55: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bisherige Notationszusammenfassung:

• Merkmalstrager: e1, e2, . . . , en

• Grundgesamtheit: G = {e1, . . . , en}

• Merkmal (interessierende Eigenschaft): X, Y etc.

• Merkmalsauspragungen (Merkmalswerte): ξ1, ξ2, . . .

51

Page 56: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiele:

Grundgesamtheit Merkmal Auspragungen

Haushalte in der verfugbares [0,∞) EuroBRD am 1.1.2010 Monatseinkommen

Studierende der Geschlecht weibl., mannl.WWU am 1.10.2010

52

Page 57: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Typisierungen von Merkmalen: [I]

• Diskrete vs. stetige Merkmale

Ein Merkmal heißt diskret, falls es nur eine ’abzahlbare’Menge von Auspragungen annehmen kann(Vorsicht: ’abzahlbar’ bedeutet nicht endlich!)

Beispiele:

– Typischerweise Zahlmerkmale wie Anzahl von Kindern,Anzahl von Fachsemestern etc.

Ein Merkmal heißt stetig, falls es theoretisch alle reellenZahlen (eines Intervalls) annehmen kann

Beispiele:

– Gewichte, Temperaturen, Preise, Einkommen

53

Page 58: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Typisierungen von Merkmalen: [II]

• Qualitative vs. quantitative Merkmale

Ein Merkmal heißt qualitativ, wenn seine Auspragungendurch verbale Ausdrucke gegeben sind

Beispiele:

– Beruf, Geschlecht, Farbe, Status

Ein Merkmal heißt quantitativ, wenn seine AuspragungenZahlen sind

Beispiele:

– Alter, Einkommen, Noten (falls Note durch Zahl aus-gedruckt wird)

54

Page 59: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Wichtige Frage fur den Statistiker:

• Welche Rechenoperationen sind mit den erhobenen Wertenmoglich?

Antwort uber Skalenniveaus der Daten: [I]

• Nominalskala

Merkmalswerte haben nur Bezeichnungsfunktion(Codes)

Rechenoperationen (Addition, Multiplikation etc.) sindsinnlos

Beispiele: Geschlecht, Religionszugehorigkeit

55

Page 60: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Skalenniveaus: [II]

• Ordinalskala

Es existiert eine naturliche Ordnung der MerkmalswerteGroße der Abstande zwischen den Merkmalswerten ist ir-relevant−→ Rechenoperationen sind sinnlosBeispiele: Klausurnoten, Windstarken

• Intervallskala

Differenzen von je zwei Merkmalswerten konnen sinnvollverglichen werdenFrei wahlbarer MaßstabBeispiel: Temperaturen (in Grad Celsius oder Fahrenheit)

56

Page 61: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Skalenniveaus: [III]

• VerhaltnisskalaBesitzt naturlichen Nullpunkt, aber keine naturliche Mess-einheitBeispiele: Einkommen, Geldmenge(wenn keine Messeinheit vorgegeben ist)

• Absolute SkalaIst eindeutig bestimmt(naturlicher Nullpunkt und naturliche Messeinheit)Beipiele: Einkommen in Euro, Alter in Jahren etc.

Ausdrucksweise:

• Intervall-, Verhaltnis- und absolute Skala werden auch me-trische Skalen genannt

57

Page 62: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

3.3 Daten und ihre Erhebung

Begriffserklarung:

• Unter dem Begriff Daten versteht man die beobachtetenWerte eines oder mehrerer Merkmale

Schreibweisen fur Daten:

• Bei einem Merkmal X:

x1, . . . , xn

• Bei 2 Merkmalen X und Y :

(x1, y1), . . . , (xn, yn)

58

Page 63: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Weitere Begriffe: [I]

• Urliste:

Die Gesamtheit aller erhobenen Daten nennt man Urliste

• Haufigkeitsverteilung:

Die Haufigkeitsverteilung gibt fur jeden Merkmalswert dieHaufigkeit an, mit der dieser in den erhobenen Datenvorkommt

Haufigkeitsverteilung (inklusive grafischer Darstellung)ausfuhrlich in Kapitel 4

59

Page 64: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Weitere Begriffe: [II]

• Vollerhebung / Teilerhebung

Vollerhebung: Ermittlung der Merkmalswerte aller Unter-suchungseinheiten der Grundgesamtheit(z.B. Volkszahlung)

Teilerhebung: Auswertung nur eines Teils der Grundge-samtheit

Mogliche Grunde:

– GG ist zu groß (Vollerhebung zu teuer)

– Beobachtung des Merkmals zerstort den Merkmalstra-ger (Qualitatskontrolle)

60

Page 65: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Weitere Begriffe: [III]

• Querschnitte / Zeitreihen / Panels

Querschnitt: Erhebung der Werte eines Merkmals zur sel-ben Zeit an verschiedenen Untersuchungseinheiten(z.B. Umsatze von Unternehmen im Jahre 2002)

Zeitreihen: Erhebung der Werte eines Merkmals an dersel-ben Untersuchungseinheit zu verschiedenen Zeitpunkten(z.B. BSP eines Landes uber verschiedene Jahre)

Panel: Kombination von Querschnitten und Zeitreihen(z.B. Jahrliche Befragung von Haushalten nach ihrem Ein-kommen)

61

Page 66: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

3.4 Amtliche und nichtamtliche Statistik

Trager der Wirtschafts- und Sozialstatistik in der BRD:

• Amtliche Statistik

• Nichtamtliche Statistik

Institutionen der amtlichen Statistik:

• Statistisches Bundesamt

• Bundesministerien

• Deutsche Bundesbank

• Bundesanstalten

62

Page 67: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Trager der nichtamtlichen Statistik:

• Unabhangige Wirtschaftswissenschaftliche Institute

IFO (Institut fur Wirtschaftsforschung, Munchen)DIW (Deutsches Institut fur Wirtschaftsforschung, Berlin)IfW (Institut fur Weltwirtschaft, Kiel)RWI (Rheinisch-Westfalisches Institut fur Wirtschaftsfor-schung, Essen)

• Wirtschaftsforschungsinstitute von Interessenverbanden

• Unabhangige, quasi ’halbamtliche’ Institutionen(z.B. Sachverstandigenrat, Monopolkommission)

• Markt-, Meinungs- und Umfrageinstitute

63

Page 68: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

4. Auswertung eindimensionaler Daten

Ziel dieses Kapitels:

• Prasentation von Methoden zur statistischen Auswertung eineseinzelnen Merkmals

64

Page 69: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bezeichnungen (Wiederholung):

• Merkmalstrager: e1, . . . , en

• Grundgesamtheit: G = {e1, . . . , en}

• Zu untersuchendes Merkmal: X

• Mogliche Merkmalswerte: ξ1, . . . , ξJ

• Daten in Urliste: x1, . . . , xn

65

Page 70: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Fragestellungen:

• Formale und grafische Darstellung der Daten

• Berechnung aussagekraftiger Kenngroßen der Daten

Vorgehensweise:

• Vorstellung der statistischen Methoden anhand des Skalen-niveaus des Merkmals X

66

Page 71: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

4.1 Beliebig skalierte Daten

Skalenniveau des zu untersuchenden Merkmals X:

• Nominalskala (oder hoher)

Haufigkeiten des Merkmals X mit Auspragungen ξ1, . . . , ξJ:

• Absolute Haufigkeit der Auspragung ξj (j = 1, . . . J):

nj = Anzahl von Daten mit Merkmalswert ξj

• Relative Haufigkeit der Auspragung ξj (j = 1, . . . J):

fj =nj

n= Anteil von Daten mit Merkmalswert ξj

67

Page 72: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Offensichtlich gilt:

• 0 ≤ nj ≤ n sowie∑J

j=1 nj = n (warum?)

• 0 ≤ fj ≤ 1 sowie∑J

j=1 fj = 1 (warum?)

Jetzt:

• Mit den Begriffen der absoluten und relativen Haufigkeitengelangt man zur 1. Darstellungsform des Merkmals X, nam-lich zur Haufigkeitstabelle

68

Page 73: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Definition 4.1: (Haufigkeitstabelle)

Unter der Haufigkeitstabelle des Merkmals X versteht man diefolgende tabellarische Darstellung:

j ξj nj fj = nj/n1 ξ1 n1 f12 ξ2 n2 f2... ... ... ...J ξJ nJ fJSumme: n 1

69

Page 74: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiel (Verkehrsmittelbenutzung):

• Grundgesamtheit bestehe aus 20 Beschaftigten eines Be-triebes, d.h. G = {e1, . . . , e20}

• Zu untersuchendes Merkmal X:Benutztes Verkehrsmittel zum Arbeitsplatz

• Merkmalsauspragungen:

ξ1 = Busξ2 = PKWξ3 = Motorradξ4 = Fahrradξ5 = zu Fuß

70

Page 75: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Erhobene Urliste:

1,1,2,2,2,4,3,5,2,2,5,2,4,1,1,2,2,1,2,1

Haufigkeitstabelle:

j ξj nj fj = nj/n1 Bus 6 6/20 = 0.302 PKW 9 9/20 = 0.453 Motorrad 1 1/20 = 0.054 Fahrrad 2 2/20 = 0.105 zu Fuß 2 2/20 = 0.10

Summe: 20 1.00

71

Page 76: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Man beachte den folgenden ’Trade-Off’:

• Ubergang von Urliste zur Haufigkeitstabelle

erhoht die Ubersichtlichkeit

fuhrt zu einem Informationsverlust

Grafische Darstellungen von Haufigkeitstabellen durch

• Saulendiagramme

• Balkendiagramme

72

Page 77: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Balken- oder Stabdiagramm (absolute Häufigkeiten)

0

2

4

6

8

10

Bus PKW Motorrad Fahrrad zu Fuß

Kuchen- oder Kreisdiagramm (relative Häufigkeiten)

Bus30%

PKW45%

Motorrad5%

Fahrrad10%

zu Fuß10%

Page 78: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Vorsicht bei der Interpretation von Grafiken:

• Grafiken konnen auf viele Weisen manipuliert werden

• Manipulation muss nicht immer schlecht sein

• Verzerren der Achsen

Bestimmte Bereiche werden hervorgehobenBestimmte Bereiche werden unterdruckt

• Skalierungen der Y -Achsen

Bestimmte Entwicklungen werden dramatisiertBestimmte Entwicklungen werden verschwiegen

74

Page 79: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Wichtige Kennzahl einer Datenreihe ist der Modus:

Definition 4.2: (Modus)

Ein Merkmalswert ξj heißt Modus, wenn seine (absolute oderrelative) Haufigkeit mindestens so groß ist wie die aller anderenMerkmalswerte, d.h. wenn nj ≥ nk fur alle k ∈ {1, . . . , J} gilt.

Offensichtlich:

• Eine Datenreihe kann mehrere Modi aufweisen

75

Page 80: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

4.2 Mindestens ordinal skalierte Daten

Jetzt:

• Daten seien mindestens ordinal skaliert, d.h. erhobene Datenkonnen sinnvoll geordnet werden

Wichtige Darstellungsform der Daten:

• Empirische Verteilungsfunktion

76

Page 81: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Definition 4.3: (Empirische Verteilungsfunktion)

Gegeben seien die Daten x1, . . . , xn einer Urliste. Fur jede reelleZahl x ∈ R definiert man die empirische Verteilungsfunktionan der Stelle x (in Zeichen: F (x)) als den Anteil der Datenx1, . . . , xn, die kleiner oder gleich x sind:

F (x) =Anzahl aller xi ≤ x

n.

Bemerkung:

• Es gibt alternative Moglichkeiten, die empirische Verteilungs-funktion auszudrucken. Z.B. kann man alle Merkmalsauspra-gungen ξj (j = 1, . . . , J) betrachten, die kleiner oder gleich xsind und deren relative Haufigkeiten fj = nj/n aufsummieren:

F (x) =∑

ξj≤xfj

77

Page 82: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiel (Klausurnoten): [I]

• 16 Studierende erzielten in einer Klausur die folgenden ganz-zahligen Noten:

3,4,2,1,2,4,5,5,2,1,4,5,3,3,2,4

• Zur Berechnung der emp. VF sortieren wir die Urliste vonder kleinsten zur großten Beobachtung

1,1,2,2,2,2,3,3,3,4,4,4,4,5,5,5

78

Page 83: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiel (Klausurnoten): [II]

• Die emp. VF ergibt sich wie folgt:

F (x) =

016 = 0.0000 furx < 1

216 = 0.1250 fur 1 ≤ x < 2

616 = 0.3750 fur 2 ≤ x < 3

916 = 0.5625 fur 3 ≤ x < 4

1316 = 0.8125 fur 4 ≤ x < 5

1616 = 1.0000 furx ≥ 5

79

Page 84: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bemerkung:

• Wir notieren die vom kleinsten Datenwert (Minimum) zumgroßten Datenwert (Maximum) geordnete Urliste als

x(1) ≤ x(2) ≤ . . . ≤ x(n).

(x(1) = Minimum der Urliste, x(n) = Maximum)

80

0

0,2

0,4

0,6

0,8

1

0 1 2 3 4 5 6

Page 85: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Eigenschaften der empirischen Verteilungsfunktion: [I]

• F (x) = 0 fur alle x < x(1)

• F (x) = 1 fur alle x ≥ x(n)

• F (x) ist eine Treppenfunktion. Sprunge erfolgen an denStellen, die als Daten in der Urliste vorkommen. Die Sprunghohean der Stelle x = ξj betragt fj = nj/n.

• F (x) ist rechtsseitig stetig

• Ist die Urliste sehr lang (d.h. n sehr groß), so wird F (x)immer ’glatter’

81

Page 86: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Eigenschaften der empirischen Verteilungsfunktion: [II]

• Aus F (x) lassen sich die beobachteten Merkmalswerte undderen relativen Haufigkeiten rekonstruieren. Kennt man zu-satzlich noch n, so folgen aus F (x) auch die absoluten Hau-figkeiten

Wichtige Kennzahlen einer Datenreihe:

• Quantile

• Definition der Quantile uber emp. Verteilungsfkt. F (x)

82

Page 87: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Definition 4.4: (p-Quantil)

Gegeben seien die Daten x1, . . . , xn einer Urliste. Man betrachteeine beliebige reelle Zahl p mit 0 < p < 1. Das p-Quantil (oderder p · 100%-Punkt) der Daten (in Zeichen: xp) ist definiert als

xp = min {x ∈ R |F (x) ≥ p}

= kleinstes x ∈ R fur das gilt F (x) ≥ p.

Bemerkung:

• Das p-Quantil xp ist also der kleinste Wert x ∈ R mit derEigenschaft, dass mindestens p ·100% der Daten kleiner odergleich xp sind

83

Page 88: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bisher:

• Bestimmung von Quantilen uber emp. VerteilungsfunktionF (x)

Jetzt:

• Technische Vorschrift (Algorithmus) zur Bestimmung vonQuantilen aus der Urliste x1, . . . xn (ohne Berechnung deremp. VF F (x))

Betrachte dazu:

• Geordnete Urliste der Daten

x(1) ≤ x(2) ≤ . . . x(n)

84

Page 89: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Das p-Quantil ist dann gegeben durch:

xp =

{

x(n·p), falls n · p ganzzahlig istx(bn·pc+1) sonst

(bn · pc bezeichnet den ganzzahligen Anteil von n · p)

Definition 4.5: (Spezielle Quantile)

Einige p-Quantile haben besondere Namen:

• Median (p = 0.5): x0.5

• Quartile (p = 0.25,0.5,0.75): x0.25, x0.5, x0.75

• Quintile (p = 0.2,0.4,0.6,0.8): x0.2, x0.4, x0.6, x0.8

85

Page 90: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiel (Klausurnoten): [I]

• Urliste (ungeordnet)

x1 x2 x3 x4 x5 x6 x7 x83 4 2 1 2 4 5 5

x9 x10 x11 x12 x13 x14 x15 x162 1 4 5 3 3 2 4

• Geordnete Urliste

x(1) x(2) x(3) x(4) x(5) x(6) x(7) x(8)1 1 2 2 2 2 3 3

x(9) x(10) x(11) x(12) x(13) x(14) x(15) x(16)3 4 4 4 4 5 5 5

86

Page 91: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiel (Klausurnoten): [II]

• Berechnung des 0.25-Quantils:

n = 16, p = 0.25 ⇒ n · p = 16 · 0.25 = 4 (ganzzahlig)

⇒ x0.25 = x(n·p) = x(4) = 2

• Berechnung des Medians:

n = 16, p = 0.5 ⇒ n · p = 16 · 0.5 = 8 (ganzzahlig)

⇒ x0.5 = x(n·p) = x(8) = 3

• Berechnung des 0.8-Quantils:

n = 16, p = 0.8 ⇒ n·p = 16·0.8 = 12.8 (nicht ganzzahlig)

⇒ x0.8 = x(bn·pc+1) = x(b12.8c+1) = x(12+1) = x(13) = 4

87

Page 92: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

4.3 Metrisch skalierte Daten

Jetzt:

• Metrisch skaliertes Merkmal X (vgl. Folie 29)

• Rechenoperationen mit Daten x1, . . . , xn sinnvoll

Unter dieser Voraussetzung:

• Einfuhrung von Kennzahlen zur Beschreibungder Lage (Abschnitte 4.3.1, 4.3.2)der Streuung (Abschnitt 4.3.3)der Symmetrie (Abschnitt 4.3.6)

der metrisch skalierten Daten x1, . . . , xn

88

Page 93: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

4.3.1 Lagemessung

Wichtige Frage der deskriptiven Statistik:

• Beschreibung des ’Lagezentrums’ der erhobenen Datenx1, . . . , xn durch geeignete Kennzahlen(Lagekennziffern, Lagemaße)

Man beachte:

• Je nach Skalenniveau der Daten kommen unterschiedlicheLagemaße in Betracht

89

Page 94: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiele:

• Fur ordinal skalierte Daten kennen wir bereits

den Modus (haufigster Wert einer Datenreihe)den Median (0.5-Quantil, 50%-Wert)

Wichtigstes Lagemaß fur metrisch skalierte Daten:

Definition 4.6: (Arithmetisches Mittel)

Fur die metrisch skalierten Daten x1, . . . , xn ist das arithmetischeMittel (auch: Mittelwert oder Durchschnitt) definiert durch

x =1n· (x1 + x2 + . . . + xn) =

1n

n∑

i=1xi.

90

Page 95: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Eigenschaften des arithmetischen Mittels: [I]

• Arithm. Mittel und Merkmalssummen

i=1xi = n · x = x + x + . . . + x

︸ ︷︷ ︸

n mal

• x liegt zwischen Minimum und Maximum:

x(1) = min{x1, . . . , xn} ≤ x ≤ max{x1, . . . , xn} = x(n)

• Schwerpunkteigenschaft:n

i=1(xi − x) =

n∑

i=1xi − n · x = n · x− n · x = 0

91

Page 96: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Eigenschaften des arithmetischen Mittels: [II]

• Minimumeigenschaft:Fur x gilt:

n∑

i=1(xi − x)2 = min

c∈R

n∑

i=1(xi − c)2

Weitere Berechnungsmoglichkeiten fur x:

• Anhand von relativen bzw. absoluten Haufigkeiten(vgl. Folie 67)

x =1n

n∑

i=1xi =

1n

J∑

j=1ξj · nj =

J∑

j=1ξj · fj

92

Page 97: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiel:

• Grundgesamtheit: n = 520 Haushalte eines Vorortes

• Merkmal: Anzahl der Haushaltsmitglieder

ξj nj1 1882 1733 794 565 206 4

Summe: 520

• Durchschnittliche Haushaltsgroße:

x =1

520· (1 · 188 + 2 · 173 + . . . + 6 · 4) = 2.1519

93

Page 98: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Verallgemeinerung des arithmetischen Mittels:

• Das gewogene arithmetische Mittel:

xw =n

i=1wi · xi

mit den Gewichten w1, . . . , wn, wobei

0 ≤ wi ≤ 1

n∑

i=1wi = 1

94

Page 99: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bemerkungen:

• Mit w1 = w2 = . . . = wn = 1/n ergibt sich das arithmetischeMittel als Spezialfall

• Das gewogene Mittel ist zu verwenden, falls das relativeGewicht einzelner Untersuchungseinheiten an der Grundge-samtheit von Bedeutung ist. Soll z.B. der durchschnittlicheStrukturwandel in der BRD statistisch erfasst werden, so sindbei der Durchschnittsbildung uber die einzelnen Bundeslanderderen wirtschaftliche Kapazitaten zu berucksichtigen. Z.B.erhalt in der Strukturberichterstattung der gemessene Struk-turwandel in NRW ein hoheres Gewicht als der des Saarlan-des.

95

Page 100: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Arithmetisches Mittel vs. Median

Wiederholung (vgl. Folie 85):

• Median ist 0.5-Quantil

x0.5 =

{

x(n/2), falls n geradex(bn/2c+1), falls n ungerade

Man beachte:

• Sowohl das arithmetische Mittel x als auch der Median x0.5sind populare Lagemaße

96

Page 101: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Vergleich Mittelwert / Median:

• In die Berechnung von x fließen alle Beobacht. ein

Vorteil: Es wird keinerlei Information verschenkt

Nachteil: x reagiert empfindlich auf extreme Ausreißer inden Daten

• x0.5 wird durch Ermittlung der mittleren Position der geord-neten Urliste bestimmt

Vorteil: x0.5 ist robust gegenuber extremen Datenaus-reißern

Nachteil: Es wird Information verschenkt, da nur die Po-sition der Beobachtungen eine Rolle spielt

97

Page 102: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

4.3.2 Weitere Mittelwerte

Neben dem (gewogenen) arithmetischen Mittel gibt es eine Reiheweiterer Mittelwerte:

Definition 4.7: (Harmonisches, geometrisches Mittel)

Es seien x1, . . . , xn metrisch skalierte Daten mit xi > 0 fur i =1, . . . , n. Das harmonische Mittel xH sowie das geometrischeMittel xG sind definiert als

xH =1

1n

n∑

i=1

1xi

=

1n

n∑

i=1x−1

i

−1

98

Page 103: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

bzw.

xG = n√x1 · x2 · . . . · xn =

n∏

i=1xi

1n

.

Spezielle Anwendungsgebiete:

• Harmonisches Mittel: Indizes vom Typ Paasche(Kapitel 5)

• Geometrisches Mittel: Wachstumsfaktoren und Wachstum-sraten(Kapitel 5)

99

Page 104: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

4.3.3 Streuungsmaße

Weitere Frage der dekriptiven Statistik:

• Wie stark streuen die Daten x1, . . . , xn um ein geeignet defi-niertes Zentrum?(Kennzahlen: Streuungs- oder Dispersionsmaße)

Man beachte:

• Mit alternativen Lagemaßen fur das Zentrum ergeben sichunterschiedliche Streuungsmaße

Wichtigste Streuungsmaße fur metrische Daten:

• Varianz und Standardabweichung

100

Page 105: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Definition 4.8: (Varianz, Standardabweichung)

Fur die metrisch skalierten Daten x1, . . . , xn ist die Varianz (inZeichen: s2) definiert durch

s2 =1n·

n∑

i=1(xi − x)2 .

Die Standardabweichung (in Zeichen: s) ist definiert als dieWurzel aus der Varianz, d.h.

s =√

s2 =

1n·

n∑

i=1(xi − x)2.

Bemerkung:

• Meist wird bei der Berechnung von s2 bzw. s nicht durch n,sondern durch n− 1 dividiert(Begrundung: in Statistik II)

101

Page 106: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Eigenschaften von s2 und s: [I]

• s2 hat quadratische Dimension, s hat gleiche Dimension wiedie Daten x1, . . . , xn

• Es gilt stets: s2 ≥ 0 und s ≥ 0

• Ferner:

s = 0 ⇐⇒ s2 = 0 ⇐⇒ x1 = x2 = . . . = xn,

d.h. Varianz und Std.Abwch. sind genau dann gleich 0, wennalle Daten gleich sind(keine Streuung)

102

Page 107: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Eigenschaften von s2 und s: [II]

• Alternative Darstellungen:

s2 =1n

n∑

i=1x2

i − x2 (Proseminar)

s2 =1

2n2

n∑

i=1

n∑

j=1

(

xi − xj)2

103

Page 108: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Zwei weitere zentrale Eigenschaften: [I]

• Es seien a, b ∈ R und x1, . . . , xn erhobene Daten eines Merk-mals X. Das Merkmal Y sei eine lineare Transformation vonX, d.h. Y = a ·X + b, so dass fur die Daten des Merkmals Ygilt

yi = a · xi + b fur alle i = 1, . . . , n.

Dann folgt fur die Varianz s2Y bzw. die StandardabweichungsY des Merkmals Y :

s2Y = a2 · s2X bzw. sY = |a| · sX

104

Page 109: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Zwei weitere zentrale Eigenschaften: [II]

• Fur jede reelle Zahl c ∈ R gilt der Verschiebungssatz:

1n

n∑

i=1(xi − c)2 = s2 + (x− c)2

Hieraus folgt die Minimumeigenschaft des arithmetischen Mit-tels (vgl. Folie 92):

”Die durchschnittliche quadratische Abweichung der Datenvon einem Bezugspunkt c wird minimal, wenn man c = xwahlt”

105

Page 110: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Alternative Streuungsmaße: [I]

• Mittlere absolute Abweichung vom Median:

d =1n

n∑

i=1|xi − x0.5|

Es gilt die Minimierungseigenschaft:

d = minc∈R

1n

n∑

i=1|xi − c|

• Quartilsabstand Q

Q = x0.75 − x0.25

(Lange des Bereichs mit mittleren 50% der Daten)

106

Page 111: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Alternative Streuungsmaße: [II]

• Spannweite R

R = maxi=1,...,n

{xi} − mini=1,...,n

{xi} = x(n) − x(1)

(Lange des gesamten Datenbereichs)

Jetzt:

• Berechnung von Streuungsmaßen anhand von Haufigkeiten

Zur Erinnerung (vgl. Folie 67):

• Merkmal X hat die J Auspragungen ξ1, . . . , ξJ mit den jew-eiligen absoluten Haufigkeiten n1, . . . , nJ

107

Page 112: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Damit folgende Formeln fur die Streuungsmaße:

s2 =1n

J∑

j=1

(

ξj − x)2· nj

s =

1n

J∑

j=1

(

ξj − x)2· nj

d =1n

J∑

j=1

∣ξj − x0.5∣

∣ · nj

R = maxj=1,...,J

{ξj|nj > 0} − minj=1,...,J

{ξj|nj > 0}

108

Page 113: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

4.3.4 Additionssatze fur arithmetische Mittel undVarianzen

Ausgangssituation:

• Grundgesamtheit G gliedert sich in K TeilgesamtheitenG1, . . . , GK

• Mittelwerte bzw. Varianzen in den K Teilgesamtheiten sindx1, . . . , xK bzw. s21, . . . , s2K

• Umfange der Teilgesamtheiten seien n1, . . . , nKDamit ist der Umfang der Grundgesamtheit

n =K∑

k=1nk

109

Page 114: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Frage:

• Zusammenhange zwischen dem Mittelwert x bzw. der Vari-anz s2 der Grundgesamtheit und den Mittelwerten bzw. Vari-anzen der Teilgesamtheiten?

Additionssatz fur Mittelwerte:

x =K∑

k=1xk ·

nkn

(Mittelwert der Grundgesamtheit ist gewichtetes Mittel der Mit-telwerte der Teilgesamtheiten)

110

Page 115: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Additionssatz fur Varianzen:

s2 =K∑

k=1s2k ·

nkn

︸ ︷︷ ︸

=s2int

+K∑

k=1(xk − x)2 ·

nkn

︸ ︷︷ ︸

=s2ext

Bedeutung der internen bzw. externen Varianzen s2int, s2ext:

• Interne Varianz ist gewichtetes Mittel aus den Varianzen derTeilgesamtheiten

• Externe Varianz ist gewichtete quadratische Abweichung derMittelwerte xk der K Teilgesamtheiten vom Mittelwert x derGrundgesamtheit

111

Page 116: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Offensichtlich:

• Gesamtvarianz lasst sich exakt in Summe aus interner undexterner Varianz zerlegen:

s2 = s2int + s2ext

Beispiel:

• 100 (Wieder-)Erwerbstatige wurden nach der Dauer X derfruheren Arbeitslosigkeit befragt (in Monaten)

Frauen MannerAnzahl 60 40Mittlere Arbeitslosigkeitsdauer 9.2 7.4Std.-Abwchg. der Arbeitslosigkeitsdauer 4.1 3.2

112

Page 117: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Berechnungen:

x = 9.2 ·60100

+ 7.4 ·40100

= 8.48

s2int = 4.12 ·60100

+ 3.22 ·40100

= 14.182

s2ext = (9.2− 8.48)2 ·60100

+ (7.4− 8.48)2 ·40100

= 0.7776

s2 = s2int + s2ext = 14.182 + 0.7776 = 14.9596

s =√

14.9596 ≈ 3.9

113

Page 118: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

4.3.5 Stetig klassierte Daten

Haufiges praktisches Problem:

• Daten liegen nicht als Urliste x1, . . . , xn vor (Einzeldaten),sondern zusammengefasst nach Klassen(stetig klassierte oder Gruppendaten)

Beispiel:

• Verfugbares Monatseinkommen (in Euro) von 5000 Studieren-den

114

Page 119: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

j EK-Klasse Kj Studierende nj fjfj

xoj−xu

j1 0 bis 250 300 0.06 0.000242 mehr als 250 bis 500 1000 0.20 0.000803 mehr als 500 bis 750 2000 0.40 0.001604 mehr als 750 bis 1000 1000 0.20 0.000805 mehr als 1000 700 0.14

Summe: 5000 1.00

Grund fur stetige Klassierung:

• Bei sehr langen Datenreihen ist die Angabe von Haufigkeitenjedes einzelnen Datenpunktes oft sinnlos

115

Page 120: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Notationen zur Auswertung stetig klassierter Daten:

• Betrachte die J Klassen (Intervalle)

K1 = [xu1, xo

1], Kj = (xuj , xo

j], j = 2, . . . , J,

wobei fur die Intervallgrenzen gelten soll

xu1 < xo

1 = xu2 < xo

2 = xu3 < xo

3 < . . . < xoJ−1 = xu

J < xoJ

Bemerkungen:Die untere Grenze xu

1 der 1. Klasse kann −∞ seinDie obere Grenze xo

J der J. Klasse kann ∞ sein

• nj ist die Anzahl der Daten in Klasse Kj

• fj =njn ist der Anteil der Daten in Klasse Kj

116

Page 121: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Damit:

• Die Haufigkeitsverteilung der stetig klassierten Daten ist gegebendurch

(K1, n1), (K2, n2), . . . , (KJ , nJ)

bzw. durch

(K1, f1), (K2, f2), . . . , (KJ , fJ)

Bemerkung:

• Es wird nichts uber die Datenverteilung innerhalb der Klassenausgesagt−→ Informationsverlust

117

Page 122: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Probleme bei der stetigen Klassierung:

• Wieviele Klassen J soll man wahlen?Faustregel: Wahle bei n Daten J ≈ 10 · log10 n

• Soll man die J Klassen alle gleich breit wahlen?

• Ist es moglich, die oberste Klasse durch eine endliche Ober-grenze sinnvoll abzuschließen?

118

Page 123: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Definition 4.9: (Empirische Dichte, Histogramm)

Den Quotientennj

n · (xoj − xu

j )=

fj

xoj − xu

j

bezeichnet man als empirische Dichte der Daten in der KlasseKj, j = 1,2, . . . , J. Tragt man die empirischen Dichten als waage-rechte Linien uber den Klassen ab und zeichnet an den Klas-sengrenzen senkrechte Linien in Hohe der jeweiligen emprischenDichten ein, so entsteht ein Histogramm der Daten.

119

Page 124: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Empirische Dichten und Histogramm zum Beispiel ’Studierende’

120

0

0,0004

0,0008

0,0012

0,0016

0,002

0 250 500 750 1000 1250 1500

Page 125: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bemerkungen zum Histogramm:

• Das Rechteck uber der Klasse j hat die Flache

(xoj − xu

j ) ·fj

xoj − xu

j= fj

• Die Gesamtflache unter dem Histogramm betragt 1, denn

Gesamtflache = Summe der Rechteckflachen

=J

j=1(xo

j − xuj ) ·

fj

xoj − xu

j

=J

j=1fj = 1

121

Page 126: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Jetzt:

• Berechnung statistischer Kenngroßen bei stetig klassiertenDaten

Zunachst:

• Empirische Verteilungsfunktion und Quantile

Erinnerung: (vgl. Folie 77, Definition 4.3)

• Der Wert der emp. Verteilungsfunktion F (x) ist definiert alsAnteil der Daten, die kleiner oder gleich x sind

122

Page 127: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Problem bei stetiger Klassierung:

• Verteilung der Daten in Klasse Kj ist unbekannt

−→ Fur ein x ∈ Kj (x nicht auf der Ober- oder Untergrenze)ist der Anteil nicht bestimmbar

Vorgehensweise:

• Betrachte zunachst die x ∈ R, fur die die emp. Verteilungs-funktion F (x) exakt berechenbar ist

123

Page 128: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Zunachst gilt:

F (x) =

0 fur x < xu1

1 fur x ≥ xoJ

Weiterhin gilt an den Obergrenzen aller Klassen:

F (xoj) =

j∑

r=1fr fur alle j = 1,2, . . . , J

Ubrig bleibt:

• Berechnung von F (x) fur x ∈ (xuj , xo

j]

124

Page 129: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Vorgehensweise:

• Lineare Interpolation von F (x) fur x ∈ (xuj , xo

j]:

F (x) ≈ F (xuj ) +

fj

xoj − xu

j(x− xu

j )

= F (xoj−1) +

fj

xoj − xu

j(x− xu

j )

=j−1∑

r=1fr +

fj

xoj − xu

j(x− xu

j )

125

Page 130: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiel: (vgl. Folien 114, 115) [I]

• Monatseinkommen von 5000 Studierenden

• Obergrenze der letzten Klasse wurde willkurlich auf 1500Euro gesetzt

j EK-Klasse Kj fj F (xoj)

1 0 bis 250 0.06 0.062 mehr als 250 bis 500 0.20 0.263 mehr als 500 bis 750 0.40 0.664 mehr als 750 bis 1000 0.20 0.865 mehr als 1000 bis 1500 0.14 1.00

126

Page 131: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiel: [I]

• Zwischen Klassengrenzen wird linear interpoliert, z.B.

F (650) ≈ f1 + f2 +f3

xo3 − xu

3(x− xu

3)

= 0.26 +0.4

750− 500(650− 500) = 0.5

Empirische Verteilungsfunktion zum Beispiel ’Studierende’

127

0,06

0,26

0,66

0,86

1

0

0,2

0,4

0,6

0,8

1

0 500 1000 1500

x

F(x)

Page 132: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Jetzt:

• Berechnung von Quantilen bei stetiger Klassierung uber em-pirische Verteilungsfunktion F (x)(vgl. Folie 83, Definition 4.4)

Zusatzannahme:

• Keine der Klassen Kj besitzt die Haufigkeit 0

=⇒ Emp. VF F (x) ist streng monoton wachsend=⇒ Fur jedes p ∈ (0,1) hat die Gleichung

F (x) = p

eine eindeutige Losung, namlich das p-Quantil xp

128

Page 133: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Explizite Berechnung von xp: [I]

1. Bestimme die Klasse Kj in der xp liegt,d.h. bestimme das j fur das gilt F (xu

j ) < p ≤ F (xoj)

2. Lose die Gleichung

p = F (xuj ) +

fj

xoj − xu

j(x− xu

j )

nach x auf. Die Losung approximiert das Quantil xp.

129

Page 134: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Explizite Berechnung von xp: [II]

p = F (xuj ) +

fj

xoj − xu

j(x− xu

j )

⇐⇒ x− xuj =

p− F (xuj )

fj(xo

j − xuj )

⇐⇒ x = xuj +

p− F (xuj )

fj(xo

j − xuj )

⇐⇒ x = xuj +

p− F (xuj )

F (xoj)− F (xu

j )(xo

j − xuj )

︸ ︷︷ ︸

≈ xp

130

Page 135: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiel: (vgl. Folie 126, ’Einkommen Studierende’)

• Gesucht: unteres Quartil x0.25

Berechnung von x0.25:

1. 0.06 = F (xu2) < 0.25 ≤ 0.26 = F (xo

2),

d.h.

x0.25 ∈ K2 = (250,500]

2. Damit folgt:

x0.25 ≈ 250 +0.25− 0.060.26− 0.06

(500− 250) = 487.5

131

Page 136: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Es verbleibt:

• Berechnung weiterer statistischer Kennzahlen, z.B.

Arithmetisches Mittel

Varianz bzw. Standardabweichung

(Nicht in der VL)

132

Page 137: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

4.3.6 Schiefemessung

Situation:

• Betrachte Urliste x1, . . . , xn (keine stetige Klassierung)

Wichtige praktische Feststellung:

• In der empirischen Wirtschaftsforschung werden Kennzahlenwie arithmetisches Mittel, Varianz, Standardabweichung etc.in der Praxis nicht per Hand ausgerechnet, sondern mit spe-zieller Auswertungssoftware (z.B. EViews)

133

Page 138: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiel: (vgl. Folie 12)

• Tagliche Wechselkursveranderungsraten der griechischenDrachme zum Euro

Stabdiagramm und statistische Kennzahlen fur GRD-Veranderungsraten

134

0

100

200

300

400

500

-1.0 -0.5 0.0 0.5

Series: GRD_RETSample 16/12/1998 1/01/2001Observations 748

Mean 0.005082Median 0.000000Maximum 0.817738Minimum -1.295992Std. Dev. 0.114130Skewness -1.693633Kurtosis 38.21140

Jarque-Bera 38999.36Probability 0.000000

Page 139: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

0

100

200

300

400

500

600

-4 -3 -2 -1 0 1 2 3

Series: SYMMETRIESample 1 5000Observations 5000

Mean -0.007964Median 0.004551Maximum 3.433310Minimum -3.982642Std. Dev. 0.994190Skewness -0.019422Kurtosis 2.939408

Jarque-Bera 1.079224Probability 0.582974

Symmetrische Verteilung

0

100

200

300

400

500

600

0.0 0.1 0.2 0.3 0.4 0.5 0.6

Series: RECHTSSample 1 5000Observations 5000

Mean 0.168041Median 0.150735Maximum 0.661654Minimum 0.002084Std. Dev. 0.102757Skewness 0.865684Kurtosis 3.650617

Jarque-Bera 712.6960Probability 0.000000

Rechtsschiefe Verteilung

0

100

200

300

400

500

600

0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0

Series: LINKSSample 1 5000Observations 5000

Mean 0.830835Median 0.851905Maximum 0.996949Minimum 0.280793Std. Dev. 0.104683Skewness -0.896282Kurtosis 3.619218

Jarque-Bera 749.3160Probability 0.000000

Linksschiefe Verteilung

Page 140: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Fazit:

• Datenreihen zeigen unterschiedliches Symmetrieverhalten

Jetzt:

• Kennzahl fur Symmetrieverhalten

136

Page 141: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Definition 4.10: (Schiefe)

Die Schiefe einer Urliste x1, . . . , xn ist definiert durch

g =1n

n∑

i=1

(xi − xs

)3,

wobei wie ublich

x =1n

n∑

i=1xi

und

s =

1n

n∑

i=1(xi − x)2

das arithmetische Mittel sowie die Standardabweichung der Datenbezeichnen.

137

Page 142: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bemerkungen:

• Der zentrale Term in Definition 4.10 ist∑n

i=1(xi − x)3

• Liegen ’viele’ Daten xi rechts von x, so ist g tendenziell posi-tiv

• Liegen ’viele’ Daten xi links von x, so ist g tendenziell negativ

• Insgesamt gelten die folgenden Relationen:

g < 0 =⇒Verteilung ist linksschiefg ≈ 0 =⇒Verteilung ist symmetrischg > 0 =⇒Verteilung ist rechtsschief

138

Page 143: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

5. Verhaltniszahlen, Messzahlen und Indexzahlen

Ziel dieses Kapitels:

• Grundlegende Maßzahlen der praktischen Wirtschaftsstatistik

5.1 Verhaltniszahlen

Definition 5.1: (Verhaltniszahl)

Eine Verhaltniszahl ist allgemein der Quotient zweier statistis-cher Großen. Die den beiden Großen zugrunde liegenden Grund-gesamtheiten konnen identisch oder verschieden sein. Als spezi-elle Verhaltniszahlen unterscheidet man Gliederungszahlen, Be-ziehungszahlen und Messzahlen.

139

Page 144: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Gliederungszahl:

• Aussage uber die Struktur der Grundgesamtheit G eines (me-trisch skalierten) Merkmals U

• Annahme: G zerfallt in J Teilgesamtheiten, d.h.

G = G1 ∪G2 ∪ . . . ∪GJ

• Es bezeichne uj die Merkmalssumme von U in der Teilge-samtheit Gj (j = 1, . . . , J), so dass gilt

u =J

r=1ur = Merkmalssumme von U auf ganz G

• Definiere nun fur j = 1, . . . , J die Gliederungszahlen

gj =uj

u

140

Page 145: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bemerkungen:

• Die Gliederungszahlen gj sind Anteile, d.h. es gilt

gj ≥ 0∑J

r=1 gr = 1

Beispiele:

• Anteile der Studierenden der unterschiedlichen Disziplinenam Fachbereich WiWi der WWU(Betriebs-, Volkswirte, Wirtschaftsinformatiker)

• Anteile von Bund, Landern und Kommunen an der Gesamtver-schuldung der BRD

141

Page 146: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beziehungszahl: [I]

• Aussage uber die Struktur der Grundgesamtheit G in Bezugauf 2 (metrisch skalierte) Merkmale U und V

• Annahme: G zerfallt in J Teilgesamtheiten, d.h.

G = G1 ∪G2 ∪ . . . ∪GJ

• Es bezeichnen uj und vj die Merkmalssummen von U und Vin der Teilgesamtheit Gj (j = 1, . . . , J), so dass gilt

u =J

r=1ur = Merkmalssumme von U auf ganz G

v =J

r=1vr = Merkmalssumme von V auf ganz G

142

Page 147: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beziehungszahl: [II]

• Definiere nun die Beziehungszahlen

b =uv

bzw. fur j = 1, . . . , J

bj =uj

vj

Beispiel: (Bundeslanderstatistik)

• Amtliche Statistik der BRD

143

Page 148: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bundesland Einw. in 1000 BIP (Mrd. DM)Baden-Wurttemberg 10397 520.36Bayern 12066 614.97Berlin 3426 154.81Brandenburg 2573 75.72Bremen 674 40.34Hamburg 1705 141.25Hessen 6032 340.91Meck.-Vorpommern 1808 47.91Niedersachsen 7845 315.75NRW 17975 799.51Rheinland-Pfalz 4018 156.04Saarland 1081 43.92Sachsen 4522 124.08Sachsen-Anhalt 2702 69.71Schleswig-Holstein 2757 113.79Thringen 2478 64.93Summe 82059 3624.00

144

Page 149: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Gliederungszahlen: (vgl. Folie 146)

• Bevolkerungsanteil

• Anteil am BIP

Beziehungszahlen: (vgl. Folie 147)

• BIP pro Kopf

145

Page 150: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bundesland Bev.-Anteil Anteil am BIPBaden-Wurttemberg 0.1267 0.1436Bayern 0.1470 0.1697Berlin 0.0418 0.0427Brandenburg 0.0314 0.0209Bremen 0.0082 0.0111Hamburg 0.0208 0.0390Hessen 0.0735 0.0941Meck.-Vorpommern 0.0220 0.0132Niedersachsen 0.0956 0.0871NRW 0.2190 0.2206Rheinland-Pfalz 0.0490 0.0431Saarland 0.0132 0.0121Sachsen 0.0551 0.0342Sachsen-Anhalt 0.0329 0.0192Schleswig-Holstein 0.0336 0.0314Thringen 0.0302 0.0179Summe 1 1

146

Page 151: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bundesland BIP pro Kopf in DMBaden-Wurttemberg 50049.05Bayern 50967.18Berlin 45186.81Brandenburg 29428.68Bremen 59851.63Hamburg 82844.57Hessen 56516.91Meck.-Vorpommern 26498.89Niedersachsen 40248.57NRW 44479.00Rheinland-Pfalz 38835.24Saarland 40629.05Sachsen 27439.19Sachsen-Anhalt 25799.41Schleswig-Holstein 41273.12Thringen 26202.58Deutschland insgesamt 44163.35

147

Page 152: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Einige Zusammenhange: [I]

• Es gilt:

b =uv

=1v

J∑

j=1uj =

J∑

j=1

uj

v

=J

j=1

vj

v·uj

vj

=J

j=1hj ·

uj

vj

−→ Beziehungszahl b = uv ist gewogenes arithmetisches Mittel

der Beziehungszahlenujvj

mit den Gewichten hj =vjv

148

Page 153: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Einige Zusammenhange: [II]

• Ferner gilt:

b =(v

u

)−1=

∑Jj=1 vj

u

−1

=

J∑

j=1

uj

u·vj

uj

−1

=

J∑

j=1gj

(

uj

vj

)−1

−1

=1

∑Jj=1 gj · 1

bj

−→ b = uv ist gewogenes harmonisches Mittel der bj =

ujvj

mit den

Gewichten gj =uju

149

Page 154: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Messzahl:

• Quotient zweier sachlich aufeinander bezogener Maßzahlenfur zwei statistische Massen

Beispiele: [I]

• Geschlechterverhaltnis

Geschl.-Verhaltn. =Manner in der BRD am 1.1.2010Frauen in der BRD am 1.1.2010

(Messzahl des sachlichen Vergleichs)

150

Page 155: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiele: [II]

• Einwohnerrelation zwischen 2 Landern

Einwohnerel. =Einwohner der BRD am 1.1.2010

Einwohner Frankreichs am 1.1.2010(Messzahl des raumlichen Vergleichs)

• Einwohnerrelation eines Landes an 2 Zeitpunkten

Einwohnerel. =Einwohner der BRD am 1.1.2010Einwohner der BRD am 1.1.2005

(Messzahl des zeitlichen Vergleichs)

151

Page 156: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

5.2 Messzahlen des zeitlichen Vergleichs

Ausgangssituation und Begriffe: [I]

• Betrachte eine zeitlich geordnete Folge von Zeitpunkten t0 ≤t1 ≤ . . . ≤ tT sowie die Auspragungen eines (metrischen)Merkmals X zu diesen Zeitpunkten:

xt0, xt1, . . . , xtT

(alternative Schreibweise: xt, t = t0, . . . , tT )

• Der Index t steht fur die Zeit (time). Deshalb nennt man dieobige Urliste xt0, . . . , xtT eine Zeitreihe

152

Page 157: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Ausgangssituation und Begriffe: [II]

• Sind die Abstande zwischen den Zeitpunkten t0, t1, . . . , tT im-mer gleich, d.h.

t1 − t0 = t2 − t1 = . . . = tT − tT−1,

so spricht man von aquidistanten Zeitpunkten. In diesemFall benennt man die Zeitpunkte t0, t1, . . . , tT der Einfachheithalber um in 0,1, . . . , T und notiert die obige Zeitreihe als

x0, x1, . . . , xT

Beispiele fur Zeitreihen:

• Monatliche Arbeitslosenquoten

• Tagliche Wechselkurse zwischen Euro und US-$

153

Page 158: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Haufiges Vorgehen in der Empirischen Wirtschaftsforschung:

• Wahle aus der Menge aller moglichen Zeitpunkte einen Ba-siszeitpunkt s ∈ {t0, . . . , tT} und setze die gesamte Zeitreihext, t = t0, . . . , tT , ins Verhaltnis zur Beobachtung xs des Ba-siszeitpunktes. Fur einen beliebigen Berichtszeitpunkt t be-trachtet man also den Quotienten

ms,t =xt

xsfur t = t0, . . . , tT

• Begrundung:Man interessiert sich fur die Entwicklung der Zeitreihe relativzur Auspragung des Basiszeitpunktes s(in praxi wird oft s = t0 gewahlt)

154

Page 159: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Definition 5.2: (Messzahl mit fester Basiszeit)

Fur einen konkreten Basiszeitpunkt s ∈ {t0, . . . , tT} nennt manden Quotienten

ms,t =xt

xs

die Messzahl fur die Berichtszeit t.

Man beachte:

• Aus Definition 5.2 folgt unmittelbar:

mt,t = 1

ms,t =xt

xs=

1xs/xt

=1

mt,s

155

Page 160: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiel:

• Wechselkurszeitreihe ’Griechische Drachme zum Euro’(Tagesdaten)

Offensichtlich:

• Qualitativer Verlauf gleich

• Untere Grafik betont Kursverlauf relativ zum Startwert

156

Page 161: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

320

325

330

335

340

345

15/12/98 3/07/99 19/01/00 6/08/00

Originale Zeitreihe

0.96

0.98

1.00

1.02

1.04

15/12/98 3/07/99 19/01/00 6/08/00

Zeitreihe zum Basiszeitpunkt s=0 (Basiswert: 328.388)

Page 162: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

5.2.1 Umbasierung und Verkettung von Mess-zahlen

Definition 5.3: (Umbasierung)

Unter der Umbasierung einer Messzahl zum Basiszeitpunkt s ver-steht man den Ubergang zu einer Messzahl mit anderer Basiszeitr ∈ {t0, . . . , tT}.

Rechenregel fur Umbasierung: [I]

• Offensichtlich gilt fur jedes t ∈ {t0, . . . , tT}

mr,t =xt

xr=

xt/xs

xr/xs=

ms,t

ms,r

158

Page 163: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Rechenregel fur Umbasierung: [II]

−→ Zirkularitat von Messzahlen:

ms,t = ms,r ·mr,t

Verkettung von Messzahlen:

• Betrachtete aquidistante Zeitreihe x0, x1, . . . , xT und Folgenvon Messzahlen zu den Basiszeiten 0 bzw. s

m0,t fur t = 0,1, . . . , sms,t fur t = s, s + 1, . . . , T

• Gesucht: durchgehende (vollstandige) Folgen von Messzahlenzu den Basiszeiten 0 bzw. s

159

Page 164: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Losung:

• Messzahlenfolge fur die Basiszeit 0:

m0,t =

{

m0,t fur t = 0,1, . . . , sm0,s ·ms,t fur t = s + 1, s + 2, . . . , T

• Messzahlenfolge fur die Basiszeit s:

ms,t =

m0,tm0,s

fur t = 0,1, . . . , s− 1

ms,t fur t = s, s + 1, . . . , T

Zahlenbeispiel:

• In den Tutorien

160

Page 165: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

5.2.2 Zuwachsraten und Zuwachsfaktoren

Betrachte:

• Aquidistante Zeitreihe xt, t = 0,1, . . . , T

• Messzahl mit fester Basiszeit

ms,t =xt

xs

(vgl. Definition 5.2, Folie 155)

161

Page 166: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Definition 5.4: (Zuwachsfaktor, Zuwachsrate)

Die Messzahl ms,t bzeichnet man auch als Zuwachsfaktor bzw. alsWachstumsfaktor. Die absolute Anderung xt − xs bezogen aufden Wert zur Zeit s

ws,t =xt − xs

xs= ms,t − 1

bezeichnet man als Zuwachsrate bzw. Wachstumsrate.

Bemerkungen:

• Zuwachsfaktoren und -raten werden oft in Prozent angegeben

• Es gilt

xt = ms,t · xs bzw. xt − xs = ws,t · xs

162

Page 167: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiel:

• Bargeldumlauf in der BRD

Jahr Umlauf Zuwachsfaktor Zuwachsrate(in Mio. DM) (in Prozent)

1992 2272851993 238641 1.04996 4.9961994 250907 1.05140 5.1401995 263510 1.05023 5.0231996 275744 1.04643 4.6431997 276242 1.00181 0.1811998 270981 0.98096 −1.9041999 289972 1.07008 7.0082000 278143 0.95921 −4.0792001 162205 0.58317 −41.683

163

Page 168: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Definition 5.5: (Durchschnittlicher Zuwachsfaktor)

Als durchschnittlichen Zuwachsfaktor zwischen Anfangs- undEndzeitpunkt bezeichnet man das geometrische Mittel (vgl. Def-inition 4.7, Folie 98) der 1-periodigen Zuwachsfaktoren:

mG = T√

m0,1 ·m1,2 · . . . ·mT−1,T .

Bemerkungen: [I]

• Es gilt:

mG = T√

m0,1 ·m1,2 · . . . ·mT−1,T

= T

x1

x0·x2

x1·x3

x2· . . . ·

xT−1

xT−2·

xTxT−1

= T

xTx0

(Durchschnittl. Zuwachsfaktor hangt nur von x0 und xT ab)

164

Page 169: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bemerkungen: [II]

• Wenn x0 jede Periode um den durchschnittlichen Zuwachs-faktor steigt, ergibt sich nach T Perioden xT :

t = 0 : x0

t = 1 : x0 ·mG

t = 2 : x0 ·mG ·mG = x0 ·m2G

... ...

t = T : x0 ·mTG = x0 ·

(

T

xTx0

)T= xT

165

Page 170: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Definition 5.6: (Durchschnittliche Zuwachsrate)

Als durchschnittliche Zuwachsrate bezeichnet man den um 1 ver-minderten durchschnittlichen Zuwachsfaktor:

w = mG − 1 = T

xTx0

− 1.

166

Page 171: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

5.2.3 Logarithmische Zuwachsraten

Definition 5.7: (Logarithmische Zuwachsrate)

Unter der logarithmischen Zuwachsrate (auch stetige Zuwach-srate) zwischen den Zeitpunkten s, t versteht man die Große

rs,t = ln(xt

xs

)

= ln(xt)− ln(xs).

Bemerkungen: [I]

• Es gilt:

xt = xs · ers,t

167

Page 172: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bemerkungen: [II]

• Zwischen der log. Wachstumsrate rs,t und der Zuwachsratews,t aus Definition 5.4 gilt in ’guter’ Naherung:

rs,t = ln(xt)− ln(xs) ≈xt − xs

xs= ws,t

Vorteile der logarithmischen Wachtumsrate: [I]

• Addierbarkeit:

r0,T = ln(xT )− ln(x0) =T

t=1

[

ln(xt)− ln(xt−1)]

=T

t=1rt−1,t

(Wachstumsrate r0,T ist Summe der 1-periodigen Wachs-tumsraten rt−1,t)

168

Page 173: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Vorteile der logarithmischen Wachtumsrate: [II]

−→ Durchschnittliche logarithmische Zuwachsrate r zwischen denZeitpunkten 0 und T ist arithmetisches Mittel der 1-periodigenlogarithmischen Wachstumsraten

r =1T·

T∑

t=1rt−1,t =

1T· r0,T

• ’Symmetrie’:Verandert sich der Wert xt in der Folgeperiode t+1 auf xt+1und fallt dann in t+2 auf xt zuruck (also xt+2 = xt), so sinddie log. Wachstumsraten rt,t+1 und rt+1,t+2 vom Betrage hergleich (mit entgegengesetzen Vorzeichen)

169

Page 174: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiel: Symmetrische Aktienkursbewegung

Periode Kurs rt,t+1 wt,t+1t 100

t + 1 110 0.0953 0.1t + 2 100 −0.0953 −0.0909

Summe: 0 0.0091

Anwendungsgebiete der log. Zuwachsrate:

• Finanzmathematik (stetige Verzinsung)

• Finanzmarkte (Aktien- und Wechselkursanderungen)

• Modelle der Wachstums- und Konjunkturtheorie

170

Page 175: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

5.3 Indexzahlen

Bisher:

• Zeitliche Entwicklung einer okonomischen Große uber Mess-zahlen

Jetzt:

• Zeitliche Entwicklung mehrerer Großen gleichzeitig

171

Page 176: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiele:

• Preisentwicklung fur Guter des privaten Konsums

Problem:Preise einiger Guter steigen, Preise anderer Guter fallen

−→ Aggregation aller Messzahlen zu einer Indexzahl (Index)

• Aktienindizes (DAX, Dow Jones, Euro Stoxx)

Aggregation von Kursen verschiedener Aktien zu einemAktienkorb

Ziel:Darstellung der Entwicklung des Gesamtmarktes

172

Page 177: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Voraussetzungen und Notationen:

• Betrachte einen Warenkorb (Kollektion von Gutern)

• Jedes Gut des Korbes hat einen Preis und eine Menge

• n: Anzahl der Guter im Warenkorb

• pt(i): Preis des Gutes i zur Zeit t

• qt(i): Menge des Gutes i zur Zeit t

• vt(i) = pt(i) · qt(i): Wert des Gutes i zur Zeit t

173

Page 178: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Benennungen:

• Preise: GeldeinheitenMengeneinheit (z.B. 1 Euro / Liter)

• Mengen: Mengeneinheiten

• Wert: Geldeinheiten

Betrachtung zweier Zeitpunkte:

• Berichtszeit (notiert mit t)

• Basiszeit (Setzung auf 0)

174

Page 179: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Generelles Ziel:

• Beschreibung der Veranderungen von Preisen, Mengen undWerten des gesamten Warenkorbes zwischen der Berichtszeitt und dem Basiszeitpunkt 0

Zunachst fur einzelnes Gut i (i = 1, . . . , n):

• pt(i)p0(i)

: Preismesszahl fur das Gut i

• qt(i)q0(i)

: Mengenmesszahl fur das Gut i

• vt(i)v0(i)

: Wertmesszahl fur das Gut i

175

Page 180: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Offensichtlich:

vt(i)v0(i)

=pt(i) · qt(i)p0(i) · q0(i)

=pt(i)p0(i)

·qt(i)q0(i)

(Wertmesszahl = Preismesszahl × Mengenmesszahl)

Bisher:

• Anderungen des Warenkorbes durch 3 · n Messzahlen

Jetzt:

• Aggregation einzelner Messzahlen zu Indexzahlen

176

Page 181: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

5.3.1 Preisindizes

Ziel:

• Indexzahlen zur Messung der Preisentwicklung

Definition 5.8: (Laspeyres-Preisindex)

Die Mittelwertform des Preisindexes vom Typ Laspeyres ist defi-niert durch

IpLa;0,t =

n∑

i=1

pt(i)p0(i)

·p0(i) · q0(i)

∑nj=1 p0(j) · q0(j)

.

177

Page 182: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bemerkungen: [I]

• In seiner Mittelwertform ist der Preisindex IpLa;0,t ein gewo-

genes arithmetisches Mittel der Preismesszahlen

pt(i)p0(i)

, i = 1, . . . , n.

• Die Gewichtep0(i) · q0(i)

∑nj=1 p0(j) · q0(j)

sind die Ausgabenanteile fur jedes einzelne Gut i zum Ba-siszeitpunkt 0

178

Page 183: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bemerkungen: [II]

• Durch Kurzen von p0(i) ergibt sich die Aggregatform desLaspeyres-Indexes:

IpLa;0,t =

∑ni=1 pt(i) · q0(i)

∑ni=1 p0(i) · q0(i)

Definition 5.9: (Paasche-Preisindex)

Die Mittelwertform des Preisindexes vom Typ Paasche ist definiertdurch

IpPa;0,t =

1n

i=1

1pt(i)p0(i)

·pt(i) · qt(i)

∑nj=1 pt(j) · qt(j)

.

179

Page 184: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bemerkungen: [I]

• In seiner Mittelwertform ist der Preisindex IpPa;0,t ein gewo-

genes harmonisches Mittel der Preismesszahlen

pt(i)p0(i)

, i = 1, . . . , n.

• Die Gewichtept(i) · qt(i)

∑nj=1 pt(j) · qt(j)

sind die Ausgabenanteile fur jedes einzelne Gut i zum Bericht-szeitpunkt t

180

Page 185: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bemerkungen: [II]

• Durch Umformung des Doppelbruchs ergibt sich die Aggre-gatform des Paasche-Indexes:

IpPa;0,t =

∑ni=1 pt(i) · qt(i)

∑ni=1 p0(i) · qt(i)

Beispiel: [I]

• Warenkorb mit n = 3 Gutern

Gut Basiszeit t = 0 Berichtszeit t = 1i p0(i) q0(i) p1(i) q1(i)1 14.30 2.20 14.70 1.802 1.19 8.00 1.05 18.003 0.94 18.00 0.99 14.00

181

Page 186: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiel: [II]

• Arbeitstabelle zur Indexberechnung in Aggregatform

i p1(i) · q0(i) p0(i) · q0(i) p1(i) · q1(i) p0(i) · q1(i)1 32.34 31.46 26.46 25.742 8.40 9.52 18.90 21.423 17.82 16.92 13.86 13.16∑

58.56 57.90 59.22 60.32

• Berechnung der Indizes:

IpLa,0,t =

58.5657.90

= 1.0114, IpPa,0,t =

59.2260.32

= 0.9818

182

Page 187: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Offensichtliches Dilemma:

• Laspeyres-Index zeigt Preiserhohung an, Paasche-Index dage-gen Preissenkung

Frage:

• Wie hangen die beiden Indizes zusammen?

183

Page 188: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Mathematisches Resultat:

• Es gilt

IpPa,0,t < Ip

La,0,t

genau dann, wenn die beiden Folgen der Preis- und Mengen-messzahlen (fur i = 1, . . . , n)

pt(i)p0(i)

undqt(i)q0(i)

’negativ korreliert’ sind(Zum Begriff der Korrelation, vgl. Kapitel 6)

Jetzt:

• Ein letzter Preis-Index-Typ

184

Page 189: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Definition 5.10: (Fisher-Preisindex)

Der Preisindex vom Typ Fisher ist definiert durch

IpF i;0,t =

IpLa;0,t · I

pPa;0,t.

Bemerkungen:

• Fisher-Index ist geometrisches Mittel aus Laspeyres- undPaasche-Index

• Es gilt:

min{

IpLa;0,t, I

pPa;0,t

}

≤ IpF i;0,t ≤ max

{

IpLa;0,t, I

pPa;0,t

}

• Fur das obige Warenkorbbeispiel gilt:

IpF i;0,t =

√1.0114 · 0.9818 = 0.9965

(Preisreduktion des Warenkorbes um 0.35%)

185

Page 190: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

5.3.2 Mengenindizes

Jetzt:

• Ubertragung des Konzeptes der Preisindizes auf Mengenin-dizes durch einfache Vertauschung der Rollen von Preisenund Mengen

186

Page 191: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Definition 5.11: (Mengenindizes)

Die Mittelwert- bzw. Aggregatformen des(a) Mengenindexes nach Laspeyres sind definiert durch

IqLa;0,t =

n∑

i=1

qt(i)q0(i)

·p0(i) · q0(i)

∑nj=1 p0(j) · q0(j)

=∑n

i=1 qt(i) · p0(i)∑n

i=1 q0(i) · p0(i),

(b) Mengenindexes nach Paasche sind definiert durch

IqPa;0,t =

1n

i=1

1qt(i)q0(i)

·pt(i) · qt(i)

∑nj=1 pt(j) · qt(j)

=∑n

i=1 qt(i) · pt(i)∑n

i=1 q0(i) · pt(i).

(c) Der Mengenindex nach Fisher ist definiert durch

IqF i;0,t =

IqLa;0,t · I

qPa;0,t.

187

Page 192: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

5.3.3 Wertindizes

(Kanonische) Definition eines Wertindexes:

• Man beachte hierbei, dass die Werte des Warenkorbes zu denZeitpunkten 0 bzw. t gegeben sind durch

n∑

i=1v0(i) =

n∑

i=1p0(i) · q0(i) bzw.

n∑

i=1vt(i) =

n∑

i=1pt(i) · qt(i)

Definition 5.12: (Wertindex)

Ein geeigneter Wertindex ist in naturlicher Weise definiert durch

Iv0,t =

∑ni=1 vt(i)

∑ni=1 v0(i)

=∑n

i=1 pt(i) · qt(i)∑n

i=1 p0(i) · q0(i).

188

Page 193: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bemerkungen:• Strukturell analog zu den Preis- und Mengenindizes konnte

man Wertindizes vom Typ Laspeyeres, Paasche bzw.Fisher definieren als

IvLa;0,t =

n∑

i=1

vt(i)v0(i)

·v0(i)

∑nj=1 v0(j)

IvPa;0,t =

1n

i=1

1vt(i)v0(i)

·vt(i)

∑nj=1 vt(j)

IvF i;0,t =

IvLa;0,t · I

vPa;0,t

• Man uberpruft leicht, dass gilt:

IvLa;0,t = Iv

Pa;0,t = IvF i;0,t = Iv

0,t

189

Page 194: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

5.3.4 Umbasierung und Verkettung von Indizes

Jetzt:

• Umbasierung und Verkettung beliebiger Indizes (Preis, Menge,Wert) in Analogie zur Umbasierung und Verkettung von Mess-zahlen(vgl. Folien 158, 159)

190

Page 195: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Definition 5.13: (Umbasierung von Indizes)

Gegeben sei eine Folge von Indizes zur Basiszeit s:

I∗s,t, t = t0, t1, . . . , tT .

Eine Folge von Indizes Ir,t zu einer alternativen Basiszeit r ∈{t0, t1, . . . , tT}, r 6= s, erhalt man durch

Ir,t =I∗s,tI∗s,r

, t = t0, t1, . . . , tT .

191

Page 196: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Definition 5.14: (Verkettung von Indizes)

Gegeben seien zwei Folgen von Indizes zu aquidistanten Zeiten:

I∗0,t fur t = 0,1, . . . , s,

I∗∗s,t fur t = s, s + 1, . . . , T.

Als verkettete Folge zur Basiszeit 0 verwendet man

I0,t =

{

I∗0,t fur t = 0,1, . . . , sI∗0,s · I

∗∗s,t fur t = s + 1, . . . , T

.

Durch Umbasierung der Indizes I∗0,t erhalt man die verketteteFolge zur Basiszeit s:

Is,t =

I∗0,tI∗0,s

fur t = 0,1, . . . , s− 1

I∗∗s,t fur t = s, s + 1, . . . , T.

192

Page 197: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Problem:

• Umbasierung und Verkettung von Indizes ist im allgemeinennicht typerhaltend

Beispiel: [I]

• Umbasierung des Laspeyres-Preisindexes IpLa;91,t vom Basiszeit-

punkt 91 auf Basiszeitpunkt 95

193

Page 198: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiel: [II]

• Fur den Berichtszeitpunkt t = 96 ergibt sich:

I95,96 =IpLa;91,96

IpLa;91,95

=

∑ni=1 p96(i) · q91(i)

∑ni=1 p91(i) · q91(i)

∑ni=1 p95(i) · q91(i)

∑ni=1 p91(i) · q91(i)

=∑n

i=1 p96(i) · q91(i)∑n

i=1 p95(i) · q91(i)

6=∑n

i=1 p96(i) · q95(i)∑n

i=1 p95(i) · q95(i)= Ip

La;95,96

194

Page 199: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

5.3.5 Formale Indexkriterien (Fisher-Proben)

Offensichtlich:

• Es gibt mehrere Indizes fur ein Messproblem

Frage:

• Welcher Index ist der ’beste’?

Losungsmoglichkeit:

• Postuliere ’sinnvolle’ Kriterien, die ein Index erfullen sollte

195

Page 200: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Vorschlag von I. Fisher (1922): [I]

• Ein Index Is,t (zur Basiszeit s und Berichtszeit t) sollte diefolgenden 7 Kriterien erfullen:

(1) Identitatsprobe

It,t = 1

(2) Zeitumkehrprobe

It,0 =1

I0,t

(3) Rundprobe (fur die Zeitpunkte t1, t2, . . . , tT )

It1,tT = It1,t2 · It2,t3 · . . . · ItT−1,tT

196

Page 201: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Vorschlag von I. Fisher (1922): [II](4) Faktorumkehrprobe

Iv0,t = Ip

0,t · Iq0,t

(5) Proportionalitatsprobe

Ip0,t = 1 + α,

wenn alle Preise um α · 100% steigen

(6) DimensionswechselsprobeDer Wert der Indizes hangt nicht davon ab, in welchen Ein-heiten Preise und Mengen gemessen werden

(7) BestimmtheitsprobeDer Index soll auch dann bestimmt sein, wenn einzelne Preiseoder Mengen gleich 0 sind

197

Page 202: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Frage:

• Welche Kriterien (Fisherproben) erfullen die alternativen In-dizes vom Typ Laspeyres, Paasche, Fisher?

Fisherprobe Laspeyres Paasche FisherIdentitatsprobe + + +Zeitumkehrprobe − − +Rundprobe − − −Faktorumkehrprobe − − +Proportionalitatsprobe + + +Dimensionswechselprobe + + +Bestimmtheitsprobe + + +

Fazit:

• Der Fisher-Index erfullt die meisten, aber auch nicht alle Kri-terien (6 von 7)

198

Page 203: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

6. Auswertung mehrdimensionaler Daten

Bisher:

• Auswertungsmethoden fur Daten eines einzelnen Merkmals,z.B.

Diskrete Klassierung

Grafische Darstellungen (Verteilungsfunktion)

Lagemaße

Streungsmaße

Schiefemaße

199

Page 204: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Jetzt:

• Methoden zur Auswertung von Daten uber mehrere Merk-male gleichzeitig(mehrdimensionale oder multivariate Daten)

Ziele:

• Simultane Beschreibung durch Tabellen und Grafiken

• Mehrdimensionale Messung von Lage und Streuung

• Aufdecken von Beziehungen zwischen den Merkmalen(Korrelationen)

200

Page 205: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

6.1 Grundbegriffe

Ausgangssituation: [I]

• n Merkmalstrager e1, e2, . . . , en

• Grundgesamtheit: G = {e1, e2, . . . , en}

• 2 Merkmale X und Y , die jeweils am Merkmalstrager ei, i =1, . . . , n, beobachtet werden konnen

201

Page 206: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Ausgangssituation: [II]

• Urliste lautet dann:

(x1, y1), (x2, y2), . . . , (xn, yn)

oder in Matrix-Schreibweise

x1 y1x2 y2... ...

xn yn

(n× 2 Matrix)

202

Page 207: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiel: [I]

• Ausgaben fur Werbung und Absatze von 84 Unternehmen inden USA im Jahr 1990

• Merkmale

X: Ausgaben fur Werbung (in Mill. US-$)

Y : Absatz (in Mill. US-$)

203

Page 208: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiel: [II]

• Datensatz:

i Werbeausgaben (X) Absatze (Y)1 11.22487 508.83022 31.08904 517.04253 70.32822 524.7197... ... ...

82 31.50510 502.037883 55.39850 515.297684 48.43819 501.1283

• Falls X und Y metrisch skaliert sind (wie hier), kann man dien Datenpunkte (x1, y1), . . . , (xn, yn) in einem Streudiagrammdarstellen

204

Page 209: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Streudiagramm ’Werbeausgaben gegen Absatzzahlen’

205

480

500

520

540

560

0 20 40 60 80 100

Werbeausgaben in Mill. US-$ (X)

Abs

atz

in M

ill.

US-

$ (Y

)

Page 210: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Jetzt:

• Betrachte p ≥ 2 Merkmale X1, . . . , Xp mit Beobachtungen(xi1, xi2, . . . , xip) fur die Untersuchungseinheit ei−→ Urliste bzw. n× p Datenmatrix:

(x11, x12, . . . , x1p), (x21, x22, . . . , x2p), . . . , (xn1, xn2, . . . , xnp)

x11 x12 . . . x1px21 x22 . . . x2p... ... . . . ...

xn1 xn2 . . . xnp

206

Page 211: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

6.1.1 Kontingenztafel und Haufigkeiten

Gegeben:

• 2 Merkmale X und Y

• n× 2 Datenmatrix

x1 y1x2 y2... ...

xn yn

bzw. Urliste mit n Zahlenpaaren

(xi, yi), i = 1, . . . , n,

207

Page 212: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Ziel:

• Beschreibung von absoluten und relativen Haufigkeiten

Notation:

• ξ1, . . . , ξJ seien die J moglichen Werte von X

• η1, . . . , ηK seien die K moglichen Werte von Y

208

Page 213: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Definition 6.1: (Gemeinsame und Randhaufigkeiten) [I]

Fur jedes j = 1, . . . , J und k = 1, . . . , K versteht man

1. unter der gemeinsamen absoluten Haufigkeit die Anzahl njkaller Datenpaare (xi, yi) fur die gilt xi = ξj und yi = ηk.

2. unter den absoluten Randhaufigkeiten der X-Auspragung ξjbzw. der Y -Auspragung ηk die Summen

nj· =K∑

k=1njk bzw. n·k =

J∑

j=1njk.

209

Page 214: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Definition 6.1: (Gemeinsame und Randhaufigkeiten) [II]

3. Die gemeinsamen absoluten Haufigkeiten zusammen mit denabsoluten Randhaufigkeiten stellt man ubersichtlich in derfolgenden Haufigkeitstabelle dar, die man Kontingenztafeloder Kontingenztabelle nennt:

Y =η1 η2 . . . ηK−1 ηK∑

ξ1 n11 n12 . . . n1(K−1) n1K n1·ξ2 n21 n22 . . . n2(K−1) n2K n2·

X = ... ... ... ... ... ...ξJ−1 n(J−1)1 n(J−1)2 . . . n(J−1)(K−1) n(J−1)K n(J−1)·

ξJ nJ1 nJ2 . . . nJ(K−1) nJK nJ ·∑

n·1 n·2 . . . n·(K−1) n·K n

210

Page 215: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiel: [I]

• Erhebung folgender Merkmale bei n = 1000 Personen:

Berufszugehorigkeit X

Ausmaß sportlicher Betatigung Y

211

Page 216: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiel: [II]

• Kontingenztabelle:

Y (sportliche Betatigung)X (Berufsgruppe) nie gelegentlich regelmaßig

Arbeiter 240 120 70 430Angestellte 160 90 90 340Beamte 30 30 30 90Landwirte 37 7 6 50sonstige 40 32 18 90∑

507 279 214 1000

• Offensichtlich:Aus gemeinsamen Haufigkeiten lassen sich Randhaufigkeiteneindeutig bestimmen(Umkehrung gilt nicht!)

212

Page 217: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Definition 6.2: (Relative Haufigkeiten, Randverteilung)

Fur jedes j = 1, . . . , J und k = 1, . . . , K heißen

1. fjk =njkn die gemeinsame relative Haufigkeit von ξj und ηk,

2. fj· =∑K

k=1 fjk bzw. f·k =∑J

j=1 fjk die relative Randhaufigkeitvon ξj bzw. ηk.

3. Die relativen Randhaufigkeiten f1·, f2·, . . . , fJ · der Werte vonX nennt man die Randverteilung des Merkmals X. Entspre-chend bilden die relativen Randhaufigkeiten f·1, f·2, . . . , f·K dieRandverteilung des Merkmals Y .

213

Page 218: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Kontingenztafel mit relativen Haufigkeiten:

Y =η1 η2 . . . ηK−1 ηK∑

ξ1 f11 f12 . . . f1(K−1) f1K f1·ξ2 f21 f22 . . . f2(K−1) f2K f2·

X = ... ... ... ... ... ...ξJ−1 f(J−1)1 f(J−1)2 . . . f(J−1)(K−1) f(J−1)K f(J−1)·

ξJ fJ1 fJ2 . . . fJ(K−1) fJK fJ ·∑

f·1 f·2 . . . f·(K−1) f·K 1

214

Page 219: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bemerkung:

• Offensichtlich gilt:

J∑

j=1

K∑

k=1fjk =

J∑

j=1fj· =

K∑

k=1f·k = 1

(Die Summe uber den relativen Randhaufigkeiten eines jedenMerkmals ist 1)

215

Page 220: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Kontingenztabelle mit relativen Haufigkeiten fur das obige Beispiel:

Y (sportliche Betatigung)X (Berufsgruppe) nie gelegentlich regelmaßig

Arbeiter 0.240 0.120 0.070 0.430Angestellte 0.160 0.090 0.090 0.340Beamte 0.030 0.030 0.030 0.090Landwirte 0.037 0.007 0.006 0.050sonstige 0.040 0.032 0.018 0.090∑

0.507 0.279 0.214 1.000

216

Page 221: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

6.1.2 Bedingte Verteilungen

Jetzt:

• Weiteres wichtiges Konzept der mehrdimensionalen Daten-analyse

Definition 6.3: (Bedingte relative Haufigkeiten)

Fur ein festes k ∈ {1, . . . , K} sowie fur jedes j = 1, . . . , J nenntman die Große

fj|Y =ηk=

fjk

f·kdie bedingte relative Haufigkeit von ξj unter der Bedingung Y =ηk.

217

Page 222: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bemerkung:

• Die bedingte relative Haufigkeit fj|Y =ηkist die relative Haufigkeit

der X-Auspragung ξj in der Teilgesamtheit aller derjenigenEinheiten, welche die Y -Auspragung ηk aufweisen, denn

fj|Y =ηk=

fjk

f·k=

njk

nn·kn

=njk

n·k

Definition 6.4: (Bedingte Verteilung)

Gemaß Definition 6.3 kann man insgesamt J bedingte relativeHaufigkeiten betrachten:

f1|Y =ηk, f2|Y =ηk

, . . . , fJ |Y =ηk.

Die Gesamtheit dieser J Werte heißt die bedingte Verteilung vonX unter (der Bedingung) Y = ηk.

218

Page 223: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bemerkungen: [I]

• Analog zu Definition 6.3 definiere fur ein festes j ∈ {1, . . . , J}sowie fur beliebige k = 1, . . . , K

fk|X=ξj=

fjk

fj·.

Diese Große heißt bedingte relative Haufigkeit von ηk unter(der Bedingung) X = ξj.

• Analog zu Definition 6.4 heißt

f1|X=ξj, f2|X=ξj

, . . . , fK|X=ξj

die bedingte Verteilung von Y unter X = ξj

219

Page 224: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bemerkungen: [II]

• Offensichtlich gilt:

J∑

j=1fj|Y =ηk

=J

j=1

njk

n·k= 1 fur jedes k = 1, . . . , K

K∑

k=1fk|X=ξj

=K∑

k=1

njk

nj·= 1 fur jedes j = 1, . . . , J

220

Page 225: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiel: (Berufsgruppe ←→ Sport, vgl. Folien 211 ff.)

Gesucht: [I]

• Verteilung der sportlichen Aktivitat bei Arbeiternoder statistisch ausgedruckt:Die bedingte Verteilung von Y unter X = ξ1

f1|X=ξ1 =n11

n1·=

240430

= 0.558 (nie)

f2|X=ξ1 =n12

n1·=

120430

= 0.279 (gelegentlich)

f3|X=ξ1 =n13

n1·=

70430

= 0.163 (regelmaßig)

221

Page 226: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Gesucht: [II]

• Verteilung der Berufsgruppen bei regelmaßig Aktivenoder statistisch ausgedruckt:Die bedingte Verteilung von X unter Y = η3

f1|Y =η3=

70214

= 0.327 (Arbeiter)

f2|Y =η3=

90214

= 0.421 (Angestellte)

f3|Y =η3=

30214

= 0.140 (Beamte)

f4|Y =η3=

6214

= 0.028 (Landwirte)

f5|Y =η3=

18214

= 0.084 (sonstige)

222

Page 227: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

6.1.3 Deskriptive Unabhangigkeit

Jetzt:

• Frage nach dem Zusammenhang zwischen X und Y

Definition 6.5: (Deskriptive Unabhangigkeit)

Die Merkmale X und Y heißen deskriptiv unabhangig, falls sichfur alle j = 1, . . . , J und fur alle k = 1, . . . , K die gemeinsamenrelativen Haufigkeiten als Produkt der relativen Randhaufigkeitenergeben, d.h. falls gilt

fjk = fj· · f·k.

223

Page 228: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiel: (Geschlecht (X) ←→ gewahlte Partei (Y ))

Kontingenztafel mit absoluten Haufigkeiten:

Y (Partei)X (Geschlecht) A B C

mannlich 200 120 80 400weiblich 300 180 120 600

500 300 200 1000

224

Page 229: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Kontingenztafel mit relativen Haufigkeiten:

Y (Partei)X (Geschlecht) A B C

mannlich 0.20 0.12 0.08 0.40weiblich 0.30 0.18 0.12 0.60

0.50 0.30 0.20 1.00

f11 = 0.20 = 0.40 · 0.50 = f1· · f·1f12 = 0.12 = 0.40 · 0.30 = f1· · f·2f13 = 0.08 = 0.40 · 0.20 = f1· · f·3f21 = 0.30 = 0.60 · 0.50 = f2· · f·1f22 = 0.18 = 0.60 · 0.30 = f2· · f·2f23 = 0.12 = 0.60 · 0.20 = f2· · f·3

Fazit: X und Y sind deskriptiv unabhangig225

Page 230: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Betrachte nun:

• Bedingte Verteilungen von X unter Y = η1, Y = η2, Y = η3

• Bedingte Verteilungen von Y unter X = ξ1, X = ξ2

Bedingte Verteilungen von X: [I]

• unter Y = η1:

f1|Y =η1=

f11

f·1=

0.200.50

= 0.40

f2|Y =η1=

f21

f·1=

0.300.50

= 0.60

226

Page 231: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bedingte Verteilungen von X: [II]

• unter Y = η2:

f1|Y =η2=

f12

f·2=

0.120.30

= 0.40

f2|Y =η2=

f22

f·2=

0.180.30

= 0.60

• unter Y = η3:

f1|Y =η3=

f13

f·3=

0.080.20

= 0.40

f2|Y =η3=

f23

f·3=

0.120.20

= 0.60

227

Page 232: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Offensichtlich:

• Bedingte Verteilungen von X unter Y = η1, Y = η2, Y = η3sind alle gleich

• Man uberpruft leicht, dass die bedingten Verteilungen von Yunter X = ξ1, X = ξ2 ebenfalls beide gleich sind

228

Page 233: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Allgemein gilt:X und Y sind genau dann deskriptiv unabhangig, sobald eine derfolgenden aquivalenten Bedingungen erfullt ist:

• Fur alle j = 1, . . . , J und alle k = 1, . . . , K gilt:

fjk = fj· · f·k (= Definition 6.5)

• Fur alle j = 1, . . . , J und alle k = 1, . . . , K gilt:

njk =nj· · n·k

n

• Fur alle j = 1, . . . , J gilt:

fj|Y =η1= fj|Y =η2

= . . . = fj|Y =ηK= fj·

• Fur alle k = 1, . . . , K gilt:

fk|X=ξ1 = fk|X=ξ2 = . . . = fk|X=ξJ= f·k

229

Page 234: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

6.1.4 Arithmetische Mittel und Varianzen

Annahmen:

• X und Y sind metrisch skaliert(sinnvolle Arithmetik)

• Daten liegen in Kontingenztafeln vor(absolute oder relative Haufigkeiten)

230

Page 235: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Jetzt:

• Ubertragung von Mittelwert und Varianz auf mehrdimension-ale Daten

−→ Mittelwert- und Varianzbildung uber Rand- bzw. bedingteVerteilungen

Definition 6.6: (Arithmetische Mittel)

Die arithmetischen Mittel von X und Y sind definiert als diearithmetischen Mittel der jeweiligen Randverteilung:

x =1n

J∑

j=1ξj · nj· =

J∑

j=1ξj · fj·,

y =1n

K∑

k=1ηk · n·k =

K∑

k=1ηk · f·k.

231

Page 236: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bemerkung:

• In mehrdimensionalen Datensatzen sind die arithmetischenMittel einzelner Merkmale einfach die Mittelwerte der einzel-nen Datenreihen

Definition 6.7: (Bedingte arithmetische Mittel)

Das bedingte arithmetische Mittel von X unter Y = ηk (k fest)sowie das bedingte arithmetische Mittel von Y unter X = ξj(j fest) sind jeweils definiert als die arithmetischen Mittel derentsprechenden bedingten Verteilungen von X und Y :

xk =1

n·k

J∑

j=1ξj · njk =

J∑

j=1ξj · fj|Y =ηk

,

yj =1

nj·

K∑

k=1ηk · njk =

K∑

k=1ηk · fk|X=ξj

.

232

Page 237: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bemerkungen:

• Sind X und Y deskriptiv unabhangig, so stimmen samtlichebedingte Verteilungen von X mit der Randverteilung von Xuberein (vgl. Folie 229). Da das bedingte arithmetische Mit-tel von X unter Y = ηk der Mittelwert der entsprechendenbedingten Verteilung von X ist, stimmt im Fall der deskrip-tiven Unabhangigkeit fur jedes k der bedingte Mittelwert xkmit dem gewohnlichen Mittelwert uberein:

x1 = x2 = . . . = xK = x

• Analog gilt im Fall der deskriptiven Unabhangigkeit fur diebedingten Mittelwerte von Y :

y1 = y2 = . . . = yJ = y

233

Page 238: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Jetzt:

• Definition von Varianzen und bedingten Varianzen von X undY

Definition 6.8: (Varianz)

Die Varianzen von X und Y sind definiert als die Varianzen derjeweiligen Randverteilungen, d.h.

s2X =1n

J∑

j=1

(

ξj − x)2· nj· =

1n

J∑

j=1ξ2j · nj· − x2,

s2Y =1n

K∑

k=1(ηk − y)2 · n·k =

1n

K∑

k=1η2k · n·k − y2.

234

Page 239: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bemerkung:

• In mehrdimensionalen Datensatzen sind die Varianzen dereinzelnen Merkmale einfach die Varianzen der einzelnen Daten-reihen

Definition 6.9: (Bedingte Varianz)

Die bedingte Varianz von X unter Y = ηk (k fest) sowie diebedingte Varianz von Y unter X = ξj (j fest) sind definiert alsdie Varianzen der entsprechenden bedingten Verteilungen von Xund Y :

s2X|Y =ηk=

J∑

j=1

(

ξj − xk)2·njk

n·k=

J∑

j=1ξ2j ·

njk

n·k− x2

k,

s2Y |X=ξj=

K∑

k=1

(

ηk − yj)2·njk

nj·=

K∑

k=1η2k ·

njk

nj·− y2

j .

235

Page 240: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bemerkungen:

• Sind X und Y deskriptiv unabhangig, so stimmen samtlichebedingte Verteilungen von X mit der Randverteilung von Xuberein (vgl. Folie 229). Da die bedingte Varianz von X unterY = ηk die Varianz der entsprechenden bedingten Verteilungvon X ist, stimmt im Fall der deskriptiven Unabhangigkeit furjedes k die bedingte Varianz s2X|Y =ηk

mit der gewohnlichenVarianz uberein:

s2X|Y =η1= s2X|Y =η2

= . . . = s2X|Y =ηK= s2X

• Analog gilt im Fall der deskriptiven Unabhangigkeit fur diebedingten Varianzen von Y :

s2Y |X=ξ1= s2Y |X=ξ2

= . . . = s2Y |X=ξJ= s2Y

236

Page 241: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiel: (Wohnraum)

• Betrachte n = 1000 Wohnungen

• Merkmale:

X: Anzahl der Wohnraume pro Wohnung

Y : Anzahl der Personen pro Wohnung

237

Page 242: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Y = 1 Y = 2 Y = 3 Y = 4 Y = 5∑

X = 1 200 40 0 0 0 240X = 2 200 100 30 10 0 340X = 3 80 40 100 60 10 290X = 4 20 15 10 20 20 85X = 5 0 5 10 10 20 45

500 200 150 100 50 1000

Berechnung von (bedingten) Mittelwerten und Varianzen

• Im Proseminar

238

Page 243: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

6.2 Zusammenhangsmaße

Gegeben:

• Zwei Merkmale X und Y mit Urliste der Lange n

Gesucht:

• Maßzahl fur den Zusammenhang zwischen X und Y

239

Page 244: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiele:

• Zusammenhang zwischen Korpergroße (X) und Korperge-wicht (Y )

• Zusammenhang zwischen Inflationsrate (X) und Arbeitslo-senquote (Y )(Phillips-Kurve)

• Zusammenhang zwischen Arbeitslosigkeit (X) und Wirt-schaftswachstum (Y )(Okunsches Gesetz)

240

Page 245: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Wichtiges Charakteristikum:

• Datenniveau von X und Y

Metrische Skalierung

Ordinale Skalierung

Nominale Skalierung

241

Page 246: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

6.2.1 Metrische Daten: Korrelationskoeffizient

Situation:

• X und Y sind metrisch skaliert

• Urliste: (x1, y1), . . . , (xn, yn)

Frage:

• Wie hangen X und Y zusammen?

242

Page 247: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Zunachst:

• Betrachte fur ein festes i ∈ {1, . . . , n} die Große

T1 = (xi − x) · (yi − y)

Offensichtlich gilt:

• T1 > 0

=⇒ xi und yi sind beide jeweils großer oder beide jeweils kleinerals ihre Mittelwerte

• T1 < 0

=⇒ xi und yi verhalten sich jeweils umgekehrt bzgl. ihrer Lagezum jeweiligen Mittelwert

243

Page 248: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Jetzt:

• Summenbildung uber alle Daten

T2 =n

i=1(xi − x) · (yi − y)

• T2 � 0:

=⇒ Die positiven Summanden in T2 uberwiegen die negativenerheblich. Zu ’hohen’ bzw. ’niedrigen’ xi gehoren tenden-ziell ’hohe’ bzw. ’niedrige’ yi(positiver Zusammenhang)

244

Page 249: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Summenbildung uber alle Daten: [II]

• T2 � 0:

=⇒ Die negativen Summanden in T2 uberwiegen die positivenerheblich. Zu ’hohen’ bzw. ’niedrigen’ xi gehoren tenden-ziell nun ’niedrige’ bzw. ’hohe’ yi(negativer Zusammenhang)

• T2 ≈ 0:

=⇒ Positive und negative Summanden in T2 heben sich ten-denziell auf. Zu ’hohen’ (’niedrigen’) xi gehoren nunsowohl ’niedrige’ als auch ’hohe’ yi(kein Zusammenhang)

245

Page 250: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Definition 6.10: (Kovarianz)

Die Kovarianz zwischen X und Y ist definiert durch

sXY =1n

n∑

i=1(xi − x) · (yi − y) =

1n

n∑

i=1xi · yi − x · y.

Bemerkungen: [I]

• Die Kovarianz sXY ist ’symmetrisch’, d.h.

sXY = sY X

246

Page 251: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bemerkungen: [II]

• Die Kovarianz eines Merkmals mit sich selbst ist gleich derVarianz des Merkmals:

sXX =1n

n∑

i=1(xi − x)2 = s2X

• Liegt die Datenurliste in Form einer Haufigkeitstabelle vor,so ist die Kovarianz gegeben durch

sXY =1n

J∑

j=1

K∑

k=1

(

ξj − x)

· (ηk − y) · njk

=1n

J∑

j=1

K∑

k=1ξj · ηk · njk − x · y

247

Page 252: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Jetzt:

• Normierung der Kovarianz sXY durch Division durch das Pro-dukt der Standardabweichungen von X und Y

248

Page 253: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Definition 6.11: (Korrelationskoeffizient von Bravais-Pearson)

Der Korrelationskoeffizient zwischen X und Y ist definiert durch

rXY =sXY

s2X ·√

s2Y=

n∑

i=1(xi − x) · (yi − y)

n∑

i=1(xi − x)2 ·

n∑

i=1(yi − y)2

=

n∑

i=1xi · yi − n · x · y

n∑

i=1x2

i − n · x2 ·

n∑

i=1y2i − n · y2

.

249

Page 254: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bemerkungen: [I]

• Der Korrelationskoeffizient rXY ist ’symmetrisch’:

rXY = rY X

• Der Korrelationskoeffizient ist normiert, d.h. es gilt immer

−1 ≤ rXY ≤ 1

• Wenn rXY = 0 ist, so sagt man:

’Die Merkmale X und Y sind unkorreliert’

250

Page 255: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bemerkungen: [II]

• Sind X und Y deskriptiv unabhangig, so gilt: rXY = 0(Deskrip. Unabhangigkeit impliziert Unkorreliertheit)

• Vorsicht:Die Umkehrung gilt im allgemeinen nicht(Unkorreliertheit (rXY = 0) impliziert nicht die deskriptiveUnabhangigkeit von X und Y )

• Ist rXY = 1 oder rXY = −1, so sagt man:

’Die Merkmale X und Y sind perfekt korreliert’

251

Page 256: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Zentrales Resultat:

• Es gilt rXY = 1 genau dann, wenn es Zahlen a > 0, b ∈ Rgibt, so dass yi = a · xi + b fur alle i = 1, . . . , n gilt

(Alle Daten liegen auf einer Geraden mit positiver Steigung)

• Es gilt rXY = −1 genau dann, wenn es Zahlen a < 0, b ∈ Rgibt, so dass yi = a · xi + b fur alle i = 1, . . . , n gilt

(Alle Daten liegen auf einer Geraden mit negativer Steigung)

252

Page 257: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Offensichtlich:

• Der Korrelationskoefizient rXY ist ein Maß fur den linearenZusammenhang zwischen X und Y

Vorsicht:

• rXY = 0 (bzw. rXY ≈ 0) bedeutet nur, dass kein (bzw. nurein schwacher) linearer Zusammenhang zwischen X und Ybesteht. Es konnen aber trotzdem starke andere (nicht-lineare) Zusammenhange zwischen X und Y bestehen

253

Page 258: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

-4

-2

0

2

4

6

-4 -2 0 2 4

X

Y

Korrelation zwischen X und Y: -0.008

-6

-4

-2

0

2

4

6

-4 -2 0 2 4

X

Y1

Korrelation zwischen X und Y1: 0.7020

-6

-4

-2

0

2

4

6

-4 -2 0 2 4

X

Y2

Korrelation zwischen X und Y 2: -0.7054

0

5

10

15

20

-4 -2 0 2 4

X

Y3

Korrelation zwischen X und Y3: 0.0225

Page 259: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Weitere Aspekte zur Korrelation: [I]

• Korrelation und Kausalitat

• Scheinkorrelation:Die zu untersuchenden Merkmale X und Y hangen beidevon einem 3. Merkmal Z ab, das nicht Gegenstand der Un-tersuchung ist. Ein hoher Wert fur rXY kann daher zus-tandekommen, weil sowohl X als auch Y von Z abhangen(indirekter Zusammenhang)

Beispiel:

X: Wortschatz eines KindesY : Korpergroße eines KindesZ: Alter eines Kindes

255

Page 260: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Weitere Aspekte zur Korrelation: [II]

• Nonsens-Korrelation:Hohe Korrelation zwischen vollig sachfremden Merkmalen Xund Y

Beispiel:

Hohe Korrelation zwischen (menschlicher) Geburtenrate(X) einer Region und deren Population von Klapperstor-chen (Y )

256

Page 261: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

6.2.2 Ordinale Daten: Rangkorrelationskoeffizient

Jetzt:

• X und Y sind ordinal skaliert

=⇒ Berechnung vonarithmetischem MittelVarianz und Kovarianz

nicht sinnvoll

Gesucht:

• Sinnvolles Korrelationsmaß fur ordinale Daten

257

Page 262: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Zunachst Zusatzannahme:

• Alle Daten eines Merkmals sind verschieden, d.h.

xi 6= xj und yi 6= yj fur alle i 6= j

Damit:

• Einfache Definition der Rangzahl einer Merkmalsauspragungxi bzw. yi

258

Page 263: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Definition 6.12: (Rangzahl eines Datenpunktes)

Gegeben seien die ungeordnete Urliste x1, . . . , xn sowie die geord-nete Urliste x(1) < x(2) < . . . < x(n) eines Merkmals X. Unter derRangzahl (kurz: Rang) eines Datenwertes xi, in Zeichen RX(xi),versteht man die Position, die xi in der geordneten Urliste ein-nimmt, d.h.

RX(xi) = r, falls xi = x(r).

259

Page 264: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Zahlenbeispiel:

• Ungeordnete Urliste

x1 x2 x3 x4 x5 x61 4 7 3 6 8

• Geordnete Urliste

x(1) x(2) x(3) x(4) x(5) x(6)(= x1) (= x4) (= x2) (= x5) (= x3) (= x6)

1 3 4 6 7 8

• Damit ergeben sich folgende Rangzahlen:

RX(x1) = 1, RX(x2) = 3, RX(x3) = 5,

RX(x4) = 2, RX(x5) = 4, RX(x6) = 6

260

Page 265: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Sinnvolles Korrelationsmaß fur ordinale Daten:

• Korrelationskoeffizient aus Definition 6.11 angewendet aufdie Range RX(xi) und RY (yi)

Definition 6.13: (Rangkorrelationskoeff. von Spearman)

Es bezeichnen RX und RY die arithmetischen Mittel der Rangzahlender Merkmale X und Y . Der Rangkorrelationskoeffizient zwis-chen X und Y ist definiert durch

rRXY =

n∑

i=1

(

RX(xi)−RX)

·(

RY (yi)−RY)

n∑

i=1

(

RX(xi)−RX)2·

n∑

i=1

(

RY (yi)−RY)2

.

261

Page 266: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Man beachte:

• Fur die arithmetischen Mittel RX und RY gilt:

RX = RY =1n

n∑

i=1i =

1n·n · (n + 1)

2=

n + 12

(vgl. Folie 27)

Hieraus folgt:

rRXY =

n∑

i=1

(

RX(xi)−n + 1

2

)

·(

RY (yi)−n + 1

2

)

n∑

i=1

(

RX(xi)−n + 1

2

)2·

n∑

i=1

(

RY (yi)−n + 1

2

)2

262

Page 267: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bemerkungen:

• Es gibt weitere, aquivalente Formeln fur rRXY , z.B.

rRXY =

n∑

i=1RX(xi) ·RY (yi)−

n · (n + 1)2

4√

n∑

i=1RX(xi)

2 −n · (n + 1)2

n∑

i=1RY (yi)

2 −n · (n + 1)2

4

• Sind alle xi und yi verschieden (wie hier zunachst angenom-men), so ergibt sich die vereinfachte Formel

rR,OBXY = 1−

6n

i=1[RX(xi)−RY (yi)]

2

n · (n2 − 1)

263

Page 268: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiel: (Schulnoten)

• 6 Schuler haben folgende Punktzahlen auf einer von 1 bis 10reichenden Ordinalskala fur Klausuren in Mathematik (X)und Physik (Y ) erreicht:

x1 x2 x3 x4 x5 x6 y1 y2 y3 y4 y5 y61 4 7 3 6 8 1 2 9 4 10 5

Es gilt:

rRXY = rR,OB

XY = 1−6 · 10

6 · (62 − 1)= 0.714

264

Page 269: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Wichtige Eigenschaften von rRXY : [I]

• rRXY ist symmetrisch, d.h. rR

XY = rRY X

• rRXY ist invariant gegenuber streng monoton wachsenden

Transformationen:

Sind f und g streng monoton wachsende Funktionen unduberfuhrt man die Ursprungsdaten (xi, yi) in

x′i = f(xi) und y′i = g(yi) fur alle i = 1, . . . , n

so gilt fur alle i:

RX ′(x′i) = RX(xi) RY ′(y′i) = RY (yi)

und damit

rRXY = rR

X ′Y ′

265

Page 270: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Wichtige Eigenschaften von rRXY : [II]

• rRXY ist normiert:

−1 ≤ rRXY ≤ 1

• Extremfalle:

rRXY = 1 ⇐⇒ RX(xi) = RY (yi) fur alle i = 1, . . . , n

(vollig gleich gerichteter monoton wachsender Zusammen-hang)

rRXY = −1 ⇐⇒ RX(xi) = n−RY (yi)+1 fur alle i = 1, . . . , n

(vollig gegenlaufiger monoton fallender Zusammenhang)

266

Page 271: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Jetzt:

• Berucksichtigung von Bindungen durch Anwendung der Meth-ode der Durchschnittsrange

Zahlenbeispiel: [I]

• Ungeordnete Urliste

x1 x2 x3 x43.7 3.9 3.1 3.7

267

Page 272: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Zahlenbeispiel: [II]

• Geordnete Urliste

x(1) x(2) x(3) x(4)(= x3) (= x1) (= x4) (= x2)3.1 3.7 3.7 3.9

• Vergabe von Rangen

RX(x3) = 1, RX(x1) = 2, RX(x4) = 3︸ ︷︷ ︸

(wegen x1 = x4 = 3.7)RX(x1) = 2.5, RX(x4) = 2.5

, RX(x2) = 4

268

Page 273: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bei Auftreten von Bindungen:

• Vergabe von Durchschnittsrangen sowohl fur die xi als auchdie yi

• Die vereinfachte Formel rR,OBXY (vgl. Folie 263) nicht mehr

zulassig

Stattdessen:

Anwendung der aquivalenten Formeln fur rRXY auf den

Folien 262, 263

269

Page 274: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

6.2.3 Nominale Daten: Kontingenzkoeffizient

Jetzt:

• X und Y sind nominal skaliert

• Daten in Kontingenztafel (absolute Haufigkeiten)

Geeignetes Zusammenhangsmaß:

• Der Kontingenzkoeffizient

270

Page 275: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Voruberlegung:

• X und Y sind deskriptiv unabhangig, wenn

njk =nj· · n·k

nfur alle j = 1, . . . , J und k = 1, . . . , K(vgl. Folie 229)

Abweichungsmaß von der deskriptiven Unabhangigkeit:

χ2 =J

j=1

K∑

k=1

(

njk −nj· · n·k

n

)2

nj· · n·kn

= n ·

J∑

j=1

K∑

k=1

n2jk

nj· · n·k− 1

271

Page 276: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bemerkung:

• Damit χ2 definiert ist, muss gelten: nj· > 0 und n·k > 0 furalle j und alle k. Ist einer der beiden Ausdrucke fur irgendeinj oder k gleich 0, so konnen die zugehorigen Merkmalswerteξj bzw. ηk aus der Kontingenztafel gestrichen werden

Jetzt:

• Normierung von χ2 liefert Kontingenzkoeffizient

272

Page 277: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Definition 6.14: (Kontingenzkoeffizient)

Als Zusammenhangsmaß zwischen den nominal skalierten Merk-malen X und Y verwendet man den Kontingenzkoeffizienten, derdefiniert ist als

CXY =

χ2

χ2 + n·

min{J, K}min{J, K} − 1

.

Bemerkung:

• Der Kontingenzkoeffizient CXY ist streng monoton wachsendin χ2 und normiert, d.h.

0 ≤ CXY ≤ 1

273

Page 278: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Zentrales Ergebnis:

• Der Kontingenzkoeffizient CXY wird genau dann gleich 0,wenn χ2 = 0 gilt, d.h. genau dann, wenn X und Y deskriptivunabhangig sind

Weitere Bemerkungen:

• Gilt CXY = 1, so spricht man von einem vollstandigen Zusam-menhang zwischen X und Y

• CXY misst nur die Starke des Zusammenhangs zwischen Xund Y , nicht jedoch die Richtung

• Jedoch misst CXY beliebige Zusammenhange, also nicht nurlineare (wie rXY ) oder monotone wie rR

XY

274

Page 279: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Zur praktischen Anwendung von rXY , rRXY , CXY :

• Unterschiedliche Datenniveaus von X und Y :

Wahle Zusammenhangsmaß fur das ’schwachste’ Daten-niveau der Variablen X und Y(vgl. Folie 276)

• Ermittlung des allgemeinen Zusammenhangs von X und Y :

Verwende CXY

275

Page 280: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Behandlung unterschiedlicher Datenniveaus:

Y Nominal Ordinal MetrischXNominal CXY CXY CXY

Ordinal CXY rRXY rR

XY

Metrisch CXY rRXY rXY

276

Page 281: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

6.3 Deskriptive Regression

Bedeutung des Begriffes ’Regression’:

• Untersuchung des Zusammenhangs zwischen einer abhangi-gen Variablen (auch Regressand oder endogene Variable) undeiner oder mehrerer unabhangiger Variablen (auch Regres-soren oder exogene Variablen)

Allgemeines mathematisches Modell:

Y = f(X1, X2, . . . , Xk; ~β) + u

277

Page 282: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bezeichnungen:

• Y : abhangige Variable, Regressand

• X: unabhangige Variablen, Regressoren

• f(·): funktionaler Zusammenhang

• ~β: unbekannter Parametervektor

• u: Fehler

278

Page 283: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Ziel der Regressionsrechnung:

• Moglichst ’genaue’ Aussagen uber den Zusammenhang zwis-chen Regressand und Regressor(en)

Beispiele: [I]

• Keynesianische Konsumfunktion

Y = a + b ·X + u

Y = privater Konsuma = autonomer Konsumb = marginale KonsumquoteX = verfugbares Einkommen

279

Page 284: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiele: [II]

• Zusammenhang zwischen Inflation und Geldmengenwachs-tum (Quantitatstheorie)

Y = a + b ·X + u

Y = InflationsrateX = Wachstumsrate der Geldmenge (M2)

• Zusammenhang zwischen Inflation und Arbeitslosigkeit (Phillip-skurve)

Y = a + b ·1X

+ u

Y = InflationsrateX = Arbeitslosenquote(Vorsicht: f ist eine Hyperbel, nicht-linear)

280

Page 285: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Hier:

• Nur lineare Funktionen, d.h.

Y = a + b ·X + u (vgl. Abschnitt 6.3.2)

281

Page 286: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

6.3.1 Regression 1. Art

Zunachst:

Y wird zuruckgefuhrt (regressiert) auf verschiedene Auspra-gungen von X(ohne funktionalen Zusammenhang)

Voraussetzungen:

• Y ist metrisch skaliert(mindestens intervallskaliert)

• X ist beliebig skaliert mit moglichen Auspragungen ξ1, . . . , ξJ

282

Page 287: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Jetzt:

• Bilde die bedingten Mittelwerte yj unter der Bedingung X =ξj fur j = 1, . . . , J(vgl. Definition 6.7, Folie 232)

Definition 6.15: (Deskriptive Regression 1. Art)

Die J Paare (ξj, yj), j = 1, . . . , J, nennt man deskriptive Regres-sion 1. Art von Y auf X.

283

Page 288: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiel: (Haushaltseinkommen) [I]

• Y : verfugbares Haushalts-Nettoeinkommen(Durchschnitte)

• X: Haushaltstyp

284

Page 289: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiel: (Haushaltseinkommen) [II]

• Daten:

Einkommen Y Anz. Haushaltej Haushaltstyp X (in DM) (in (1000)1 Selbstandige 8470 22482 Beamte 7977 17343 Angestellte 6150 104524 Arbeiter 4967 72405 Arbeitslose 2892 19836 Nichterwerbstatige 3756 13124

Summe: 36781

285

Page 290: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Hier:

• Regressionsergebnis dargestellt als Balkendiagramm

286

0100020003000400050006000700080009000

j=1 j=2 j=3 j=4 j=5 j=6

Page 291: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Offensichtlich:

• Durch die J Auspragungen von X kann die Grundgesamtheitin J Teilgesamtheiten zerlegt werden

• Die J Teilgesamtheiten haben die Umfange n1·, n2·, . . . , nJ ·

=⇒ Anwendung der Additionssatze fur arithmetische Mittelund Varianzen des Merkmals Y(vgl. Abschnitt 4.3.4)

287

Page 292: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Es gilt:

y =1n

J∑

j=1yj · nj·

s2Y =1n

J∑

j=1s2Y |X=ξj

· nj·

︸ ︷︷ ︸

=s2int

+1n

J∑

j=1

(

yj − y)2· nj·

︸ ︷︷ ︸

=s2ext

Hieraus:

• Maßzahl fur den Erklarungswert der unabhangigen VariablenX fur die abhangige Variable Y

288

Page 293: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Definition 6.16: (Bestimmtheitsmaß)

Die Große

B =s2exts2Y

heißt Bestimmtheitsmaß der deskriptiven Regression 1. Art.

Bemerkungen: [I]

• Es gilt stets:

0 ≤ B ≤ 1

289

Page 294: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bemerkungen: [II]

• Es gilt B = 0 genau dann, wenn s2ext = 0 , d.h. wenn

y1 = y2 = . . . = yJ = y

=⇒ Alle bedingten Mittel yj sind gleich

=⇒ X hat keinen Erklarungswert fur Y

• Es gilt B = 1 genau dann, wenn s2Y = s2ext und s2int = 0

=⇒ Fur alle bedingten Varianzen gilt sY |X=ξj= 0

=⇒ X hat hochsten Erklarungswert fur Y

290

Page 295: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bemerkungen: [III]

• B gibt den Anteil der durch die Regression 1. Art erklartenVarianz an der Gesamtvarianz von Y an

291

Page 296: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

6.3.2 Regression 2. Art: Die lineare Einfachregre-ssion

Jetzt:

• X und Y sind beide metrisch skaliert

Ziel:

• Erklarung der Abhangigkeit zwischen X und Y durch eineGerade

292

Page 297: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Ausgangssituation:

• Urliste (x1, y1), . . . , (xn, yn)

• Regressionsgleichung

yi = a + b · xi + ui (i = 1, . . . , n)

• a, b sind aus den Daten zu bestimmende Parameter

• ui ist die Abweichung (auch Fehler oder Residuum)

293

Page 298: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Problemstellung:

• Bestimme die Parameter a und b aus den Daten derart, dassein ’geeignet definiertes Abweichungsmaß’ fur die Residuenminimal wird

Definition 6.17: (Lineare Einfachregression)

Das Regressionsproblem von Folie 293 nennt man lineare Ein-fachregression von Y auf X.

Beispiel:

• Zusammenhang zwischen Ausgaben fur Werbung (X) undden Absatzen (Y ) gemessen an 84 Unternehmen in den USAim Jahr 1990

294

Page 299: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Lineare Einfachregression

295

480

500

520

540

560

0 20 40 60 80 100

Werbeausgaben in Mill. US-$

Abs

atz

in M

ill. U

S-$

Absatz = 502.92 + 0.218 * Werbeausgaben + Fehler

Page 300: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Jetzt:

• ’Sinnvolle Ermittlung’ der Parameter a und b aus den Daten(x1, y1), . . . , (xn, yn)

Dafur zunachst:

• Geeignetes Abweichungsmaß fur die Residuen

ui = yi − (a + b · xi)

(vertikaler Abstand des Datenpunktes (xi, yi) von der Regres-sionsgeraden)

296

Page 301: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Sinnvolles Abstandsmaß ist:

Q(α, β) =n

i=1[yi − (α + β · xi)]

2

Bemerkungen:

• Die Großen α, β ∈ R sind ’formaler Ersatz’ fur die unbekan-nten Parameter a, b

• Die unbekannten Parameter a, b der Regressionsgeraden wer-den gleich durch spezielle Wahlen von α bzw. β ermittelt

297

Page 302: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Jetzt:

• Ermittle a und b durch Minimierung des Abstandsmaßes Q(α, β)bezuglich α und β

Bemerkungen:

• a und b werden also derart gewahlt, dass die Summe derquadrierten Abstande zwischen den Datenpunkten (xi, yi) undder Regressionsgeraden minimal wird

• Die Regressionsgerade yi = a + b · xi beschreibt dann die(xi, yi)-Punktwolke im Sinne des gewahlten Abstandsmaßesoptimal

298

Page 303: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Jetzt:

• Mathematische Bestimmung der Parameter a und b

Formaler Ablauf: [I]

• Bilde die (partiellen) Ableitungen von Q(α, β)

∂∂α

Q(α, β) = 2n

i=1[yi − (α + β · xi)] · (−1)

∂∂β

Q(α, β) = 2n

i=1[yi − (α + β · xi)] · (−xi)

299

Page 304: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Formaler Ablauf: [II]

• Die jeweiligen Nullstellen der partiellen Ableitungen (bezeich-net mit a und b) liefern das potenzielle Minimum (d.h. diegesuchten Parameterwerte)(notwendige Bedingung)

• Es bleibt zu uberprufen, ob die Nullstellen tatsachlich einMinimum darstellen(hinreichende Bedingung)

300

Page 305: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Endergebnisse:

• Die gesuchten Nullstellen ergeben sich als

b =

n∑

i=1xi · yi − n · x · y

n∑

i=1x2

i − n · x2=

sXYs2X

= rXY ·sYsX

,

a = y − b · x

Definition 6.18: (Kleinste-Quadrate-Methode)

Die obige Vorgehensweise zur Bestimmung der Regressionskoef-fizienten a und b nennt man die Methode der Kleinsten Quadrate.

301

Page 306: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Offensichtlich:

• Zur Berechnung der Kleinste-Quadrate-Koeffizienten beno-tigt man nur die 4 Großen x, y, s2X und sXY

302

Page 307: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bemerkungen:

• Fur die Regressionsgerade gilt also:

y(x) = a + b · x

= y −sXYs2X

· x︸ ︷︷ ︸

= a

+sXYs2X

︸ ︷︷ ︸

= b

·x

Fur die Regresssionsgerade gilt somit:

y(x) = y

=⇒ Die Regressionsgerade verlauft durch den Punkt (x, y)

• Interpretation der Regressionsgeraden nicht fur alle x-Wertesinnvoll

303

Page 308: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiel:

• X = Werbeausgaben, Y = Absatze, n = 84

• Es gilt:

x = 50.7276, y = 513.9912, s2X = 297.5332, sXY = 64.9557

Damit ergibt sich:

b =64.9557297.5332

= 0.2183

a = 513.9912− 0.2183 · 50.7276 = 502.9174

304

Page 309: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Erinnerung:

• Bestimmtheitsmaß B bei Regression 1. Art beschreibt Anteilan der Varianz s2Y , der durch die Regression erklart wird

Jetzt:

• Ubetragung dieses Konzeptes auf Regression 2. Art

Betrachte dazu:

• Werte der Regressionsgerade (yi) an den Stellen xi:

yi = a + b · xi, i = 1, . . . , n

305

Page 310: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Offensichtlich gilt fur die y-Daten:

yi = a + b · xi + ui = yi + ui

Bedeutung:

• Datenwert yi ist Summe aus Wert auf Regressionsgeradenplus Fehler

Nun gilt folgende Varianzzerlegung:

s2Y = s2Y + s2U

306

Page 311: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Fazit:

• Varianz der Y -Werte lasst sich in 2 Teile zerlegen

s2Y : Varianz der exakt auf der Regressionsgeraden liegen-

den Werte yi(den durch die Regression erklarten Teil der Varianz derY -Werte s2Y )

s2U : Varianz der Residuen ui(Residualvarianz oder den durch die Regression nicht er-klarten Teil der Varianz der Y -Werte s2Y )

307

Page 312: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Definition 6.19: (Bestimmtheitsmaß)

Das Bestimmtheitsmaß der deskriptiven Regression 2. Art definiertman als

R2 =s2Ys2Y

= 1−s2Us2Y

.

Bemerkungen: [I]

• Das R2 ist der Anteil an der Varianz der y-Werte, der durchdie Regression erklart wird

• Es gilt:

0 ≤ R2 ≤ 1

308

Page 313: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bemerkungen: [II]

• R2 = 0:Es ist dann s2U = s2Y , d.h. die Residualvarianz entspricht exaktder Varianz der y-Werte. Die Regression selbst liefert keinenErklarungsbeitrag fur die y-Werte

• R2 = 1:Es ist dann s2Y = s2Y . Die Regression erklart die Varianz dery-Werte vollstandig(Alle Punkte (xi, yi) liegen auf der Regressionsgeraden)

309

Page 314: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bemerkungen: [III]

• Praktische Berechnungsmoglichkeit:

R2 =

sXY√

s2X ·√

s2Y

2

= (rXY )2

(R2 entspricht dem Quadrat des Korrelationskoeffizientenvon Bravais-Pearson)

310

Page 315: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiel:

• Im Beispiel Werbeausgaben ←→ Absatz gilt:

R2 =

sXY√

s2X ·√

s2Y

2

=

(

64.9557√297.5332 ·

√159.309

)2

= 0.0890

311

Page 316: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

6.4 Lineare Mehrfachregression

Jetzt:

• Ubertragung des Konzeptes auf k Regressoren X1, . . . , Xk(alle metrisch)

Regressionsmodell:

yi = a + b1 · x1i + . . . + bk · xki + ui, i = 1, . . . , n

312

Page 317: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Analog zu Abschnitt 6.3.2:

• Kleinste-Quadrate-Methode:

minα,β1,...,βk

Q(α, β1, . . . , βk)

mit

Q(α, β1, . . . , βk) =n

i=1[yi − (α + β1 · x1i + . . . + βk · xki)]

2

• Definition des R2:

R2 =s2Ys2Y

= 1−s2Us2Y

313

Page 318: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

7. Konzentrations- und Disparitatsmessung

Betrachte:

• Merkmal X, bei dem alle Daten xi ≥ 0 sind und die Merk-malssumme

∑ni=1 xi eine sinnvolle Interpretation besitzt

(extensives Merkmal)

314

Page 319: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiel:

• X: Haushaltseinkommen

=⇒

Alle xi sind großer oder gleich Null

∑ni=1 xi ist Gesamteinkommen der Population

Fragestellung:

• Wie ist die Merkmalssumme∑n

i=1 xi auf die einzelnen Merk-malstrager verteilt?(Konzentration, Ungleichheit)

315

Page 320: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

7.1 Disparitat und Konzentration

Jetzt:

• Klarung der Begriffe

Ungleichheit (= Disparitat)

Konzentration

316

Page 321: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Messung von Disparitat:

• Welcher Anteil der Merkmalssumme fallt auf einen bestimmtenAnteil der Merkmalstrager?

• Beispiel:Welchen Anteil am Gesamteinkommen einer Bevolkerung vere-inigen die 10% Reichsten auf sich?(Anteil des Gesamt-EK ←→ Anteil der Bevolkerung)

317

Page 322: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Messung von Konzentration:

• Welcher Anteil der Merkmalssumme fallt auf eine bestimmteAnzahl von Merkmalstragern?

• Beispiel:Welchen Anteil am Gesamtumsatz eines Industriesektors habendie 5 großten Unternehmen?(Anteil des Gesamtumsatzes ←→ Anzahl von Unternehmen)

318

Page 323: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

7.2 Konzentrationsmessung

Wichtige Grundvoraussetzung:

• Die Daten x1, . . . , xn sind absteigend geordnet:

x1 ≥ x2 ≥ . . . ≥ xn ≥ 0

Bemerkungen und Bezeichnungen: [I]

• An dieser Stelle verzichten wir auf die Schreibweise der geord-neten Urliste x(n) ≥ x(n−1) ≥ . . . ≥ x(1) ≥ 0

319

Page 324: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bemerkungen und Bezeichnungen: [II]

• Stattdessen ordnen wir (notigenfalls) unsere Urliste einfachso um, dass gilt

x1 ≥ x2 ≥ . . . ≥ xn ≥ 0

• Es bezeichne

hr =xr

n∑

i=1xi

=xr

n · x, r = 1, . . . , n

den Merkmalsanteil des r-ten Merkmalstragers an der Merk-malssumme

• Wegen x1 ≥ x2 ≥ . . . ≥ xn ≥ 0 gilt fur die Merkmalsanteile:

h1 ≥ h2 ≥ . . . ≥ hn ≥ 0

320

Page 325: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

7.2.1 Konzentrationsraten und Konzentrationskurve

Definition 7.1: (Konzentrationsrate i-ter Ordnung)

Die Summe der i großten Merkmalsanteile,

CR(i) =i

r=1hr =

i∑

r=1xr

n∑

r=1xr

heißt Konzentrationsrate der Ordnung i. CR(i) ist der Merkmal-santeil, der auf die i großten Merkmalstrager entfallt. Fur i = 0wird CR(0) = 0 gesetzt.

321

Page 326: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Definition 7.2: (Konzentrationskurve)

Zeichnet man fur i = 0, . . . , n die Punkte (i, CR(i)) in ein Koordi-natensystem und verbindet man die Punkte durch einen linearenStreckenzug, so erhalt man die Konzentrationskurve.

Bemerkung:

• Per Definition beginnt die Konzentrationskurve im Punkt(0, CR(0)) = (0,0) und endet im Punkt (n, CR(n)) = (n,1).

322

Page 327: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiel: [I]

• Funf Unternehmen eines Marktes weisen die folgenden Umsatzeauf (in Mill. Euro)

x1 = 330, x2 = 120, x3 = 90, x4 = 30, x5 = 30

Man beachte:Die Daten sind bereits absteigend geordnet

323

Page 328: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiel: [II]

• Arbeitstabelle:

i xi hi CR(i)0 01 330 0.55 0.552 120 0.20 0.753 90 0.15 0.904 30 0.05 0.955 30 0.05 1.00∑

600 1.00

324

Page 329: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiel: [III]

• Verbinden der Punkte (i, CR(i)) ergibt die Konzentrationskurve:

325

0

0,2

0,4

0,6

0,8

1

0 1 2 3 4 5

i

CR

(i)

Page 330: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Eigenschaften der Konzentrationskurve: [I]

• Die Konzentrationskurve ist der Graph einer Funktion, diedas Intervall [0, n] auf das Intervall [0,1] abbildet. Die Funk-tion ist stuckweise linear und streng monoton wachsend vomAnfangspunkt (0,0) bis zum Endpunkt (n,1)

• Die Steigung des r-ten Segmentes (r = 1, . . . , n) betragt

CR(r)− CR(r − 1)1

= hr.

Die Steigungen hr nehmen mit wachsendem r ab. Somit istdie Konzentrationskurve konkav

326

Page 331: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Eigenschaften der Konzentrationskurve: [II]

• Der Fall maximaler Konzentration:

Ein Merkmalstrager vereinigt die gesamte Merkmalssummeauf sich:

h1 = 1, h2 = h3 = . . . = hn = 0

Es folgt:

CR(0) = 0, CR(1) = CR(2) = . . . = CR(n) = 1

327

Page 332: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Eigenschaften der Konzentrationskurve: [III]

• Der Fall minimaler Konzentration (egalitare Verteilung):

Jeder Merkmalstrager hat denselben Anteil 1/n an der Merk-malssumme. Es gilt:

h1 = h2 = . . . = hn =1n

Es folgt:

CR(i) =in

, i = 0, . . . , n

328

Page 333: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Offensichtlich gilt:

• Jede Konzentrationskurve liegt zwischen den Extremen dermaximalen Konzentration und der minimalen Konzentration

329

0

0,2

0,4

0,6

0,8

1

0 1 2 3 4 5

i

CR

(i)

Page 334: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Naheliegende Vorgehensweise:

• Benutze die Konzentrationskurven zweier Grundgesamtheiten(Markte) zum Vergleich des Ausmaßes der Konzentration inbeiden Grundgesamtheiten (Markten), z.B. zum Vergleich

der Konzentration eines Merkmals auf ein und demselbenMarkt zu verschiedenen Zeitpunkten(zeitlicher Vergleich der Konzentration)

der Konzentration eines Merkmals auf zwei unterschied-lichen Markten zum gleichen Zeitpunkt(raumlicher Vergleich der Konzentration)

330

Page 335: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiel: [I]

• Umsatze auf 2 Markten:

Markt I:

38,12,106,34,10

Markt II:

25,20,39,7,9

• Man beachte:

Daten mussen zunachst geordnet werden

331

Page 336: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiel: [II]

• Arbeitstabelle:

i xi hi CRI(i) xi hi CRII(i)0 0 01 106 0.53 0.53 39 0.39 0.392 38 0.19 0.72 25 0.25 0.643 34 0.17 0.89 20 0.20 0.844 12 0.06 0.95 9 0.09 0.935 10 0.05 1.00 7 0.07 1.00∑

200 1.00 100 1.00

332

Page 337: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiel: [III]

• Konzentrationskurven CRI und CRII:

333

0

0,2

0,4

0,6

0,8

1

0 1 2 3 4 5

i

CR

(i)

Page 338: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Offensichtlich:

• Markt I weist gleichmaßig hohere Konzentration als Markt IIauf

Haufiges praktisches Problem:

• Konzentrationskurven CRI und CRII schneiden sich

−→ Kein eindeutiger Konzentrationsvergleich moglich

334

Page 339: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Ausweg:

• Beschreibe Konzentrationsausmaß in einer Grundgesamtheitdurch geeignete Zahlen (Indizes)

−→ Eindeutiger Konzentrationsvergleich durch Vergleich vonZahlen ist immer moglich

335

Page 340: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

7.2.2 Konzentrationsindizes

Hier nur zwei Indizes:

• Herfindahl- und Rosenbluth-Index

Definition 7.3: (Herfindahl-Index)

Die Summe der quadrierten Merkmalsanteile

KH =n

i=1h2

i

bezeichnet man als Herfindahl-Index.

336

Page 341: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bemerkungen:

• Der Herfindahl-Index ist normiert. Es gilt

1n≤ KH ≤ 1

• Es gilt KH = 1/n genau dann, wenn minimale Konzentrationvorliegt

• Es gilt KH = 1 genau dann, wenn maximale Konzentrationvorliegt

337

Page 342: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Jetzt:

• Index, der die ’Biegung’ der Konzentrationskurve ausnutzt

Erinnerung:

• Bei maximaler Konzentration ist die Konzentrationskurve ’max-imal gebogen’

• Bei egalitarer Verteilung ist die Konzentrationskurve gar nichtgebogen (sondern eine Gerade)

338

Page 343: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Dehalb:

• Flache A innerhalb des Rechtecks [0, n]× [0,1], die oberhalbder Konzentrationskurve liegt, ist sinnvolle Maßzahl fur dieKonzentration des Merkmals

’Kleines’ A −→ ’hohe Konzentration’

’Großes’ A −→ ’geringe Konzentration’

Jetzt:

• Formale Berechnung des Flacheninhaltes A

339

Page 344: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Zur Berechnung des Rosenbluth-Index

340

0

0,2

0,4

0,6

0,8

1

0 1 2 3 4 5

i

CR

(i)

Page 345: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Zunachst:

• Berechnung der Flacheninhalte A1, . . . , A5

A1 =h1

2= h1 ·

2 · 1− 12

A2 = h2 · 2−12· h2 =

32· h2 = h2 ·

2 · 2− 12

A3 = h3 · 3−12· h3 =

52· h3 = h3 ·

2 · 3− 12

A4 = h4 · 4−12· h4 =

72· h4 = h4 ·

2 · 4− 12

A5 = h5 · 5−12· h5 =

92· h5 = h5 ·

2 · 5− 12

341

Page 346: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Allgemein gilt fur alle i = 1, . . . , n:

Ai = hi ·2i− 1

2

Somit folgt fur den gesuchten Flacheninhalt A:

A =n

i=1Ai =

n∑

i=1hi ·

2i− 12

=n

i=1hi · (i−

12)

=n

i=1hi · i−

12

n∑

i=1hi

=n

i=1hi · i−

12

342

Page 347: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Jetzt:

• Definition eines Konzentrationsindexes basierend auf demFlacheninhalt A

Definition 7.4: (Rosenbluth-Index)

Der Rosenbluth-Index ist definiert als

KR =12A

=1

2n

i=1i · hi

− 1

.

343

Page 348: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bemerkungen:

• Der Rosenbluth-Index ist normiert. Es gilt

1n≤ KR ≤ 1

• Es gilt KR = 1/n genau dann, wenn minimale Konzentrationvorliegt

• Es gilt KR = 1 genau dann, wenn maximale Konzentrationvorliegt

344

Page 349: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

7.3 Disparitatsmessung

Wichtige Grundvoraussetzung:

• Die Daten x1, . . . , xn sind aufsteigend geordnet:

0 ≤ x1 ≤ x2 ≤ . . . ≤ xn

(vgl. Folie 319)

345

Page 350: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Weitere Bezeichnungen:

• Wie bei der Konzentrationsmessung bezeichne

hr =xr

n∑

i=1xi

den Anteil des r-ten Merkmalstragers an der Merkmalssumme

• Wegen 0 ≤ x1 ≤ . . . ≤ xn gilt fur die Merkmalsanteile:

0 ≤ h1 ≤ h2 ≤ . . . ≤ hn

Frage:

• Welchen Anteil an der Merkmalssumme vereinigen bestimmteAnteile der Population auf sich?

346

Page 351: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

7.3.1 Lorenzkurve

Definition 7.5: (Lorenzkurve)

Fur i = 1, . . . , n bezeichne

L( i

n

)

=i

r=1hr =

i∑

r=1xr

n∑

r=1xr

den Anteil der i kleinsten Merkmalstrager an der Merkmalssumme.Zeichnet man nun die Punkte

(0,0),(1

n, L

(1n

))

,(2

n, L

(2n

))

, . . . ,(n− 1

n, L

(n− 1n

))

, (1,1)

in ein Koordinatensystem und verbindet man diese durch einenlinearen Streckenzug, so erhalt man die Lorenzkurve der Datenx1, . . . , xn.

347

Page 352: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bemerkung:

• Die Lorenzkurve ordnet dem Anteil i/n der i kleinsten Merk-malstrager der Population den dazugehorigen MerkmalsanteilL(i/n) an der Grundgesamtheit zu. Die Lorenzkurve tragtsomit zwei Anteile gegeneinander ab

Beispiel: [I] (vgl. Folie 323)

• Funf Unternehmen eines Marktes weisen die folgenden Umsatzeauf (in Mill. Euro)

x1 = 330, x2 = 120, x3 = 90, x4 = 30, x5 = 30

348

Page 353: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiel: [II]

• Umordnung (vom kleinsten zum großten) ergibt folgende Ar-beitstabelle:

i xi hi L( i5) =

∑ir=1 hr

1 30 0.05 0.052 30 0.05 0.103 90 0.15 0.254 120 0.20 0.455 330 0.55 1.00∑

600 1.00

349

Page 354: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Lorenzkurve:

350

0

0,2

0,4

0,6

0,8

1

0 0,2 0,4 0,6 0,8 1

i/n

L(i/n

)

Page 355: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Eigenschaften der Lorenzkurve: [I]

• Der Graph der Lorenzkurve befindet sich im Einheitsquadrat.Es gilt L(0) = 0 und L(1) = 1. Die Lorenzkurve ist stuckweiselinear, streng monoton wachsend und konvex.

• Der Fall minimaler Disparitat (absolute Gleichheit):

Gilt x1 = x2 = . . . = xn, so folgt

h1 = h2 = . . . = hn

Dies impliziert

L(i/n) = i/n, i = 0, . . . , n

(Lorenzkurve ist die Diagonale im Einheitsquadrat)

351

Page 356: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Eigenschaften der Lorenzkurve: [II]

• Der Fall maximaler Disparitat (absolute Ungleichheit):

Die gesamte Merkmalssumme entfallt auf einen (den großten)Merkmalstrager:

x1 = x2 = . . . = xn−1 = 0, xn =n

i=1xi

Es folgt

h1 = h2 = . . . = hn−1 = 0, hn = 1

Dies impliziert

L(1

n

)

= L(2

n

)

= . . . = L(n− 1

n

)

= 0, L(1) = 1

(Lorenzkurve ist ’maximal’ gebogen)

352

Page 357: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Lorenzkurven minimaler und maximaler Disparitat:

353

0

1

0 1

i/n

L(i/n

)

Page 358: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Es gilt:

• Jede Lorenzkurve liegt zwischen den Extremen der mini-malen Disparitat (absolute Gleichheit) und der maximalenDisparitat (absolute Ungleichheit)

• Wenn sich zwei Lorenzkurven nicht schneiden, weist die hohereLorenzkurve eindeutig weniger Disparitat auf als die niedrigereLorenzkurve

354

Page 359: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Praktisches Problem:

• Lorenzkurven schneiden sich in vielen Fallen

−→ Kein eindeutiger Disparitatsvergleich moglich

Ausweg:

• Beschreibe Ausmaß der Disparitat durch einen Index

−→ Disparitatsvergleich anhand von Zahlen

355

Page 360: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

7.3.2 Der Gini-Koeffizient

Bekanntester Disparitatsindex:

• Der Gini-Koeffizient

Intuition:

• Gini-Koeffizient nutzt ’Biegung’ der Lorenzkurve aus

356

Page 361: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Definition 7.6: (Gini-Koeffizient)

Der Gini-Koeffizient (in Zeichen: DG) ist definiert als das Zweifacheder Flache zwischen der Lorenzkurve und der Diagonalen im Ein-heitsquadrat.

Formale Darstellung: [I]

• Es bezeichne B die Flache unterhalb der Lorenzkurve im Ein-heitsquadrat.

Dann gilt:

DG = 2 ·(12−B

)

= 1− 2B

357

Page 362: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Zur Berechnung des Gini-Koeffizienten

358

0

1

0 1

i/n

L(i/n

)

Page 363: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Formale Darstellung: [II]

• Man kann zeigen, dass gilt:

B =n

i=1Bi =

n∑

i=1hi ·

2n− 2i + 12n

• Damit folgt

DG = 1− 2B = 1−n

i=1hi ·

2n− 2i + 1n

=n

i=1hi −

n∑

i=1hi ·

2n− 2i + 1n

=n

i=1hi ·

(

1−2n− 2i + 1

n

)

=n

i=1hi ·

2i− n− 1n

359

Page 364: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Bemerkungen:

• Der Gini-Koeffizient ist normiert. Es gilt

0 ≤ DG ≤ 1−1n

• Es gilt DG = 0 genau dann, wenn minimale Disparitat (ab-solute Gleichheit) vorliegt

• Es gilt DG = 1− 1/n genau dann, wenn maximale Disparitat(absolute Ungleichheit) vorliegt

360

Page 365: Folien zur Vorlesung - Wirtschaftswissenschaftliche Fakultät · Folien zur Vorlesung Statistik I (Deskriptive Statistik) Wintersemester 2010/2011 Donnerstag, 10.00 - 11.30 Uhr H¨orsaal:

Beispiel: (vgl. Folie 348)

• Gini-Koeffizient fur die 5 Unternehmen eines Marktes

Arbeitstabelle:

i xi hi L( i5) =

∑ir=1 hr

2i−5−15

2i−5−15 hi

1 30 0.05 0.05 −0.8 −0.042 30 0.05 0.10 −0.4 −0.023 90 0.15 0.25 0.00 0.004 120 0.20 0.45 0.4 0.085 330 0.55 1.00 0.8 0.44∑

600 1.00 0 0.46 = DG

361