Top Banner
Statistik Kapitel 4: Wahrscheinlichkeitsrechnung und Kombinatorik 4.1. Zufallsexperiment und Ereignisse » Zufallsexperiment: drei Eigenschaften notwendig » Alle möglichen Ergebnisse des Experiments sind vorab bekannt. » Das Ergebnis eines einzelnen Experiments kann nicht vorhergesagt werden (Zufälligkeit). » Das Experiment kann unter identischen Bedingungen beliebig oft wiederholt werden. » Realisierung eines Zufallsexperiments/Versuchsausgang » Das Ergebnis der tatsächlichen Durchführung eines Zufallsexperiments. 2 Statistik, Prof. Dr. Karin Melzer Hochschule Esslingen » Ergebnismenge (Ereignismenge, Ereignisraum, Menge der Grundergebnisse) » Die Menge aller möglichen (einfachen) Ergebnisse des Zufallsexperiments wird Ergebnismenge (Ereignismenge, Ereignisraum) genannt. » Sie wird mit bezeichnet. » Bei jeder Durchführung tritt genau einer der zu gehörenden Ausgänge ein.
31

Statistik Vorlesung Kapitel 4 - hs-esslingen.dekamelzer/stat/Statistik_Vorlesung_Kapitel_4.pdf · Statistik, Prof. Dr. Karin Melzer 19 Hochschule Esslingen welchen Wahrscheinlichkeiten

Aug 10, 2019

Download

Documents

vuongquynh
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Statistik Vorlesung Kapitel 4 - hs-esslingen.dekamelzer/stat/Statistik_Vorlesung_Kapitel_4.pdf · Statistik, Prof. Dr. Karin Melzer 19 Hochschule Esslingen welchen Wahrscheinlichkeiten

StatistikStatistik

Kapitel 4:

Wahrscheinlichkeitsrechnung und Kombinatorik

4.1. Zufallsexperiment und Ereignisse

» Zufallsexperiment: drei Eigenschaften notwendig» Alle möglichen Ergebnisse des Experiments sind vorab bekannt. » Das Ergebnis eines einzelnen Experiments kann nicht vorhergesagt

werden (Zufälligkeit). » Das Experiment kann unter identischen Bedingungen beliebig oft

wiederholt werden.

» Realisierung eines Zufallsexperiments/Versuchsausgang» Das Ergebnis der tatsächlichen Durchführung eines Zufallsexperiments.

2Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

» Ergebnismenge (Ereignismenge, Ereignisraum, Menge der Grundergebnisse) Ω

» Die Menge aller möglichen (einfachen) Ergebnisse des Zufallsexperiments wird Ergebnismenge (Ereignismenge, Ereignisraum) genannt.

» Sie wird mit Ω bezeichnet. » Bei jeder Durchführung tritt genau einer der zu Ω gehörenden Ausgänge

ein.

Page 2: Statistik Vorlesung Kapitel 4 - hs-esslingen.dekamelzer/stat/Statistik_Vorlesung_Kapitel_4.pdf · Statistik, Prof. Dr. Karin Melzer 19 Hochschule Esslingen welchen Wahrscheinlichkeiten

4.1. Zufallsexperiment und Ereignisse

» Ereignis: ein Ereignis A ist eine Teilmenge der Ergebnismenge Ω, also A ⊆ Ω

» Wir sagen:

» Das Ereignis A ist eingetreten, wenn das Ergebnis des Zufallsexperiments ein Element von A ist.

» ω ∊ A ⊆ Ω ⇒ A ist eingetreten

» ω ∉ A ⊆ Ω ⇒ A ist nicht eingetreten

» Sicheres Ereignis: Ω

3Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

» Sicheres Ereignis: Ω» Die Menge Ω stellt das Ereignis dar, das in jedem Fall eintritt

» Unmögliches Ereignis: ∅» Tritt nie ein, leere Menge bzw. ∅ ⊆ Ω

» Beachten Sie: » „Versuchsausgang“ bzw. „Ergebnis eines Zufallsexperiments“

ist nicht das Gleiche wie „Ereignis“!

» Mit jedem Versuchsausgang treten gewisse Ereignisse ein und andere nicht.

4.2. Laplace-Experiment

» Ein Laplace-Experiment ist ein Zufallsexperiment mit den folgenden Eigenschaften:

» Das Zufallsexperiment hat nur endlich viele mögliche Ergebnisse» Jedes dieser Ergebnisse ist gleich wahrscheinlich

» Grundformel für Wahrscheinlichkeiten bei Laplace-Experimenten

» Die Wahrscheinlichkeit P(A) eines beliebigen Ereignisses A ⊆ Ωberechnet sich als

4Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

berechnet sich als

» wobei k = |A|: Anzahl der Elementarereignisse/Elemente in An = |Ω|: Anzahl der Elementarereignisse/Elemente in Ω

» Es handelt sich nur um verschiedene gebräuchliche Darstellungsformen

Ω===

A

n

kAP

Ergebnisse möglichen aller Anzahl A in Ergebnisse der Anzahl

)(

Page 3: Statistik Vorlesung Kapitel 4 - hs-esslingen.dekamelzer/stat/Statistik_Vorlesung_Kapitel_4.pdf · Statistik, Prof. Dr. Karin Melzer 19 Hochschule Esslingen welchen Wahrscheinlichkeiten

4.3. Kombinatorik („Kunst des Abzählens“)

» Um bei einem Laplace-Experiment die Wahrscheinlichkeit eines Ereignisses richtig zu berechnen, muss man die Anzahl der möglichen und günstigen Ergebnisse in A abzählen – das ist eine kombinatorische Fragestellung Kombinatorik = Lehre des Abzählens.

Definition: Fakultät

5Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

Definition: Fakultät

» n! = 1 · 2 · 3 · … · n (lies: n Fakultät) und

» 0! = 1 (per Definition)

» Berechnung von n! mit TR mindestens bis 69! i. d. R. möglich

» für größere n näherungsweise mit der Formel von Stirling; lg = Logarithmus zur Basis 10 – TR: log-Taste

+≈e

nnnn lg)2lg(

2

1)!lg( π

4.3. Kombinatorik: Permutationen („Kunst des Abzählens“)

4.3.1 Permutationen» Permutation = Anzahl der möglichen Anordnungen oder

Vertauschungen» Permutationen ohne Wiederholung

» Wie viele Möglichkeiten gibt es, n verschiedene Objekte anzuordnen (o. Wdh. = alle Elemente verschieden)?Anzahl Möglichkeiten: n! (lies: n Fakultät)

» Permutationen mit Wiederholung

6Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

» Permutationen mit Wiederholung» Von Objekt 1 gibt es n1 (gleiche) Exemplare, von Objekt 2 gibt es n2

(gleiche) Exemplare, …, von Objekt k gibt es nk gleiche Exemplare.» Auf wie viele Arten kann man die n = n1 + … + nk Objekte anordnen?

» Anzahl der möglichen Anordnungen:

» Durch die ni! Möglichkeiten der Anordnung in jeder Klasse muss man dividieren.

» Achtung: nicht alle Objekte verschieden

!!!

!

21 knnn

n

⋅⋅⋅ K

Page 4: Statistik Vorlesung Kapitel 4 - hs-esslingen.dekamelzer/stat/Statistik_Vorlesung_Kapitel_4.pdf · Statistik, Prof. Dr. Karin Melzer 19 Hochschule Esslingen welchen Wahrscheinlichkeiten

4.3. Kombinatorik: Grundprobleme („Kunst des Abzählens“)

4.3.2 Die vier Grundprobleme der Kombinatorik

» Grundaufgabe: Aus n verschiedenen Objekten werden kausgewählt. Wie viele Möglichkeiten gibt es?

» Die Antwort auf diese Frage hängt davon ab,

» ob die Reihenfolge des Auswählens eine Rolle spielt („mit Beachtung der Reihenfolge“, „geordnet“) oder nicht („ohne Beachtung der Reihenfolge“, ungeordnet)

7Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

(„ohne Beachtung der Reihenfolge“, ungeordnet)

» ob ein Objekt mehrfach ausgewählt werden darf („mit Wiederholung“, „Ziehen mit Zurücklegen“) oder nicht(„ohne Wiederholung“, Ziehen ohne zurücklegen“).

4.3. Kombinatorik: Grundprobleme („Kunst des Abzählens“)

Anzahl der Möglichkeiten bei den vier Grundaufgaben:

» Ziehen mit Zurücklegen mit Beachtung der Reihenfolge

N = nk

» Ziehen ohne Zurücklegen mit Beachtung der Reihenfolge

» Sonderfall für k = n: n! Möglichkeiten (Permutation))!(

!)1()1()(

kn

nknnnn k −

=+−⋅⋅−⋅= K

8Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

» Sonderfall für k = n: n! Möglichkeiten (Permutation)

» Ziehen ohne Zurücklegen ohne Beachtung der Reihenfolge

» Sprechweise: Binomialkoeffizient „n über k“

» Ziehen mit Zurücklegen ohne Beachtung der Reihenfolge

)(!)!(

!

21

)1()1(nk

kkn

n

k

knnn

k

n≤

⋅−=

⋅⋅⋅+−⋅⋅−⋅=

K

K

!)!1()!1(1

kn

kn

k

kn

⋅−−+=

−+

k

n

Page 5: Statistik Vorlesung Kapitel 4 - hs-esslingen.dekamelzer/stat/Statistik_Vorlesung_Kapitel_4.pdf · Statistik, Prof. Dr. Karin Melzer 19 Hochschule Esslingen welchen Wahrscheinlichkeiten

4.3. Kombinatorik: Grundprobleme („Kunst des Abzählens“) Übersicht

Stichproben-auswahlk aus n

geordnet/mitBeachtung

der Reihenfolge

ungeordnet/ohneBeachtung

der Reihenfolge

mit Zurück-legen

mit Mehrfach-besetzung

kn

−+k

kn 1

9Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

ohneZurück-legen

ohneMehrfach-

besetzungen

mit unterscheid-baren Kugeln

nichtunterscheid-bare Kugeln

Verteilen von kKugeln auf n

Zellen

( ) knkn

n)(

!

! =−

k

n

4.4. Eigenschaften von Wahrscheinlichkeiten

» Zufällige Ereignisse → keine exakten Voraussagen möglich. » In der Mathematik: Man möchte zumindest ein Maß für die Sicherheit

(oder Unsicherheit) anzugeben, die mit einer Aussage verbunden ist. Ein solches Maß ist die Wahrscheinlichkeit.

» Die Wahrscheinlichkeitsrechnung ordnet jedem Ereignis eine Wahrscheinlichkeit für sein Eintreten zu.

» Die dem Ereignis A zugeschriebene Wahrscheinlichkeit wird mit P(A) bezeichnet (P von engl. probability).

» Die Wahrscheinlichkeit für das Eintreten eines Ereignisses A ist immer eine reelle Zahl, für die gilt

10Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

eine reelle Zahl, für die gilt0 ≤ P(A) ≤ 1

» Zwei Extremfälle kennzeichnen Sicherheit: » Ist P(A) = 1, so tritt A mit Sicherheit ein. » Ist P(A) = 0, so tritt A mit Sicherheit nicht ein.

» Werte dazwischen drücken Grade an Sicherheit aus. » Je größer die Wahrscheinlichkeit P(A), umso „eher“ ist anzunehmen,

dass das Ereignis A eintritt. » Was aber bedeutet das genau? Wie sind die Grade an Sicherheit, die

durch Wahrscheinlichkeiten ausgedrückt werden, definiert?

Page 6: Statistik Vorlesung Kapitel 4 - hs-esslingen.dekamelzer/stat/Statistik_Vorlesung_Kapitel_4.pdf · Statistik, Prof. Dr. Karin Melzer 19 Hochschule Esslingen welchen Wahrscheinlichkeiten

4.4. Eigenschaften von Wahrscheinlichkeiten

4.4.1. Wahrscheinlichkeit und relative Häufigkeit» Wahrscheinlichkeit ist eine Konstante

» relative Häufigkeit hängt vom Zufall (konkreter Ausgang der Experimente) ab

» Im Allgemeinen ist daher P(A) ≠ hn(A)

» Beispiel: Werfen eines gezinkten Würfels

n Versuchsreihe 1 Versuchsreihe 2

Anzahl der Absolute

Häufigkeit von Relative

Häufigkeit von Absolute

Häufigkeit von Relative

Häufigkeit von

11Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

» Auf lange Sicht scheint 6 mit einer relativen Häufigkeit von 0,25 aufzutreten.

» In der Praxis: Wahrscheinlichkeit eines Ereignisses ≈ relative Häufigkeit dieses Ereignisses in einer großen Anzahl von Versuchen (Näherungswert)

Anzahl der Würfe

Häufigkeit von „6“

Häufigkeit von „6“

Häufigkeit von „6“

Häufigkeit von „6“

10 2 0,2 4 0,4

50 15 0,3 19 0,38

100 26 0,26 31 0,31

1000 248 0,248 252 0,252

4.4. Eigenschaften von Wahrscheinlichkeiten

4.4.1 Wahrscheinlichkeit und relative Häufigkeit» Wenn man P(A) nicht ausrechnen kann, aber ein Zufallsexperiment n

mal durchführt, kann man P(A) durch die relative Häufigkeit schätzen.» Nach dem Gesetz der großen Zahlen wird diese Schätzung um so

besser sein, je größer n ist. » Definition der Wahrscheinlichkeit:

» Die Wahrscheinlichkeit eines Ereignisses ist die für eine gegen unendlich strebende Anzahl n von Durchführungen des betreffenden Zufallsexperiments vorausgesagte relative Häufigkeit seines

12Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

Zufallsexperiments vorausgesagte relative Häufigkeit seines Eintretens.

» Das Maß für die Sicherheit, mit dem gezinkten Würfel eine 6 zu würfeln, könnte man so formulieren (die Wkt., eine 6 zu würfeln, beträgt bei dem gezinkten Würfel ¼):

» "Unter einer sehr großen Zahl n von Würfel-Versuchen wird ungefähr n/4 mal die Augenzahl 6 auftreten".

∞→→= nAPnhf n

n für )(

Page 7: Statistik Vorlesung Kapitel 4 - hs-esslingen.dekamelzer/stat/Statistik_Vorlesung_Kapitel_4.pdf · Statistik, Prof. Dr. Karin Melzer 19 Hochschule Esslingen welchen Wahrscheinlichkeiten

4.4.2 Schranken für Wahrscheinlichkeiten

» Die Wahrscheinlichkeit eines Ereignisses A ⊆ Ω liegt immer zwischen 0 und 1:

0 ≤ P(A) ≤ 1

» P(A) = 0 gilt für ein unmögliches Ereignis

» P(A) = 1 gilt nur für ein mit Sicherheit eintretendes Ereignis.

» Beispiel „Würfeln“

13Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

» Beispiel „Würfeln“» A = Augenzahl größer als 7; dann ist P(A) = 0

» B = Augenzahl kleiner als 7; dann ist P(B) = 1

4.4.3 Wahrscheinlichkeiten für zusammengesetzte Ereignisse

Gegenereignis und zusammengesetzte Ereignisse» Man kann Ereignisse miteinander verknüpfen, um

andere/komplexere Ereignisse zu erhalten. » Seien A und B Ereignisse mit A, B ⊆ Ω .

a) „nicht A“ = Ā = Ω\A d.h. A tritt nicht ein, Gegenereignis von A

b) „A und B“ = A ⋂ B (Durchschnitt) d.h. A und B treten beide ein; sowohl A als auch B tritt ein

14Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

d.h. A und B treten beide ein; sowohl A als auch B tritt einc) „A oder B“ = A ⋃ B (Vereinigung)

d.h. A tritt ein oder B tritt ein oder beide treten ein

Tipp: Benutzen Sie a) – c), um Text in Formeln umzuwandeln.

» Die Ereignisse A und B heißen unvereinbar, wenn A ⋂ B = d.h. A und B haben keine gemeinsamen Elemente.

» Die Ereignisse A und B heißen vereinbar, wenn A ⋂ B ≠ .

Page 8: Statistik Vorlesung Kapitel 4 - hs-esslingen.dekamelzer/stat/Statistik_Vorlesung_Kapitel_4.pdf · Statistik, Prof. Dr. Karin Melzer 19 Hochschule Esslingen welchen Wahrscheinlichkeiten

4.4.3 Wahrscheinlichkeiten für zusammengesetzte Ereignisse

Wahrscheinlichkeiten zusammengesetzter Ereignisse» Wkt. des Gegenereignisses Ā von A: P(Ā) = 1 – P(A)

» P(A ⋂ B) – Multiplikationssatz:

»Multiplikationssatz allgemein: P(A ⋂ B) = P(A) · P(B|A) = P(B) · P(A|B)

»Multiplikationssatz für unabhängige Ereignisse: P(A ⋂ B) = P(A) · P(B)

Dabei ist P(B|A) (lies: „Wahrscheinlichkeit von B unter der Bedingung A“) die Wahrscheinlichkeit, dass B eintritt, wenn sicher ist, dass A eintritt bzw.

15Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

die Wahrscheinlichkeit, dass B eintritt, wenn sicher ist, dass A eintritt bzw. eingetreten ist.

Wenn sich zwei Ereignisse (definitiv) nicht beeinflussen, spricht man von unabhängigen Ereignissen, dann gilt P(B|A) = P(B).

» P(A ⋃ B) – Additionssatz:

»Additionssatz allgemein: P(A ⋃ B) = P(A) + P(B) – P(A ⋂ B )

»Additionssatz für unvereinbare Ereignisse: P(A ⋃ B) = P(A) + P(B)

4.4.3 Wahrscheinlichkeiten für zusammengesetzte Ereignisse

Bemerkung/Beispiel: (un)abhängige Ereignisse» In einer Urne befinden sich zwei weiße und drei schwarze

Kugeln. Zwei Kugeln werden nacheinander gezogena) mit Zurücklegen b) ohne Zurücklegen

» Wie groß ist die Wahrscheinlichkeit, dass beide weiß sind?» Ereignisse W1 = „erste Kugel weiß“ , W2= „zweite Kugel

weiß“a) W1 und W2 sind unabhängig, wenn mit Zurücklegen gezogen

16Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

a) W1 und W2 sind unabhängig, wenn mit Zurücklegen gezogen wird. P(W1) = P(W2) = P(W1 ∩ W2) =

b) Die Wahrscheinlichkeit für W2 hängt davon ab, ob im ersten Zug eine weiße Kugel gezogen wurde, oder nicht. W1 und W2 sind abhängig, wenn ohne Zurücklegen gezogen wird.P(W1) = P(W2|W1) = P(W1 ∩ W2) =

Page 9: Statistik Vorlesung Kapitel 4 - hs-esslingen.dekamelzer/stat/Statistik_Vorlesung_Kapitel_4.pdf · Statistik, Prof. Dr. Karin Melzer 19 Hochschule Esslingen welchen Wahrscheinlichkeiten

4.4.3 Wahrscheinlichkeiten für zusammengesetzte Ereignisse

» Wann dürfen Sie die Wahrscheinlichkeiten von zwei Ereignissen einfach

» addieren?

» multiplizieren?

» Beispiel:» Ein zufällig gewählter PC besitze

17Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

» Ein zufällig gewählter PC besitze » mit Ws-keit 0,5 eine Festplatte mit mind. 80GB,

» mit Ws-keit 0,4 einen Flachbildschirm und

» mit Ws-keit 0,2 beide Eigenschaften.

» P(PC hat mindestens eine der Eigenschaften) = ?

» P(PC hat Festplatte mit mind. 80GB aber keinen Flachbildschirm) = ?

4.4.4 Wahrscheinlichkeiten bei mehrstufigen Zufallsexperimenten

» Zufallsexperimente, die aus Einzelversuchen aufgebaut sind, die nacheinander oder gleichzeitig durchgeführt werden, kann man als Baumdiagramm darstellen.

» Knoten: Ereignisse

» Entlang der Pfade werden die Wahrscheinlichkeiten aufgetragen (Wahrscheinlichkeitsbaum)

B ( )ABP |

Berechnung von Wahrscheinlich-keiten im Baumdiagramm:» Wahrscheinlichkeit eines Pfades

= Produkt der

18Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

A

B

1. Stufe 2. Stufe

B( )AP

( )AP

( )ABP |

( )ABP |

( )ABP |

= Produkt der Wahrscheinlichkeiten längs des Pfades (Produktregel). „Entlang der Pfade wird multipliziert“

» Wahrscheinlichkeit für ein Ereignis = Summe der Wahrscheinlichkeiten aller zu diesem Ereignis führenden Pfade (Summenregel) „Entlang der Äste wird addiert“

Page 10: Statistik Vorlesung Kapitel 4 - hs-esslingen.dekamelzer/stat/Statistik_Vorlesung_Kapitel_4.pdf · Statistik, Prof. Dr. Karin Melzer 19 Hochschule Esslingen welchen Wahrscheinlichkeiten

4.5 Zufallsvariablen

» real (Daten) abstrakt (Modell)» Merkmal Zufallsvariable» Merkmalsausprägung Realisierung der Zufallsvariablen» relative Häufigkeit Wahrscheinlichkeit

Definition: » Eine Zufallsvariable (ZV) X beschreibt, welche Ausprägungen

eines quantitativen Merkmals in einem Zufallsexperiment mit

19Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

eines quantitativen Merkmals in einem Zufallsexperiment mit welchen Wahrscheinlichkeiten auftreten.

» Man spricht von einer diskreten Zufallsvariablen, falls es sich um ein quantitativ-diskretes Merkmal handelt,

» und von einer stetigen Zufallsvariablen, falls es sich um ein quantitativ-stetiges Merkmal handelt.

4.6 Diskrete Zufallsvariablen

» Wahrscheinlichkeitsverteilung oder Dichtefunktion» Diskrete ZV kann nur einzelne Punkte auf dem Zahlenstrahl als

Ausprägungen annehmen» Die Menge aller Ausprägungen einer Zufallsvariable mit den

zugehörigen Wktn. heißt Wahrscheinlichkeitsverteilung oder (diskrete) Dichtefunktion/Dichte

» (diskrete) Dichte = Liste aller Wahrscheinlichkeiten P(X = xi)» Darstellung der Wkts.verteilung: Tabelle, Formel oder Stab- oder

Säulendiagramm

20Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

Säulendiagramm

» Verteilungsfunktion» Die Funktion

heißt Verteilungsfunktion von X.» Die Funktion F(t) beschreibt die Wahrscheinlichkeit, dass die

Zufallsvariable X kleiner als der fixe Wert t ist.» Darstellung der Verteilungsfunktion: Funktionsterm oder

(Funktions-)Graph

ℜ∈≤= xxXPxF ),()(

Page 11: Statistik Vorlesung Kapitel 4 - hs-esslingen.dekamelzer/stat/Statistik_Vorlesung_Kapitel_4.pdf · Statistik, Prof. Dr. Karin Melzer 19 Hochschule Esslingen welchen Wahrscheinlichkeiten

4.6 Diskrete Zufallsvariablen

» Zusammenhang Wahrscheinlichkeitsverteilung/Dichte –Verteilungsfunktion

» Die (kumulative) Verteilungsfunktion F(x) = P(X ≤ x)wird durch die Wahrscheinlichkeiten P(X = xi) eindeutig bestimmt:

» Dichte und Verteilungsfunktion lassen sich ineinander überführen.Gewichte = Höhe der Sprünge der diskreten Verteilungsfunktion

» Es gilt:

( )∑≤

==≤=xx

k

k

xXPxXPxF )()(

21Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

» Es gilt:

» 0 ≤ F(x) ≤ 1 für, F(x) ist monoton wachsend.» Die Wahrscheinlichkeitsverteilung ist sozusagen die theoretische

Verteilung eines Ereignisses. Wenn man etwa das Zufallsexperiment Würfelwurf betrachtet, so bestimmt die Wahrscheinlichkeitsverteilung, mit welchen Wahrscheinlichkeiten die einzelnen Ausprägungen auftreten.

( ) 101)( ≤=≤==∑ kk

k xXPxXP ,

Berechnung von Wahrscheinlichkeiten für diskrete ZVen:

» Zusammenhang zw. VF und Wahrscheinlichkeiten:

4.6 Diskrete Zufallsvariable

( )

)()(

)()(

)(

xXPaXP

aFxXPaXP

aXP

axi

axi

i

==<

===≤=

<

sfunktion)Verteilung n(Definitio

Verteilung jeweiligender ndentspreche Berechnung

22Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

» Achtung: Unterscheidung zwischen < und ≤(darf nicht verwechselt werden).

( )( ) )(1)(1

)()()()(

)()(

aFaXPaXP

aFbFaXPbXPbXaP

xXPbXaPb

axi

ax

i

i

−=≤−=>−=≤−≤=≤<

==≤≤ ∑

=

<

Page 12: Statistik Vorlesung Kapitel 4 - hs-esslingen.dekamelzer/stat/Statistik_Vorlesung_Kapitel_4.pdf · Statistik, Prof. Dr. Karin Melzer 19 Hochschule Esslingen welchen Wahrscheinlichkeiten

4.6 Diskrete Zufallsvariablen

Kennzahlen diskreter Zufallsvariablen

» Erwartungswert

» Varianz

( ) ( )∑ =⋅==i

ii xXPxXEµ

( ) ( ) ( )∑ =⋅−== ii xXPxXVar 22 µσ

23Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

» „Taschenrechnerformel“ (besser zu berechnen):

» Standardabweichung

( ) ( ) ( )∑ =⋅−==i

ii xXPxXVar µσ

( ) 222 µσ −

=⋅= ∑i

ii xXPx

( )XVar== 2σσ

4.6 Diskrete Zufallsvariablen

Bemerkungen zu Erwartungswert µ und arithmetisches Mittel :

» Pro Zufallsexperiment ist µ eine Konstante, während vom Zufall abhängt, nämlich von der jeweiligen Messreihe x1, x2, x3, … xn , den Realisierungen der Zufallsvariablen X.

» Im Allgemeinen gilt daher:

» Falls n groß ist, gilt das „Gesetz der großen Zahlen“, das besagt, dass .

» Der Wert wird später (siehe Kapitel 5) zur Schätzung von µ benutzt. Die Schätzung ist umso besser, je größer n ist.

x≠µ

xx

x≈µx

24Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

Bemerkungen zu Varianz σ2 und empirische Varianz s2:

» Pro Zufallsexperiment ist σ2 eine Konstante, während s2 vom Zufall abhängt, nämlich von der jeweiligen Messreihe x1, x2, x3, … xn , den Realisierungen der Zufallsvariablen X.

» Im Allgemeinen gilt daher: σ2 ≠ s2.

» Falls n groß ist, gilt das „Gesetz der großen Zahlen“, das besagt, dass σ2 ≈ s2 .

» Der Wert s2 wird später (siehe Kapitel 5) zur Schätzung von σ2 benutzt. Die Schätzung ist umso besser, je größer n ist.

Page 13: Statistik Vorlesung Kapitel 4 - hs-esslingen.dekamelzer/stat/Statistik_Vorlesung_Kapitel_4.pdf · Statistik, Prof. Dr. Karin Melzer 19 Hochschule Esslingen welchen Wahrscheinlichkeiten

4.7 Spezielle diskrete Zufallsvariablen

» Wir betrachten hier folgende diskrete Verteilungen» Hypergeometrische Verteilung» Binomialverteilung» Poisson-Verteilung

» Zufallsvariablen (ZV) werden durch ihre Verteilung vollständig charakterisiert.

» Bei diskreten ZV entspricht die Verteilung der Angabe der Wahrscheinlichkeiten für die Elementarereignisse (Dichte).

25Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

Wahrscheinlichkeiten für die Elementarereignisse (Dichte). » Statt der Dichte kann man auch die Verteilungsfunktion angeben.

Dichte und Verteilungsfunktion lassen sich ineinander überführen.» Aus der Verteilung lassen sich die Wahrscheinlichkeiten für alle

Ereignisse berechnen.» Außerdem lassen sich alle anderen Kennzahlen ableiten:

» Erwartungswert» Varianz» Standardabweichung

4.7 Spezielle diskrete Zufallsvariablen4.7.1 Hypergeometrische Verteilung

» Ausgangslage» Grundgesamtheit (GG) aus N Elementen,

» M Elemente der GG haben eine spezifische Eigenschaft A,

» entnommen wird eine Stichprobe (ohne Zurücklegen) vom Umfang n

» Die ZV X gebe an, wie viele der gezogenen Objekte die Eigenschaft A haben.X = Anzahl der Elemente mit Eigenschaft A in der Stichprobe

» Dann ist X hypergeometrisch verteilt mit Parametern n, N, M. Man schreibtX ~ H(n;N;M)

» Achtung: in machen Büchern ist die Reihenfolge der Parameter anders.

26Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

» Achtung: in machen Büchern ist die Reihenfolge der Parameter anders.

» Die Wahrscheinlichkeit, genau k Elemente mit der spezifischen Eigenschaft in der Stichprobe vorzufinden, beträgt dann: (diskrete Dichte)

( )

−−

==

n

Nkn

MN

k

M

kXP

Page 14: Statistik Vorlesung Kapitel 4 - hs-esslingen.dekamelzer/stat/Statistik_Vorlesung_Kapitel_4.pdf · Statistik, Prof. Dr. Karin Melzer 19 Hochschule Esslingen welchen Wahrscheinlichkeiten

4.7 Spezielle diskrete Zufallsvariablen4.7.1 Hypergeometrische Verteilung

» Erwartungswert für X ~ H(n;N;M):

wobei Anteil der Objekte mit Eigenschaft A in der Grundgesamtheit

» Varianz:

Typische Anwendungssituation für hypergeometrische Verteilung:

( ) , pnN

MnXE ⋅=⋅==µ

==N

Mp

( ) pqN

nNqpnXVar −=

−−⋅⋅⋅== 1

12 mit , σ

27Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

Typische Anwendungssituation für hypergeometrische Verteilung:

» Ziehen ohne Zurücklegen: » Gegeben sind N Objekte (z. B. eine Lieferung von Bauteilen oder Kugeln in

einer Urne). M gebe die Anzahl der Objekte mit einer bestimmten Eigenschaft A an (z. B. defektes Bauteil bzw. rote Kugel). Unter den Objekten wird n-mal eines zufällig ausgewählt; das gezogene Objekt wird nicht zurückgelegt. Das Ergebnis der folgenden Ziehung ist also von den vorherigen Ziehungen abhängig. X gibt dann an, wie viele der gezogenen Objekte die Eigenschaft A haben (z. B. Anzahl der Defektstücke bzw. Anzahl der roten Kugeln).

4.7 Spezielle diskrete Zufallsvariablen4.7.2 Binomialverteilung

» Ausgangslage» Ein Zufallsexperiment wird n-mal durchgeführt (unabhängig voneinander). » Bei jeder der Durchführungen kann ein Ereignis A („Erfolg“) mit der

Wahrscheinlichkeit P(A) = p auftreten. Das Gegenereignis Ā („Misserfolg“) tritt mit einer Wahrscheinlichkeit von P(Ā) = 1 –p auf.

» Die Zufallsvariable X gibt an, wie oft bei den n Durchführungen das Ereignis A eintritt.

» X = Anzahl „Erfolge“ bei n-maliger Durchführung des Experiments» Dann ist X binomialverteilt mit den Parametern n, p und man schreibt

X ~ B(n; p)

28Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

X ~ B(n; p)» Die Wahrscheinlichkeit, dass das Ereignis A genau k-mal bei den n

Versuchen eintritt, beträgt (Dichte):

» Erwartungswert und Varianz für X ~ B(n; p):» µ = E(X) = n · p ,» σ2 = Var(X) = n · p · q mit q = 1 –p

( ) ( ) nkppk

nkXP knk ...,,1,01 =−⋅⋅

== −

Page 15: Statistik Vorlesung Kapitel 4 - hs-esslingen.dekamelzer/stat/Statistik_Vorlesung_Kapitel_4.pdf · Statistik, Prof. Dr. Karin Melzer 19 Hochschule Esslingen welchen Wahrscheinlichkeiten

4.7 Spezielle diskrete Zufallsvariablen4.7.2 Binomialverteilung

Typische Anwendungssituationen für die Binomialverteilung:» n unabhängige Wiederholungen eines Zufallsexperimentes

(z.B. Aufg. 75: Werfen eines Würfels mit X = # Einsen)» n-maliges Ziehen mit Zurücklegen aus einer endlichen

Grundgesamtheit (z.B. Aufg. 70: Ziehen von schwarzen Kugeln mit X = # der gezogenen schwarzen Kugeln)

» n-maliges Ziehen ohne Zurücklegen aus einer unendlichen Grundgesamtheit (z.B. Aufg. 72: laufende Produktion oder Massenproduktion mit p= Ausschussanteil, X = # der defekten

29Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

Grundgesamtheit (z.B. Aufg. 72: laufende Produktion oder Massenproduktion mit p= Ausschussanteil, X = # der defekten Teile in der Stichprobe)

» Binomialverteilung B(n,p) als Näherung der hypergeometrischen Verteilung H(n;N;M).

» Falls N groß ist und n nicht zu groß ist (Faustregel: )darf die hypergeom. Verteilung H(n;N;M) durch die Binomialverteilung B(n,p) angenähert werden.

» Dabei ist p = M/N zu setzen.

1,0≤N

n

4.7 Spezielle diskrete Zufallsvariablen4.7.3 Poisson-Verteilung

» Gegeben » Betrachtungseinheit wie z.B. Länge, Zeit

oder Fläche

» die mittlere Anzahl λ (lambda) von Vorkommnissen pro Betrachtungseinheit

» X = Anzahl der Vorkommnisse pro Betrachtungseinheit

» Dann sagt man, X ist Poissonverteilt mit

30Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

» Dann sagt man, X ist Poissonverteilt mit dem Parameter λ

» und schreibt X ~ Po(λ)

» Die Wahrscheinlichkeit, dass genau kVorkommnisse pro Betrachtungseinheit auftreten, beträgt (diskrete Dichte):

( ) λλ −== ek

kXPk

!

Siméon Denis Poisson 1781-1840

Page 16: Statistik Vorlesung Kapitel 4 - hs-esslingen.dekamelzer/stat/Statistik_Vorlesung_Kapitel_4.pdf · Statistik, Prof. Dr. Karin Melzer 19 Hochschule Esslingen welchen Wahrscheinlichkeiten

4.7 Spezielle diskrete Zufallsvariablen4.7.3 Poisson-Verteilung

» Erwartungswert und Varianz für X ~ Po(λ):µ = E(X) = λσ2 = Var(X) = λ

Typische Anwendungssituationen für Poissonverteilung:

» In Fällen, bei denen als Parameter nur eine „mittlere Anzahl“ bekannt ist, eignet sich die Poissonverteilung.

» Beispiel: In einer Telefonzentrale gehen im Mittel 3 Gespräche innerhalb von 5 Minuten ein. Dann ist zur Beschreibung der

31Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

innerhalb von 5 Minuten ein. Dann ist zur Beschreibung der zufälligen Anzahl der in 5 Minuten eingehenden Gespräche eine Poissonverteilung mit λ = 3 anwendbar.

» Poissonverteilung als Näherung der Binomialverteilung,wenn n groß und p klein ist

» Faustregel: Näherung erlaubt für n ≥ 30 und p ≤ 0,1(verschieden Faustregeln in der Literatur!)

» Dann Po(λ) als Näherung für die Binomialverteilung B(n;p), wobei λ = npgesetzt wird (z.B. Aufgabe 81)

4.7 Spezielle diskrete Zufallsvariable:Näherungen (Zusammenfassung)

X ~ H(n;N;M)

» Voraussetzung: N groß und n nicht zu groß (N/n ≤ 0,1)

» Dann kann man die Wahrscheinlichkeiten näherungsweise mit der Binomialverteilung berechnen, wobei n beibehalten wird und p = M/N ist.

rteilungBinomialve Vert Hypergeom. groß klein, → Nn

32

X ~ B(n,p)

» Voraussetzung: p ≤ 0,1 (klein) und n ≥ 30(groß)

» Dann kann man die Wahrscheinlichkeiten näherungsweise durch die Poissonverteilung mit λ = n ⋅pberechnen

Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

rteilungBinomialve Vert Hypergeom. →

teilungPoissonver rteilungBinomialve groß klein, → np

Page 17: Statistik Vorlesung Kapitel 4 - hs-esslingen.dekamelzer/stat/Statistik_Vorlesung_Kapitel_4.pdf · Statistik, Prof. Dr. Karin Melzer 19 Hochschule Esslingen welchen Wahrscheinlichkeiten

4.8 Stetige Zufallsvariablen

» Das Konzept der diskreten Zufallsgrößen P( X = xi ) = pi > 0 , Σpi = 1 (Gewichte)

passt in vielen Situationen nicht: » Zeit bis zum Eintreten eines Ereignisses

(Ausfall eines Geräts, Antwort eines Servers) » Messungen auf kontinuierlicher Skala

(Größe, Gewicht, Widerstand, Spannung,…)

» Beispiel: P(Körpertemperatur übermorgen um 7:00 Uhr ist 36,457812 °C) = ?

33Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

P(Körpertemperatur übermorgen um 7:00 Uhr ist 36,457812 °C) = ?» Es gibt keine Gewichte!» Modellvorstellungen mit Wahrscheinlichkeiten oder gar

kombinatorischen Berechnungen von Laplace-Wktn. sind hier nicht möglich!

» Neue Vorstellung: Die Gewichte werden „verschmiert“, aus den pi entsteht eine positive Funktion f , die Wahrscheinlichkeits-Dichte.

4.8 Stetige Zufallsvariable

» Die Wahrscheinlichkeits-Dichte kann man sich vorstellen als idealisiertes Histogramm, in dem relative Häufigkeiten (Prozentwerte) dargestellt werden

→ sehr viele Beobachtungen

34Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

→ sehr viele Beobachtungen

→ viele Klassen

» Vorstellung: verbinde die Mitten der Säulen.

» Daten werden jetzt durch eine Kurve repräsentiert

Page 18: Statistik Vorlesung Kapitel 4 - hs-esslingen.dekamelzer/stat/Statistik_Vorlesung_Kapitel_4.pdf · Statistik, Prof. Dr. Karin Melzer 19 Hochschule Esslingen welchen Wahrscheinlichkeiten

4.8 Stetige Zufallsvariablen

Definition:

» Eine Zufallsvariable X ist eine stetige Zufallsvariable, wenn sie jeden beliebigen Wert in einem Intervall annehmen kann,

» das ist genau dann der Fall, wenn eine Dichtefunktion f ≥ 0 existiert, mit

x

35Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

» f(x) heißt Dichtefunktion von X

» Die Verteilungsfunktion F(x) = P(X ≤ x) ist dann eine stetige Funktion.

∫∞−

=≤=x

duufxXPxF )()()(

4.8 Stetige Zufallsvariablen

Folgerungen:

» Fläche unter der Dichte = 1:

» F(x) = P(X ≤ x) entspricht dem Flächeninhalt unter dem Graphen von fim Intervall von –∞ bis x bzw. „Fläche unter der Dichte links von x“:

» Berechnung von Wahrscheinlichkeiten als Fläche unter der Dichte:

1)( =∫∞

∞−

duuf

∫∞−

=≤=x

duufxXPxF )()()(

b

36Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

» P(X=x) = 0 für alle x ∊ ℝ

» P(X ≤ x) = P(X < x) und P(X ≥ x) = P(X > x)jedes „≤“ darf für stetige ZV durch „<“ ersetzt werden.

» Zusammenhang Dichte – Verteilungsfunktion: F´(x) = f(x)

)(1)(),()(

)()()()(

aFXaFbFbXP

aFbFdxxfbXaPb

a

−=≤=≤

−==≤≤ ∫

Page 19: Statistik Vorlesung Kapitel 4 - hs-esslingen.dekamelzer/stat/Statistik_Vorlesung_Kapitel_4.pdf · Statistik, Prof. Dr. Karin Melzer 19 Hochschule Esslingen welchen Wahrscheinlichkeiten

4.8 Stetige Zufallsvariablen

» Berechnung von Kennzahlen und Wahrscheinlichkeiten einer diskreten und stetigen Zufallsvariable X im Vergleich:

Ausdruck Symbol X diskret X stetig Wert der Verteilungsfunktion an der Stelle x

)()( xXPxFX ≤= ∑≤

=xk

kXP )( ( )duufx

∫∞−

Wahrscheinlichkeit dafür, dass die Zufallsvariable X ( )bXaP ≤≤ ( )∑ =

b

kXP ( )duufb

37Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

Zufallsvariable X einen Wert zw. a und b annimmt

( )bXaP ≤≤ ( )∑=

=ak

kXP ( )duufa

Erwartungswert ( )XE=µ ∑ =i

ii xXPx )( ( )duufu∫∞

∞−

Varianz )(2 XVar=σ

( )22

2

)(

)(

µ

µ

−=

==−

iii

iii

xXPx

xXPx

( ) ( )

( ) 22

2

µ

µ

=−

∫∞

∞−

∞−

duufu

duufu

4.9 Spezielle stetige Zufallsvariablen

» Wir betrachten folgende Beispiele für stetige ZV» Gleichverteilung

» Exponentialverteilung

» Normalverteilung/Standardnormalverteilung

4.9.1 Gleichverteilung» Eine Zufallsvariable mit der Dichtefunktion

1

38Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

heißt gleichverteilt auf dem Intervall [a,b].

» Schreibweise: X ~ U(a,b)

» Erwartungswert und Varianz sind in diesem Fall gegeben durch

( )

≤≤

−=sonst

für

,0

,1

bxaabxf

( )122

22 abba −=+= σµ und

Page 20: Statistik Vorlesung Kapitel 4 - hs-esslingen.dekamelzer/stat/Statistik_Vorlesung_Kapitel_4.pdf · Statistik, Prof. Dr. Karin Melzer 19 Hochschule Esslingen welchen Wahrscheinlichkeiten

4.9 Spezielle stetige Zufallsvariablen4.9.2 Exponentialverteilung

» Eine Zufallsvariable mit der Dichtefunktion

oder mit der Verteilungsfunktion

( ) >

=−

sonst

für

,0

0, xexf

xλλ

( ) >−

=−

sonst

für

,0

0,1 xexF

39Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

heißt exponentialverteilt mit Parameter λ.

» Schreibweise: X ~ Exp(λ)

» Für Erwartungswert und Varianz gilt:

sonst,0

22 11

λσ

λµ == und

4.9 Spezielle stetige Zufallsvariablen4.9.3 Normalverteilung

Unter allen stetigen Dichtekurven herausragend: die Normalverteilung.

» Wichtig(st)e stetige Verteilung

» Beschreibt viele Größen, die in der Realität vorkommen.

» Abweichungen von (Mess-)Werten vieler ingenieurswissenschaftlicher Vorgänge vom Mittelwert lassen sich durch die Normalverteilung entweder exakt oder wenigstens in sehr guter Näherung beschreiben

» Vor allem bei Prozessen, bei denen mehrere Faktoren unabhängig voneinander in verschiedene

40

voneinander in verschiedene Richtungen wirken, kann man von einer Normalverteilung ausgehen.

» Beispiele:» Zufällige Messfehler

» zufällige Abweichungen vom Sollmaß bei der Fertigung von Werkstücken

Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

Page 21: Statistik Vorlesung Kapitel 4 - hs-esslingen.dekamelzer/stat/Statistik_Vorlesung_Kapitel_4.pdf · Statistik, Prof. Dr. Karin Melzer 19 Hochschule Esslingen welchen Wahrscheinlichkeiten

4.9 Spezielle stetige Zufallsvariablen4.9.3 Normalverteilung

Eigenschaften der Normalverteilung:

» Symmetrisch

» Es gibt viele verschiedene Kurven, manche schmal und hoch, manche breit und flach

» Das Zentrum kann an einer beliebigen Stelle sein. Manche sind bei 0 zentriert, manche bei 5, etc.

» Jede Normalverteilung wird eindeutig durch zwei Parameter

41

eindeutig durch zwei Parameter identifiziert: Erwartungswert und Standardabweichung.

» Kennt man µ und σ, kann man dieNormalverteilung zeichnen.

» Erwartungswert: Mitte der Kurve

» Standardabweichung: definiert, wie breit die Verteilung ist

Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

4.9 Spezielle stetige Zufallsvariablen4.9.3 Normalverteilung

» Ist eine Zufallsvariable X normalverteilt, so schreibt manX ~ N(µ,σ2)

» Dabei ist µ der Erwartungswert und σ2 die Varianz» Erwartungswert µ und Varianz σ2 müssen entweder bekannt

sein, oder es muss eine Stichprobe vorliegen, so dass man die Werte aus den Daten über das arithmetische Mittel bzw. die empirische Varianz schätzen kann.

» Die zugehörige Wahrscheinlichkeitsverteilung heißt

42Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

» Die zugehörige Wahrscheinlichkeitsverteilung heißt Normalverteilung oder Gauß-Verteilung.

» Dichte: (Gauß´sche Glockenkurve)

» Erwartungswert: E(X) = µ (bestimmt Lage der Dichte)» Varianz: Var(X) = σ2 (bestimmt Form der Glocke)

( )( )

2

2

2

2

1 σµ

σπ

−−⋅=

x

exf

Page 22: Statistik Vorlesung Kapitel 4 - hs-esslingen.dekamelzer/stat/Statistik_Vorlesung_Kapitel_4.pdf · Statistik, Prof. Dr. Karin Melzer 19 Hochschule Esslingen welchen Wahrscheinlichkeiten

4.9 Spezielle stetige Zufallsvariablen4.9.3 Normalverteilung

» Die Gauß´sche Glockenkurve besitzt die folgenden Eigenschaften:» sie ist symmetrisch zu x0=µ,» die einzige Maximumsstelle existiert bei x0=µ,» sie besitzt zwei Wendepunkte an den Stellen x1=µ + σ und x2=µ – σ, » Flächeninhalt unter der Gauß´schen Glockenkurve ist gleich 1 (wie jede

Dichte, d.h. in dem Fall eine schmale Glockenkurve ist hoch, eine breite Glockekurve ist niedrig).

» Die Verteilungsfunktion

43Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

» Die Verteilungsfunktion

kann nur numerisch berechnet werden (und damit auch die Wktn.)

» In der Praxis » Verwendung von Tabellen für die Standardnormalverteilung N(0,1).» Excel: =NORMVERT(x; µ; σ; „kumuliert“);

» Kumuliert WAHR = P(X ≤ x) = VF (zur Berechnung von Wktn.); » Kumuliert FALSCH = f(x) (Funktions-)Wert der Dichtefunktion

( )dtexXPxF

x t

X ∫∞−

−−

⋅=≤= 2

2

2

1

2

1)()( σ

µ

πσ

Berechnung von Wahrscheinlichkeiten für normalverteilte ZVen:

» Es gibt unendlich viele Normalverteilungen (für jede Kombination von µ und σ)

» Zwischen allen Kurven gibt es aber eine Beziehung, alle können in die sog. Standardnormalverteilung transformiert werden.

» Z ist normalverteilt mit EW 0 und Varianz 1: Z ~ N(0,1)

4.9 Spezielle stetige Zufallsvariablen 4.9.3 Normalverteilung

( )1,0~ NX

µ−=

44Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

» Für die Standardnormalverteilung liegt die Verteilungsfunktion (Fläche „links von“ a) als Tabelle vor: Φ(z) = P(Z ≤ z)

» Damit kann man die Wahrscheinlichkeiten für beliebige X~N(µ,σ2)berechnen:

» Kurz: ( )

−Φ=≤σ

µxxXP

( ) ( )

−Φ=

−≤=

−≤−=≤=σ

µσ

µσ

µσ

µ xxZP

xXPxXPxFX

Page 23: Statistik Vorlesung Kapitel 4 - hs-esslingen.dekamelzer/stat/Statistik_Vorlesung_Kapitel_4.pdf · Statistik, Prof. Dr. Karin Melzer 19 Hochschule Esslingen welchen Wahrscheinlichkeiten

Berechnung von Wahrscheinlichkeiten für normalverteilte ZVen:

» Wahrscheinlichkeiten für X~N(µ,σ2):(Berechnung als Fläche unter der Dichte)

4.9 Spezielle stetige Zufallsvariablen 4.9.3 Normalverteilung

( )

( )

( ) a

bbFbXP

abaFbFbXaP

X

XX

−Φ==≤

−Φ−

−Φ=−=≤≤

)(

)()(

µσ

µσ

µσ

µ

45Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

» P(X = x) = 0 für alle x ∊ ℝ

» P(X ≤ x) = P(X < x) und P(X ≥ x) = P(X > x)d.h. jedes „≤“ darf für stetige ZV durch „<“ ersetzt werden und umgekehrt.

( )

( ) ( )zz

z

aaFaXP X

Φ−=−ΦΦ

−Φ−=−=≥

1

)(

1)(1

lungrmalverteiStandardnoder sfunktionVerteilung : mit

σµ

4.9 Spezielle stetige Zufallsvariablen 4.9.3 Normalverteilung

Verteilungsfunktion )(zΦ der Standard-Normalverteilung N(0; 1)

z 0 1 2 3 4 5 6 7 8 9 0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359 0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753 0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141 0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517 0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879 0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224 0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549 0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852 0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133 0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389 1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621 1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830 1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015 1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177

46Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177 1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319 1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441 1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545 1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633 1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706 1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767 2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817 2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857 2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890 2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916 2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936 2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952 2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964 2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974 2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981 2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986 3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990

Ablesebeispiel: 8212,0)92,0( =Φ Werte für negatives z mit der Formel )(1)( zz Φ−=−Φ , z. B.

0606,09394,01)55,1( =−=−Φ

Page 24: Statistik Vorlesung Kapitel 4 - hs-esslingen.dekamelzer/stat/Statistik_Vorlesung_Kapitel_4.pdf · Statistik, Prof. Dr. Karin Melzer 19 Hochschule Esslingen welchen Wahrscheinlichkeiten

4.10.1 Quantile der Normalverteilung» Die Zahl z mit P(Z ≤ z) = 0,95heißt das 95 %-Quantil der

(Standard)Normalverteilung.

» Der Zahlenwert dieses Quantils ist 1,645; man schreibt hierfür

z0,95= 1,645.

» Entsprechend sind das 99 %-Quantil und weitere Quantile definiert.

» Die wichtigsten Quantile stehen in einer Tabelle zur Verfügung.

4.10 Quantile & Zufallsstreubereiche

47

Allgemein:

» Für eine Zufallsvariable Z ~ N(0; 1) heißt die Zahl zp mit

P(Z ≤ zp) = Φ(zp) = p für 0 ≤ p ≤ 1

das p-Quantil der Standardnormalverteilung (Werte: Tabelle).

» Für eine Zufallsvariable X ~ N(µ; σ2) heißt die Zahl qp = µ + zp·σ mit

P(X ≤ qp) = p für 0 ≤ p ≤ 1

das p-Quantil dieser Normalverteilung.

Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

4.10 Quantile der Standard-normalverteilung & Zufallsstreubereiche

Quantile

der t-Verteilung m

it

Quantile

der Standard

q

m

0,8 0,9

0,951

1,376 3,078

6,3142

1,061 1,886

2,9203

0,978 1,638

2,3534

0,941 1,533

2,1325

0,920 1,476

2,0156

0,906 1,440

1,9437

0,896 1,415

1,8958

0,889 1,397

1,8609

0,883 1,383

1,83310

0,879 1,372

1,81211

0,876 1,363

1,79612

0,873 1,356

1,78213

0,870 1,350

1,77114

0,868 1,345

1,76115

0,866 1,341

1,75316

0,865 1,337

1,74617

0,863 1,333

1,74018

0,862 1,330

1,73419

0,861 1,328

1,72920

0,860 1,325

1,72521

0,859 1,323

1,72122

0,858 1,321

1,71723

0,858 1,319

1,71424

0,857 1,318

1,71125

0,856 1,316

1,70826

0,856 1,315

1,70627

0,855 1,314

1,70328

0,855 1,313

1,70129

0,854 1,311

1,69930

0,854 1,310

1,69735

0,852 1,306

1,69040

0,851 1,303

1,68445

0,850 1,301

1,67950

0,849 1,299

1,67660

0,848 1,296

1,67170

0,847 1,294

1,66780

0,846 1,292

1,66490

0,846 1,291

1,662100

0,845 1,290

1,660200

0,843 1,286

1,653500

0,842 1,283

1,648

N

V

0,842 1,282

1,645 A

blesebeispiele: ;

Werte für

mit den F

ormeln

Beispiele hierfür:

48Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

Verteilung m

it m F

reiheitsgraden und

der Standard-Norm

alverteilung (NV

)

0,95

0,975 0,99

0,995 0,999

6,314 12,706

31,821 63,656

318,289 2,920

4,303 6,965

9,925 22,328

2,353 3,182

4,541 5,841

10,214 2,132

2,776 3,747

4,604 7,173

2,015 2,571

3,365 4,032

5,894 1,943

2,447 3,143

3,707 5,208

1,895 2,365

2,998 3,499

4,785 1,860

2,306 2,896

3,355 4,501

1,833 2,262

2,821 3,250

4,297 1,812

2,228 2,764

3,169 4,144

1,796 2,201

2,718 3,106

4,025 1,782

2,179 2,681

3,055 3,930

1,771 2,160

2,650 3,012

3,852 1,761

2,145 2,624

2,977 3,787

1,753 2,131

2,602 2,947

3,733 1,746

2,120 2,583

2,921 3,686

1,740 2,110

2,567 2,898

3,646 1,734

2,101 2,552

2,878 3,610

1,729 2,093

2,539 2,861

3,579 1,725

2,086 2,528

2,845 3,552

1,721 2,080

2,518 2,831

3,527 1,717

2,074 2,508

2,819 3,505

1,714 2,069

2,500 2,807

3,485 1,711

2,064 2,492

2,797 3,467

1,708 2,060

2,485 2,787

3,450 1,706

2,056 2,479

2,779 3,435

1,703 2,052

2,473 2,771

3,421 1,701

2,048 2,467

2,763 3,408

1,699 2,045

2,462 2,756

3,396 1,697

2,042 2,457

2,750 3,385

1,690 2,030

2,438 2,724

3,340 1,684

2,021 2,423

2,704 3,307

1,679 2,014

2,412 2,690

3,281 1,676

2,009 2,403

2,678 3,261

1,671 2,000

2,390 2,660

3,232 1,667

1,994 2,381

2,648 3,211

1,664 1,990

2,374 2,639

3,195 1,662

1,987 2,368

2,632 3,183

1,660 1,984

2,364 2,626

3,174 1,653

1,972 2,345

2,601 3,131

1,648 1,965

2,334 2,586

3,107

1,645

1,960 2,326

2,576 3,090

und .

;

Page 25: Statistik Vorlesung Kapitel 4 - hs-esslingen.dekamelzer/stat/Statistik_Vorlesung_Kapitel_4.pdf · Statistik, Prof. Dr. Karin Melzer 19 Hochschule Esslingen welchen Wahrscheinlichkeiten

4.10 Quantile der Standard-normalverteilung & Zufallsstreubereiche

4.10.2 Zufallsstreubereich oder Prognoseintervall» Zufallsstreubereich oder Prognoseintervall einer normalverteilten

Zufallsvariable X: ein Intervall um den Erwartungswert µ, in dem sich die Ausprägungen von X mit einer Wahrscheinlichkeit p (z. B. p = 90%, 98%, 99%) befinden.

» Die Ausprägungen von X befinden sich außerhalb des Zufallsstreubereiches mit einer Wahrscheinlichkeit von α =1-p.

» Zufallsstreubereiche können die folgende Form annehmen:

49Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

» Zufallsstreubereiche können die folgende Form annehmen:

» Zweiseitiger Zufallsstreubereich für X~N(µ;σ2):

» Einseitig nach oben beschränkter Zufallsstreubereich für X~N(µ;σ2):

» Einseitig nach unten beschränkter Zufallsstreubereich für X~N(µ;σ2):

[ ]σµσµ αα ⋅+⋅− −−22

11; zz

[ )∞⋅− − ;1 σµ αz

( ]σµ α ⋅+∞− −1; z

4.10 Quantile der Standard-normalverteilung & Zufallsstreubereiche

4.10.3 Zufallsstreubereich für

» Das durch X~N(µ;σ2) beschriebene Zufallsexperiment soll jetzt nicht nur einmal durchgeführt werden, sondern n-mal unabhängig wiederholt werden. In welchem Bereich wird der arithmetische Mittelwert der nDaten liegen? Ein solcher Bereich heißt ein Zufallsstreubereich für

» Die entsprechenden Formeln lauten (wegen ):

» zweiseitiger Zufallsstreubereich

X

σσ

X

nNX

2

;~σµ

50Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

» zweiseitiger Zufallsstreubereich

» einseitig nach oben beschränkt

» einseitig nach unten beschränkt

» Formeln für n = 1 Zufallsstreubereich für X

⋅+⋅− −− nz

nz

σµσµ αα22

11;

∞⋅− − ;1n

zσµ α

⋅+∞− −n

zσµ α1;

Page 26: Statistik Vorlesung Kapitel 4 - hs-esslingen.dekamelzer/stat/Statistik_Vorlesung_Kapitel_4.pdf · Statistik, Prof. Dr. Karin Melzer 19 Hochschule Esslingen welchen Wahrscheinlichkeiten

4.11 Der Zentrale GrenzwertsatzEinführendes Beispiel (1)

» Sie arbeiten in einer Firma, deren Gewinn im nächsten Jahr folgendermaßen modelliert werden kann: drehen Sie ein Glücksrad, das Werte zwischen 0 und 1 liefert, und multiplizieren Sie diesen Wert mit 1 Mio. (d. h. der Gewinn liegt zw. 0 und 1 Mio. EUR).

» Ihr Risiko: Ist der Gewinn < 200.000 €, bekommen Sie keinen Bonus.

» Fragen:» Wie hoch wäre der durchschnittliche Gewinn, wenn diese Situation wiederholt

auftritt?

51Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

auftritt?

» Wie groß ist die Wkt., dass Sie keinen Bonus bekommen?

» Ihr Chef fragt nach „einer Zahl“ für den Gewinn. Was sollten Sie ihm antworten?

» Wie würde ein Histogramm aussehen, das die Prozentanteile dafür zeigt, dass der Gewinn in die folgenden Klassen fällt:

0 − 0,2 0,2 − 0,4 0,4 − 0,6 0,6 − 0,8 0,8 − 1

4.11 Der Zentrale GrenzwertsatzEinführendes Beispiel (2)

» Jetzt: Durchschnittsbildung Bei der Bildung eines Durchschnitts von Zufallszahlen wird die Unsicherheit reduziert („Diversifizierung“)

» Modifizieren Sie die Gewinnfunktion: bilden Sie den Durchschnitt aus dem Ergebnis von zwei Glücksrädern und multiplizieren Sie diesen Wert mit 1 Mio.

» Beträgt der Gewinn weniger als 200.000 €, bekommen Sie keinen Bonus.

» Fragen (wie vorher):» Wie hoch wäre der durchschnittliche Gewinn, wenn diese Situation wiederholt

auftritt?

52Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

auftritt?

» Wie groß ist die Wkt., dass Sie keinen Bonus bekommen?

» Ihr Chef fragt nach „einer Zahl“ für den Gewinn. Was sollten Sie ihm antworten?

» Wie würde ein Histogramm aussehen, das die Prozentanteile dafür zeigt, dass der Gewinn in die folgenden Klassen fällt:

0 − 0,2 0,2 − 0,4 0,4 − 0,6 0,6 − 0,8 0,8 − 1

Page 27: Statistik Vorlesung Kapitel 4 - hs-esslingen.dekamelzer/stat/Statistik_Vorlesung_Kapitel_4.pdf · Statistik, Prof. Dr. Karin Melzer 19 Hochschule Esslingen welchen Wahrscheinlichkeiten

4.11 Der Zentrale GrenzwertsatzEinführendes Beispiel (3)

» Simulation mit xls: zufallszahl() erzeugt zufällige Zahlen zwischen 0 und 1. Mit <F9> kontrollieren, ob‘s funktioniert (Werte müssen sich ändern).

» Fragen (wie vorher):» Durchschnittlicher Gewinn: Wie im ersten Fall: 0,5 Millionen (Erwartungswert)

» Wkt., dass kein Bonus gezahlt wird: Wesentlich kleiner als im 1. Fall (s. Histogramm)

» Ihr Chef fragt nach „einer Zahl“ für den Gewinn. Wenn es um Zufallszahlen geht, sollte man den Chef daran gewöhnen, besser zu fragen

53Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

besser zu fragen „Wie ist die Verteilung?“ anstatt „Was ist die Zahl?“

» Beispiel für Histogramm mit prozentualer Verteilung des Gewinns:

» Warum geht das Histogramm in

» der Mitte nach oben?

» Noch wichtiger: was bedeutet das?

Histogramm

0,00%

5,00%

10,00%

15,00%

20,00%

25,00%

30,00%

35,00%

40,00%

0 - 0,2 0,2 - 0,4 0,4 - 0,6 0,6 - 0,8 0,8 - 1

Gewinn in Mio.

Pro

zen

t

4.11 Der Zentrale GrenzwertsatzEinführendes Beispiel (4)

Warum geht das Histogramm in der Mitte nach oben? » Würfeln mit einem Würfel: Werte von 1 bis 6 mit gleicher Wkt. 1/6:

» Würfeln mit 2 Würfeln: Werte zwischen 2 und 12 mit unterschiedlicher Wkt.

1/6 1 2 3 4 5 6

6/36 43

5/36 33 34 44

4/36 32 42 52 53 54

54Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

» Glücksrad: » Angenommen, die Glücksräder drehen sich in 1/100-tel-Abschnitten.» Wie bekommt man 0: nur als Mittelwert von 0 und 0» Wie bekommt man 0,5: Mittelwert von 0 und 1, 0,01/0,99, 0,02/0,98, etc. » D.h. die Form der Verteilung ändert sich, wenn man den Mittelwert von ZV

bildet.

3/36 22 23 24 25 35 45 55

2/36 21 31 41 51 61 62 63 64 65

1/36 11 12 13 14 15 16 26 36 46 56 66

Page 28: Statistik Vorlesung Kapitel 4 - hs-esslingen.dekamelzer/stat/Statistik_Vorlesung_Kapitel_4.pdf · Statistik, Prof. Dr. Karin Melzer 19 Hochschule Esslingen welchen Wahrscheinlichkeiten

4.11 Der Zentrale GrenzwertsatzEinführendes Beispiel (5)

Welche Bedeutung hat die Änderung der Verteilung zur Mitte hin?

» Histogramm:» wenn der Balken in der Mitte höher wird, müssen die Balken an den Enden

kleiner werden (Summe: 100%)

» Das Risiko, keinen Bonus zu bekommen wird also kleiner.

» Allgemein: » Wenn man den Durchschnitt von Zufallsvariablen bildet, wird die Verteilung

des Durchschnitts in der Mitte höher und an den Enden niedriger, d.h. die

55Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

des Durchschnitts in der Mitte höher und an den Enden niedriger, d.h. die Verteilung wird mehr zentralisiert.

» Die Streuung einer Verteilung ist ein Maß für die Unsicherheit einer Zufallsvariablen.

» Je breiter die Verteilung, desto größer ist die Varianz bzw. Std.abweichung und damit desto größer ist die Unsicherheit (das Risiko).

» Je schmaler die Verteilung, desto kleiner ist die Varianz bzw. Std.abweichung und damit desto kleiner ist die Unsicherheit.

» ZGWS: bildet man die Summe o. den Durchschnitt über genügend viele unabhängige Zufallsvariablen (die Verteilung ist dabei egal), so erhält man eine Normalverteilung!

4.11 Der Zentrale Grenzwertsatz4.11.1 Summe/Durchschnitt normalverteilter ZV

» Sind X1, X2, X3, … Xn unabhängige (!) und normalverteilte Zufallsvariablen mit versch. Erwartungswerten µ1, µ2, µ3, …, µn und Standardabweichungen σ1, σ2, σ3, …, σn , dann gilt:

» Sn = X1+ X2+X3+… +Xn ~ N(µ1+µ2+µ3+ …+µn ; σ12 + σ2

2 + σ32 + …+ σn

2 )

» Spezialfälle:

» X1+ X2 ~ N(µ1 + µ2; σ12 + σ2

2 )

» X – X ~ N(µ – µ ; σ 2 + σ 2 ) (Achtung: „+“ bei Var)

56Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

» X1 – X2 ~ N(µ1 – µ2; σ12 + σ2

2 ) (Achtung: „+“ bei Var)

» Jetzt: gleiche Erwartungswerte µ1= µ2 = µ3 = …= µn = µ und gleiche Varianzen σ1

2 = σ22 = σ3

2 = …= σn2 =σ2

» Sn = X1+ X2+X3+… +Xn ~ N(nµ ; nσ2 ) (Summe normalverteilter ZV)

» D = 1/n (X1+ X2+X3+… +Xn) ~ N(µ ; σ2/n ) (Durchschnitt normalverteilter ZV)

Page 29: Statistik Vorlesung Kapitel 4 - hs-esslingen.dekamelzer/stat/Statistik_Vorlesung_Kapitel_4.pdf · Statistik, Prof. Dr. Karin Melzer 19 Hochschule Esslingen welchen Wahrscheinlichkeiten

4.11 Der Zentrale Grenzwertsatz 4.11.2 Der zentrale Grenzwertsatz

» Zentraler Grenzwertsatz: Summe/Durchschnitt nicht normalverteilter Zufallsvariablen

» Sind X1, X2, X3, … Xn (nicht notwendigerweise normalverteilte) Zufallsvariablen, die unabhängige Durchführungen desselben Zufallsexperimentes beschreiben,

» mit gleichen Erwartungswerten E(X1)= E(X2)=…=E(Xn) = µ und

» gleichen Varianzen Var(X1)=Var(X2)=…=Var(Xn)= σ2,

dann gilt für große n:

( )≈+++= nnNXXXS n2

21 ;... σµ

57Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

» Insbesondere bedeutet das, dass eine Summe vieler unabhängiger Größen näherungsweise normalverteilt ist, selbst wenn die einzelnen Summanden nicht normalverteilt sind.

( )

≈+++=

≈+++=

nN

n

XXXX

nnNXXXS

n

n

221

21

;...

;...

σµ

σµ

4.11 ZGWS4.11.3 Eigenschaften von EW & Varianz

Begründung für Erwartungswert und Varianz beim ZGWS:» Lineare Transformation:

» Für eine beliebige Zufallsvariable X und Konstanten a,b ∊ ℝ gilt immer

» Summe von Zufallsvariablen:» Für zwei beliebige Zufallsvariablen

( ) ( )( ) )(2 XVarabaXVar

bXaEbaXE

=++=+

58Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

» Für zwei beliebige Zufallsvariablen X und Y gilt immer

» Für zwei unabhängige Zufallsvariablen X und Y gilt

» Diese Formeln gelten analog auch für mehr als zwei ZV

» Standardisierung von ZV: Wenn E(X) = µ und Var(X) = σ2, dann ist

eine Zufallsvariable mit E(Z) = 0 und Var(Z) = 1.

( ) ( ) ( )YEXEYXE +=+

( ) ( ) ( )YVarXVarYXVar +=+

σµ−= X

Z

Page 30: Statistik Vorlesung Kapitel 4 - hs-esslingen.dekamelzer/stat/Statistik_Vorlesung_Kapitel_4.pdf · Statistik, Prof. Dr. Karin Melzer 19 Hochschule Esslingen welchen Wahrscheinlichkeiten

4.11 Der Zentrale Grenzwertsatz Beispiele für den ZGWS

» Näherung der Binomialverteilung durch die Normalverteilung

0,05

0,1

0,15

0,2

0,25

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

0

59Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0,16

0

00

0

0

0,05

4.11 Der Zentrale Grenzwertsatz Beispiele für den ZGWS

» Näherung einer Summe von Gleichverteilungen durch die Normalverteilung

0,2

0,4

0,6

0,8

1

1,2

0

0,2

0,4

0,6

0,8

1

1,2

-3 -2,6 -2,2 -1,8 -1,4 -1 -0,6 -0,2 0,2 0,6 1 1,4 1,8 2,2 2,6 3 3,4 3,8

60Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

0

-3 -2,6 -2,2 -1,8 -1,4 -1 -0,6 -0,2 0,2 0,6 1 1,4 1,8 2,2 2,6 3 3,4 3,8

-0,2

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

-3 -2,6 -2,2 -1,8 -1,4 -1 -0,6 -0,2 0,2 0,6 1 1,4 1,8 2,2 2,6 3 3,4 3,8 0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

-3 -2,6 -2,2 -1,8 -1,4 -1 -0,6 -0,2 0,2 0,6 1 1,4 1,8 2,2 2,6 3 3,4 3,8

Page 31: Statistik Vorlesung Kapitel 4 - hs-esslingen.dekamelzer/stat/Statistik_Vorlesung_Kapitel_4.pdf · Statistik, Prof. Dr. Karin Melzer 19 Hochschule Esslingen welchen Wahrscheinlichkeiten

4.11 Der Zentrale Grenzwertsatz4.11.4 Stetigkeitskorrektur

» Wird eine diskrete Zufallsvariable X, die nur ganzzahlige Werte annehmen kann, durch eine Normalverteilung approximiert, sollten Wahrscheinlichkeiten mit den Formeln

−−Φ−

+−Φ≈≤≤σµ

σµ 5,05,0

)(ab

bXaP

+−Φ≈≤

σµ 5,0

)(b

bXP

61Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

berechnet werden. » Achtung: Bei diesen Formeln darf „≤“ nicht durch „<“ ersetzt werden.» Die Summanden „+0,5“ bzw. „–0,5“ nennt man „Stetigkeitskorrektur“. » Sie sind erforderlich, wenn eine diskrete Zufallsvariable X mit

ganzzahligen Werten durch eine stetige Zufallsvariable (Normalverteilung) angenähert wird.

Φ≈≤σ

)( bXP

−−Φ−≈≤σµ 5,0

1)(a

XaP

4.11 Der Zentrale Grenzwertsatz4.11.4 Approximation von BV, PV, HV durch NV

Bekannt: X ~ H(n;N;M) ≈ B(n;p) ≈ Po(λ) mit λ = np bzw. p = N/M

(Faustregeln beachten)

ZGWS: Approximation von BV, PV, HV durch die Normalverteilung

» B(n;p) ≈ N(µ;σ2) mit µ = n·p und σ2 = n·p·q, wobei q = 1 –p. » Faustregel: Approximation ist gültig für n·p·q≥ 9.

» Po(λ) ≈ N(µ;σ2) mit µ = λ und σ2 = λ.

62Statistik, Prof. Dr. Karin MelzerHochschule Esslingen

» Po(λ) ≈ N(µ;σ ) mit µ = λ und σ = λ. » Faustregel: Approximation ist gültig für λ ≥ 9.

» H(n;M;N) ≈ N(µ;σ2) mit µ = n·pund σ2 = n·p·q·(N – n)/(N – 1), wobei p = M/N und q = 1 –p.

» Faustregel: Approximation ist gültig für n/N ≤ 0,05und n·p·q≥ 9.

» Merke: Alle Faustregeln bedeuten σ ≥ 3.

» In allen drei Fällen ist die Stetigkeitskorrektur bei der Berechnung der Wahrscheinlichkeiten zu beachten.