This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
1
AGAH Annual Meeting 2004, BerlinT. Sudhop und M. Reber: Workshop Biometrie - Beschreibende und schließende Statistik in Klinischen Studien
Grundlagen der BiometrieBeschreibende und schließende Statistik in
klinischen Studien
PD Dr. Thomas Sudhop & Dr. med. Dipl. chem. Michael ReberAbteilung für Klinische Pharmakologie
Universität Bonn
“Jede mathematische Formelreduziert die Anzahl der Zuhörer
um 50%”
Wie viele Formeln werden benötigt,um den Saal zu leeren?
“Statistik“Lehre von den Verteilungen
Deskriptive Statistik = empirischeVerteilungen von Merkmalen
Induktive/Analytische Statistik =Schließen von einer Stichprobe aufdie Grundgesamtheit
Wahrscheinlichkeitstheorie =Verteilungen von Zufallsvariablen
AGAH Annual Meeting 2004, BerlinT. Sudhop und M. Reber: Workshop Biometrie - Beschreibende und schließende Statistik in Klinischen Studien
Deskriptive StatistikWas?
Strukturierung der Rohdaten
Wie?Verwendung mathematischer Methoden zurstandardisierten Erfassung bestimmterMerkmale der erhobenen Daten
Warum?Hervorheben wesentlicher Zusammenhängedurch Datenreduktion und graphischeDarstellung um anderen Personen ohneKenntnisse der Einzeldaten die erhobenenBeobachtungen vermitteln zu können
Population
Population (Grundgesamtheit)Die Grundgesamtheit sind alle Individuen, fürwelche Schlussfolgerungen gezogen werden sollen.
- Alle Einwohner eines Bundeslandes
- Alle Autos in Deutschland- Alle Typ II Diabetiker (Zielpopulation)
Populationen weisen einen großen Umfang(=Menge der Elemente) auf und können dahernicht vollständig untersucht werden.
Stichprobe
StichprobeEine Stichprobe aus einer Population stelltdie Anzahl von Individuen dar, welchetatsächlich beobachtet werden.
Der Stichprobenumfang (Elemente derStichprobe = Fallzahl) muss ausreichendgroß sein
Stichproben sollten repräsentativ fürdie Population sein
Repräsentative StichprobeStichprobe sollte Elemente aus allenBereichen der Population umfassen
Alle PKW, welche an einem Stichtag zugelassenwurden
Alle roten PKW in Berlin sind nicht repräsentativfür alle PKW
Univariante deskriptive StatistikKurze und prägnante Charakterisierungder Daten einer Stichprobe
Statistische Kennwerte
Lagemaße
Streumaße
Graphische Darstellung
Lagemaße
- Mittelwerte
- Arithmetisches Mittel
- Geometrisches Mittel
- Harmonisches Mittel
- Getrimmtes Mittel
- Median
3
AGAH Annual Meeting 2004, BerlinT. Sudhop und M. Reber: Workshop Biometrie - Beschreibende und schließende Statistik in Klinischen Studien
Er ist der durchschnittliche Wert allerElemente einer Menge
Nachteil: empfindlich gegenüber Extremen
Berechnung:
Mittelwert = Summe aller Element : Anzahl aller Elemente
nxxxxx n++++
=L321
15
Geometrisches MittelFindet häufig Anwendung in der Pharmakokinetik
⊕ Weniger empfindlich gegen Extremwerte
Berechnung erfordert log.-Transformation
Berechnung:
nnxxxxx ⋅⋅⋅⋅= K321
16
Log - Transformation
statistische Verfahren beruhen auf derAnnahme, dass Versuchsdaten sich derNormalverteilung annähern
17
Log - Transformation
• Anpassung der Transformation durch Auswahl des Logarithmus
• Anwendung bei rechtschiefer Verteilung (Es liegen mehrWerte rechts vom Mittelwert)
nxxxx n)ln(...)ln()ln()ln( 21 +++
=
nnxxxxx ⋅⋅⋅⋅= K321
Mittel hesGeometrisc)ln( =xe
18
Harmonisches MittelEs dient als Lagemaß, wenn die BeobachtungswerteVerhältniszahlen sind (z.B. zur Berechnung einerdurchschnittlichen Geschwindigkeit oderÜberlebenszeit). Bsp.: Ohmsches Gesetz
Berechnung:
4
AGAH Annual Meeting 2004, BerlinT. Sudhop und M. Reber: Workshop Biometrie - Beschreibende und schließende Statistik in Klinischen Studien
19
Getrimmtes MittelEntspricht einem Arithmetischen Mittel
Vor der Berechnung werden an beiden Enden derVerteilung die Extremwerte gekappt (grau unterlegt)
0 100 200 300 400 500 600
20
Median
Der Median beschreibt den mittlerenWert in einer sortierten Stichprobe
Berechnung:
Stichprobe aufsteigend sortieren
Bei ungeradem Stichprobenumfang
⇒ Mittleres Element ist der Median
Bei geradem Stichprobenumfang
⇒ Median ist der Mittelwert aus den beiden mittlerenElementen
21
Median BeispielBestimmung des Alters-Medians von 6 Patienten
Alter der Patienten: 48, 50, 46, 52, 47, 48
1. Schritt: aufsteigend sortieren
46, 47, 48, 48, 50, 52
2. Schritt: Mittelwert der beiden mittleren Werte bilden
46, 47, 48, 48, 50, 52
( 48 + 48 ) ÷ 2 = 48
Der Alters-Median der Patienten beträgt 48 Jahre
22
Mittelwert versus MedianDer Mittelwert ist derjenige Wert, der die Daten auf einerWaage ausbalanciert. Entfernte Werte besitzen eine großeHebelkraft.
Beim Median spielt der Abstand der Beobachtung keine Rolle.Der Median ist robust gegen Ausreißer.
0 100 200 300 400 500 600
23
Mittelwert versus Median
Die Wahl zwischen Mittelwert und Median ist:
- Abhängig davon, ob ein typischer oder einmittlerer Wert gesucht wird
- Abhängig von der Verteilung (Normal, Schiefoder „Gibt es Ausreißer?“)
- Abhängig davon, ob Präzision oder Robustheitim Vordergrund steht
24
Praktisches Beispiel Lagemaße
Klinische Studie mit ACE-Hemmern
360 Probanden
Randomisiert auf drei Behandlungsarme
5
AGAH Annual Meeting 2004, BerlinT. Sudhop und M. Reber: Workshop Biometrie - Beschreibende und schließende Statistik in Klinischen Studien
25
Streumaße
Streumaße liefern Informationen zurZusammensetzung (Streuung) von Stichproben
Stichprobe A: { 2, 2, 3, 3, 4, 4, 4, 5, 5, 6 }
Stichprobe B: { 2, 2, 2, 5, 6, 9, 9, 19, 19, 21 }
26
Streumaße - Übersicht
Range
Standardabweichung
Varianz
Standardfehler
Quantile / Perzentile
27
Range (Spannweite)Definition: Differenz aus größtem und kleinstem Elementeiner Stichprobe
Stichprobe A: { 2, 2, 3, 3, 4, 4, 4, 5, 5, 6 }
Range: 6 - 2 = 4
Stichprobe B: { 2, 2, 2, 5, 6, 9, 9, 19, 19, 21 }
Range: 21 - 2 = 19
28
Range / MedianMedian und Range beschreiben Stichprobe
Stichprobe A: { 2, 2, 3, 3, 4, 4, 4, 5, 5, 6 }
Median: 4
Range: 4
Stichprobe B: { 2, 2, 2, 4, 5, 6, 9, 19, 19, 21 }
Median: 5,5
Range: 19
0 2 4 6 8 10 12 14 16 18 20 22
0 2 4 6 8 10 12 14 16 18 20 22
29
Streumaße - Übersicht
Range
Standardabweichung
Varianz
Standardfehler
Quantile / Perzentile
30
Standardabweichung
Standardabweichung (engl. Standard deviation, SD) wirdmeist in Verbindung mit dem Mittelwert angegeben
Mittelwert ± Standardabweichung (Mean ± SD)
Sie stellt ein Maß für die Streuung um den Mittelwert dar.
Grobe Vorstellung: gibt den „durchschnittlich“ Abstanddes Einzelwertes vom Mittelwert an.
6
AGAH Annual Meeting 2004, BerlinT. Sudhop und M. Reber: Workshop Biometrie - Beschreibende und schließende Statistik in Klinischen Studien
31
-2
2
-1
3
-2
Arithmetisches MittelArithmetisches Mittel
Standardabweichung
32
Standardabweichung
1)(...)()()( 22
32
22
1
−−++−+−+−
=n
xxxxxxxxSD n
-2
2
-1
3
-2
Arithmetisches MittelArithmetisches Mittel
33
Standardabweichung
Stichprobe A: { 2, 2, 3, 3, 4, 4, 4, 5, 5, 6 }
Mittelwert: 3.8 ± 1.3
Stichprobe B: { 2, 2, 2, 5, 6, 9, 9, 19, 19, 21 }
Mittelwert: 9.4 ± 7.6
0 2 4 6 8 10 12 14 16 18 20 22
0 2 4 6 8 10 12 14 16 18 20 22
34
StandardabweichungProband
Tablette A Tablette B
1 140 150
2 125 141
3 120 110
4 130 107
5 135 152
6 115 105
Mittelwert 127,5 127,5
SD 9,4 22,5
Blutdruck (syst.)
35
Streumaße - Übersicht
Range
Standardabweichung
Varianz
Standardfehler
Quantile / Perzentile
36
Varianz
Varianz = Standardabweichung²
„Mittleres Abstandsquadrat“ derElemente vom Mittelwert der Stichprobe
Berechnung:
1)(...)()()( 22
32
22
1
−−++−+−+−
=n
xxxxxxxxVarianz n
7
AGAH Annual Meeting 2004, BerlinT. Sudhop und M. Reber: Workshop Biometrie - Beschreibende und schließende Statistik in Klinischen Studien
37
Standardabweichung / Varianz
Standardabweichung ist das meistgebrauchteStreuungsmaß
Vorteil der Standardabweichung - gleicheEinheit wie die ursprünglichen Messwerte.
38
Streumaße - Übersicht
Range
Standardabweichung
Varianz
Standardfehler
Quantile / Perzentile
39
Standardfehler des Mittelwerts (SEM)
Standardfehlerstandard error of the mean = SEM
Abgeleitet aus Standardabweichung(SD) und Stichprobenumfang (n)
Immer kleiner als Standardabweichung
nSDSEM =
40
Standardfehler des Mittelwerts (SEM)
Der Standardfehler beschreibt nicht die Daten.
SEM gibt die Genauigkeit des Mittelwertes alsSchätzwert an.
CAVE: Häufig wird SEM anstelle des Standard-Abweichung verwandt. Die kleinere Maßzahl fürSEM soll eine bessere Wirkung suggerieren.
Nährung 95%-KI des Mittelwert:
Mittelwert +/- 2 SEM
41
SD SEM
Mittelwert +/- Standardabweichung
Mittelwert +/- 2 SEM
-2S-3S -1S 1S 2S 3S
42
SD > SEM
nSDSEM =
Mean ± SD(11,4 ± 9,0)
Mean ± SEM(11,4 ± 3,0)
Alte
r von
9 K
inde
rn
1)(...)()()( 22
32
22
1
−−++−+−+−
=n
xxxxxxxxSD n
8
AGAH Annual Meeting 2004, BerlinT. Sudhop und M. Reber: Workshop Biometrie - Beschreibende und schließende Statistik in Klinischen Studien
43
Streumaße - Übersicht
Range
Standardabweichung
Varianz
Standardfehler
Quantile / Perzentile
44
RangDefinition
Position innerhalbder aufsteigendsortierten(Rang-)Liste einerStichprobe
ZusammenfassungDie deskriptive Statistik beschreibtmathematische Eigenschaften des erhobeneDatenmaterials anhand von Stichproben
Es werden Lagemaße (Mittelwert, Median, 95%-Perzentile) von Streumaßen(Standardabweichung, Varianz, SEM, range,interquartile range) unterschieden.
Anhand dieser Parameter können Untersuchungs-ergebnisse standardisiert berichtet werden, sodass es anderen gelingt, die Ergebnisse einerUntersuchung nachzuvollziehen, ohne alleEinzeldaten zu kennen.
10
AGAH Annual Meeting 2004, BerlinT. Sudhop und M. Reber: Workshop Biometrie - Beschreibende und schließende Statistik in Klinischen Studien
Grundlagen der BiometrieBeschreibende und schließende Statistik in
klinischen Studien
PD Dr. med. Thomas Sudhop & Dr. med. Dipl. chem. Michael ReberAbteilung für Klinische Pharmakologie
Universität Bonn
56
Wahrscheinlichkeit
Verhältnis „Anzahl aller günstigen Ereignisse“zu „Anzahl aller möglichen Ereignisse“
Wahrscheinlichkeit, mit einem Würfel imnächsten Wurf eine „6“ zu werfen:
Der Mittelwert der Stichproben-Mittelwerteentspricht dem Mittelwert der Population
Ist die Population normal verteilt, so ist auchder Mittelwert der Stichproben-Mittelwertenormal verteilt
Ist die Population nicht normal verteilt, so istder Mittelwert der Stichproben-Mittelwertedennoch annähernd normal verteilt*
*für große Stichproben*für große Stichproben
12
AGAH Annual Meeting 2004, BerlinT. Sudhop und M. Reber: Workshop Biometrie - Beschreibende und schließende Statistik in Klinischen Studien
67
Standardabweichung und Standardfehler
Standardabweichung
SD ist die Standard-abweichung derEinzelwerte
Standardfehler
SEM entspricht derStandardabweichungder Mittelwerte
nSEM
nnSDSEM
22 σ
σ
=
==
68
Konfidenzintervall /Vertrauensbereich des Mittelwerts
Der x%-Vertrauensbereich eines Mittelwertseiner Stichprobe (x) bezeichnet das Intervall,das mit x%iger Wahrscheinlichkeit denMittelwert der Population (µ) enthält
Beispiel: x=122 mmHg, 95%-CI [118; 124]
2 Konstellationen sind zu unterscheiden
Varianz/SD der Population ist bekannt
Varianz/SD der Population ist unbekannt
69
Vertrauenbereich für z-VerteilungN(µ,σ²) = N(0, 1)
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
-4 -3 -2 -1 0 1 2 3 4
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
-4 -3 -2 -1 0 1 2 3 4
100%-∞... +∞
2.5%< -1,96
97,5%> +1,96
µ = 0σ = 1
µ = 0σ = 1
]96,1;96,1[ SEMxSEMx ⋅+⋅−
]96,1;96,1[n
xn
x σσ⋅+⋅−
];[ %5,97%5,2 σσ ⋅+⋅− zxzx
µzX += σ
nzx
nzx ];[ %5,97%5,2
σσ⋅+⋅−
70
Beispiel:95%-CI bei bekannter SD der Population
Systolischer Blutdruck der Normalpopulation(SD=10 mmHg)
Stichprobe mit n=25 liefert einen Mittelwertvon 122 mmHg
]92,125;078,118[%95
92,3122296,1122%95
251096,1%95
=
±=⋅±=
⋅±=
CI
CI
xCI
71
95%-Konfidenzintervall
µµ
95% aller Stichprobenbeinhalten mit ihrem95%-CI den Populations-mittelwert µ
Nur 5% aller Stichprobenbeinhalten mit ihrem95%-Vertrauensintervallnicht den Populations-mittelwert µ
72
Irrtumswahrscheinlichkeit α
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
-4 -3 -2 -1 0 1 2 3 4
2.5%< -1,96
97,5%> +1,96
µ = 0σ = 1
96,196,1%5
2/12/ +=−==
−αα
αzz
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
-4 -3 -2 -1 0 1 2 3 4
0,5%< -2,576
99,5%> +2,576
µ = 0σ = 1
576,2576,2%1
2/12/ +=−==
−αα
αzz
13
AGAH Annual Meeting 2004, BerlinT. Sudhop und M. Reber: Workshop Biometrie - Beschreibende und schließende Statistik in Klinischen Studien
73
Konfidenzintervall bei bekannter SD
];[ 2/12/11 nzx
nzxCI σσ
ααα ⋅+⋅−= −−−
α = Irrtumswahrscheinlichkeit
σ = Standardabw. der Population
x = Mittelwert der Stichprobe
n = Umfang der Stichprobe
74
95%-Vertrauensbereich beiunbekannter SD
Bei unbekanntem Populations-SD müssenanstelle von z1-α/2 die entsprechenden Werteder t-Verteilung eingesetzt werden
Da das 95%-Konfidenzintervall nicht die „0“ umfasst, ist dieBehandlungsdifferenz von „0“ verschieden
Simplifiziert: Es liegt ein signifikanter Behandlungseffekt mitIrrtumswahrscheinlichkeit von α = 0,05 vor
78
-3 -2 -1 0 1 2 3
Konfidenzintervall für Differenzen
Beinhaltet ein 1-αKonfidenzintervall füreine Differenz die „0“, sokann keine „signifikanteDifferenz“ angenommenwerden.
Ist die „0“ nicht im 1-αKonfidenzintervall für eineDifferenz enthalten, sokann von einemsignifikanten Unterschiedausgegangen werden
Die Differenz ist mit einerIrrtumswahrscheinlichkeitvon α von „0“ verschieden
14
AGAH Annual Meeting 2004, BerlinT. Sudhop und M. Reber: Workshop Biometrie - Beschreibende und schließende Statistik in Klinischen Studien
79
Statistischer TestHypothesen
Einfluss der Intervention
H0: hat keinen Einfluss
H1: hat einen Einfluss
Bezogen auf gemessene Differenz derStichprobe
H0: Differenz ist nicht „0“ verschieden
H1: Differenz ist von „0“ verschieden
80
Aufbau der Hypothesen
Die Null-Hypothese (H0) geht von keinemsystematischen Unterschied aus. GefundeneUnterschiede sind zufällig und nicht systematisch
Die Alternativ-Hypothese (H1 / HA) ist die logischeUmkehrung der Null-Hypothese, d.h. es existiert einsystematischer Unterschied. Gefundene Unterschiedesind nicht zufällig, sondern systematisch
Null- und Alternativ-Hypothesen müssen sichgegenseitig ausschließen und alle Möglichkeitenabdecken.
Wenn H0 falsch ist, muss H1 wahr sein
Wenn H0 wahr ist, muss H1 falsch sein
81
Ein- und zweiseitige Fragestellung
Ungerichteter Effekt
H0: RRt=28 - RRt=0 = 0
H1: RRt=28 - RRt=0 ≠ 0
Zweiseitiger Test
Gerichteter Effekt
H0: RRt=28 - RRt=0 = 0
H1: RRt=28 - RRt=0 < 0
Einseitiger Test
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
-4 -3 -2 -1 0 1 2 3 4
2,5% 97,5%
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
-4 -3 -2 -1 0 1 2 3 4
5%
82
Testergebnis und WirklichkeitStatistische Fehler
4 Möglichkeiten, wie Testergebnis undWirklichkeit zusammentreffen können
H0 wird akzeptiert, H0 ist in Wirklichkeit wahr
H0 wird akzeptiert, H1 ist in Wirklichkeit wahr
H0 wird abgelehnt, H1 ist in Wirklichkeit wahr
H0 wird abgelehnt, H0 ist in Wirklichkeit wahr
83
Statische FehlerFehler I. Art und II. Art
Wirklichkeit
Richtigpositiv
(Power = 1-β)
Falschpositiv
(Fehler I. Artα-Fehler)
Falschnegativ
(Fehler II. Artβ-Fehler)
Richtignegativ
Differenz<>0 (H1ist wahr)
Differenz=0 (H0 ist wahr)
Differenz<>0 (H0 ablehnen)
Differenz=0 (H0 beibehalten)Te
sten
tsch
eidu
ng
84
Testergebnis und WirklichkeitStatistische Fehler
α-Fehler
H0 wird abgelehnt, obwohl H0 in Wirklichkeit wahr ist
Ein Effekt wird angenommen, wo keiner ist
β-Fehler
H0 wird akzeptiert, obwohl H1 in Wirklichkeit wahr ist
Ein vorhandener Effekt wird nicht erkannt
Welcher Fehler ist „schlimmer“ und daher eherzu vermeiden?
15
AGAH Annual Meeting 2004, BerlinT. Sudhop und M. Reber: Workshop Biometrie - Beschreibende und schließende Statistik in Klinischen Studien
85
Signifikanz-Niveau
Konsequenzen eines falsch-positiven Tests
uneffektive Behandlung
Risiko ohne Nutzen („Nihil nocere“)
Kosten ohne Nutzen
Fazit
Das Risiko eines falsch positiven Tests sollte bekanntsein und durch vorherige Festlegung eines α-Niveauskontrolliert werden
Übliche Werte für α
0,05 (5%), 0,01 (1%), 0,001 (0,1%) ...
Das Signifikanz-Niveau muss vor Testbeginnfestgelegt werden
86
Gepaarter t-Test
Testet, ob eine Differenzzwischen unabhängigenBeobachtungspaaren von„0“ verschieden ist
Verteilung der Differenzentspricht einer t-Statistikder Form:
Ist der gefundene t-Wert kleiner als der untere kritischeWert oder größer als der obere kritische Wert, muss dieNullhypothese H0 auf dem α-Signifikanzniveau abgelehntwerden
Einfacher: Ist der Betrag des gefundenen t-Wertesgrößer als der positive (obere) kritische Wert, muss H0abgelehnt werden:
-2,14
Akzeptanzbereich (95%)Akzeptanzbereich (95%)
dSEdt =
2/1,1, α−−> nkrittt
88
Gepaarter t-TestBeispiel
-4 -3 -2 -1 0 1 2 3 4
2,14
Da |t|=3,43 größer als der kritische Wert fürdie t-Verteilung bei 14 Freiheitsgraden unddem 0,975-Quantil ist (2,14), muss die H0-Hypothese auf dem Signifikanz-Niveau α=0,05verworfen werden
Die Fallzahlschätzung sollte immer auch die antizipierteDrop out Rate beinhalten
n = 50 & antizipierte “drop out” Rate 11% ⇒ n = 56
110
Praktische Fallzahlschätzung1. Beispiel
α = 5%
Power = 80%
Geschätzte Differenz & SD
xPBO - xZ99 ~ 13 mmHg
SDpooled ~ 16
Fallzahlberechnung
2 x n = 50
Antizipierte Drop out Rate: 0%
25 Patienten pro Gruppebenötigt
GPOWER - Version 2.0 Franz Faul & Edgar Erdfelder
111
Power: A priori & Post-hoc
“A priori” Power
Schätzung, basierend auf
geschätzte Differenz
geschätzte SD
kalkulierte Fallzahl
“Post-hoc” Power
Berechnung, basierend auf
beobachteter Differenz
beobachteter SD
echter Fallzahl
“Post-hoc Power” “Post-hoc Power” kannkann größergrößer aberaber auch kleiner alsauch kleiner als die “a priori Power” die “a priori Power” seinsein!!
112
Tipps & Tricks“Oder, warum Studien scheitern?”
Frühzeitige Einbindung des Statistikers in dieStudienplanung
Verwendung realistischer Schätzer für die erwarteteDifferenz und Varianz/SD
Strikte Protokolleinhaltung
Exakte Messung
Vermeidung von Drop outs
113
Literatur
Bücher
Rossner B. Fundamentals of Biostatistics. Duxberry Press
Dawson-Saunders B. & Trapp R.G. Basics and ClinicalBiostatistics. Prentice Hall International Inc.
Motulsky, H. Intuitive Biostatistics, Oxford University Press
SoftwareSPSS - www.spss.com
SAS - www.sas.com
Buchner A., Faul F., Erdfelder E. GPOWER 2.0 - Computerprogram for power- and sample size calculation,http://www.psycho.uni-duesseldorf.de/aap/projects/gpower/(Freeware) [MS-DOS/Windows and Macintosh]