Page 1
Analisi della sopravvivenza
Grazia Vurro
Anno Accademico 2010-2011
Indice
1 Introduzione 1
2 Sperimentazione clinica 2
3 Importanza di un’analisi time-to-event 3
4 Stima della funzione di sopravvivenza 6
4.1 Metodo di Kaplan-Meier . . . . . . . . . . . . . . . . . . . . . 7
4.2 Fondamenti teorici del metodo di Kaplan-Meier . . . . . . . . 11
5 Confronto tra due curve di sopravvivenza 15
6 Software statistico: SPSS 19
1 Introduzione
L’analisi della sopravvivenza puo essere interpretata come caso particolare
dell’analisi dell’affidabilita. Ricordiamo alcuni concetti chiave della teoria
1
Page 2
1 INTRODUZIONE
dell’affidabilita.
Collasso. Si definisce collasso del componente o del sistema lo stato in cui
esso cessa di funzionare.
Tempo necessario al collasso. Se un componente e messo in condizioni
di stress in un istante temporele t = 0 e viene osservato fino a quando
collassa, la durata della vita o il tempo necessario al collasso e una
variabile aleatoria indicata generalmente con T.
Guasto. Si definisce guasto la cessazione di un dispositivo ad adempiere
la funzione richiesta (guasto totale) oppure la variazione della sua
prestazione (guasto parziale).
Nell’analisi della sopravvivenza in sistema preso in considerazione e il paziente
e il guasto e rappresentato dal cosiddetto evento avverso indicato general-
mente con la sigla AE ( adverse event).
Evento avverso. Per evento avverso si intende ogni evento di interesse
per l’indagine clinica come la morte di un paziente, l’insorgere di effetti
collaterali dovuti all’assunzione di nuovi farmaci, la guarigione da una
determinata malattia oggetto di studio.
E’ chiaro, quindi, fin da subito che l’analisi della sopravvivenza non ha come
unico oggetto lo studio dell’evento morte, ma ogni evento di interesse. Per
usare termini anglosassoni diremo che la survival analysis rientra tra le time-
to-event analysis. In altri termini, l’analisi della sopravvivenza si occupa
dell’analisi dell’incidenza di un determinato evento in un determinato arco
temporale intendendosi con incidenza il numero dei pazienti che sviluppano
l’evento.
2
Page 3
3 IMPORTANZA DI UN’ANALISI TIME-TO-EVENT
2 Sperimentazione clinica
Per apprezzarne al meglio le sue potenzialita, prima di iniziare la costruzione
formale dell’analisi della sopravvivenza sarebbe utile capire il contesto medi-
co nel quale si applica . Supponiamo che un gruppo di ricercatori un’azienda
farmaceutica sintetizzi un nuovo farmaco per la cura di certa malattia. La
fase nella quale praticamente si testa la sua efficacia e chiamata sperimen-
tazione clinica o clinical trial. La sperimentazione clinica consta di quattro
fasi , in ognuna delle quali la statistica gioca un importante ruolo.
Fase 1: Farmacologia clinica e tossicita che ha come obiettivo l’accer-
tamento della tollerabilita e la determinazione di un dosaggio accetta-
bile del farmaco.
Fase 2: Indagine clinica iniziale dell’effetto del trattamento in cui si
testa il farmaco su in campione ridotto per valutarne l’efficacia.
Fase 3: Valutazione del trattamento su larga scala considerata la fase
piu importante e spesso identificata con il termine ricerca clinica, in cui
si testa il farmaco su campioni piu ampi, confrontandolo spesso con altri
trattamenti esistenti.
Fase 4: Farmacovigilanza in cui si valutano gli effetti collaterali a lungo
termine del farmaco e gli effetti dello stesso sulla mortalita.
3 Importanza di un’analisi time-to-event
. Mettere in relazione l’AE con il tempo e di fondamentale importanza, cosı
come mostra il seguente esempio.
3
Page 4
3 IMPORTANZA DI UN’ANALISI TIME-TO-EVENT
Supponiamo che un’azienda farmaceutica sia nella fase 3 o 4 della sperimen-
tazione clinica di un nuovo farmaco che dovrebbe favorire la guarigine da
una certa malattia, cioe ridurre il tempo di attesa necessario ad osservare
l’evento guarigione. Supponiamo che il campione di pazienti sia costituito da
20 unita e supponiamo di suddividerli in due gruppi omogenei ciascuno con
10 unita:
gruppo attivo al quale verra somministrato il nuovo farmaco;
gruppo placebo al quale verra somministrato placebo ovvero qualsiasi sostan-
za o terapia innocua somministrata al paziente facendogli credere che
sia un trattamento necessario.
Supponiamo di aver osservato i seguenti dati:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Active
Pla
ce
bo
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20 x
o
x
x
x
x
x
x
x
x
x
o
o
o
o
o
o
o
o
o
g
Id Paziente
Figura 1: Esempio
4
Page 5
3 IMPORTANZA DI UN’ANALISI TIME-TO-EVENT
In questo diagramma si e rappresentato sull’asse delle ascisse i tempi di
risposta, ovvero l’intervallo di tempo tra l’inizio dello studio, giorno 0, e il
verificarsi dell’ EA e sull’asse delle ordinate i pazienti oggetto dello studio
individuabili da un codice identificativo. Il verificarsi dell’ AE e indicato con
×, mentre i pazienti che alla fine dello studio non hanno verificato l’AE sono
contrassegnati da ◦.La domanda che ci poniamo e se in virtu di questi dati osservati possiamo
affermare che effettivamente il farmaco sia efficace. Operando un semplice
confronto tra i gruppi sulla base dei pazienti con evento, dovremmo dire
che, poiche in entrambi i gruppi i pazienti con AE sono 5 su 10, ovvero il
50%, e considerando per questa proporzione un intervallo di confidenza al
95%, non esiste una significativa differenza tra i due gruppi. Questo modo di
operare pecca palesemente di superficialita, perche se osserviamo i pazienti
con AE nei due gruppi e li mettiamo in relazione con i rispettivi tempi di
risposta riscontriamo che nel gruppo attivo l’evento avviene nei primi giorni
dello studio mentre nel gruppo placebo il verificarsi dell’AE e distribuito
uniformemente nella durata dello studio.
Id Paziente Gruppo Placebo Tempi di risposta
2 4
8 9
5 11
3 14
6 18
5
Page 6
3 IMPORTANZA DI UN’ANALISI TIME-TO-EVENT
Id Paziente Gruppo Attivo Tempi di risposta
20 1
11 2
15 4
17 5
14 6
Questo fa pensare ad una relazione nel gruppo attivo tra il verificarsi
dell’evento e il nuovo farmaco , relazione che il semplice confronto delle pro-
porzioni dell’AE non mette in risalto. Inoltre, se si pensa che se lo studio
fosse durato piu a lungo probabilmente altri pazienti avrebbero verificato
l’AE, si capisce l’estrema importanza di relazionare l’AE al tempo. Esiste
altresı un’ulteriore problematica che questo metodo non risolverebbe, ovvero
l’esistenza nella pratica di numerosi dati troncati o censurati. Infatti ac-
cade spesso che pazienti escano dallo studio (persi al follow-up )prima del
suo termine e prima che sviluppino l’AE. Per esempio, potremmo essere nella
seguente situazione:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Active
Pla
ce
bo
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20 x
o
x
x
x
x
x
x
x
x
x
o
o
o
o
o
o
o
x
x
g
Id Paziente
6
Page 7
4 STIMA DELLA FUNZIONE DI SOPRAVVIVENZA
in cui i pazienti con ◦ in corrispondenza di un tempo minore della durata
dello studio sono quelli persi al follow-up. Dovremmo escludere dalle nostre
considerazioni tali pazienti , ma in effetti la loro presenza nello studio fino
alla data di uscita fornisce comunque un’informazione utile di cui bisogna
tener conto. L’analisi della sopravvivenza supera tutti questi limiti.
4 Stima della funzione di sopravvivenza
Sia T la variabile aleatoria che rappresenta i tempi di risposta. Sia F (t) :=
P (T ≤ t) la funzione di ripartizione che rappresenta la probabilita che l’AE si
verifichi in un intervallo di tempo minore o uguale a t. Sia S(t) := 1−F (t) =
P (T > t) la funzione di sopravvivenza ovvero la probabilita che l’ AE si ver-
ifichi dopo t.
La stima della funzione di sopravvivenza puo avvenire sia con metodi para-
metrici che con metodi non parametrici. E’ chiaro che se non si conosce
a priori la distribuzione teorica di T bisogna necessariamente ricorrere a
metodi non parametrici. Accade spesso in campo medico di non conoscere
la distribuzione di T ed e per questo che molto diffusi sono i metodi non
parametrici. Qui illustreremo il metodo di Kaplan-Meier per la stima della
funzione di sopravvivenza rientrante tre i metodi non parametrici.
Lo illustreremo prima in pratica senza formalismi e poi in teoria, mostran-
do come esso derivi da una particolare applicazione del metodo di massima
verosimiglianza.
7
Page 8
4 STIMA DELLA FUNZIONE DI SOPRAVVIVENZA
4.1 Metodo di Kaplan-Meier
Sia N il numero dei soggetti ammessi allo studio e sia J il numero dei tempi
distinti di risposta ( J ≤ N) rilevati nel campione ed ordinati in modo cres-
cente: t1 ≤ t2 ≤ · · · ≤ tJ .
Sia dj il numero di soggetti che presentano l’evento al tempo tj. ( Ovvi-
amente dj > 1 solamente nel caso in cui piu soggetti presentano tempi di
risposta uguali.)
Sia nj il numero di soggetti esposti al rischio al tempo tj e cioe tutti quei
soggetti vivi e sotto osservazione appena prima di tj .
Se non vi sono evidenti ragioni contrarie, si assume che l’esperienza di vita
dei soggetti persi di vista o che terminano lo studio senza evento sia la stessa
di coloro che verificano l’ evento durante lo studio, dunque essi sono inclusi
nell’insieme degli esposti a rischio sino a che sono sotto osservazione. Si noti
che le quantita dj e nj sono definite soltanto in corrispondenza dei tempi di
risposta e non anche dei tempi troncati.
Una stima della probabilita condizionata di morire all’istante tj, che indicher-
emo con qj, e data da:
qj =dj
nj
j = 1, 2, · · ·, J
e quindi la probabilita condizionata di sopravvivere all’istante tj, che in-
dicheremo con pj, e stimata da:
pj = 1− qj =nj − dj
nj
j = 1, 2, · · ·, J.
Il prodotto delle stime delle probabilita pj ci fornisce la stima della probabilita
cumulativa di sopravvivere ad un istante fissato sapendo che si e vissuti
fino all’istante precedente. Indicando con Pj la probabilita di sopravvivere
8
Page 9
4 STIMA DELLA FUNZIONE DI SOPRAVVIVENZA
all’istante tj e a ciascuno degli istanti precedenti a tj, avremo che:
Pj = p1 · p2 · · · pj,
da cui si ottiene la seguente formula di ricorrenza:
Pj = Pj−1 · pj.
Si assume che P0 = p0 = 1, intendendo con cio che la probabilita di sopravvi-
vere oltre l’istante di inizio studio e fino al primo tempo di risposta osservato
sia pari ad 1. Osserviamo che in ognuno dei punti tj dell’asse dei tempi la
curva di sopravvivenza varia di un fattore pari anj−dj
nj, anzi piu precisamente
tale variazione avviene appena prima tj ovvero la curva di sopravvivenza e
una funzione a gradini, che in corrispondenza dei tempi di risposta presenta
punti di discontinuita (essendo continua in tali punti solo da destra).
In accordo con Greenwood (1926), la varianza di Pj sara:
V ar(Pj) = Pj
2j∑
h=1
qh
nhph
= Pj
2j∑
h=1
dh
nh(nh − dh).
Assumendo che la statistica Pj sia distribuita approssimativamente in modo
gaussiano , l’intervallo di confidenza con coefficiente di confidenza 1−α sara:
Pj ± z1−α2
√V ar(Pj).
Torniamo all’esempio 2 e riassumiamo nella seguente tabella i calcoli relativi
alla probabilita di sopravvivenza:
9
Page 10
4 STIMA DELLA FUNZIONE DI SOPRAVVIVENZA
Id Paz Gruppo Placebo ti ni di qi pi Pi
2 4 10 1 110
0.9 0.9
8 9 9 1 19
0.89 0.8
5 11 8 1 18
0.88 0.70
3 14 7 1 17
0.86 0.60
7 15∗ - - - - -
9 17 5 1 15
0.8 0.48
6 18 4 1 14
0.75 0.36
1 19∗ - - - - -
4 20∗ - - - - -
10 20∗ - - - - -
Id Paz Gruppo Attivo ti ni di qi pi Pi
20 1 10 1 110
0.9 0.9
11 2 9 1 19
0.89 0.8
12 4∗ - - - - -
15 4 7 1 17
0.86 0.69
17 5 6 1 16
0.83 0.57
14 6 5 1 15
0.80 0.46
19 9 4 1 14
0.75 0.34
16 10∗ - - - - -
13 20∗ - - - - -
18 20∗ - - - - -
Possiamo ora rappresentare la curva di sopravvivenza :
10
Page 11
4 STIMA DELLA FUNZIONE DI SOPRAVVIVENZA
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
t i
0,60
0,69
0,8
0,9
1
0,57
0,46
0,34
0,8
0,9
0,48
0,36
S (t )i
0,70
0
Gruppo attivo
Gruppo placebo
Funzione di Sopravvivenza
Figura 2: Curva di sopravvivenza
4.2 Fondamenti teorici del metodo di Kaplan-Meier
Sia T la variabile casuale tempo di sopravvivenza. Si consideri una popo-
lazione omogenea in cui la v.c. T sia discreta e supponiamo che i valori che
essa assume siano: t1 ≤ t2 ≤ · · ·. La funzione di probabilita, la funzione di
distribuzione e la funzione di sopravvivenza sono rispettivamente:
f(tj) = Pr(T = t) F (tj) = Pr(T ≤ tj) S(tj) = Pr(T > tj).
La stima non parametrica della funzione di sopravvivenza fu motivata da
Kaplan e Meier nell’articolo del 1958 con un uso particolare del metodo della
11
Page 12
4 STIMA DELLA FUNZIONE DI SOPRAVVIVENZA
massima verosimiglianza. Essi costruirono la funzione di verosimiglianza sen-
za riferirsi ad una specifica classe di funzioni di distribuzioni, ma sfruttando
solamente le proprieta di una generica funzione di sopravvivenza.
E’ necessario fare alcune precisazioni: una riguardante la continuita della
funzione e l’altra sulla notazione per i tempi troncati.
• La funzione di sopravvivenza e una funzione continua solo a destra nei
punti tj, ovvero
P (tj) 6= P (tj − 0) con P (tj − 0) = limx→0
P (tj − x)
e poiche la P (t) varia solo in corrispondenza dei valori tj, si ha che :
P (tj − 0) = P (tj−1).
• Poiche P (tj) esclude, mentre P (tj−0) include la probabilita che T = tj,
per ottenerla ne faremo la differenza ( ci servira per costruire la L)
• Sia cj il numero dei soggetti che in quanto persi di vista o terminato lo
studio senza l’AE forniscono tempi di osservazione troncati nell’inter-
vallo [tj, tj+1), dunque t∗i,j ∈ [tj, tj+1) con i = 1, 2, ..., cj e j = 0, 1, ..., J
e il generico tempo troncato che cade in detto intervallo. In particolare,
definiti t0 = 0 e tJ+1 = ∞, i tempi troncati rilevati prima di t1 sono
appartenenti all’intervallo [0, t1), mentre quelli rilevati dopo tJ saranno
appartenenti a [tJ ,∞).
Costruiamo la funzione di verosimiglianza , ricordandone la definizione.
Sia (X1, X2, ..., Xn) un campione casuale di v.c. i.i.d. con legge fϑ(x). In-
dichiamo con (x1, x2, ..., xn) il valore dell’osservazione. Chiamiamo funzione
12
Page 13
4 STIMA DELLA FUNZIONE DI SOPRAVVIVENZA
di verosimiglianza la funzione
Lϑ(x1, x2, ..., xn) = fϑ(x1, x2, ..., xn) =n∏
i=1
fϑ(xi).
La funzione di verosimiglianza potra scriversi come il prodotto dei seguenti
fattori:c0∏
i=1
P (t∗i,0)
[P (t1 − 0)− P (t1)]d1 ·
c1∏i=1
P (t∗i,1)
...
[P (tJ − 0)− P (tJ)]dJ ·cJ∏i=1
P (t∗i,J)
Riscriviamo la L considerando che: P (tj − 0) = P (tj−1).
[P (tj − 0)− P (tj)]dj = [P (tj−1)− P (tj)]
dj
Obiettivo e determinare quei valori che massimizzano la funzione. Os-
serviamo che per rendere massima la funzione a P (t∗i,j)) deve essere associato
il valore piu grande possibile e lo si puo fare assegnandoli la probabilita di
sopravvivere oltre l’estremo inferiore dell’intervallo in cui il tempo troncato
si e verificato, cioe:
t∗i,j ∈ [tj, tj+1) → P (t∗i,j) = P (tj)
13
Page 14
4 STIMA DELLA FUNZIONE DI SOPRAVVIVENZA
Dunque avremo:
c0∏i=1
P (t∗i,0) = P (t0)c0 = 1
c1∏i=1
P (t∗i,1) = P (t1)c1
...
cJ∏i=1
P (t∗i,J) = P (tJ)cJ
La funzione di verosimiglianza diventa:
L =J∏
j=1
[P (tj+1)− P (tj)]djP (tj)
cj
Ricordando che:
P (tj) = p1 · p2 · ... · pj−1 · pj
P (tj−1) = p1 · p2 · ... · pj−1
avremo che:
P (tj−1)− P (tj) = (p1 · p2 · ... · pj−1)(1− pj)
Possiamo riscrivere L come :
L =J∏
j=1
(p1 · p2 · ... · pj−1 qj)dj(p1 · p2 · ... · pj)
cj =
J∏j=1
(p1 · p2 · ... · pj−1)dj+cj (1− pj)
cj qdj
j =
J∏j=1
(p1 · p2 · ... · pj−1)dj+cj q
dj+cj
j =
J∏j=1
pnj−dj
j qdj
j
14
Page 15
5 CONFRONTO TRA DUE CURVE DI SOPRAVVIVENZA
Osserviamo che pe ogni j fissato pnj−dj
j qdj
j rappresenta la probabilita di
ottenere una sequenza di dj successi con probabilita qj ed nj − dj insuccessi
con probabilita pj (v.c. binomiale) che risulta massima quando :
q =dj
nj
5 Confronto tra due curve di sopravvivenza
L’interesse di un ricercatore clinico non e solo rivolto alla stima della proba-
bilita cumulativa di sopravvivenza, ma anche al confronto dell’esperienza di
vita di due insiemi di soggetti sottoposti a differenti trattamenti. Purtrop-
po, in campo bio-medico e estremamente difficile avere a priori conoscenze
sufficienti per ipotizzare la forma delle sottostanti funzioni teoriche di so-
pravvivenza ( per esempio esponenziale, di Weibull, etc), pertanto anche per
il confronto di curve di sopravvivenza e spesso necessario far ricorso a metodi
non parametrici.
Qui illustreremo il metodo noto come Log-rank test proposto da Mantel nel
1966. Il fondamento logico di questo test e facilmente comprensibile a livello
intuitivo e cio giustifica il suo ampio uso nella ricerca clinica.
Sia N il numero di pazienti sotto osservazione.Si supponga di aver attribuito
con una procedura casuale (randomizzazione) la meta dei pazienti al tratta-
mento A e l’altra meta al trattamento B. Sotto l’ipotesi che i due trattamenti
abbiano la stessa efficacia, ci si attende che il numero di pazienti con AE in
un determinato giorno sia circa lo stesso in entrambi i gruppi, ma in realta
puo capitare che questo numero sia differente in ciascun gruppo, ossia che vi
sia uno scostamento tra eventi attesi ed eventi osservati. L’eventuale scosta-
mento tra queste quantita farebbe pensare alla possibilita che un trattamento
15
Page 16
5 CONFRONTO TRA DUE CURVE DI SOPRAVVIVENZA
sia piu efficace o meno dell’altro ed il ricorso al pertinente test, statistico con-
sente di determinare il livello di significativita di tale scostamento.
L’ipotesi attinente l’efficacia dei due trattamenti si esprime usualmente in
termini di rischio istantaneo di morte intendendo con cio quello che avevamo
precedentemente indicato con q.
Indicando con H0 l’ipotesi nulla e con H1 l’ipotesi alternativa si ha:
H0 : qA(t) = qB(t) ⇔ H0 : ϑ = 1
H1 : qA(t) = ϑqB(t) ⇔ H1 : ϑ 6= 1
dove ϑ e l’incognita costante di proporzionalita. Quando ϑ < 1 il trattamento
A e piu efficace di quello B, e vero il contrario quando ϑ > 1.
Le informazioni si possono riassumere nella seguente tabella di contingenza
2× 2:
Gruppi Paz. con AE a tj Paz. senza AE a tj Paz. a rischio prima di tj
A dAj nAj − dAj nAj
B dBj nBj − dBj nBj
Totali dj nj − dj nj
Benche dAj, dBj, nAj, nBj siano v.c. dipendenti dalla esperienza precedente
di sopravvivenza e dal processo di troncamento, il test di significativita puo
essere costruito solo considerandole fisse ad ogni tempo tj, cio comporta che
solo una di queste puo essere costruita condizionatamente ai volori marginali
osservati, generalmente si considera dAj e si dimostra che essa e una v.c.
ipergeometrica. Essendo una v.c. ipergeometrica, sotto H0, il valore atteso
E(dAj) di dAj e:
E(dAj) = nAjdj
nj
16
Page 17
5 CONFRONTO TRA DUE CURVE DI SOPRAVVIVENZA
e la sua varianza:
V ar(dAj) =[nAj
dj
nj
(1− dj
nj
)](nj − nAj
nj − 1
).
Osserviamo che la varianza e data dal prodotto di due termini: la parentesi
quadra che e la varianza di una v.c. binomiale e la parentesi tonda che e il
fattore di correzione per il campionamento da un insieme di dimensione nj.
La v.c.∑J
j=1
[dAj − E(dAj)
]e distribuita in modo gaussiano e la statistica:
Q =
∑Jj=1
[dAj − E(dAj)
]2
∑Jj=1 V ar(dAj)
e distribuita asintoticamente come una χ2 con un grado di liberta.
Applichiamo ora questo test all’esempio precedente per valutare l’efficienza
del trattamento somministrato al gruppo attivo rispetto a quello placebo.
Consideriamo le dieci tabelle di contingenza, una per ogni tempo di rispos-
ta. In riferimento ad ognuna di queste dobbiamo calcolare E(dP i) e V ar(dP i),
dove dP i indica il numero di pazienti del gruppo placebo con evento all’is-
tante ti.
t1 = 1 d n-d n
Placebo 0 10 10
Attivo 1 9 10
TOT 1 19 20
⇒ E(dP1) = 12
V ar(dP1) = 14
t2 = 2 d n-d n
Placebo 0 10 10
Attivo 1 8 9
TOT 1 18 19
⇒ E(dP2) = 1019
V ar(dP2) = 90361
17
Page 18
5 CONFRONTO TRA DUE CURVE DI SOPRAVVIVENZA
t3 = 4 d n-d n
Placebo 1 9 10
Attivo 1 7 8
TOT 2 16 18
⇒ E(dP3) = 109
V ar(dP3) = 6401377
t4 = 5 d n-d n
Placebo 0 9 9
Attivo 1 5 6
TOT 1 14 15
⇒ E(dP4) = 915
V ar(dP4) = 625
t5 = 6 d n-d n
Placebo 0 9 9
Attivo 1 4 5
TOT 1 13 14
⇒ E(dP5) = 914
V ar(dP5) = 45196
t6 = 9 d n-d n
Placebo 1 8 9
Attivo 1 3 4
TOT 2 11 13
⇒ E(dP6) = 1813
V ar(dP6) = 66169
t7 = 11 d n-d n
Placebo 1 7 8
Attivo 0 2 2
TOT 1 9 10
⇒ E(dP7) = 45
V ar(dP7) = 425
t8 = 14 d n-d n
Placebo 1 6 7
Attivo 0 2 2
TOT 1 8 9
⇒ E(dP8) = 79
V ar(dP8) = 1481
18
Page 19
6 SOFTWARE STATISTICO: SPSS
t9 = 17 d n-d n
Placebo 1 4 5
Attivo 0 2 2
TOT 1 6 7
⇒ E(dP9) = 57
V ar(dP9) = 57
t10 = 18 d n-d n
Placebo 1 3 4
Attivo 0 2 2
TOT 1 5 6
⇒ E(dP10) = 23
V ar(dP10) = 29
Calcolando il quadrato della somma gli scostamenti del valore osservato
dal valore atteso e la somma delle varianze ricaviamo la statisticaa test:
Q = 2,972,58
= 1, 15. Poiche Q < 3.841 ( valore della v.c. chi-quadrato con
un grado di liberta in corrispondenza di α = 0.05), l’ipotesi nulla non puo
essere rigettata e dunque le differenze osservate nei due gruppi non sono
significative.
6 Software statistico: SPSS
Esistono numerosi software statistici che permettono di condurre un’analisi
della sopravvivenza tra cui SPSS.
Il programma necessita di tre variabili: i tempi di risposta di tutti i pazienti
( non necessariamente ordinati) , l’indicazione dei dati troncati, l’indicazione
del gruppoo di appartenenza del paziente. L’output della procedura di anal-
isi mostra una tabella riepilogativa riguardante la stima delle probabilita di
sopravvivenza , l’esito del log-rank test e il plot della funzione di sopravviven-
za. Abbiamo utilizzato il software per testare i dati dell’esempio precedente.
Il risultato e il seguente:
19
Page 20
6 SOFTWARE STATISTICO: SPSS
Case Processing Summary
Censored
Gruppo Total N N of Events N Percent
0 10 6 4 40,0%
1 10 6 4 40,0%
Overall 20 12 8 40,0%
Estimate Std. Error
1 4,000 1 0,900 0,095 1 9
2 9,000 1 0,800 0,126 2 8
3 11,000 1 0,700 0,145 3 7
4 14,000 1 0,600 0,155 4 6
5 15,000 0 . . 4 5
6 17,000 1 0,480 0,164 5 4
7 18,000 1 0,360 0,161 6 3
8 19,000 0 . . 6 2
9 20,000 0 . . 6 1
10 20,000 0 . . 6 0
1 1,000 1 0,900 0,095 1 9
2 2,000 1 0,800 0,126 2 8
3 4,000 1 0,700 0,145 3 7
4 4,000 0 . . 3 6
5 5,000 1 0,583 0,161 4 5
6 6,000 1 0,467 0,166 5 4
7 9,000 1 0,350 0,160 6 3
8 10,000 0 . . 6 2
9 20,000 0 . . 6 1
10 20,000 0 . . 6 0
0
1
Survival Table
Gruppo Time Status
Cumulative Proportion Surviving at the Time N of Cumulative
Events
N of Remaining
Cases
Chi-Square df Sig.
Log Rank (Mantel-Cox) 1,150 1 0,284
Overall Comparisons
Test of equality of survival distributions for the different levels of Gruppo.
Kaplan-Meier
20
Page 21
6 SOFTWARE STATISTICO: SPSS
21