ESTADÍSTICA BÁSICA APLICADA CON SPSS Alfonso García Pérez María Yolanda Cabrero Ortega
ESTADSTICA BSICA APLICADA
CON SPSS
Alfonso Garca Prez Mara Yolanda Cabrero Ortega
ESTADSTICA BSICA APLICADA CON SPPS 2
Copyright 2010 Alfonso Garca Prez Mara Yolanda Cabrero Ortega ``No est permitida la reproduccin total o parcial de este libro, ni su tratamiento informtico, ni la transmisin de ninguna forma o por cualquier medio, ya sea electrnico, mecnico, por fotocopia, por registro u otros medios, sin el permiso previo y por escrito de los titulares del Copyright. El contenido de este libro est registrado por el autor en el Registro de la Propiedad Intelectual y protegido por la Ley, que establece penas de prisin adems de las correspondientes indemnizaciones para quien lo plagiara"
Edita: Universidad Nacional de Educacin a Distancia
ALFONSO GARCA PREZ y
MARA YOLANDA CABRERO ORTEGA 3
Contenido
Prlogo. 5 Captulo 1: Introduccin al SPSS 7 Captulo 2: Estadstica Descriptiva . 11 Captulo 3: Intervalos y Contrastes bsicos . 17 Captulo 4: Anlisis de la Varianza ............. 19 Captulo 5: Regresin Lineal y Correlacin .. 31 Captulo 6: Tablas de Contingencia ............... 37
ESTADSTICA BSICA APLICADA CON SPPS 4
ALFONSO GARCA PREZ y
MARA YOLANDA CABRERO ORTEGA 5
Prlogo
El presente texto es dedicado al Tratamiento Informtico del curso Estadstica Aplicada a las Ciencias de la Salud. En l se analiza el uso de SPSS. No obstante, ya adelantamos que no es exhaustivo en cuanto al anlisis de todos los Mtodos a los que dicho paquete se puede aplicar, ya que la mejor manera de aprenderlo es utilizarlo y, en la mayora de las ocasiones, los comentarios resultan redundantes ante la sencillez de manejo de este software. Dado que los ejemplos que analizaremos en este texto son los del libro Estadstica Aplicada: Conceptos Bsicos, no repetiremos aqu los enunciados de dichos ejemplos, indicndolos con la abreviatura CB y el nmero del ejemplo correspondiente. Por ltimo, le recordamos que puede ver ms grandes la reproducciones de la pantalla, es decir, las ventanas, utilizando el zoom de su pdf.
Alfonso Garca Prez Mara Yolanda Cabrero Ortega
ESTADSTICA BSICA APLICADA CON SPPS 6
ALFONSO GARCA PREZ y
MARA YOLANDA CABRERO ORTEGA 7
Captulo 1
Introduccin al SPSS 1.1. Introduccin Una de las caractersticas ms destacadas de SPSS (en especial con respecto a BMDP o SAS) es que no es necesario conocer un lenguaje de programacin para utilizarlo (aunque lo tiene). Su exitosa presentacin de Mtodos Estadsticos a ejecutar en forma de persianas, permite comenzar a utilizarlo casi sin conocimientos previos del paquete. Por esta razn, este texto ser simple y breve ya que, sin duda, la mejor manera de aprende a manejar SPSS es utilizarlo.
1.2. El editor de datos Lo primero que analizaremos es cmo introducir los datos de nuestro problema, definiendo las variables a analizar con posterioridad. Al abrir el paquete SPSS nos aparece un cuadro como el de la Figura 1.1, en el que, si queremos ir tecleando los datos, elegiremos la opcin Introducir datos, apareciendo, a continuacin el editor de datos en blanco en el que debemos introducir los datos observados en el primer individuo de la primera variable en la primera fila de la primera columna. Para ir viendo cmo funciona el editor de datos, vamos a considerar un ejemplo
Ejemplo 1.1 _____________________________________________ Se eligi al azar una muestra de 56 individuos de una poblacin a los que se clasific segn su Edad, su Sexo y segn si era o no Fumador, obtenindose los siguientes datos:
ESTADSTICA BSICA APLICADA CON SPPS 8
Menores de 20 aos Hombre Mujer S fuma 11 3 No fuma 1 7 Entre 20 y 50 aos Hombre Mujer S fuma 1 4 No fuma 2 5 Mayores de 50 aos Hombre Mujer S fuma 13 1 No fuma 2 6 En determinados modelos, las variables deben ser categricas; es decir, deben definir categoras en las que clasificar los datos. Nosotros, de momento, utilizaremos datos de tipo numrico. Para ello, lo ms simple es ir introduciendo los datos y ms tarde, modificar, si es necesario, sus propiedades.
Figura 1.1 Para el ejemplo en cuestin, incluiremos (por este orden) datos de las tres variables: la variable Edad, con tres valores, 1 para los individuos menores de 20 aos, 2 para los individuos entre 20 y 50 aos y 3 para los individuos mayores de 50 aos. Para la variable Sexo, dos valores, 0 para los hombres y 1 para las mujeres. Y, finalmente, la variable Fumador, con dos valores, 0 para los individuos que no fuman y 1 para los que s fuman. As, los datos de los individuos de la tabla anterior sern los de la Figura 1.2.
ALFONSO GARCA PREZ y
MARA YOLANDA CABRERO ORTEGA 9
Figura 1.2 Con objeto de introducir el nombre de las variables, pincharemos con el Ratn la pestaa de abajo Vista de variables, apareciendo un panel como el de la Figura 1.3. Pinchando el 1, podremos teclear el nombre de las tres variables as como sus principales caractersticas. Volveremos al editor de datos pinchando en la pestaa inferior, Vista de datos.
Figura 1.3
En la barra de arriba (en Archivo) deberemos salvar nuestro fichero de datos. Si nuestros datos estn ya en un archivo, debemos incluirlos en el Editor de datos con la opcin: Archivo Abrir Datos (Figura 1.4)
ESTADSTICA BSICA APLICADA CON SPPS 10
Figura 1.4
ALFONSO GARCA PREZ y
MARA YOLANDA CABRERO ORTEGA 11
Captulo 2
Estadstica Descriptiva 2.1. Distribuciones de Frecuencias, Representaciones Grficas, Medidas de Posicin y Dispersin El estudio de las tcnicas estudiadas aqu, puede seguirse en el Captulo 2 del texto CB. Una de las ventajas de SPSS es que, de una vez, obtenemos la mayora de los resultados en los que estamos interesados.
Ejemplo 2.1-CB ___________________________________________ Despus de introducir los datos, ejecutamos la secuencia
Analizar Estadsticos Descriptivos Frecuencias
Figura 2.1
ESTADSTICA BSICA APLICADA CON SPPS 12
aparecindonos una ventana de dilogo como la de la Figura 2.2
Figura 2.2
Ahora, pasamos la variable en estudio, nivel, al cuadro de la derecha, completamos lo estadsticos que queremos calcule en el botn Estadsticos, que en nuestro caso hemos elegido segn la Figura 2.3
Figura 2.3 cerrando la ventana con el botn Continuar. Lo mismo hacemos con el botn Grficos, con el que, en este caso, hemos elegido las opciones que aparecen en la Figura 2.4,
ALFONSO GARCA PREZ y
MARA YOLANDA CABRERO ORTEGA 13
Figura 2.4
Ya podemos ejecutar nuestras elecciones efectuadas con las anteriores ventanas de dilogo, presionando el botn Aceptar. No obstante, queremos sealar que, todo lo que hemos ido seleccionando, se ha ido traduciendo al lenguaje SPSS dentro de lo que aparece en el botn Pegar, que si lo presionamos aparecer, en este ejemplo, FREQUENCIES VARIABLES=nivel /NTILES= 4 /STATISTICS=STDDEV VARIANCE RANGE MINIMUM MAXIMUM MEAN MEDIAN MODE SKEWNESS SESKEW KURTOSIS SEKURT /HISTOGRAM NORMAL /ORDER= ANALYSIS .
sta es la denominada Sintaxis SPSS o Lenguaje de Programacin SPSS, que podemos salvar, guardar, modificar y ejecutar en lugar de utilizar las persianas que aparecen arriba del Editor de Datos. No obstante, como precisamente stas son la ventaja de SPSS, no utilizaremos la sintaxis de este paquete sino dichas persianas, pero queremos que el lector tenga presente siempre la existencia subyacente de estos programas. O bien mediante los mens o bien con la sintaxis, para este ejemplo obtendramos los siguientes resultados:
ESTADSTICA BSICA APLICADA CON SPPS 14
Estadsticos
nivel
N Vlidos 34
Perdidos 0
Media 11,3529
Mediana 11,4500
Moda 12,50
Desv. tp. 1,87459
Varianza 3,514
Asimetra ,536
Error tp. de asimetra ,403
Curtosis ,876
Error tp. de curtosis ,788
Rango 8,70
Mnimo 7,80
Mximo 16,50
Percentiles 25 10,0500
50 11,4500
75 12,4000
nivel
Frecuencia Porcentaje Porcentaje
vlido Porcentaje acumulado
Vlidos 7,80 1 2,9 2,9 2,9
8,50 1 2,9 2,9 5,9
8,60 1 2,9 2,9 8,8
9,10 1 2,9 2,9 11,8
9,20 1 2,9 2,9 14,7
9,30 1 2,9 2,9 17,6
9,70 1 2,9 2,9 20,6
9,90 1 2,9 2,9 23,5
10,10 1 2,9 2,9 26,5
10,20 1 2,9 2,9 29,4
10,30 1 2,9 2,9 32,4
10,60 1 2,9 2,9 35,3
10,80 1 2,9 2,9 38,2
11,10 2 5,9 5,9 44,1
11,30 1 2,9 2,9 47,1
11,40 1 2,9 2,9 50,0
11,50 1 2,9 2,9 52,9
11,60 1 2,9 2,9 55,9
11,80 1 2,9 2,9 58,8
11,90 1 2,9 2,9 61,8
12,00 1 2,9 2,9 64,7
12,20 1 2,9 2,9 67,6
12,30 2 5,9 5,9 73,5
ALFONSO GARCA PREZ y
MARA YOLANDA CABRERO ORTEGA 15
12,40 2 5,9 5,9 79,4
12,50 3 8,8 8,8 88,2
12,70 1 2,9 2,9 91,2
14,90 1 2,9 2,9 94,1
15,00 1 2,9 2,9 97,1
16,50 1 2,9 2,9 100,0
Total 34 100,0 100,0
18,0016,0014,0012,0010,008,00
nivel
8
6
4
2
0
Fre
cu
en
cia
Media =11,3529
Desviacin tpica =1,
87459
N =34
Histograma
El histograma final se puede editar y cambiar los colores, el ttulo, etc. Con la secuencia
Grficos Histograma
podemos volver a obtener el histograma anterior, pero lo que queremos sealar es que la persiana de Grficos, permite obtener grficos de ata calidad sin tener que realizar anlisis estadstico alguno.
ESTADSTICA BSICA APLICADA CON SPPS 16
Figura 2.5
ALFONSO GARCA PREZ y
MARA YOLANDA CABRERO ORTEGA 17
Captulo 3
Intervalos y Contrastes bsicos 3.1. Intervalos y tests t-Student SPSS calcula, bsicamente, intervalos y tests de la t de Student. Aunque en CB resolvimos este ejemplo con un intervalo basado en la normal, lo ejecutaremos a continuacin con uno basado en la t de Student. Dado que se consideran 35 observaciones, las diferencias apenas si existe entre ambas metodologas.
Ejemplo 6.2-CB ___________________________________________ Despus de introducir los datos, ejecutamos la secuencia
Analizar Comparar medias Prueba T para una muestra
Figura 3.1
ESTADSTICA BSICA APLICADA CON SPPS 18
A continuacin aparece (Figura 3.2) el siguiente cuadro de dilogo en donde hemos trasladado la variable en estudio al cuadro de la derecha. El 0 de la ventana Valor de Prueba es la hiptesis nula a contrastar. Con el botn Opciones podemos solicitar el intervalo de confianza para el coeficiente de confianza deseado.
Figura 3.2 El resultado obtenido es el siguiente: Estadsticos para una muestra
N Media Desviacin
tp. Error tp. de
la media
Actividad 35 ,75300 ,518283 ,087606
Prueba para una muestra
Valor de prueba = 0
t gl Sig. (bilateral) Diferencia de medias
95% Intervalo de confianza para la
diferencia
Inferior Superior
Actividad 8,595 34 ,000 ,753000 ,57496 ,93104
Al final del segundo cuadro vemos el intervalo de confianza de confianza 095.
ALFONSO GARCA PREZ y
MARA YOLANDA CABRERO ORTEGA 19
Captulo 4
Anlisis de la Varianza 4.1. Un Factor: Diseo Completamente Aleatorizado El estudio del test analizado aqu, puede estudiar en la Seccin 8.2 del texto CB.
Ejemplo 8.1-CB ___________________________________________ Despus de introducir los datos, primero vamos a visualizar los datos dibujando un Diagrama de Cajas mediante la secuencia (Figura 4.1)
Grficos Diagramas de Cajas
Figura 4.1 con lo que se abre la ventana de dilogo de la Figura 4.2
ESTADSTICA BSICA APLICADA CON SPPS 20
Figura 4.2
en la que seleccionamos definir, hacindolo segn la Figura 4.3
Figura 4.3 Ahora, con el botn Aceptar obtenemos los siguientes resultados,
ALFONSO GARCA PREZ y
MARA YOLANDA CABRERO ORTEGA 21
dieta Resumen del procesamiento de los casos
dieta
Casos
Vlidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
peso 1 5 100,0% 0 ,0% 5 100,0%
2 5 100,0% 0 ,0% 5 100,0%
3 5 100,0% 0 ,0% 5 100,0%
peso
321
dieta
36,00
33,00
30,00
pe
so
en donde destaca el ltimo grfico, el Diagrama de Cajas buscado, en donde se puede apreciar que puede aceptarse una dispersin parecida en los tres tratamientos del factor dieta.
ESTADSTICA BSICA APLICADA CON SPPS 22
El Anlisis de la Varianza para un factor puede hacerse ahora con la secuencia
Analizar Comparar medias ANOVA de un factor
pero preferimos seguir la secuencia (Figura 4.4)
Analizar Modelo lineal general Univariante
por ser este anlisis el ms simple de Modelo Lineal General
Figura 4.4 La ventana de dilogo que aparece a continuacin se completa como se indica
Figura 4.5
ALFONSO GARCA PREZ y
MARA YOLANDA CABRERO ORTEGA 23
en la Figura 4.5. Con el botn Aceptar obtendramos ahora los siguientes resultados Factores inter-sujetos
N
dieta 1 5
2 5
3 5
Pruebas de los efectos inter-sujetos
Variable dependiente: peso
Fuente
Suma de cuadrados
tipo III gl Media
cuadrtica F Significacin
Modelo corregido 20,133(a) 2 10,067 1,144 ,351
Interseccin 16800,267 1 16800,267 1909,121 ,000
dieta 20,133 2 10,067 1,144 ,351
Error 105,600 12 8,800
Total 16926,000 15
Total corregida 125,733 14
a R cuadrado = ,160 (R cuadrado corregida = ,020)
de donde destaca el ltimo cuadro que es la tabla de Anlisis de la Varianza
Ejemplo 8.2-CB ___________________________________________ Despus de introducir los datos y de ver con un diagrama de cajas que puede admitirse la hiptesis de homocedasticidad, correramos un Anlisis de la Varianza como antes, obteniendo la tabla final Pruebas de los efectos inter-sujetos
Variable dependiente: insulina
Fuente
Suma de cuadrados
tipo III gl Media
cuadrtica F Significacin
Modelo corregido 154,920(a) 4 38,730 29,755 ,000
Interseccin 957,071 1 957,071 735,281 ,000
estimula 154,920 4 38,730 29,755 ,000
Error 45,557 35 1,302
Total 1157,548 40
Total corregida 200,477 39
a R cuadrado = ,773 (R cuadrado corregida = ,747)
ESTADSTICA BSICA APLICADA CON SPPS 24
que indica rechazar la hiptesis nula de igualdad de los efectos medios de los cinco estimulantes. Para ejecutar test de comparaciones mltiples elegimos el botn Post hoc y completamos el cuadro de dilogo con varios de estos tests, una vez trasladada la variable en estudio al cuadro de la derecha (Figura 4.6)
Figura 4.6
Los resultados as obtenidos (adems de la tabla ANOVA anterior) aparecen a continuacin,
Pruebas post hoc
estimula Comparaciones mltiples
Variable dependiente: insulina
(I) estimula (J) estimula
Diferencia entre medias
(I-J) Error tp. Significacin
Intervalo de confianza al 95%.
Lmite inferior Lmite
superior
DHS de Tukey 1 2 -,0263 ,57045 1,000 -1,6663 1,6138 3 -2,2800(*) ,57045 ,003 -3,9201 -,6399
4 -4,3900(*) ,57045 ,000 -6,0301 -2,7499
5 -4,4363(*) ,57045 ,000 -6,0763 -2,7962
2 1 ,0263 ,57045 1,000 -1,6138 1,6663
3 -2,2538(*) ,57045 ,003 -3,8938 -,6137
4 -4,3638(*) ,57045 ,000 -6,0038 -2,7237 5 -4,4100(*) ,57045 ,000 -6,0501 -2,7699
3 1 2,2800(*) ,57045 ,003 ,6399 3,9201
2 2,2538(*) ,57045 ,003 ,6137 3,8938
4 -2,1100(*) ,57045 ,006 -3,7501 -,4699
ALFONSO GARCA PREZ y
MARA YOLANDA CABRERO ORTEGA 25
5 -2,1563(*) ,57045 ,005 -3,7963 -,5162
4 1 4,3900(*) ,57045 ,000 2,7499 6,0301 2 4,3638(*) ,57045 ,000 2,7237 6,0038
3 2,1100(*) ,57045 ,006 ,4699 3,7501
5 -,0463 ,57045 1,000 -1,6863 1,5938
5 1 4,4363(*) ,57045 ,000 2,7962 6,0763
2 4,4100(*) ,57045 ,000 2,7699 6,0501
3 2,1563(*) ,57045 ,005 ,5162 3,7963 4 ,0463 ,57045 1,000 -1,5938 1,6863
Scheffe 1 2 -,0263 ,57045 1,000 -1,8805 1,8280
3 -2,2800(*) ,57045 ,009 -4,1342 -,4258
4 -4,3900(*) ,57045 ,000 -6,2442 -2,5358
5 -4,4363(*) ,57045 ,000 -6,2905 -2,5820
2 1 ,0263 ,57045 1,000 -1,8280 1,8805 3 -2,2538(*) ,57045 ,010 -4,1080 -,3995 4 -4,3638(*) ,57045 ,000 -6,2180 -2,5095
5 -4,4100(*) ,57045 ,000 -6,2642 -2,5558
3 1 2,2800(*) ,57045 ,009 ,4258 4,1342
2 2,2538(*) ,57045 ,010 ,3995 4,1080
4 -2,1100(*) ,57045 ,018 -3,9642 -,2558
5 -2,1563(*) ,57045 ,015 -4,0105 -,3020 4 1 4,3900(*) ,57045 ,000 2,5358 6,2442
2 4,3638(*) ,57045 ,000 2,5095 6,2180
3 2,1100(*) ,57045 ,018 ,2558 3,9642
5 -,0463 ,57045 1,000 -1,9005 1,8080
5 1 4,4363(*) ,57045 ,000 2,5820 6,2905
2 4,4100(*) ,57045 ,000 2,5558 6,2642 3 2,1563(*) ,57045 ,015 ,3020 4,0105
4 ,0463 ,57045 1,000 -1,8080 1,9005
Basado en las medias observadas. * La diferencia de medias es significativa al nivel ,05.
Subconjuntos homogneos insulina
estimula N
Subconjunto
1 2 3
DHS de Tukey(a,b)
1 8 2,6650
2 8 2,6913
3 8 4,9450
4 8 7,0550
5 8 7,1013
Significacin 1,000 1,000 1,000
Scheffe(a,b)
1 8 2,6650
2 8 2,6913
3 8 4,9450
4 8 7,0550
5 8 7,1013
Significacin 1,000 1,000 1,000
Se muestran las medias para los grupos en subconjuntos homogneos.
ESTADSTICA BSICA APLICADA CON SPPS 26
Basado en la suma de cuadrados tipo III El trmino error es la Media cuadrtica (Error) = 1,302. a Usa el tamao muestral de la media armnica = 8,000 b Alfa = ,05.
observndose en la ltima tabla los mismos grupos de tratamientos homognenos obtenidos en el texto CB.
4.2. Un Factor: Diseo por Bloques Aleatorizados El estudio del test analizado aqu, puede estudiar en la Seccin 8.3 del texto CB.
Ejemplo 8.3-CB ___________________________________________ Despus de introducir los datos, obtenemos la tabla de Anlisis de la Varianza ejecutando la secuencia (Figura 4.7)
Analizar Modelo lineal general Univariante
Figura 4.7 para completar luego el cuadro de dilogo como se indica en la Figura 4.8
ALFONSO GARCA PREZ y
MARA YOLANDA CABRERO ORTEGA 27
Figura 4.8
Ahora con el botn Modelo elegimos la opcin Personalizado y, pasando las variables a la ventana de la derecha, la opcin de Efectos principales, ya que en el diseo por bloques no consideramos la posibilidad de interaccin entre las variables. Con los botones Continuar y Aceptar obtenemos los siguientes resultados, Factores inter-sujetos
N
Vitamina 1 4
2 4
3 4
Raza 1 3
2 3
3 3
4 3
Pruebas de los efectos inter-sujetos
Variable dependiente: Peso
Fuente
Suma de cuadrados
tipo III gl Media
cuadrtica F Significacin
Modelo corregido 165,000(a) 5 33,000 3,062 ,103
Interseccin 94696,333 1 94696,333 8786,258 ,000
Vitamina 84,667 2 42,333 3,928 ,081
Raza 80,333 3 26,778 2,485 ,158
Error 64,667 6 10,778
Total 94926,000 12
ESTADSTICA BSICA APLICADA CON SPPS 28
Total corregida 229,667 11
a R cuadrado = ,718 (R cuadrado corregida = ,484)
en donde la ltima tabla es la de Anlisis de la Varianza obtenida en CB.
4.3. Dos Factores: Diseo Completamente Aleatorizado El estudio del test analizado aqu, puede estudiar en la Seccin 8.5 del texto CB.
Ejemplo 8.5-CB ___________________________________________ Despus de introducir los datos, obtenemos la tabla de Anlisis de la Varianza ejecutando la secuencia
Analizar Modelo lineal general Univariante y completando despus la ventana de dilogo como se indica en la Figura 4.9
Figura 4.9 Hay muchas semejanzas con el caso anterior del diseo por bloques pero ahora s se admite la interaccin entre variables, por lo que no hace falta modificar el modelo; ahora lo requerimos completo. Por eso, presionando ya el botn Aceptar, obtenemos los siguientes resultados, en donde la ltima tabla es la misma de ANOVA obtenida en CB
ALFONSO GARCA PREZ y
MARA YOLANDA CABRERO ORTEGA 29
Factores inter-sujetos
N
Estacin 1 12
2 12
3 12
4 12
Frmaco 1 16
2 16
3 16
Pruebas de los efectos inter-sujetos
Variable dependiente: Alergia
Fuente
Suma de cuadrados
tipo III gl Media
cuadrtica F Significacin
Modelo corregido 10488,167(a) 11 953,470 44,781 ,000
Interseccin 93633,333 1 93633,333 4397,652 ,000
Estacin 4132,167 3 1377,389 64,691 ,000
Frmaco 6017,167 2 3008,583 141,303 ,000
Estacin * Frmaco 338,833 6 56,472 2,652 ,031
Error 766,500 36 21,292
Total 104888,000 48
Total corregida 11254,667 47
a R cuadrado = ,932 (R cuadrado corregida = ,911)
ESTADSTICA BSICA APLICADA CON SPPS 30
ALFONSO GARCA PREZ y
MARA YOLANDA CABRERO ORTEGA 31
Captulo 5
Regresin Lineal y Correlacin 5.1. Regresin Lineal Simple El estudio del test analizado aqu, puede estudiar en las Secciones 9.2 y 9.3 del texto CB. Como all destacbamos, hay dos aspectos de inters: la representacin grfica de los datos y el Anlisis de la Regresin
Ejemplo 9.1-CB ___________________________________________ Despus de introducir los datos, primero vamos a visualizar los datos dibujando un Diagrama de Dispersin mediante la secuencia (Figura 5.1)
Grficos Interactivos Diagrama de dispersin
Figura 5.1
ESTADSTICA BSICA APLICADA CON SPPS 32
La cantidad de oxgeno se pasa a la dependiente y la profundidad a la independiente, obtenindose el siguiente grfico en donde puede verse tambin la correlacin entre ambas variables.
Regresin lineal
20,00 30,00 40,00 50,00 60,00 70,00
profund
0,00
2,00
4,00
6,00
co
nt_
ox
i
1cont_oxi = 8,63 + -0,11 * profund
R-cuadrado = 0,80
La segunda cuestin importante es contrastar, mediante la tabla de Anlisis de la Varianza para la Regresin Lineal, si puede admitirse la hiptesis nula de que la variable independiente no es significativa a la hora de predecir a la variable dependiente. Para ello ejecutamos la secuencia
Analizar Regresin Lineal
completando la ventana de dilogo que aparece como se indica en la Figura 5.2, en donde. A dems de indicar cul es la variable independiente y dependiente, hemos seleccionado el Mtodo Hacia atrs. El resto de las opciones, como la de que nos d los estimadores o el nivel de significacin del test de la F de Snedecor de la tabla de Anlisis de la Varianza para la Regresin Lineal, ya vienen dadas por defecto.
ALFONSO GARCA PREZ y
MARA YOLANDA CABRERO ORTEGA 33
Figura 5.2 Los resultados as obtenidos son los siguientes, en donde de nuevo destaca la penltima tabla ANOVA y las estimaciones de los coeficientes de regresin de la ltima tabla.
Regresin Variables introducidas/eliminadas(b)
Modelo Variables
introducidas Variables
eliminadas Mtodo
1 profund(a) . Introducir
a Todas las variables solicitadas introducidas b Variable dependiente: cont_oxi
Resumen del modelo
Modelo R R cuadrado R cuadrado corregida
Error tp. de la estimacin
1 ,896(a) ,803 ,763 1,20444
a Variables predictoras: (Constante), profund
ANOVA(b)
Modelo Suma de
cuadrados gl Media
cuadrtica F Sig.
1 Regresin 29,481 1 29,481 20,322 ,006(a)
Residual 7,253 5 1,451
Total 36,734 6
a Variables predictoras: (Constante), profund
ESTADSTICA BSICA APLICADA CON SPPS 34
b Variable dependiente: cont_oxi Coeficientes(a)
Modelo
Coeficientes no estandarizados
Coeficientes estandarizado
s
t Sig. B Error tp. Beta
1 (Constante) 8,631 1,077 8,010 ,000
profund -,108 ,024 -,896 -4,508 ,006
a Variable dependiente: cont_oxi
5.2. Regresin Lineal Mltiple El estudio del test analizado aqu, puede estudiar en las Secciones 10.2 y 10.3 del texto CB. Las opciones a ejecutar son las mismas que en la seccin anterior, con la diferencia de que debemos incluir ms de una variable independiente.
Ejemplo 10.1-CB __________________________________________ Despus de introducir los datos, ejecutamos
Regresin Lineal completando el cuadro de dilogo como se indica en la Figura 5.3
Figura 5.3 Las tres ltimas tablas que as se obtienen,
ALFONSO GARCA PREZ y
MARA YOLANDA CABRERO ORTEGA 35
ANOVA(c)
Modelo Suma de
cuadrados gl Media
cuadrtica F Sig.
1 Regresin 2502,390 2 1251,195 34,081 ,000(a)
Residual 440,543 12 36,712
Total 2942,933 14
2 Regresin 2502,373 1 2502,373 73,840 ,000(b)
Residual 440,561 13 33,889
Total 2942,933 14
a Variables predictoras: (Constante), X2, X1 b Variables predictoras: (Constante), X2 c Variable dependiente: Y
Coeficientes(a)
Modelo
Coeficientes no estandarizados
Coeficientes estandarizado
s
t Sig. B Error tp. Beta
1 (Constante) 2,086 6,739 ,309 ,762
X1 ,057 2,613 ,006 ,022 ,983
X2 1,050 ,326 ,916 3,219 ,007
2 (Constante) 1,977 4,373 ,452 ,659
X2 1,057 ,123 ,922 8,593 ,000 a Variable dependiente: Y
Variables excluidas(b)
Modelo Beta dentro t Sig. Correlacin
parcial
Estadsticos de colinealidad
Tolerancia
2 X1 ,006(a) ,022 ,983 ,006 ,154
a Variables predictoras en el modelo: (Constante), X2 b Variable dependiente: Y
indican considerar a X2 como nica covariable independiente significativa y concluir con la recta ajustada
Y = 1977 + 1057 X2
ESTADSTICA BSICA APLICADA CON SPPS 36
ALFONSO GARCA PREZ y
MARA YOLANDA CABRERO ORTEGA 37
Captulo 6
Tablas de Contingencia 6.1. Contraste de homogeneidad de varias muestras El estudio del test analizado aqu, puede estudiar en la Seccin 12.3 del texto CB.
Ejemplo 12.8-CB __________________________________________ Despus de introducir los datos, ejecutamos la secuencia (Figura 6.1)
Datos Ponderar casos
Figura 6.1
ESTADSTICA BSICA APLICADA CON SPPS 38
y, en el cuadro de dilogo resultante, ponderamos los datos con la variable frecu (Figura 6.2)
Figura 6.2
Ahora ya podemos realizar el Anlisis de la tabla de contingencia ejecutando la secuencia (Figura 6.3)
Analizar Estadsticos descriptivos Tablas de contingencia
Figura 6.3 Ahora debemos completar el cuadro de dilogo que se abre, teniendo en cuenta cul variable forma las filas y cul las columnas. Adems, con el botn Estadsticos, le pedimos el Chi-cuadrado de Pearson, que es el utilizado en CB (Figura 6.4)
ALFONSO GARCA PREZ y
MARA YOLANDA CABRERO ORTEGA 39
Figura 6.4
Por ltimo, en el botn Casillas le podemos pedir no slo las frecuencias observadas sino las esperadas de cada casilla. (Figura 6.5)
Figura 6.5 Los resultados as obtenidos son los siguientes:
ESTADSTICA BSICA APLICADA CON SPPS 40
Tablas de contingencia Resumen del procesamiento de los casos
Casos
Vlidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
Comunidad * Fumador 300 100,0% 0 ,0% 300 100,0%
Tabla de contingencia Comunidad * Fumador
Fumador
Total 1 2
Comunidad 1 Recuento 13 87 100
Frecuencia esperada 16,0 84,0 100,0
2 Recuento 17 83 100
Frecuencia esperada 16,0 84,0 100,0
3 Recuento 18 82 100
Frecuencia esperada 16,0 84,0 100,0
Total Recuento 48 252 300
Frecuencia esperada 48,0 252,0 300,0
Pruebas de chi-cuadrado
a 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 16,00.
destacando la ltima tabla en la que aparece el valor del estadstico chi-cuadrado de Pearson, 1042 y el p-valor del test, 0594, los mismos valores que en CB.
6.2. Contraste de independencia de caracteres El estudio del test analizado aqu, puede estudiar en la Seccin 12.4 del texto CB. El anlisis con SPSS es idntico al de la seccin anterior.
Ejemplo 12.9-CB __________________________________________ Despus de introducir los datos, ejecutamos la secuencia (Figura 6.6)
Valor gl Sig. asinttica
(bilateral)
Chi-cuadrado de Pearson 1,042(a) 2 ,594
Razn de verosimilitudes 1,069 2 ,586 Asociacin lineal por lineal ,927 1 ,336
N de casos vlidos 300
ALFONSO GARCA PREZ y
MARA YOLANDA CABRERO ORTEGA 41
Datos Ponderar casos
Figura 6.6 ponderndolos en este caso con la variable frecuen. Ahora ya podemos ejecutar el Anlisis de la tabla de contingencia ejecutando la secuencia (Figura 6.7)
Analizar Estadsticos descriptivos Tablas de contingencia
Figura 6.7
ESTADSTICA BSICA APLICADA CON SPPS 42
sin olvidar completar, como antes, los botones Estadsticos y Celdas. Los resultados as obtenidos son los siguientes:
Tablas de contingencia Resumen del procesamiento de los casos
Casos
Vlidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
deterior * depresio 100 100,0% 0 ,0% 100 100,0%
Tabla de contingencia deterior * depresio
depresio
Total ,00 1,00
deterior ,00 Recuento 22 31 53
Frecuencia esperada 16,4 36,6 53,0
1,00 Recuento 9 38 47
Frecuencia esperada 14,6 32,4 47,0
Total Recuento 31 69 100
Frecuencia esperada 31,0 69,0 100,0
Pruebas de chi-cuadrado
Valor gl Sig. asinttica
(bilateral) Sig. exacta (bilateral)
Sig. exacta (unilateral)
Chi-cuadrado de Pearson 5,823(b) 1 ,016
Correccin por continuidad(a) 4,824 1 ,028
Razn de verosimilitudes 5,975 1 ,015
Estadstico exacto de Fisher ,018 ,013
Asociacin lineal por lineal 5,764 1 ,016
N de casos vlidos 100
a Calculado slo para una tabla de 2x2. b 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 14,57.
observando en la ltima tabla los valores del estadstico de Pearson, 5823 y el p-valor del test asociado, 0016, los mismos que los obtenidos en CB.