Práctica 7 (Tema 9) Cálculo de intervalos de confianza Esta práctica con la que se cierra el curso se dedica a la obtención de resultados finales. Una vez desarrolladas en prácticas anteriores la preparación y organización de los datos ahora se avanzan las líneas de análisis, en concreto la construcción de intervalos de confianza. En la discusión de estos resultados se avanzan cuestiones centrales para el análisis estadístico como es la relación entre variables, y que serán materia de otras asignaturas. Con la realización de esta práctica el alumno consigue su capacitación a nivel básico como técnico de análisis de datos de encuestas. 1 La construcción de intervalos de confianza de medias Para la realización de esta práctica volveremos a utilizar el estudio del CIS2927 del cual se ha venido preparando el fichero CIS2927.SAV. Pulsando directamente sobre el fichero, se nos abrirá la matriz de datos en PSPP. En primer lugar vamos a construir un intervalo de confianza para una variable de intervalo. Vamos a estudiar la valoración que reciben Mariano Rajoy y Alfredo Pérez Rubalcaba según el enunciado de la pregunta 17. En primer lugar para el cálculo de la media tenemos que descontar los valores 98 y 99 que corresponden a las opciones “no sabe” o “no contesta”. Para ello, podemos bien mediante el uso de menús o mediante comandos de sintaxis, recodificar las variables en variables distintas y declarar los valores desde 97 a 98 como valores perdidos (MISSING). Con comandos de sintaxis, escribiremos lo siguiente. COMPUTE 1712R=P1712. COMPUTE P1713R=P1713. MISSING VALUE P1712R P1713R (97,98,99). VARIABLE LABEL P1712R “Valoración Pérez Rubalcaba” /p1713R “Valoración Mariano Rajoy”. Si vemos el cuestionario, en la pregunta 17, Pérez Rubalcaba ocupa el puesto 12 y Mariano Rajoy el 13 de los 14 políticos preguntados. Si recordamos el fichero de sintaxis (ES2927.SPS) las variables de la pregunta 17 fueron denominadas en el comando DATA LIST en conjunto usando la expresión “TO” P1701 TO P1714 81-112 Dicha expresión genera 14 variables denominadas genéricamente P17xx, siendo xx un valor que va desde 01 -que se corresponde con el item referente a Álvarez Sostres (P1701, variable que ocupa las columnas 81 y 82)- hasta 14 -que se corresponde con Carlos Salvador (P1714, variable que ocupa las columnas 111 y 112)-. La valoración de Pérez Rubalcaba se encuentra en la variable P1712 y en la P1713 la de Mariano Rajoy.
18
Embed
Práctica 7 (Tema 9) Cálculo de intervalos de confianza · 2013-02-28 · Práctica 7 (Tema 9) Cálculo de intervalos de confianza Esta práctica con la que se cierra el curso se
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Práctica 7 (Tema 9)
Cálculo de intervalos de confianza
Esta práctica con la que se cierra el curso se dedica a la obtención de resultados finales. Una
vez desarrolladas en prácticas anteriores la preparación y organización de los datos ahora se
avanzan las líneas de análisis, en concreto la construcción de intervalos de confianza. En la
discusión de estos resultados se avanzan cuestiones centrales para el análisis estadístico como
es la relación entre variables, y que serán materia de otras asignaturas. Con la realización de
esta práctica el alumno consigue su capacitación a nivel básico como técnico de análisis de
datos de encuestas.
1 La construcción de intervalos de confianza de medias
Para la realización de esta práctica volveremos a utilizar el estudio del CIS2927 del cual se ha
venido preparando el fichero CIS2927.SAV. Pulsando directamente sobre el fichero, se nos
abrirá la matriz de datos en PSPP. En primer lugar vamos a construir un intervalo de confianza
para una variable de intervalo. Vamos a estudiar la valoración que reciben Mariano Rajoy y
Alfredo Pérez Rubalcaba según el enunciado de la pregunta 17. En primer lugar para el cálculo
de la media tenemos que descontar los valores 98 y 99 que corresponden a las opciones “no
sabe” o “no contesta”.
Para ello, podemos bien mediante el uso de menús o mediante comandos de sintaxis,
recodificar las variables en variables distintas y declarar los valores desde 97 a 98 como valores
perdidos (MISSING). Con comandos de sintaxis, escribiremos lo siguiente.
Los intervalos no se solapan, con un nivel de confianza del 95%, pero tampoco si aumentamos
el nivel de confianza al 99% (Z=2,58).
Intervalos de confianza para el 99% (Z=2,58)
n Media Desviación Típica
Error típico
Límite inferior
Límite superior
De 65 y más 394 5,27 2,07 0,10 5,01 5,53
De 18 a 64 1636 4,80 1,90 0,05 4,67 4,93
Intervalos de confianza para el 99,7% (Z=3)
n Media Desviación Típica
Error típico
Límite inferior
Límite superior
De 65 y más 394 5,27 2,07 0,10 4,97 5,57
De 18 a 64 1636 4,80 1,90 0,05 4,65 4,95
Como podemos observar con más de un 99,7% de nivel de confianza podemos afirmar que los
mayores se ubican políticamente de forma diferente. El intervalo de la diferencia de medias,
no incluye el “0” y si observamos la significación de t vemos que esta es muy elevada2.
Podemos señalar que los mayores son más conservadores que el resto de la sociedad.
2 En la columna Sig.(2 colas) vemos que se ofrece el valor 0,00. La interpretación no es que el nivel de
significación es 0, sino que el nivel de significación es menor que
. El nivel de confianza será por
tanto superior al 99,9%. Dado que los grados de libertad son mayores de 120, el valor de t podemos
Diferencia de medias
Error típico ( )
Límite inferior ( ) ( )
Límite superior ( ) ( )
-0,48 0,11 -0,70 -0,29
Otra cuestión distinta será la explicación de dichas diferencias. Puede ser por la edad, los
mayores se vuelven conservadores –explicación banal-, o puede ser efecto, no de la edad, sino
de la generación. En los nacidos en el entorno de la Guerra y Postguerra priman los valores
“materialistas3” sobre los “postmaterialistas” y por ello podrían tener un comportamiento más
conservador.
2 Intervalos de confianza para proporciones
En el análisis de encuestas sociales el estadístico más corriente y empleado es la proporción.
Sin embargo los programas de cálculo estadístico no ofrecen las mismas facilidades de cálculo
de errores típicos e intervalos que para medias.
Por ejemplo, queremos conocer el peso de las religiones no católicas en la población española,
según la información que nos ofrece la pregunta 32.
Desplegamos el menú: Analizar; Estadística Descriptiva; Frecuencias y seleccionamos P32. Los
resultados:
interpretarlo como Z, en este caso tendríamos que Z>4,1, es decir el valor obtenido está a más de cuatro unidades Z del caso en el que hubiera diferencias. 3 Véase sobre valores materialistas/postmaterialistas el estudio del profesor Ronald Inglehart (1991): “El
cambio cultural en las sociedades industriales avanzadas”. CIS.
La tabla nos indica que el 2,78% de la muestra se consideran creyentes no católicos.
Observemos que además de la tabla de porcentajes, PSPP por defecto nos ofrece una tabla
con estadísticos. Sin embargo, dichos estadísticos no tienen sentido alguno. PSPP ha calculado
la media usando los valores de codificación –entre 1 y 9- como valores de las categorías. La
variable es una variable cualitativa y sus categorías no pueden relacionarse con ninguna
métrica.
Para conocer la proporción en el conjunto de los españoles mayores de 18 años vamos a
construir un intervalo de confianza. El error típico de la proporción tenemos que calcularlo
manualmente. Como sabemos:
√
√
El intervalo de los creyentes no católicos para el conjunto de la población española será:
Nivel de confianza Z
Inferior
Superior
95% 1,96 2,1% 3,4%
95,45% 2 2,1% 3,4%
99% 2,58 1,9% 3,6%
99,7% 3 1,8% 3,8%
Cuando los tamaños muestrales son grandes, como es en este caso, el error estadístico
máximo resulta muy reducido. Como puede comprobarse en la ficha técnica, para un nivel de
confianza del 95% los errores no superarán el 2% en esta encuesta. Para esta categoría –
creyentes no católicos, con el mismo nivel de confianza el error está en torno a 0,6%. Para
esta encuesta, como regla general, podemos construir intervalos muy precisos para el
conjunto de la población sin necesidad de cálculos, simplemente sumando o restando un 2% al
porcentaje.
Cuando comparamos categorías en tablas cruzadas el estadístico que utilizamos es la
diferencia de proporciones. Dicho estadístico es sin duda el de mayor utilidad en el análisis de
encuestas sociales. Vamos a investigar otro mito: ¿son las mujeres más religiosas que los
hombres?
Para ello vamos a calcular la distribución de frecuencias de la P32 para hombres y para
mujeres y luego estudiar las diferencias. Ello lo vamos a realizar mediante una tabla de
contingencia. Desplegamos el menú: Analizar; Estadística Descriptiva; Tablas Cruzadas.
Como norma, en las tablas se coloca en la posición de filas la variable que queremos estudiar,
en este caso “religiosidad” (P32) y en columnas la variable que contiene los grupos de
comparación –en este caso sexo del entrevistado (P29)-.
Como podemos ver la ventana para tablas de contingencia (Cosstabs) nos ofrece varias
posibilidades. Por una parte están los estadísticos (En esta práctica resulta recomendable
desactivar todos, ya que serán estudiados en otros cursos), y por otra “Celdas...”. En el botón
de celdas, seleccionaremos únicamente Recuento –que nos dará el número de casos “n” en
cada casilla- y Columna. Con esta característica estamos solicitando los porcentajes en la
dirección de la variable que forma los grupos de comparación. Es decir estamos haciendo 100 a
los hombres y 100 a las mujeres para poder comparar ambas distribuciones, con
independencia del número de hombres o de mujeres.
La lectura de la tabla parece confirmar la idea de que las mujeres son más religiosas. Podemos
observar que el 77,8% de las mujeres se declaran católicos, mientras que sólo lo hacen el 66%
de los hombres. Los hombres se concentran más en las categorías de “No Creyentes” y “Ateos”
que las mujeres.
El grupo de católicos mantiene una diferencia grande (77,8%-66%=11,8%). Si construimos el
intervalo del estadístico de la diferencia podemos señalar que en la población española hay
proporcionalmente más católicas que católicos.
Recordemos que el error típico de la diferencia de proporciones es:
( ) √
√
El error estadístico para un nivel de confianza del 95% (Z=1,96) será: 1,96x2,1=4,1%. El
intervalo de la diferencia se encontrará entre el 7,7% t el 16%. (11,8%±4,1%). Es decir en la
población hay diferencias por sexo respecto a la proporción de católicos.
No obstante debe tenerse en cuenta que el hecho de que encontremos diferencias no quiere
decir que sean explicadas por dichas variables. En este caso, afirmamos que hay diferencias,
pero no llegamos a afirmar que las mujeres son más “religiosas que los hombres”. Dicha
afirmación debe sustentarse en la existencia de un cuerpo teórico que soporte dicha relación,
pero además resulta necesario comprobar que no existen variables que modifican, intervienen
o alteran la relación observada.
En el presente caso, del hecho de ser hombre o mujer no se desprende mayor o menor
religiosidad, el sexo se lleva en los genes pero no podemos decir lo mismo de las creencias.
Debemos considerar otras variables que incidan en esta relación. Por ejemplo, el efecto que
puede tener la educación diferenciada con la que han crecido distintas cohortes de hombres y
de mujeres. También deberíamos descartar el efecto que pueda tener la composición por edad
en la tabla; la muestra de mujeres tiene una edad media mayor que la de hombres, como
efecto de las diferencias en esperanza de vida.
No es objeto de este ejercicio resolver esta cuestión. Es objeto de los próximos cursos mostrar
las formas de análisis de relaciones entre variables. Únicamente se ofrece para el lector
curioso la siguiente tabla que relaciona religiosidad de hombres y de mujeres en función de su
posición en el hogar. Respuestas a la pregunta 36. Resulta muy ilustrativo observar que cuando
son ellos o ellas quienes son los mantenedores del hogar, no hay diferencias importantes en el
grado de “catolicismo” y cuando están ellos o ellas en posición subsidiaria las diferencias se
hacen máximas. Esta constatación nos lleva a considerar los estudios de género como
perspectiva teórica de interés para cuestionar el mito de la (mayor) religiosidad femenina.
Relación entre posición religiosa (P32) en función de la posición en el hogar (P36, persona
que trae ingresos al hogar) por sexo del entrevistado/a
P29
Hombre Mujer
Recuento % del N de la columna Recuento
% del N de la columna
P36 La persona entrevistada P32 Católico/a 572 71,5% 299 76,5%
Creyente de otra religión 15 1,9% 10 2,6%
No creyente 125 15,6% 43 11,0%
Ateo/a 74 9,3% 30 7,7%
N.C. 14 1,8% 9 2,3%
Otra persona P32 Católico/a 168 54,7% 569 78,1%
Creyente de otra religión 18 5,9% 23 3,2%
No creyente 62 20,2% 85 11,7%
Ateo/a 50 16,3% 45 6,2%
N.C. 9 2,9% 7 1,0%
(NO LEER) El entrevistado y otro a partes iguales P32 Católico/a 55 57,9% 109 79,0%