Transcript

UNIVERSIDAD DE VALPARAÍSOFACULTAD DE MEDICINAESCUELA DE PSICOLOGÍA

Análisis de la Varianza Simple (ANOVA)

Ps. Viviana Rodríguez Díaz

Valparaíso, 7 de mayo de 2015.

Análisis de Varianza-Introducción

Ciertas investigaciones científicas requieren determinar el papel que una variable específica (variable independiente) juega en los datos observados (variable dependiente)

Ejemplo:

¿El consumo de leche materna durante la etapa de lactancia tiene alguna incidencia sobre el CI que se alcance al crecer?

Análisis de Varianza-Introducción

Para responder este tipo de preguntas:

- Se forman 2 o más grupos que difieren sólo en la variable (VI) cuya influencia se desee determinar.

- Se los compara en la variable (VD) que, según nuestras hipótesis, sería afectada por la variable independiente.

Análisis de Varianza-Introducción

Volviendo al ejemplo…..Podrían formarse 3 grupos que sólo difieran en

tipo de alimentación y luego comparar el CI alcanzado al crecer:Grupo 1: Alimentado exclusivamente con leche

materna por 6 meses.Grupo 2: Alimentado con leche materna y

relleno por 6 meses.Grupo 3: Alimentado exclusivamente con

relleno por 6 meses.

¿Cómo hacer esto?

Mediante el Análisis de Varianza (ANOVA) se puede establecer si existen diferencias significativas entre los promedios de n (dos o más) poblaciones.

Sabemos que…………Cuando se realiza con dos poblaciones es equivalente a la prueba t.

ANOVA y Prueba t

Similitud con prueba t de Student (compara 2 grupos), pero se extiende a múltiples grupos (3 o más).

Análisis de ANOVA podrían hacerse con múltiples pruebas t pero: Pruebas t aumentan geométricamente con cantidad de grupos a comparar.

Al aumentar cantidad de pruebas aumenta error en estimación.

ANOVA

Requiere: o Variable Independiente (VI) expresada en

categorías. Cada categoría es un grupo de comparación.

o Variable Dependiente (VD) cuantitativa. Medida en todos los grupos.

Análisis de Varianza

Creado en 1920, por Sir Ronald A. Fisher.

¿Cómo establece la significatividad de la diferencia entre los promedios?

A cada grupo de sujetos experimentales deberá corresponderle un nivel de la variable independiente.

Además, cada grupo se considerará una muestra aleatoria de la población de sujetos correspondientes a su nivel de la VI.

¿Cómo establece la significatividad de la diferencia entre los promedios?

Luego, se estimará la varianza poblacional común de las poblaciones mediante dos técnicas distintas:

o 1. Estimación intra-grupal.

o 2. Estimación inter-grupal.

¿Cómo establece la significatividad de la diferencia entre los promedios?

La comparación de ambas estimaciones de la varianza nos permitirá determinar si las diferencias observadas en los promedios en la VD de los distintos grupos son diferencias aleatorias o, por el contrario, reflejan diferencias reales en los promedios de las poblaciones de las cuales han sido extraídas

Para comparar ambas estimaciones de la varianza poblacional se utiliza la Distribución F de Fischer.

1. Estimación intragrupal de la varianza poblacional

- Vamos paso por paso:

- Es posible estimar la varianza poblacional (la misma para todas las poblaciones comparadas) a partir de la varianza interna observada en cada una de las muestras de sujetos correspondientes a los distintos niveles de la VI. S2

Intra = __(X –M)2 o CM Intra = SC Intra X = Ptje. de cada sujeto en la

VD.

glIntra glIntra M = Promedio del grupo.

S2Intra = Varianza Intra = σ2

Intra

glIntra = Total de observaciones

menos nº de grupos.

2. Estimación intergrupal de la varianza poblacional

- Su estimación se basa en las diferencias existentes entre los promedios de las muestras.

- La variación entre los distintos promedios muestrales puede usarse para estimar la varianza de las poblaciones (la misma para todas ellas).

S2Inter = Varianza Inter = σ2

Inter

2. Estimación intergrupal de la varianza poblacional

Hay dos posibilidades en relación a esta estimación de la varianza poblacional:

i) Ho verdadera No hay diferencia real entre el promedio de las distintas

poblaciones.Se asume que todas las poblaciones se distribuyen

normalmente y tienen la misma varianza.

2. Estimación intergrupal de la varianza poblacional

Pero muestras serán ligeramente distintas entre sí, teniendo promedios levemente diferentes.

Ejemplo:Estudio de muestras de 5 niños de 3 poblaciones

idénticas.Si cada población estuviera constituida por niños con un

peso corporal de 15 a 16 kgs., los promedios de las 3 muestras estarían entre 15 y 16 (baja varianza).

Pero si el rango de peso fuera de 15 a 25 kgs., los promedios muestrales variarían mucho más.

2. Estimación intergrupal de la varianza poblacional

Aunque promedios muestrales vengan de poblaciones idénticas no serán iguales:

a) Promedios muestrales que vienen de poblaciones con menor variación variarán menos.

b) Promedios muestrales que vienen de poblaciones con mayor variación variarán más.

2. Estimación intergrupal de la varianza poblacional

ii) Ho falsaSi H1 es verdadera implica que poblaciones

tienen promedios distintos.En este caso, la variación entre los promedios

muestrales sería el resultado, tanto de la varianza interna de las poblaciones como, además, de la diferencia entre los promedios de las poblaciones.

2. Estimación intergrupal de la varianza poblacional

Los promedios muestrales que vienen de poblaciones con promedios distintos (b) variarán más que los promedios muestrales que vienen de poblaciones con igual promedio (a).

2. Estimación intergrupal de la varianza poblacionalSe comienza estimado la varianza de los

promedios de las muestras:

S2Inter = (M –GM)2 o CM Inter = SC Inter GM = Promedio de los promedios de los grupos

glInter glInter M = Promedio de cada grupo.

S2Inter = Varianza Inter = σ2

Inter

glInter = Cantidad de grupos menos 1.

.

Lógica del ANOVA

Ho (Hipótesis nula) establece que poblaciones que se comparan tienen el mismo promedio.

H1 (Hipótesis de investigación o alternativa) establece que existen diferencias significativas entre los promedios de las poblaciones comparadas.

La prueba de hipótesis con ANOVA intenta dilucidar si los promedios muestrales difieren más de lo esperado para el caso en que Ho es verdadera.

¿Cómo saber si la diferencia entre la estimación intra e intergrupal de la varianza es

lo suficientemente grande?F compara la razón entre lo explicado y lo no explicado

F < 1 el error es más grande ⇒que lo explicado.

F = 1 el error y lo explicado ⇒miden lo mismo.

F > 1 lo explicado es más ⇒grande que el error.

Si F>1, debemos evaluar la probabilidad (p) de que ese valor F ocurra cuando no se cumple Ho.

¿Cómo saber si la diferencia entre la estimación intra e intergrupal de la varianza es

lo suficientemente grande?

Existen distribuciones F y Tablas F que cumplen rol similar a Tabla t.

En Tabla F se busca un valor teórico de F asociado a un nivel de significación especificado por el investigador (e.g. 0,05), el cual se usará como criterio para determinar si el valor encontrado es lo suficientemente grande como para rechazar Ho.

Tabla F

Tabla ANOVA

Otra Versión

Supuestos del ANOVA

1) Normalidad De las muestras en la variable dependiente. Se prueba con test de Kolmogorov-Smirnov

(K-S). No tiene efectos graves si “N” de muestras es

grande.

Supuestos del ANOVA

2) Independencia de las observacionesSe revisa por medio del gráfico de residuos,

los cuales deben tener una dispersión aleatoria.

Si no se cumple. se pueden transformar los datos por medio de logaritmos.

Supuestos del ANOVA

3) HomocedasticidadLas varianzas de las poblaciones de las

cuales se han extraído los grupos son similares.

Se evalúa por medio del test de Levene.

Ejemplo:

Psicólogo investiga influencia del nivel de conocimiento de existencia de antecedentes criminales sobre la forma en que jurado percibe si el acusado es culpable o inocente.

Se elige a 15 voluntarios seleccionados para participar como jurado (pero que aún no lo han hecho) y se les asigna al azar a 3 grupos.

Los 3 grupos observarán un video en que se muestra juicio de una mujer acusada de giro doloso de cheques.

Continuación Ejemplo:

Antes de ver video 3 grupos reciben = hoja con antecedentes (edad, estado, civil, educación) pero con la siguiente diferencia en la hoja:

Grupo 1 (con antecedentes delictivos): además, señala que mujer ya ha sido condenada varias veces por ese delito.

Grupo 2 (sin antecedentes): señala que mujer no tiene antecedentes delictivos.

Grupo 3 (sin información explícita ): no se menciona información sobre antecedentes (ni buenos ni malos).

En este ejemplo, se puede tomar caso de participante que haya calificado a mujer con 10 en culpabilidad (máxima culpabilidad).

- GP de calificaciones de culpabilidad de 3 grupos es 5,67- Calificación de este participante presenta desviación de 4,33 (10-5,67=4,33) respecto al GP.

- Promedio de su grupo (antecedentes delictivos) es 8.- Por tanto, desviación del puntaje de esta persona respecto al promedio de su grupo es 2 (10-8=2) y desviación del promedio grupal respecto al GP es 2,33 (8-5,67=2,33). - dos desviaciones (2 y 2,33) suman desviación total de 4,33

Suma de Desviaciones cuadráticas (SC)

- Después, se elevan al cuadrado c/u de desviaciones (desviación de ptje. de c/ persona respecto al promedio de su grupo y desviación del promedio grupal con respecto al GP) y se suman.- Suma de desviaciones cuadráticas de cada observación con respecto al GP está compuesto por:a) Suma de desviaciones cuadráticas de cada observación respecto del x grupal + b) Suma de las desviaciones cuadráticas del promedio del grupo respecto al GP.

Estimaciones de Varianza poblacional a partir de Suma de Desviaciones

Cuadráticas

Se divide cada suma de desviaciones cuadráticas por grados de libertad correspondientes:

Estimación de la SD² Intergrupal

Estimación de la SD² Intragrupal

Uso del Modelo Estructural en Anova sobre Antecedentes delictivos

Uso del Modelo Estructural en Anova sobre …….. Continuación.

ANOVA con tamaños grupales diferentes

EjemploSe realiza un estudio sobre satisfacción de pacientes

con tres tipos diferentes de tratamiento para alcoholismo en centro de rehabilitación.

10 sujetos se dividen al azar en 3 grupos: Tratamiento A, B y C.

Prueba de hipótesis con ANOVA

1) Plantear Ho y H1Pob. 1: alcohólicos que reciben tratamiento A.Pob. 2: alcohólicos que reciben tratamiento B.Pob. 3: alcohólicos que reciben tratamiento C.

Ho: 3 poblaciones tienen igual promedio de satisfacción con tratamiento.

Ha: 3 poblaciones NO tienen igual promedio de satisfacción con tratamiento.

Prueba de hipótesis con ANOVA

2) Determinar caracs. de la Dist. comparativaEs Distribución F. Cálculo de gl. Inter = (N°grupos-1)

Intra= (N1-1)+ (N2-1)+..+ (NN-1)

En este caso:

gl. Inter= 3-1= 2

glIntra= (4-1)+(3-1)+(3-1)=7

Por lo tanto, se trata de una distribución F para 2 y 7 gl (se busca en Tabla F el Fteórico para 2 y 7 gl.)

Prueba de hipótesis con ANOVA

3) Determinar el punto muestral de corte en la distribución comparativa:

Se busca en Tabla F el F teórico de 2 gl. en el numerador y 7 gl. en el denominador. Usando 0,05 de significación, se observa que el F de corte es 4,74.

Prueba de hipótesis con ANOVA

4) Determinar valor muestral en la Dist. comparativa:

Cálculo de la razón F:

top related