Transcript
Universidad de talca
ÍNDICE DE CONTENIDOS
ÍNDICE DE ANEXOS
RESUMEN EJECUTIVO
I. ANTECEDENTES GENERALES
Todos los países desarrollados y subdesarrollados requieren de un factor fundamental para hacer
crecer a una nación, ésta es la educación. Se entiende por educación al proceso de socialización y
endoculturación de las personas a través del cual se desarrollan capacidades físicas e intelectuales,
habilidades, destrezas, técnicas de estudio y formas de comportamiento ordenadas con un fin social.
(Azúa H, Bascuñán P., Caballero C., Castro Q., & Figueroa F, 2007)
1.1 Definición de Educación.
El sistema educacional chileno se caracteriza por tener una organización descentralizada, lo cual
significa que su administración se realiza a través de instituciones del estado autónomas,
municipales, particulares y fundaciones, que asumen ante el Estado la responsabilidad de brindar
educación y mantener un establecimiento educacional.
Reconocido en la Constitución Política del Estado, está constituido por cuatro niveles
educacionales: el nivel preescolar, el nivel básico, el nivel medio y el nivel de educación superior.
Es de real importancia el manejo y eficiencia del sistema tanto para la sociedad como para las
autoridades del país, con el objetivo de controlar y hacer un seguimiento a la evolución de este se
aplica periódicamente una prueba llamada SIMCE. (Azúa H, Bascuñán P., Caballero C., Castro Q.,
& Figueroa F, 2007)
1.2 Definición de SIMCE
El SIMCE es el Sistema Nacional de Evaluación de resultados de aprendizaje del Ministerio de
Educación de Chile. Su propósito principal es contribuir al mejoramiento de la calidad y equidad de
la educación, informando sobre el desempeño de los estudiantes en diferentes subsectores del
currículum nacional, y relacionándolos con el contexto escolar y social en el que ellos aprenden.
Las pruebas SIMCE evalúan el logro de los Objetivos Fundamentales y Contenidos Mínimos
Obligatorios (OF-CMO) del Marco Curricular vigente en diferentes subsectores de aprendizaje, a
través de una medición que se aplica a nivel nacional(una vez al año) a los estudiantes que cursan
un determinado nivel educacional.
Hasta el año 2005, la aplicación de las pruebas se alternó entre 4º y 8° básico y 2° medio. A partir
del año 2006, se evalúa a los 4 ° básicos y se alternan 8° básico y 2° medio.
Además de las pruebas asociadas al currículum, el SIMCE recoge información sobre docentes,
estudiantes y padres y apoderados, a través de cuestionarios de contexto. Esta información se utiliza
para contextualizar y analizar los resultados de los estudiantes en las pruebas SIMCE.
Las pruebas nacionales SIMCE evalúan lenguaje, matemática y ciencias (naturales y sociales).
LLECE (Laboratorio Latinoamericano de la Calidad de la Educación): Estudio
Internacional Comparativo sobre lenguaje, matemática y factores asociados. Evalúa
lenguaje y matemática en alumnos y alumnas de 3°, 4° y 6° básico de países
latinoamericanos. (Ministerio de Educación)
1.2.1 Comparación gráfica de puntajes SIMCE prueba de lenguaje y matemáticas año 2002 y 2008Se considera una muestra de promedios de puntajes SIMCE de los años 2002 y 2008 obtenidos en
las asignaturas de lenguaje y matemática a nivel nacional con el objetivo de analizar las diferencias
entre los puntajes en los distintos tipos de dependencias.
PONER GRAFICO
A simple vista las tablas parecen mostrar que ha habido un aumento general de los puntajes SIMCE
en los diversos subsectores en la cual esta prueba ha sido aplicada, sin embargo al analizarlos en
más profundidad podemos notar que en el caso de la prueba de lenguaje en las regiones de
Magallanes y la Antártica chilena y Antofagasta bajan sus rendimientos en menos de un 1% en los
establecimientos particulares pagados y en la Región Metropolitana la corporación privada baja,
aproximadamente, en un 7% su rendimiento. En el caso de la prueba de matemáticas se concluye de
los datos analizados, que en la región de Magallanes y la Antártica chilena todas las dependencias
bajan su puntaje en un 3% aproximado, mientras que en la Región Metropolitana, los
establecimientos que obtuvieron un mayor impacto, fue la corporación privada que disminuyó sus
puntajes en más de un 12%.En la región de Antofagasta, los puntajes, disminuyeron en un casi 4%
su rendimiento en todas las dependencias.
A continuación se mostrara la evolución grafica.
MOSTRAR GRAFICO
En general el pensamiento lógico sería creer que la variable dependencia, es la variable más directa
entre el tipo de colegio y el puntaje SIMCE, sin embargo los datos muestran que esta idea no se
cumple en todos los caso, es por ello que se ve necesario realizar un análisis más exhaustivo acerca
de cuáles son los factores y en que medidas afectan el puntaje SIMCE.
1.3 Planteamiento del ProblemaConocer los aspectos que determinan el puntaje SIMCE.
1.4 Justificación del ProblemaSe espera que la presente investigación sea de referencia para la identificación de las variables que
afectan tanto positiva como negativamente al sistema educacional chileno, a través del puntaje
obtenido en la prueba SIMCE y a la potenciación de estos por parte del ministerio de educación, en
pro de un sistema equitativo y más eficiente en la utilización de recursos.
1.5 Objetivos y preguntas de InvestigaciónObjetivo General.
Determinar los factores que afectan el puntaje SIMCE obtenido por los cuartos básicos de
Chile desde 1998 al 2010.
Objetivos específicos.
Conocer los resultados del puntaje SIMCE y su evolución por género (masculino/femenino)
de los alumnos.
Conocer los resultados del puntaje SIMCE y su evolución por región geográfica.
Conocer los resultados del puntaje SIMCE y su evolución por zona (urbana/rural).
Conocer los resultados del puntaje SIMCE y su evolución por dependencia.
Conocer los resultados del puntaje SIMCE y su evolución por estrato social.
Preguntas de Investigación.
¿Cómo afecta la variable socioeconómica en el puntaje SIMCE?
¿Cómo afecta la variable zona (urbana/rural) en el puntaje SIMCE?
¿Cómo afecta al puntaje SIMCE el tipo de dependencia en que se encuentran los alumnos?
¿Cómo afecta al puntaje SIMCE la inasistencia a la educación preescolar?
¿Cómo afecta al puntaje SIMCE la tasa de inasistencia a clases de los alumnos?
¿Cómo afecta la variable tasa profesor-alumnos en el puntaje SIMCE?
¿Cómo afecta al puntaje SIMCE la variable género (masculino/femenino) de los alumnos?
¿Cómo afecta la región geográfica al puntaje SIMCE?
II. ESTADO DEL ARTE.
Análisis de Papers Científicos
En Chile, existe una problemática latente respecto a la eficiencia del actual sistema educacional,
con relación a esto, (Donoso D., Aguirre G., Espinoza B., Manríquez G., & Silva C., 1999)
reconocen que “es complejo identificar el producto educacional, dado a que éste no sólo se
relaciona con el rendimiento de los alumnos en las escuelas, sino que también con su inserción en
el mundo laboral” (p. 24). Es por ello, que es fundamental alcanzar resultados deseables durante las
etapas escolares, pero como lo señala Levin (1991) “el éxito escolar depende en muchas
oportunidades de factores que se encuentran fuera de la escuela” (p. 24). Dentro de los factores
exógenos se pueden mencionar la educación de los padres, nutrición, condiciones de vivienda,
recursos materiales, acceso a prestaciones de salud, entre otros. Por otra parte, es posible identificar
que existen diversas variables que inciden en el logro de un estudiante al momento de rendir las
pruebas SIMCE, tales como la relación existente con sus familiares, pares, escuela y profesores.
Estas juegan un papel crucial interactuando entre sí y con las habilidades innatas o potencial de
aprendizaje del estudiante. Según Mizala en (Donoso D., Aguirre G., Espinoza B., Manríquez G., &
Silva C., 1999) “las variables explicativas se pueden clasificar en las relativas a: características de la
familia (ingreso familiar, nivel de educación y características de la estructura familiar, ausencia de
uno o más padres y tamaño de la familia), de los estudiantes (sexo, edad y raza), de la escuela
(infraestructura pública o privada, localización urbano o rural, tamaño de los cursos, matrícula de la
escuela, número de administrativos por alumno) y de los docentes (nivel formal de educación,
experiencia en la profesión, perfeccionamiento y salarios)” (p. 24). Con respecto a la familia, esta
ejerce una poderosa influencia en la educación de los hijos, siendo los padres los que cumplen un
rol fundamental en el proceso enseñanza-aprendizaje, ya que si se preocupan de la educación de sus
hijos y colaboran con los profesores, los niños presentan buen rendimiento y se adaptan fácilmente
a la escuela. Entre las variables familiares que influyen positivamente en el rendimiento escolar se
encuentran el nivel de educación de los padres y el nivel de ingreso familiar. En relación a la
escuela Summers y Wolf (Contreras & Macías, 2002) encuentran que “el efecto tamaño no es
significativo” (p. 399), sin embargo, los estudiantes que son asignados a clases con un menor
número de alumnos obtienen mejores puntajes en las pruebas SIMCE. Investigaciones realizadas en
Chile en base a si asistir a un tipo de establecimiento particular pagado, particular subvencionado o
municipalizado arroja diferencias significativas en cuanto a resultados. Rodríguez (1988), Aedo y
Larrañaga (1994) y Aedo (1997) concluyen que “los colegios particulares subvencionados obtienen
mejores resultados que los municipalizados” (p. 400) (Contreras & Macías, 2002).
Para Aedo y Larrañaga (1994) y Aedo (1997) considera que en Chile la variable socioeconómica es
una de las más importantes, sosteniendo que “factores como el índice de vulnerabilidad de la
escuela y las características de ingreso promedio de los alumnos están asociados fuertemente al
logro educacional” (p. 25). Idea fuertemente respaldada por los estudios pedagógicos de la
Universidad Austral de Chile, los que sostienen que la vulnerabilidad socioeconómica es una
variable que afecta significativamente el rendimiento de los alumnos en el SIMCE. En Chile, el
Programa de Escuelas Críticas lo comprueba, señalando que las escuelas que reciben intervención,
incrementan sustancialmente sus niveles de aprendizaje en las mediciones SIMCE. Como lo afirma
Fullan (Volante Beach, Cumsille Eltit, Denardin Gonçalves, & Müller Araya, 2008) ha descrito
factores de sustentabilidad que explican los cambios en las escuelas y ha determinado variables
como el mejoramiento del ambiente escolar, mejoramiento de procesos organizacionales y
monitoreo de procesos de cambios con el objetivo de dar seguimiento a lo anteriormente señalado.
Antiguamente la diferencia entre hombres y mujeres en los resultados de los test de inteligencia y
de logros educacionales era objeto de investigación. Las diferencias de género, en base a miles de
estudios realizados en los inicios de los años setenta, según Maccoby y jacklin (1974) señalan que
“los hombres lograban mejores resultados en los tests de habilidades cuantitativas(matemática y
física) desde los 13 años, mientras que las mujeres se desempeñaban mejor en lectura y
escritura”(p.23).Hoy en día los resultados de la prueba simce de acuerdo al género, no presenta
significancia, es decir, representan equidad.
La condición de Actividad Económica es uno de los principales temas investigados en los censos
nacionales y encuestas de hogares, que permiten clasificar a la población entre económicamente
activa y económicamente inactiva , según sea el tipo de actividad que realizan las personas, de
acuerdo a los resultados ,las mujeres , las personas jóvenes y residentes en zonas rurales fueron las
más afectadas en la captación de su condición de actividad , mientras que para los hombres, sobre
todo de zonas urbanas, se lograron mejores resultados”, lo que se ve reflejado en que los hombres
proporcionan mayor capacidad física.
2.2 Análisis de Variables que Afectan el Rendimiento de los Alumnos en el Puntaje SIMCE de 4° BásicoSe han seleccionado variables en función del grado de incidencia que tienen en el rendimiento
escolar en conjunto con la información proporcionada por el SIMCE. Siendo Y la variable
endógena y X las variables exógenas.
Variable endógena (Y):
Y: Resultado del SIMCE para los alumnos de 4° básico comprendido entre los años 1998 a
2010 a nivel nacional.
Variables exógenas (X):
Nivel socioeconómico (X1): Nivel de educación de los padres y disponibilidad de
alimentación escolar, debido a su gran incidencia en el rendimiento escolar. Estas se
asocian al grado de vulnerabilidad.
Infraestructura de la escuela (X2): Características medibles de los establecimientos
educacionales considerados a nivel nacional.
Eficiencia escolar (X3): Corresponde a la eficiencia interna de la unidad educativa para
llevar a cabo el proceso educacional. Se consideran tasa de promoción, de repitencia, de
retiro y tasa de éxito oportuno. Se elabora a partir de información entregada por el
establecimiento.
Dependencia del establecimiento (X4): Corresponde al tipo de establecimiento educacional
ya sea particular subvencionado, particular pagado, corporación municipal, corporación
privada y municipal.
Cobertura (X5): Se mide como la fracción de alumnos que pertenecen al sistema educativo
formal, con respecto a la población en edad escolar del área geográfica en análisis.
Desarrollo personal (X6): Identifica el grado de internalización de los alumnos. Se realiza
mediante un test diseñado para medir estos efectos.
Logro de objetivos académicos por los alumnos (X7): Permite identificar el nivel de logro
de los objetivos propuestos para las asignaturas básicas (castellano, matemáticas, ciencias
sociales y naturales). Se obtiene mediante pruebas que se aplican a los alumnos.
Aceptación de la labor educacional (X8): Se utiliza para establecer el grado de satisfacción
de los alumnos, padres y profesores con la educación impartida por el establecimiento.
Precisa la percepción de estos grupos respecto de lo que el establecimiento entrega en
materia de contenidos, trato personal, infraestructura y equipamiento. Se realiza mediante
una encuesta cerrada a cada grupo.
Tasa profesor-alumno (X9): Influye directamente en la forma de brindar conocimientos y
metodologías a los alumnos lo que se ve reflejado en su rendimiento escolar.
Total de alumnos matriculados (X10): Determina el tamaño del establecimiento e
infraestructura.
Días efectivos de clases (X11): Cantidad de días que se realizan actividades académicas al
interior del establecimiento educacional. En la práctica es declarada como constante debido
a que no existe la posibilidad de conocer su real comportamiento.
Escuelas de mujeres, hombres y mixtos (X12): Esta variable hace referencia al tipo de
alumnos que existen al interior de las dependencias. En la actualidad la tendencia se da al
aumento de colegios mixtos.
Existencia de educación preescolar (X13): Es importante considerarla debido a que en esta
etapa se desarrollan habilidades que son significativas en el rendimiento futuro de los niños.
Tasa de aprobación (X14): Existe una relación positiva entre la tasa de aprobación en la
enseñanza básica y el rendimiento del establecimiento.
Tasa de deserción (X15): Es un factor para determinar la menor demanda por el colegio.
Tasa de aceptación de la labor educativa por parte de los padres y/o
apoderados(X16): Refleja el nivel de satisfacción respecto del establecimiento.
Zona geográfica(X16): Se considera para conocer si existe alguna diferencia en el resultado
obtenido en el SIMCE, dependiendo de su ubicación.
Tasa de Denuncias de violencia intrafamiliar(X17): Corresponden a las denuncias hechas por
maltratos de índole físico o sicológico que acontecen en los hogares. La importancia de esta
variable radica en la influencia que puede tener esta en los menores a la hora de evaluar su
rendimiento escolar. [N° de Denuncias / Población de la comuna].
Tasa de establecimientos municipales (X18): Corresponde a la proporción que existe en una
comuna sobre el total de establecimiento (Colegios Privados, Colegios Pagados, Colegios
Subvencionados y Municipales) y los Municipales. Con el fin de observar si existe una
relación entre estas variables. [N° de establecimientos municipales / N° de establecimientos
en la comuna].
Porcentaje de Analfabetos (X19): Esta variable se obtiene al medir la capacidad de leer y
escribir a una edad determinada en una comuna. La importancia radica en que al tener altos
niveles de analfabetización y de educación en general, estos pueden impedir el desarrollo
económico de un país, especialmente en un mundo que cambia rápidamente impulsado por
la tecnología. Lo que trae como consecuencia una comuna con menos nivel educacional.
[N° de analfabetos / Población de la comuna]
Tasa de Deserción escolar(X20): Tal como indica el nombre, corresponde a la cantidad de
alumnos que abandonan el colegio, y cuyo motivo es diferente al cambio de
establecimiento, esto fue llevado a porcentaje, dividiendo por el total de alumnos de cada
comuna. [Porcentaje de deserción en la enseñanza básica]
Tasa de Asistencia(X21): Corresponde al promedio anual del total de asistencias de los
alumnos de una comuna dividido en el total de asistencia que se hubiese obtenido si nadie
hubiese faltado. [Porcentaje de asistencia a nivel comunal]
Tasa de Población Económico Activa(X22): Porcentaje de personas de 15 años de edad o
más, que proporcionan mano de obra para la producción de bienes y servicios. En cada
comuna analizada. [Porcentaje]
III. FUENTES DE INFORMACIÓN
Los datos obtenidos para la realización del presente informe han sido rescatados de la base de datos
SIMCE comprendida entre los años 1998 a 2010. Estos corresponden a fuentes secundarias de
información, recuperadas de la página Web del MINEDUC.
En primera instancia se realizó una investigación exploratoria, la cual consistió en recopilar
información acerca de las posibles variables que podrían explicar el rendimiento SIMCE de 4°
básico a nivel nacional. Posteriormente, se realizó una investigación descriptiva con el objetivo de
determinar cuáles de éstas son significativas para el modelo y las que no lo son desecharlas.
Dado que las variables obtenidas en la base de datos SIMCE son de carácter cuantitativas fue
preciso realizar un proceso de transformación de variables, el que consistió en transformarlas a
dicotómicas, con el fin de mejorar los resultados del modelo. Una vez que fueron obtenidas, el
modelo a utilizar es de tipo causal al que se le aplicará una función Semi-Logarítmicas y una Cobb-
Douglas.
IV. ANÁLISIS DE DATOS
4.1 VARIABLES DEPENDIENTES1. Logaritmo Natural del puntaje promedio del año 2010 de Lectura Ln(PPL): Variable
continua que muestra el logaritmo natural de la variable puntaje promedio del año 2010 del
establecimiento.
2. Logaritmo Natural del puntaje promedio del año 2010 en Educación Matemáticas
Ln(PPM): Variable continua que muestra el logaritmo natural de la variable puntaje
promedio del año 2010 del establecimiento.
4.2 VARIABLES INDEPENDIENTES
4.2.1 Descripción de las Variables Continuas 1. Alumnos con puntaje del año 2010 del establecimiento en Lectura (TEL): variable continua
que muestra a los alumnos con puntaje e el año 2010 en la región en Lectura
2. Alumnos con puntaje del año 2010 del establecimiento en Educación Matemática (TEM):
variable continua que muestra a los alumnos con puntaje e el año 2010 en la región en
Educación Matemática.
3. Logaritmo natural de Alumnos con puntaje del año 2010 del establecimiento en Lectura
(LNTEL)
4. Logaritmo natural de Alumnos con puntaje del año 2010 del establecimiento en Educación
Matemáticas (LNTEM)
4.2.2 Descripción de las Variables Dicotómicas1. ZN: Variable dicotómica que representa la Zona Norte (1=ZN; 0=Otra Zona)
Zona Norte compuesta por las siguientes regiones:
Valor Etiqueta
Nombre Región
NR1
NR2
NR3
NR4
NR5
NR6
Arica-Parinacota
Tarapacá
Antofagasta
Atacama
Coquimbo
Valparaíso
ZC: Variable dicotómica que representa la Zona Centro (1=ZC; 0=Otra Zona)
Zona Centro compuesta por las siguientes regiones:
Valor Etiqueta
Nombre Región
NR7
NR8
NR9
NR10
Arica-Parinacota
Tarapacá
Antofagasta
Biobío
ZS: Variable de criterio
Zona Sur compuesta por las siguientes regiones:
Valor Etiqueta
Nombre Región
NR11
NR12
NR13
NR14
NR15
Araucanía
De los Ríos
De los Lagos
De Aysén del General Carlos Ibáñez del
Campo
De Magallanes
2. DP: Variable dicotómica que representa la Dependencia del Establecimiento (1=DP; 0=Otro
Caso)
Dependencia del Establecimiento se compone de la siguiente forma:
Valor Etiqueta
Tipo de Dependencia
DP1,2
DP4,5
Corporación Municipal y Dirección de
Administración de Educación Municipal
Particular Pagado y Corporación Privada
DP3: Variable de criterio: Particular Subvencionado.
3. GS: variable dicotómica que representa el Grupo Socioeconómico (1=GS; 0=Otro Caso)
Grupo Socioeconómico se compone de la siguiente forma:
Valor Etiqueta
Tipo de Grupo Socioeconómico
GS1,2
GS4,5
A y B. Medio Bajo y Bajo
D y E. Medio Alto y Alto
(GS3): Variable de Criterio: C. Medio
V. MODELOS DE REGRESIÓN
5.1 MODELO SEMI-LOGARÍTMICO EN LA ASIGNATURA DE LECTURA. LN(PPL)= β0 + β1 TEL - β2 MUN + β3 PART - β4 GBAJO + β5 GALTO
La variable dependiente incluida en este modelo es el logaritmo natural del puntaje promedio del
año 2010 del establecimiento en Lectura; y como variables exógenas se incluyen las variables
dicotómicas, entre las que se encuentran Grupo Socioeconómico y Tipo de dependencia, además de
incorporar la variable continua correspondiente al número de alumnos con puntaje 2010 en el
establecimiento en Lectura. Al agrupar las regiones en tres zonas estas tienden a homogeneizar los
resultados, por lo que se eliminarán dentro de este análisis. (Ver anexo 1)
El siguiente paso consistió en realizar el modelo de regresión, el cual arrojó que todas las variables
se encuentran en región de rechazo, lo que indica que todas las variables son significativas para el
modelo. Con respecto a este modelo se obtuvo un R2 de 0,332; el que explica en un 33.2% de toda
la variabilidad de la variable puntaje promedio del año 2010 del establecimiento en Lectura, esto lo
hace ser representativo para nuestra investigación.
Con respecto a la prueba F global el modelo presenta un valor-p de 0,000 el que contrastado con un
nivel de significación del 5% indica que la hipótesis nula se rechaza, por ende, el modelo es
globalmente significativo y puede ser utilizado con fines predictivos RR:{valor-p < α} (Ver anexo
1).
En relación a la capacidad explicativa se analizará la siguiente tabla:
Hipótesis Valor-p DecisiónH0: β1=0, H1: β1≠1H0: β2=0, H1: β2≠1H0: β3=0, H1: β3≠1H0: β4=0, H1: β4≠1H0: β5=0, H1: β5≠1
0,0000,0080,0000,0000,000
Se rechaza H0
Se rechaza H0
Se rechaza H0
Se rechaza H0
Se rechaza H0
Por lo tanto todas las variables son significativas para el modelo y pueden ser utilizadas con fines explicativos.
5.2 MODELO SEMI-LOGARÍTMICO EN LA ASIGNATURA DE MATEMÁTICA.LN(PPM)= β0 + β1 TEM - β2 MUN + β3 PART - β4 GBAJO + β5 GALTO
La variable dependiente incluida en este modelo es el logaritmo natural del puntaje promedio del
año 2010 del establecimiento en la asignatura de Matemática; y como variables exógenas se
incluyen las variables dicotómicas, entre las que se encuentran Grupo Socioeconómico y Tipo de
dependencia, además de incorporar la variable continua correspondiente al número de alumnos con
puntaje 2010 en el establecimiento en la asignatura de Matemática. Al agrupar las regiones en tres
zonas estas tienden a homogeneizar los resultados, por lo que se eliminarán dentro de este análisis.
El siguiente paso consistió en realizar el modelo de regresión, el cual arrojó una variable en región
de aceptación, lo que explica que la diferencia entre la variable Dependencia Municipal (MUN) y
Dependencia Subvencionada (variable de criterio) no es significativa. Con respecto a este modelo se
obtuvo un R2 de 0,388; el que explica en un 38,8% de toda la variabilidad de la variable puntaje
promedio del año 2010 del establecimiento en la asignatura de Matemática.
Con respecto a la prueba F global el modelo presenta un valor-p de 0,000 el que contrastado con un
nivel de significación del 5% indica que la hipótesis nula se rechaza, por ende, el modelo es
globalmente significativo y puede ser utilizado con fines predictivos RR:{valor-p < α} (Ver anexo
2).
En relación a la capacidad explicativa se analizará la siguiente tabla:
Hipótesis Valor-p DecisiónH0: β1=0, H1: β1≠1H0: β2=0, H1: β2≠1H0: β3=0, H1: β3≠1H0: β4=0, H1: β4≠1H0: β5=0, H1: β5≠1
0,0000,8620,0000,0000,000
Se rechaza H0
No se rechaza H0
Se rechaza H0
Se rechaza H0
Se rechaza H0
La variable dicotómica MUN está en región de aceptación, por lo que esta no es significativamente distinta a la variable de criterio.
5.3 MODELO LOGARÍTMICO-LOGARÍTMICO DE LECTURA.
LN(PPL)= β0 + β1 LN(TEL) - β2 MUN + β3 PART - β4 GBAJO + β5 GALTO
La variable dependiente incluida en este modelo es el logaritmo natural del puntaje promedio del
año 2010 del establecimiento en Lectura; y como variables exógenas se incluyen las variables
dicotómicas, entre las que se encuentran Grupo Socioeconómico y Tipo de dependencia, además de
incorporar la variable logarítmica correspondiente al número de alumnos con puntaje 2010 en el
establecimiento en Lectura. Con respecto a la Zona, es importante señalar que al agrupar las
regiones en tres zonas estas tienden a homogeneizar los resultados, por lo que se eliminará del
análisis.
El siguiente paso consistió en realizar el modelo de regresión, el cual arrojó que todas las variables
se encuentran en región de rechazo, lo que indica que todas las variables son significativas para el
modelo. Con respecto a este modelo se obtuvo un R2 de 0,329; el que explica en un 32.9% de toda
la variabilidad de la variable puntaje promedio del año 2010 del establecimiento en Lectura, esto lo
hace ser representativo para nuestra investigación.
Con respecto a la prueba F global el modelo presenta un valor-p de 0,000 el que contrastado con un
nivel de significación del 5% indica que la hipótesis nula se rechaza, por ende, el modelo es
globalmente significativo y puede ser utilizado con fines predictivos RR:{valor-p < α} (Ver anexo
3).
En relación a la capacidad explicativa se analizará la siguiente tabla:
Hipótesis Valor-p DecisiónH0: β1=0, H1: β1≠1H0: β2=0, H1: β2≠1H0: β3=0, H1: β3≠1H0: β4=0, H1: β4≠1H0: β5=0, H1: β5≠1
0,0000,0100,0000,0000,000
Se rechaza H0
Se rechaza H0
Se rechaza H0
Se rechaza H0
Se rechaza H0
Por lo tanto todas las variables son significativas para el modelo y pueden ser utilizadas con fines
explicativos.
5.4 REGRESIÓN LOGARÍTMICO-LOGARÍTMICO MATEMÁTICALN(PPM)= β0 + β1 LN(TEM) - β2 MUN + β3 PART - β4 GBAJO + β5 GALTO
La variable dependiente incluida en este modelo es el logaritmo natural del puntaje promedio del
año 2010 del establecimiento en educación Matemática; y como variables exógenas se incluyen las
variables dicotómicas, entre las que se encuentran Grupo Socioeconómico y Tipo de dependencia,
además de incorporar la variable logarítmica correspondiente al número de alumnos con puntaje
2010 en el establecimiento en educación Matemática. Con respecto a la Zona, es importante señalar
que al agrupar las regiones en tres zonas estas tienden a homogeneizar los resultados, por lo que se
eliminará del análisis.
El siguiente paso consistió en realizar el modelo de regresión, el cual arrojó una variable en región
de aceptación, lo que explica que la diferencia entre la variable Dependencia Municipal (MUN) y
Dependencia Subvencionada (variable de criterio) no es significativa. Con respecto a este modelo se
obtuvo un R2 de 0,388; el que explica en un 38,8% de toda la variabilidad de la variable puntaje
promedio del año 2010 del establecimiento en la asignatura de Matemática.
Con respecto a la prueba F-Global el modelo presenta un valor-p de 0,000 el que contrastado con un
nivel de significación del 5% indica que la hipótesis nula se rechaza, por ende, el modelo es
globalmente significativo y puede ser utilizado con fines predictivos RR:{valor-p < α} (Ver anexo
4).
En relación a la capacidad explicativa se analizará la siguiente tabla:
Hipótesis Valor-p DecisiónH0: β1=0, H1: β1≠1H0: β2=0, H1: β2≠1H0: β3=0, H1: β3≠1H0: β4=0, H1: β4≠1H0: β5=0, H1: β5≠1
0,0000,8450,0000,0000,000
Se rechaza H0
No se rechaza H0
Se rechaza H0
Se rechaza H0
Se rechaza H0
La variable dicotómica MUN está en región de aceptación, por lo que esta no es significativamente distinta a la variable de criterio.
Dado que la función Cobb-Douglas es una función de producción, esta representa a cabalidad el
objetivo de mirar el sistema educacional chileno como un sistema productivo, donde la eficiencia
del producto es medido por diversos instrumentos formales, en este caso el SIMCE.
Considerando, además, la capacidad que tiene este tipo de función de otorgar distintas importancias
a cada parámetro (β) y con ello la importancia de cada variable.
LN(Y)= β0 + β1 LN(TE) – β2 MUN + β3 PART - β4 GBAJO + β5 GALTO
Donde:
TE: alumnos con puntaje del año 2010 del establecimiento en Lectura y Educación
Matemática, para cada caso.
MUN, PART, GBAJO y GALTO representan a las variables dicotómicas.
Análisis de los signos
LNTEL: el coeficiente dice en relación con su signo positivo, que mientras mayor sea el
número de alumnos de un establecimiento está asociado a un mayor rendimiento de las
pruebas SIMCE, dado que si un colegio tiene buen rendimiento en consecuencia tendrá
mayor demanda de alumnos, por lo que se asocia tamaño a rendimiento.
MUN: el coeficiente dice en relación con su signo negativo, que en comparación con la
variable de criterio Dependencia Subvencionado, éste presenta un menor rendimiento.
PART: el coeficiente dice en relación con su signo positivo, que en comparación con la
variable de criterio Dependencia Subvencionado, éste presenta un mayor rendimiento.
GBAJO: el coeficiente dice en relación con su signo negativo, que en comparación con la
variable de criterio Grupo Socioeconómico Medio, éste presenta un menor rendimiento.
GALTO: el coeficiente dice en relación con su signo negativo, que en comparación con la
variable de criterio Grupo Socioeconómico Medio, éste presenta un menor rendimiento.
1. Propuesta de modelos
1.1 MODELO LOGARÍTMICO - LOGARÍTMICO LECTURA.
Resumen del modelo
Modelo R R cuadrado
R cuadrado
corregida
Error típ. de la
estimación
1 ,574a ,329 ,329 ,07627
a. Variables predictoras: (Constante), LNTEL, PART, MUN, GALTO,
GBAJO
El modelo final de lectura explica un 32,9% de la variable dependiente, es decir, del logaritmo
natural del puntaje promedio en Lectura en el año 2010. Como variables exógenas se tomaron las
siguientes variables dicotómicas: grupo socioeconómico y tipo de dependencia, junto con una
variable continua logarítmica correspondiente al número de alumnos con puntaje 2010 en el
establecimiento en la asignatura de Lectura. La variable dicotómica Zona
Para determinar si el modelo es globalmente significativo se realizó la siguiente tabla:
ANOVAb
Modelo
Suma de
cuadrados gl
Media
cuadrática F Sig.
1 Regresión 16,327 5 3,265 561,320 ,000a
Residual 33,234 5713 ,006
Total 49,560 5718
a. Variables predictoras: (Constante), LNTEL, PART, MUN, GALTO, GBAJO
b. Variable dependiente: LNPPL
Hipótesis nula H0: βi = 0
Hipótesis alternativa H1: βi ≠ 0
El F-Global calculado se encuentra en región de rechazo. Además el p-value es menor que el nivel
de significancia del 5% (p-value = 0,000 < α = 0,05). Por lo tanto el modelo es globalmente
significativo, en consecuencia, el modelo puede ser utilizado con fines de pronóstico.
En relación a la capacidad explicativa, se realizaron pruebas t-student.
Coeficientesa
5,577 ,006 995,817 ,000
,006 ,001 ,049 4,103 ,000
-,007 ,003 -,035 -2,590 ,010
,038 ,005 ,102 7,921 ,000
-,050 ,003 -,268 -17,372 ,000
,065 ,003 ,277 18,713 ,000
(Constante)
LNTEL
MUN
PART
GBAJO
GALTO
Modelo1
B Error típ.
Coeficientes noestandarizados
Beta
Coeficientesestandarizad
os
t Sig.
Variable dependiente: LNPPLa.
Por lo tanto como todas las variables se encuentran en región de rechazo (p-value < α = 0,05) éstas
son significativas para el modelo y pueden ser utilizadas con fines explicativos.
1.2 MODELO LOGARÍTMICO – LOGARÍTMICO EN EDUCACIÓN MATEMÁTICA.
Resumen del modelo
Modelo R R cuadrado
R cuadrado
corregida
Error típ. de la
estimación
1 ,623a ,388 ,387 ,09565
a. Variables predictoras: (Constante), LNTEM PART, MUN, GALTO,
GBAJO
El modelo final de lectura explica un 38,8% de la variable dependiente, es decir, del logaritmo
natural del puntaje promedio en Educación Matemáticas en el año 2010. Como variables exógenas
se tomaron las siguientes variables dicotómicas: grupo socioeconómico, tipo de dependencia y
zona, junto con una variable continua logarítmica correspondiente al número de alumnos con
puntaje 2010 en el establecimiento en la asignatura de Matemáticas.
Para determinar si el modelo es globalmente significativo se realizó la siguiente tabla:
ANOVAb
Modelo
Suma de
cuadrados gl
Media
cuadrática F Sig.
1 Regresión 33,038 5 6,608 722,267 ,000a
Residual 52,173 5703 ,009
Total 85,211 5708
a. Variables predictoras: (Constante), PART, MUN, GALTO, GBAJO, LNTEM
b. Variable dependiente: LNPPM
Hipótesis nula H0: βi = 0
Hipótesis alternativa H1: βi ≠ 0
El F calculado se encuentra en región de rechazo. Además el p-value es menor que el nivel de
significancia del 5% (p-value = 0,000 < α = 0,05). Por lo tanto el modelo es globalmente
significativo, en consecuencia, el modelo puede ser utilizado con fines de pronóstico.
En relación a la capacidad explicativa, se realizaron pruebas t-student.
Coeficientesa
5,442 ,007 774,348 ,000
-,001 ,003 -,003 -,195 ,845
,068 ,006 ,140 11,298 ,000
-,062 ,004 -,254 -17,237 ,000
,092 ,004 ,298 21,035 ,000
,020 ,002 ,134 11,643 ,000
(Constante)
MUN
PART
GBAJO
GALTO
LNTEM
Modelo1
B Error típ.
Coeficientes noestandarizados
Beta
Coeficientesestandarizad
os
t Sig.
Variable dependiente: LNPPMa.
La variable dicotómica MUN está en región de aceptación, por lo que esta no es significativamente
distinta a la variable de criterio.
2. Diagnósticos de Multicolinealidad.
2.1 MODELO LOGARÍTMICO - LOGARÍTMICO LECTURA.
Para conocer si el modelo presenta problemas de Multicolinealidad es necesario realizar los
siguientes test: Índice de Tolerancia, donde los valores de las variables deben ser superiores a 0,1
(Tol<0,1), Factor de Inflación de la Varianza donde los valores de las variables deben ser inferiores
a 10 (FIV≥10) e Índice de Condición donde los valores de las variables deben ser inferiores a 30
(Ic> 30 Multicolinealidad grave; 10≤Ic≤30 Multicolinealidad moderada).
Diagnósticos de colinealidada
3,415 1,000 ,00 ,02 ,01 ,01 ,01 ,00
1,622 1,451 ,00 ,02 ,15 ,02 ,10 ,00
,502 2,609 ,00 ,05 ,72 ,03 ,14 ,01
,246 3,727 ,01 ,62 ,08 ,01 ,49 ,03
,196 4,173 ,00 ,29 ,03 ,67 ,24 ,02
,019 13,390 ,98 ,00 ,01 ,26 ,02 ,94
Dimensión1
2
3
4
5
6
Modelo1
AutovalorIndice decondición (Constante) MUN PART GBAJO GALTO LNTEL
Proporciones de la varianza
Variable dependiente: LNPPLa.
Por lo tanto, el modelo no presenta problemas de Multicolinealidad.
Coeficientesa
5,577 ,006 995,817 ,000
,006 ,001 ,049 4,103 ,000 ,807 1,239
-,007 ,003 -,035 -2,590 ,010 ,644 1,552
,038 ,005 ,102 7,921 ,000 ,705 1,419
-,050 ,003 -,268 -17,372 ,000 ,492 2,033
,065 ,003 ,277 18,713 ,000 ,535 1,868
(Constante)
LNTEL
MUN
PART
GBAJO
GALTO
Modelo1
B Error típ.
Coeficientes noestandarizados
Beta
Coeficientesestandarizad
os
t Sig. Tolerancia FIV
Estadísticos decolinealidad
Variable dependiente: LNPPLa.
2.2 MODELO LOGARÍTMICO – LOGARÍTMICO EN EDUCACIÓN MATEMÁTICA.
Para conocer si el modelo presenta problemas de Multicolinealidad es necesario realizar los
siguientes test: Índice de Tolerancia donde los valores de las variables deben ser superiores a 0,1
(Tol<0,1); Factor de Inflación de la Varianza donde los valores de las variables deben ser inferiores
a 10 (FIV≥10) e Índice de Condición donde los valores de las variables deben ser inferiores a 30
(Ic> 30 Multicolinealidad grave; 10≤Ic≤30 Multicolinealidad moderada).
Coeficientesa
5,442 ,007 774,348 ,000
,020 ,002 ,134 11,643 ,000 ,809 1,236
-,001 ,003 -,003 -,195 ,845 ,644 1,554
,068 ,006 ,140 11,298 ,000 ,704 1,420
-,062 ,004 -,254 -17,237 ,000 ,493 2,027
,092 ,004 ,298 21,035 ,000 ,535 1,869
(Constante)
LNTEM
MUN
PART
GBAJO
GALTO
Modelo1
B Error típ.
Coeficientes noestandarizados
Beta
Coeficientesestandarizad
os
t Sig. Tolerancia FIV
Estadísticos decolinealidad
Variable dependiente: LNPPMa.
Diagnósticos de colinealidada
3,416 1,000 ,00 ,00 ,02 ,01 ,01 ,01
1,622 1,451 ,00 ,00 ,02 ,15 ,02 ,10
,501 2,610 ,00 ,01 ,05 ,72 ,03 ,14
,246 3,730 ,01 ,03 ,61 ,08 ,01 ,49
,196 4,174 ,00 ,02 ,29 ,03 ,68 ,24
,019 13,391 ,98 ,94 ,00 ,01 ,26 ,02
Dimensión1
2
3
4
5
6
Modelo1
AutovalorIndice decondición (Constante) LNTEM MUN PART GBAJO GALTO
Proporciones de la varianza
Variable dependiente: LNPPMa.
Por lo tanto, el modelo no presenta problemas de Multicolinealidad.
3. Diagnósticos de Heterocedasticidad.
3.1 MODELO LOGARÍTMICO - LOGARÍTMICO LECTURA.
Correlaciones
1,000 -,208**
. ,000
7923 5719
-,208** 1,000
,000 .
5719 5719
Coeficiente decorrelación
Sig. (bilateral)
N
Coeficiente decorrelación
Sig. (bilateral)
N
Alumnos con puntajedel año 2010 delestablecimiento enLectura
Res_Lectura
Rho de Spearman
Alumnos conpuntaje del
año 2010 delestablecimiento en Lectura Res_Lectura
La correlación es significativa al nivel 0,01 (bilateral).**.
Al analizar el test de Spearman se logra identificar que el modelo de Lectura hasta el momento presenta problemas de Heterocedasticidad. Para que no existan problemas se busca aceptar la Hipótesis nula. En este caso p-value= 0.000 por lo tanto, la Hipótesis nula se rechaza y es necesario solucionar el problema a través del método de los mínimos cuadrados ponderados donde la función de ponderación se presenta a continuación:
1/Variable de Ponderación * Potencia
Donde:
Variable de ponderación: LNTEL. Variable logarítmica continua que expresa al Alumnos con puntaje del año 2010 del establecimiento en Lectura.
Potencia: El rango de las potencias comprende valores de -2 a 2 en el cual se ha seleccionado la potencia correspondiente a -1,5 para análisis porque maximiza la función de log-verosimilitud (Ver anexo 5).
Luego el modelo cumple con todos los supuestos básicos puesto que el R2 logra explicar en un 39,8% la variable dependiente, es decir, del logaritmo natural del puntaje promedio en Lectura en el año 2010. La F-Global se encuentra en región de rechazo (p-value=0,000), por lo tanto, el modelo puede ser utilizado con fines de pronóstico y finalmente, lo mismo sucede con las pruebas t, las que se encuentran en región de rechazo, de esta manera el modelo puede ser utilizado con fines explicativos (Ver anexo 6).
3.2 MODELO LOGARÍTMICO – LOGARÍTMICO EN EDUCACIÓN MATEMÁTICA.
Correlaciones
1,000 -,197**
. ,000
7914 5709
-,197** 1,000
,000 .
5709 5709
Coeficiente decorrelación
Sig. (bilateral)
N
Coeficiente decorrelación
Sig. (bilateral)
N
Alumnos con puntajedel año 2010 delestablecimiento enEducación Matemática
Res_Matemática
Rho de Spearman
Alumnos conpuntaje del
año 2010 delestablecimien
to enEducaciónMatemática
Res_Matemática
La correlación es significativa al nivel 0,01 (bilateral).**.
Al analizar el test de Spearman se logra identificar que el modelo de Matemática hasta el momento presenta problemas de Heterocedasticidad. Para que no existan problemas se busca aceptar la Hipótesis nula. En este caso p-value= 0.000 por lo tanto, la Hipótesis nula se rechaza y es necesario solucionar el problema a través del método de los mínimos cuadrados ponderados donde la función de ponderación se presenta a continuación:
1/Variable de Ponderación * Potencia
Donde:
Variable de ponderación: LNTEM. Variable logarítmica continua que expresa al Alumnos con puntaje del año 2010 del establecimiento en Matemática.
Potencia: El rango de las potencias comprende valores de -2 a 2 en el cual se ha seleccionado la potencia correspondiente a -1,5 para análisis porque maximiza la función de log-verosimilitud (Ver anexo 7).
Luego el modelo cumple con todos los supuestos básicos puesto que el R2 logra explicar en un 44,9% la variable dependiente, es decir, del logaritmo natural del puntaje promedio en Matemática en el año 2010. La F-Global se encuentra en región de rechazo (p-value=0,000), por lo tanto, el modelo puede ser utilizado con fines de pronóstico y finalmente, lo mismo sucede con las pruebas t, las que se encuentran en región de rechazo, de esta manera el modelo puede ser utilizado con fines explicativos (Ver anexo 8).
4. Discusión de los resultados.
En el modelo final de Lectura la variable número alumnos con puntaje 2010 en el establecimiento
en la asignatura de lectura, por la interpretación de su signo se obtiene que los alumnos con este
puntaje influyen en el puntaje promedio en la prueba SIMCE en dicha asignatura. Lo mismo ocurre
con el modelo final de Educación Matemáticas y su variable número alumnos con puntaje 2010 en
el establecimiento en la asignatura de Educación Matemáticas.
Con respecto al tipo de dependencia del establecimiento los establecimientos municipales según lo
avala su signo poseen menor puntaje promedio en la prueba SIMCE de Lectura y en Educación
Matemáticas en comparación con los alumnos de los establecimientos particulares, lo arrojado en
esta variable concuerda con estudios hechos por revistas y artículos científicos de gran credibilidad,
pero también es importante destacar que esta comparación no toma en cuenta todos los aspectos;
“La relación entre las condiciones socioeconómicas de la familia – con todos los efectos que esto
puede tener sobre las condiciones de aprendizaje – y la dependencia de la escuela implica que la
diferencia en el desempeño de las escuelas de distinto tipo no puede explicarse únicamente por
variables internas: las escuelas municipales son comparadas permanentemente con
establecimientos donde los estudiantes tienen un mayor apoyo de parte de los padres, menores
dificultades de aprendizaje, un desarrollo madurativo acorde con el curso en el que se encuentran,
los padres poseen un nivel educacional superior, etc.” (Castillo, González, & Puga, 2011).
Los alumnos de grupo socioeconómico bajo obtienen puntajes por debajo de los alumnos de grupo
socioeconómico alto en la dos asignaturas, esto se debe a que según la lógica los alumnos de grupo
bajo estudian en establecimientos municipales y viceversa, por eso están directamente relacionadas
entre sí y con la variable dependiente.
Cabe destacar que la variable zona no se incluye en este análisis ya que existen correlaciones
perdidas que tienden a homogenizar el análisis.
5. Conclusiones.
6. Limitaciones del Estudio.
Existen diversas limitaciones asociadas con el estudio, una de ellas es que éste estudio es de corte
transversal, es decir, en un instante determinado de tiempo, esto puede afectarlo ya que puede que
no sea representativo en su totalidad.
Lo anteriormente descrito implica que el modelo esta creado para un momento determinado del
tiempo, con una cierta cantidad de personas, que tienen ciertas características; es por esto que el
modelo no podría ser utilizado para otros años debido a que las variables determinantes de los
puntajes promedios en la prueba SIMCE varían en distintos momentos del tiempo.
top related