Top Banner
Webinar: Machine Learning (ML) aplicado a la deserción estudiantil Universidad Autónoma de Occidente Facultad de Ciencias Básicas Departamento de Matemáticas y Estadística Johann A. Ospina
24

Johann A. Ospina

Mar 19, 2022

Download

Documents

dariahiddleston
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Johann A. Ospina

Webinar: Machine Learning (ML) aplicado a la deserción estudiantil

Universidad Autónoma de OccidenteFacultad de Ciencias Básicas

Departamento de Matemáticas y Estadística

Johann A. Ospina

Page 2: Johann A. Ospina

Contenido

1. Entendiendo el ML2. Aplicaciones del ML3. Programas para trabajar ML4. Tipos de algoritmos de ML5. Caso de estudio

Page 3: Johann A. Ospina

Entendiendo el ML

Page 4: Johann A. Ospina

• Las organizaciones buscan extraerconocimiento de las enormescantidades de datos que sealmacenan y procesan diariamente.

• El apasionante deseo de predecir elfuturo impulsa el trabajo de lasempresas analistas y científicos dedatos en campos que van desde elmercadeo hasta la atención médica[Nwanganga & Chapple, 2020].

Entendiendo el ML

Page 5: Johann A. Ospina

Entendiendo el ML

?¿Cómo una

máquina puede identificar si un

estudiante piensa cancelar?

MáquinaDatos

Page 6: Johann A. Ospina

Entendiendo el ML

MáquinaDatos

No cancela

Resultado

Page 7: Johann A. Ospina

Aplicaciones del ML

Page 8: Johann A. Ospina

Aplicaciones del ML

Seguridad

Detección de transacciones

bancarias ilícitasDetección de rostros Evitar correo no

deseado

Salud

Predicción de enfermedades

Efectividad de un medicamento

Análisis de secuencias genéticasMercadeo

Identificación de nichos de mercado

Predicción del tiempo de permanencia de un

cliente

Identificación de preferencias de

clientes

Redes sociales

Análisis de sentimientos Mercadeo digital

Reconocimiento de imágenes

Comportamiento del clima

Detección de cultivos ilícitos

Diagnóstico de una enfermedad

Page 9: Johann A. Ospina

Programas para trabajar ML

Page 10: Johann A. Ospina

Programas para trabajar ML

Page 11: Johann A. Ospina

Programas para trabajar ML

Python

Numpy

Seaborn

Scikit learn

pandas

Natural Language

Toolkit (NLTK)

TensorFlow

R

caret

MICE

dplyr tydiverse

gggplot2 plotly

randomForest

rpart

Matlab

Deep Learning Toolbox

Simulink

Statistics and

Machine Learning Toolbox

Java

MOA

MALLET

Mahout

JSAT

Java-ML

ELKI

Page 12: Johann A. Ospina

¿Por qué R?

Código abierto

Orientada a objetos

Constante desarrollo

Aplicativos web

Page 13: Johann A. Ospina

Etapas del Machine Learning

Paso 1

Gestión de datos

Paso 3

Algoritmo de entrenamiento

Paso 2

Procesamiento de datos

Paso 4

Algoritmo de prueba

Paso 5

Evaluación de resultados

Page 14: Johann A. Ospina

Tipos de algoritmos de Machine Learning

Page 15: Johann A. Ospina

Tipos de algoritmos de Machine Learning

Machine Learning

Supervisados No supervisados

Regresión:• Lineal• Polinomial

Árboles de decisión

Bosques aleatorios

Clasificación:• KNN• Regresión

logísitica• SVM

Agrupamiento:• SVD• ACP• K-Medias

Variables cuantitativas

Variables cualitativas

Page 16: Johann A. Ospina

Aplicación del Machine Learning a la deserción estudiantil

Page 17: Johann A. Ospina

Datos de estudio

Datos de rendimiento de 649 estudiantes de bachillerato. Las variablesincluyen calificaciones de los estudiantes, característicassociodemográficas y variables relacionadas con el desempeñoeducativo [Cortez & Silva, 2008].

Page 18: Johann A. Ospina

Diccionario de datos

Fuente: Cortez & Silva, 2008

Page 19: Johann A. Ospina

En esta parte del webinar se realizará la aplicación de Machine Learning usando R y Rstudio

Page 20: Johann A. Ospina

Observaciones• Antes de aplicar los métodos de ML es importante conocer los datos (tipos devariables, identificación de datos faltantes, datos atípicos, etc).

• Estudiar muy bien la teoría de estadística que hay detrás de las metodologias de MLque se vayan a implementar.

• En el caso de la regresión logística se debe tener cuidado cuando predomina uno de losvalores de la variable respuesta, puesto que los enlaces simétricos son inadecuados,por lo tanto, es importante considerar enlaces asimétricos (Chen et al, 1999).

Page 21: Johann A. Ospina

Referencias

Ramasubramanian, K.; Singh, A. Machine learning using R. New Delhi, India: Apress, 2017.

James, G., Witten, D., Hastie, T., & Tibshirani. An introduction to statistical learning R. NewYork: springer. 2013.

Nwanganga, F. & Chapple, M. Practical machine learning in R. Wiley, 2020.

Cortez, P & Silva, A. Using Data Mining to Predict Secondary School Student Performance. InA. Brito and J. Teixeira Eds., Proceedings of 5th Future Business Technology Conference(FUBUTEC 2008) pp. 5-12, Porto, Portugal, April, 2008, EUROSIS, ISBN 978-9077381-39-7.

Page 22: Johann A. Ospina

ReferenciasFellman, D. Predicting dropout rate in e-learning (2019). Enlacehttps://www.rpubs.com/dfellman/elearningdropout

Vilas-Boas, L. Crafting a Machine Learning Model to Predict Student Retention Using R(2020). Enlace: https://towardsdatascience.com/crafting-a-machine-learning-model-to-predict-student-retention-using-r-5eb009dcb1ec

CHEN, Ming-Hui; DEY, Dipak K.; SHAO, Qi-Man. A new skewed link model for dichotomous quantal response data. Journal of the American Statistical Association, 1999, vol. 94, no 448, p. 1172-1186.

Page 23: Johann A. Ospina

Próximos webinars del departamento de Matemáticas y Estadística• 12 de febrero (4 a 5 pm). Método de clasificación supervisada y su aplicación en datosde salud.Andrés F. Ochoa

• 12 de marzo (4 a 5 pm). Creación de dasboard para la generación de reportes dinámicosutilizando la librería shinydashboard de R.Johann A. Ospina

• 26 de febrero (4 a 5 pm). Estimación del riesgo de incumplimiento de las empresas deun Banco, con técnicas Machine Learning.Diego A. Castro

Page 24: Johann A. Ospina

GRACIAS