Top Banner
q.e.d. (quod erat demonstrandum) ¿Es cient´ ıfica la demostraci´ on estad´ ıstica? Jes´ us L´ opez Fidalgo [email protected] https://www.uclm.es/profesorado/jesuslopezfidalgo/ CRYF La demostraci´ on estad´ ıstica
58

q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Apr 07, 2017

Download

Science

Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

q.e.d. (quod erat demonstrandum)¿Es cientıfica la demostracion estadıstica?

Jesus Lopez [email protected]

https://www.uclm.es/profesorado/jesuslopezfidalgo/

CRYF La demostracion estadıstica

Page 2: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Esquema

I Mala prensa de la estadıstica.

I Estadıstica y sentido comun.

I La magia blanca de la estadıstica.

I Manipulacion en todos los niveles.

I Temas candentes:I Reproducibilidad.I Inferencia causal.I Etica de la estadıstica.I Paradigma bayesiano.I ¿Por que fallan las encuestas?I Casualidades de la vida.

CRYF La demostracion estadıstica

Page 3: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Mala prensa de la estadıstica

CRYF La demostracion estadıstica

Page 4: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Miedo a la estadıstica

I Al desastre de las ultimas predicciones de voto.

I Al uso que otros hagan de ella.

I A sus limitaciones.

I A sus nuevas dimensiones: capacidad de calculo, simulaciones,remuestreo, metodos bayesianos, Big Data (¡Mas datos en los 2ultimos anos que en toda la historia!).

CRYF La demostracion estadıstica

Page 5: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

La prensa “mala”

CRYF La demostracion estadıstica

Page 6: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

La prensa “mala”

I Encuestas telediario: 4 escogidos ¿“al azar”?

I Opiniones viajeros ocasionales:

I 7–15 dıas: Establecen teorıas generales irrefutables.I 1 mes: Establecen teorıas generales con muchas excepciones.I 1 ano: No se atreven a generalizar.

CRYF La demostracion estadıstica

Page 7: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Estadıstica y sentido comun

Una muestra estadıstica convenientemente torturada confiesa lo quequieras.

CRYF La demostracion estadıstica

Page 8: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

¿Existe el azar?

Henri Poincare (+1912): “El azar es la medida de nuestra ignorancia”.

Florence Nightingale (+1910): “Para entender los pensamientos de Dioshemos de estudiar estadıstica, porque esta es la medida desu proposito”.

Albert Einstein (+1955): “No existe el azar, Dios no juega a los dados”(atribuida, no verificada).

George Box (+2013): “Tengo la impresion de que cuanto mas trabajomas suerte tengo”.

Picaso: “La inspiracion me pilla siempre trabajando”.

Cualquiera: Un mismo plan puesto en practica dos veces, exactamenteen las mismas condiciones, conduce habitualmente aresultados similares, pero no identicos.

CRYF La demostracion estadıstica

Page 9: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

¿Que hace?

Inferir conclusiones de los datos (descubrir relaciones):I Genes relacionados con una enfermedad.I Influencia de una dieta en la prevencion de un cancer.I Si un carburante es mas contaminante que otro.I Modelo para identificar una imagen (camaras de vigilancia).I Decidir si un cirujano opera o no a un paciente.I Indices de valoracion: “Da miedo el uso de indicadores, pero temo

mas a los que no los quieren usar”.I Fichar al delantero que necesitamos.

I ...CRYF La demostracion estadıstica

Page 10: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

La magia blanca de laestadıstica

CRYF La demostracion estadıstica

Page 11: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Estadıstica moderna

I Union de dos disciplinas que evolucionaron independientemente:I Calculo de ProbabilidadesI Estadıstica como simple descripcion de datos

I Resultado: Inferencia, toma de decisiones

CRYF La demostracion estadıstica

Page 12: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Dado regular

Metodo deductivo

CRYF La demostracion estadıstica

Page 13: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Dado irregular

Metodo inductivo

CRYF La demostracion estadıstica

Page 14: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Demostracion

I Rapida y eficaz.

I No exacta,

I pero rigurosa y cientıfica (en cierto sentido sı es exacta).

La madre de Sergio sabe como hacerlo...

CRYF La demostracion estadıstica

Page 15: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Ha desaparecido la tableta de chocolate

I Primera hipotesis (“nula”): Cuando lo compro esta manana loguardo en otro sitio y no se acuerda donde.

I Segunda hipotesis (“alternativa”): Se la ha comido Sergio.

Recojamos informacion:

I busqueda en otros armarios, bolsas...

I Se convoca a Sergio...

CRYF La demostracion estadıstica

Page 16: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Sergio asegura que no sabe nada del tema

¡No puede sancianar a Sergio si no esta completamente segura!

CRYF La demostracion estadıstica

Page 17: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Sistematizacion del razonamiento ordinario

I Queremos comprobar si una moneda esta trucada o no.

I Obtenemos 63 caras en 100 lanzamientos.

I Si no esta trucada deberıan ser unas 50 (?).

I Su probabilidad es de menos de 3 entre 1.000 (¡muy sospechoso!).

I Problemas reales no son tan sencillos, pero tenemos herramientaspara calcular probabilidades.

CRYF La demostracion estadıstica

Page 18: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

El modelo estadıstico

I Modelo matematico que deja un espacio a la incertidumbre (erroraleatorio):

I Caja del “azar” o “error aleatorio” donde introducimos bienempaquetada nuestra ignorancia.

I Admitida nuestra ignorancia, esto es una idea genial.

I Cierto control de lo desconocido con las leyes del azar.

CRYF La demostracion estadıstica

Page 19: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Contraste de hipotesis

Culpable vs. Inocente (“mejor tratamiento” vs. “no mejor”).

CRYF La demostracion estadıstica

Page 20: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Contraste de hipotesis

El sistema asume inocencia hasta que se prueba la culpabilidad (rechazohipotesis nula, significatividad).

VerdadH0 H1

Inocente CulpableH0 Inocente Culpable

En libertad en libertad en libertadSentencia ERROR II

H1 Inocente CulpableCondenado condenado condenado

ERROR I

CRYF La demostracion estadıstica

Page 21: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

El p-valor

I No mide la magnitud de la asociacion entre dos variables (Ej. Pisa).

I No es la probabilidad de H0.

I No rechazar H0 no significa aceptar H0.

I Importancia del diseno y el muestreo para conseguir rechazar H0

cuando es falsa.

CRYF La demostracion estadıstica

Page 22: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Un teorema magico

CRYF La demostracion estadıstica

Page 23: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Teorema Central del Lımite (magico)

¿Y si la distribucion de los datos es desconocida?

“La distribucion de la media se aproxima a una campana de Gauss”

Para n ≥ 30 la aproximacion es buena (¿?).

CRYF La demostracion estadıstica

Page 24: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Un ejemplo: Casos atıpicos de leucemia

I Proporcion nacional: 0.0001 (1 de cada 10000).

I Proporcion de 0.0017 (17 veces mas) en un colegio (¿?).

H0: Es pura casualidad (azar).H1: Hay algo raro (causalidad).

I Colegio 1800 alumnos 3 casos de leucemia (rechazamos H0).

I Colegio 600 alumnos 1 caso de leucemia (no rechazamos).

CRYF La demostracion estadıstica

Page 25: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Manipulacion en todos los niveles

CRYF La demostracion estadıstica

Page 26: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Niveles en una posible manipulacion

Procedimiento estadıstico:

I Diseno experimental / muestreo:Planificacion incorrecta.

I Recogida y preparacion de los datos:E.g. modificar o suprimir datos (la estadıstica ayuda a descubrirlo).

I Analisis:Eleccion equivocada (e.g. tratamiento de la no respuesta).

I Interpretacion y toma de decisiones:E.g. Graficos, comunicacion de los resultados.

CRYF La demostracion estadıstica

Page 27: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Cultura general

Saber estadıstica protege contra la manipulacion

CRYF La demostracion estadıstica

Page 28: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Plan de recogida de datos

CRYF La demostracion estadıstica

Page 29: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Pensar antes de actuar

I Ronald Fisher: “Llamar a un estadıstico despues de que elexperimento ya esta hecho es llamarle para que realice un examenpost-mortem: solamente podra decir de que murio el experimento.”

I Sofocles: “Uno debe probar a hacer algo; aunque uno piense que yasabe lo que va a ocurrir, no lo sabe con certeza hasta que lo prueba.”

I “Si no sabes hacia donde vas, cualquier camino te lleva allı.”

CRYF La demostracion estadıstica

Page 30: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Tazas de te con leche de Fisher (aleatorizacion)

Miss Buriel Bristol rechazo una taza de te con leche a Ronald Fisher alreconocer que la leche habıa sido agregada al final.

I Para probar si realmente era capaz de reconocerlo preparo 8 tazas, 4con cada combinacion.

I Orden aleatorio, pero no solo desordenado.

I P(“acertar al azar”)= 128 = 0,0039

P(“fallar exactamente una al azar”)=0,03125

CRYF La demostracion estadıstica

Page 31: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Paradoja de Simpson

I Nuevo farmaco: Fraudol.

I Farmaco tradicional: Curamina.

I Experimentacion:

Mejora No mejora %Curamina 20 20 50 %Fraudol 24 16 60 %

CRYF La demostracion estadıstica

Page 32: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Desagregados

Hombres:Mejora No mejora %

Curamina 12 18 40 %Fraudol 3 7 30 %

Mujeres:Mejora No mejora %

Curamina 8 2 80 %Fraudol 21 9 70 %

CRYF La demostracion estadıstica

Page 33: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

¿Cuantas observaciones?

10 20 30 40 50n

0.2

0.4

0.6

0.8

1.0

1�β

Potencia de contraste(capacidad de demostrar la hipotesis interesante)

CRYF La demostracion estadıstica

Page 34: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Recogida de los datos

CRYF La demostracion estadıstica

Page 35: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Monitorizacion de la recogida

El ayuntamiento de Londres en encargo un estudio a laRSS sobre los excrementos de caballo en sus calles.

Ejemplo fermentacion del vino.

CRYF La demostracion estadıstica

Page 36: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Analisis (modelo)

CRYF La demostracion estadıstica

Page 37: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Modelos

George Box (+2013): “Todos los modelos son falsos, pero algunos sonutiles”. “¿como de erroneos pueden ser para que no dejende ser utiles?”

Giberson y Artigas (2012): “Los resultados interesantes en fısicamatematica casi siempre contienen asunciones ysimplificaciones. Por muy notable que pueda ser el ajusteentre el mundo natural y las matematicas, no hayvirtualmente casos en los que el ajuste sea tan perfectoque no se requieran asunciones simplificadoras.”

CRYF La demostracion estadıstica

Page 38: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Interpretacion

CRYF La demostracion estadıstica

Page 39: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Interpretacion

No es lo mismo:“El 90 % de los enfermos de cancer de pulmon han sido fumadores”que“El 90 % de los fumadores desarrolla cancer de pulmon”

Probabilidad (condicional) inversa.

CRYF La demostracion estadıstica

Page 40: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Interpretacion: Informe PISA 2012

I Informe oficial:I “Por consiguiente, si los intervalos de confianza de dos paıses tienen

interseccion comun, la diferencia entre sus resultados no esestadısticamente significativa.”

I Desviacion tıpica aparece solo para hablar de tipificacion (16 veces)en 243 pg.

I ¿Tamanos de muestra?I Espana (484), OCDE (494, s), UE (489, ns).I ns con Reino Unido (494), Noruega (489), Portugal (487), Italia

(485), Estados Unidos (481), Suecia (478)...I s con Corea del Sur (554), Suiza (531), Paıses Bajos (523)...

I Si se transforman a una escala de estatura: en lectura OCDE, 180cm, Espana 178,8.

I Contenidos de estadıstica en la prueba: 25 %.

CRYF La demostracion estadıstica

Page 41: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Interpretacion y uso de los graficos

CRYF La demostracion estadıstica

Page 42: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

El mismo, pero bien hecho

CRYF La demostracion estadıstica

Page 43: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Proporcion rigurosa

CRYF La demostracion estadıstica

Page 44: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Temas candentes

CRYF La demostracion estadıstica

Page 45: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Reproducibilidad

I Helicoptero:

CRYF La demostracion estadıstica

Page 46: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Replicas

CRYF La demostracion estadıstica

Page 47: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Medidas repetidas

...

CRYF La demostracion estadıstica

Page 48: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Inferencia causal

Covariacion no significa relacion causa/efecto.

CRYF La demostracion estadıstica

Page 49: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

El problema estadıstico de la causalidad

Relacion determinista: Si A causa B entonces B siempre se sigue de A(fumar no produce enfisema o cancer).

Causalidad probabilıstica: Si A causa probablemente B entonces lainformacion de que ha ocurrido A aumenta la verosimilitudde B.Pero es mas general que P(B|A) > P(B):

I Ejemplo: A=“Es fumador”, B=“Tiene otendra cancer”, C=“Tiene o tendra enfisema”,

P(B|A) > P(B),P(C |A) > P(C )yP(B|C ) > P(B).

I Estimar el correcto efecto causal de X en Y :Variables confusoras : Variables extranas que correlacionan con ambas.

Variable instrumental : Z afecta a Y solamente a traves de X .

CRYF La demostracion estadıstica

Page 50: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

La etica en la estadıstica

I Diseno experimental secuencial.

I Principio de solidaridad en companıas de seguros.

I Ordenar los datos:I Generamos 100 datos de 8 variables independientemente.I Estudio correlaciones 2 a 2.I La 3 y la 8 significativamente correlacionadas.

CRYF La demostracion estadıstica

Page 51: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Estadıstica Bayesiana (probabilidad subjetiva)

Un ejemplo asombroso: Aleatoriedad de las terminaciones del numeropremiado en la loterıa nacional en los ultimos 200 anos.

CRYF La demostracion estadıstica

Page 52: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

¿Ha habido trampa?

I La estadıstica frecuentista basada solo en los datos dice que sı.

I Poco probable que haya ocurrido por azar.

I Estadıstica Bayesiana es mas delicada:I Evalua el riesgo de la decision equivocada.I Utiliza una probabilidad subjetiva de que haya habido trampa.

CRYF La demostracion estadıstica

Page 53: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Solucion que minimiza el riesgo

0.95 1

En azul el riesgo de decidir erroneamente que NO hay trampa.En rojo el riesgo de decidir erroneamente que SI hay trampa.

CRYF La demostracion estadıstica

Page 54: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Fracasos en las encuestas de intencion de voto

I Resultados obtenidos bastantes dıas antes de las elecciones.

I La comunicacion de unos resultados influye en la intencion de voto.

I No respuesta: voto de castigo y voto util.

I Abstencion contabilizada como intencion de ir a votar.

I Comportamientos historicos invalidados por nuevos partidosemergentes o las nuevas tecnologıas.

I El mundo y la mafia de las apuestas.

I Dificultad de hacer predicciones cuando entra en juego la libertadhumana.

CRYF La demostracion estadıstica

Page 55: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Casualidades de la vida

I A finales de 2015 hubo una votacion de un conocido partido paraapoyar una candidatura.

I Resultado: 3030 votantes, 1515 votaron SI y 1515 NO.

I Bajo la hipotesis del 50 % la probabilidad de ese evento es 0.0145.

I Este resultado es el mas probable.

I Hay otros razonamientos/supuestos.

CRYF La demostracion estadıstica

Page 56: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

Casualidades de la vida

I Muchas cosas raras pueden ocurrir en un momento dado.

I La probabilidad de que ocurra alguna ya no es tan rara.

CRYF La demostracion estadıstica

Page 57: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

La estadıstica mas cerca de lo que pensamos

I Probabilidad de lluvia.

I Horquillas en las elecciones.

I En Google hay muchos estadısticos trabajando.

I Estadısticos sin fronteras.

¡Ah! Miss Buriel Bristol acerto con las 8 tazas.

CRYF La demostracion estadıstica

Page 58: q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?

GRACIAS

CRYF La demostracion estadıstica