Introducci´on Resultados Te´ oricos Resultados para tama˜ no de muestra finito Referencias Aproximaci´ on computacionalmente eficiente para un test de independencia en modelos de regresi´ on no param´ etrica Gustavo Rivas Mart´ ınez 1 , Mar´ ıa Dolores Jim´ enez Gamero 2 1 Laboratorio de Sistemas de Potencia y Control. Universidad Nacional de Asunci´on-Paraguay 2 Dpto. de Estad´ ıstica e Investigaci´on Operativa. Universidad de Sevilla-Espa˜ na marzo-2019 Gustavo Rivas Mart´ ınez 1 , Mar´ ıa Dolores Jim´ enez Gamero 2
48
Embed
Aproximación computacionalmente eficiente para un test de ...
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
IntroduccionResultados Teoricos
Resultados para tamano de muestra finitoReferencias
Aproximacion computacionalmente eficiente paraun test de independencia en modelos de regresion
Resultados para tamano de muestra finitoReferencias
IntroduccionProblemaObjetivoMetodologıa
Modelo
Sean (X1,Y1), . . . (Xn,Yn) vectores aleatorios independientes eidenticamente distribuidos (iid) de (X ,Y ) que satisfacen elsiguiente modelo de regresion no parametrica,
Y = m(X ) + σ(X )ε, (1)
dondem(X ) = E (Y |X = x) es la funcion de regresion,σ2(X ) = Var(Y |X = x) es la varianza condicional,ε es el error aleatorio.
Resultados para tamano de muestra finitoReferencias
IntroduccionProblemaObjetivoMetodologıa
Hipotesis
Cuando la independencia entre X y ε no se cumple, los metodosestadısticos basados en este supuesto no son validos. Por esarazon, muchos autores han propuesto distintos tests para lasiguiente Hipotesis nula
H0 : X and ε son independientes⇔ FX ,ε = FXFε.
donde FX ,ε es la funcion de distribucion (fdd) conjunta de X y ε, yFX y Fε denotan la fdd de X y ε, respectivamente.
Resultados para tamano de muestra finitoReferencias
IntroduccionProblemaObjetivoMetodologıa
Trabajos anteriores
Einmahl and Van Keilegom (2008) han propuesto testsestadısticos del tipo Kolmogorov-Smirnov, Cramer-von Misesand Anderson-Darling
Neumeyer (2009) propuso un test estadıstico basado en unestimador tipo kernel para una distancia L2 entre la funcion dedistribucion condicional y la no condicional de X
Dhar et al. (2018) han propuesto una test basado en unamodificacion de la medida τ de asociacion de Kendall
Resultados para tamano de muestra finitoReferencias
IntroduccionProblemaObjetivoMetodologıa
Trabajos anteriores
La H0 es equivalente a
H0 : cX ,ε = cX cε.
donde cX ,ε es la funcion caracterıstica (FC) conjunta de X y ε, ycX y cε denotan las FCs marginal de X y ε, respectivamente.Hlavka et al. (2011) han propuesto el estadıstico Tn,W , queesta basado en una distancia L2 entre una estimacion de la FCconjunta (X , ε) y una estimacion de las FCs marginal de X y ε.
caracterıstica empırica (FCE) conjunta de (X , ε), cX (t) = c(t, 0),cε(s) = c(0, s) corresponde a las FCEs X y ε, respectivamente, yW (t, s) es una funcion de peso.
Resultados para tamano de muestra finitoReferencias
IntroduccionProblemaObjetivoMetodologıa
La distribucion nula de Tn,W es desconocida. Como una primeraaproximacion en el Teorema 1 de Hlavka et al. (2011) obtienen sudistribucion nula asintotica
Tn,WL−→∫ ∫
Z (t, s)2ω(t)ω(s)dtds,
donde {Z (t, s), (t, s) ∈ R2} es un proceso gaussiano centrado conestructura de covarianza U(X , ε; t, s) = {cos(sε)− Rε(s) + sεIε(s)−1
2s(ε2 − 1)I ′ε(s)}{cos(tX )− sin(tX )− RX (t) + IX (t)}donde Rε(s) y Iε(s) denotan la parte real e imaginaria la FC de ε,respectivamente, y RX (t) y IX (t) estan definidas analogamente.
Resultados para tamano de muestra finitoReferencias
IntroduccionProblemaObjetivoMetodologıa
Metodologıa
Desarrollar un bootstrap ponderado (BP) en el contexto delproblema abordado que sea consistentePara variables observables,
Los artıculos de Fan et al. (2017) y Jimenez-Gamero et al.(2018) proponen un BP para aproximar la distribucion nula detest estadısticos similares a Tn,W .
En nuestro caso, una de las variables de interes (ε) es noobservable. Esto hace que el tratamiento teorico del desarrollo delBP sea distinto al caso de variables observables.
Resultados para tamano de muestra finitoReferencias
CondicionesResultados previosResultados principales
Condiciones
(A.1∗) ε1, . . . , εn son variables aleatorias iid conE (εj/Xj) = 0, E (ε2
j /Xj) = 1, E (ε4j ) <∞ y funcion
caracterıstica cε(t), t ∈ R.
(A.1) ε1, . . . , εn son variables aleatorias iid con mediad ceroy varianza unitaria, E (ε4
j ) <∞ y funcioncaracterısticas cε(t), t ∈ R.
(A.2) X1, . . . ,Xn son variables aleatorias iid que tomanvalores en un compacto S , con densidad comunpositiva y contınuamente diferenciable fX y funcioncaracterıstica cX (t), t ∈ R.
(A.3) ε1, . . . , εn y X1, . . . ,Xn son independientes.
Resultados para tamano de muestra finitoReferencias
CondicionesResultados previosResultados principales
Condiciones
(A.1∗) ε1, . . . , εn son variables aleatorias iid conE (εj/Xj) = 0, E (ε2
j /Xj) = 1, E (ε4j ) <∞ y funcion
caracterıstica cε(t), t ∈ R.
(A.1) ε1, . . . , εn son variables aleatorias iid con mediad ceroy varianza unitaria, E (ε4
j ) <∞ y funcioncaracterısticas cε(t), t ∈ R.
(A.2) X1, . . . ,Xn son variables aleatorias iid que tomanvalores en un compacto S , con densidad comunpositiva y contınuamente diferenciable fX y funcioncaracterıstica cX (t), t ∈ R.
(A.3) ε1, . . . , εn y X1, . . . ,Xn son independientes.
Resultados para tamano de muestra finitoReferencias
CondicionesResultados previosResultados principales
Condiciones
(A.1∗) ε1, . . . , εn son variables aleatorias iid conE (εj/Xj) = 0, E (ε2
j /Xj) = 1, E (ε4j ) <∞ y funcion
caracterıstica cε(t), t ∈ R.
(A.1) ε1, . . . , εn son variables aleatorias iid con mediad ceroy varianza unitaria, E (ε4
j ) <∞ y funcioncaracterısticas cε(t), t ∈ R.
(A.2) X1, . . . ,Xn son variables aleatorias iid que tomanvalores en un compacto S , con densidad comunpositiva y contınuamente diferenciable fX y funcioncaracterıstica cX (t), t ∈ R.
(A.3) ε1, . . . , εn y X1, . . . ,Xn son independientes.
Resultados para tamano de muestra finitoReferencias
CondicionesResultados previosResultados principales
Condiciones
(A.1∗) ε1, . . . , εn son variables aleatorias iid conE (εj/Xj) = 0, E (ε2
j /Xj) = 1, E (ε4j ) <∞ y funcion
caracterıstica cε(t), t ∈ R.
(A.1) ε1, . . . , εn son variables aleatorias iid con mediad ceroy varianza unitaria, E (ε4
j ) <∞ y funcioncaracterısticas cε(t), t ∈ R.
(A.2) X1, . . . ,Xn son variables aleatorias iid que tomanvalores en un compacto S , con densidad comunpositiva y contınuamente diferenciable fX y funcioncaracterıstica cX (t), t ∈ R.
(A.3) ε1, . . . , εn y X1, . . . ,Xn son independientes.
Resultados para tamano de muestra finitoReferencias
CondicionesResultados previosResultados principales
Sean ξ1, . . . , ξn (multiplicadores) variables aleatorias iid con media0 y varianza 1, independientes de (X1,Y1), . . . , (Xn,Yn). La versionBP de Tn,W se define ası,
Resultados para tamano de muestra finitoReferencias
CondicionesResultados previosResultados principales
Z ∗1 (t, s) depende de ε1, . . . , εn (no observables), de Rε(t), Iε(t),RX (t) y IX (t), (desconocidos). Para solucionar este problema sereemplaza εj por εj , Rε(s) por Rε(s), Iε(s) por Iε(s), R ′ε(s) por
R ′ε(s), I ′ε(s) por I ′ε(s), RX (t) por RX (t), IX (t) por IX (t)
Resultados para tamano de muestra finitoReferencias
CondicionesResultados previosResultados principales
Corolario 2
Si H0 no es verdadera, las condiciones (A.1∗),(A.2) y (A.4)–(A.8)se cumplen y ω es tal que
κ =
∫ ∫{CX ,ε(t, s)− CX (t)Cε(s)}2ω(t)ω(s) > 0, (5)
entonces P(Ψ∗ = 1)→ 1.Observacion: Los resultados del Teorema 1 y los Corolarios (1 y2) siguen siendo validos si en vez de los multiplicadores en brutoξ1, ..., ξn, se utiliza los multiplicadores centrados ξ1 − ξ, ..., ξn − ξ.
Resultados para tamano de muestra finitoReferencias
Aplicacion datos reales (aeronautica)
La Agencia Espacial Canadiense en el marco de un desarrolloexperimental de materiales que disminuyan el sonido en cabina denaves espaciales cuenta con datos sobre el ruido del perfilaerodinamico. Proponen para el estudio la estimacion de unmodelo de regresion no parametrica teniendo en cuenta 1503datos. La variable dependiente (Y ) es la presion sonora (dB) y lafrecuencia motora (Hz) es la variable independiente (X ). Para quelas conclusiones del modelo estimado sean validas se necesitaconocer la distribucion del error dentro del modelo (se espera quesea ruido blanco). Pero antes es necesaria la aplicacion de un testde independencia entre la X y el error ε.
Resultados para tamano de muestra finitoReferencias
Referencias
Delhing, H., Mikosch, T. (1994) Random quadratic forms and thebootstrap for U-statistics. J. Multivariate Anal. 51, 392-413.
Huskova, M., Janssen, P. (1993) Consistency of the generalized bootstrapfor degenerate U-statistics. Test. 19, 92-112.
Huskova, M., Meintanis, S.G. (2009) Goodness-of-fit tests for parametricregression models based on empirical characteristics functions.Kibernetika. 45, 960-971.
Huskova, M., Meintanis, S.G. (2010) Test for the error distribution innonparametric possiby heteroscedatic regression models. Test. 19, 92-112.
Jimenez-Gamero, M.D., Kim, H-M. (2015) Fast goodness-of-fit test basedon the characteristic function. Comput. Statist. Data Anal. 89, 172-191.
Resultados para tamano de muestra finitoReferencias
Referencias
Jimenez-Gamero, M.D., Munoz-Garcıa, J., Pino-Mejıas, R. (2005)Testing goodness of fit for the distribution of errors in multivariate linearmodels. J. Multivariate Anal. 95, 301-322.
Kojadinovic, I., Yan, J., (2012) Goodness-of-fit testing based on aweighted bootstrap: A fast sample alternative to the parametricbootstrap. Can. J. Statist. 40, 480-500.
Pardo-Fernandez, J.C., Jimenez-Gamero, M.D., El Ghouch, A., (2015a) Anonparametric ANOVA-type test for regression curves based oncharacteristic functions. Scand. J. Stat. 42, 197-213.
Pardo-Fernandez, J.C., Jimenez-Gamero, M.D., El Ghouch, A., (2015b)Tests for the equality of conditional variance functions in nonparametricregression. Electron. J. Statist. 9, 1826-1851.