Covarianza y Transformaciones Bidimensionales Noboa Sebastián, Suquillo Alex Departamento de Eléctrica y Electrónica, Universidad de las Fuerzas Armadas – ESPE [email protected][email protected]Abstract- This document contains the generation, rendering and graphical representation of the CDF and PDF v. to. dimensional as well as obtaining the covariance and correlation coefficient based on real data, presenting the results in scatter diagrams and 3D graphics to the associated pdf and cdf. Besides obtaining some cases for certain pdf dimensional transformations given presents. Resumen-Este documento contiene la generación, representación y representación gráfica de las cdf y pdf de v. a. bidimensionales, así como la obtención de la covarianza y el coeficiente de correlación a partir de datos reales, presentando los resultados en diagramas de dispersan y las gráficas 3D para las pdf y cdf asociadas. Además se presenta la obtención de algunos casos transformaciones bidimensionales para ciertas pdf dadas. I. INTRODUCCIÓN En muchos casos es necesario asociar a cada resultado de un experimento aleatorio, dos o más características numéricas. Por ejemplo, de los remaches que salen de una línea de producción nos puede interesar el diámetro X y la longitud Y. Teniendo en cuenta la inevitable variabilidad en las dimensiones de los remaches debido a las numerosas causas presentes en el proceso de fabricación, los podemos representar asociándoles dos variables aleatorias X e Y que pueden pensarse como una variable aleatoria bidimensional: (X, Y). La covarianza es una medida del grado en que dos variables aleatorias se mueven en la misma dirección o en direcciones opuestas la una respecto a la otra. En otras palabras, si dos variables aleatorias generalmente se mueven en la misma dirección se dirá que tienen una covarianza positiva. Si tienden a moverse en direcciones opuestas, se dirá que tienen una covarianza negativa. La covarianza se mide como el valor que se espera de los productos de las desviaciones de dos variables aleatorias respecto a sus correspondientes medias. Una varianza es un caso especial de covarianza. Un coeficiente de correlación mide el grado en que dos variables tienden a cambiar al mismo tiempo. El coeficiente describe tanto la fuerza como la dirección de la relación. II. MARCO TEORICO A. Distribución conjunta de las v. a. discretas. Sean y es la función (, ) que expresa la probabilidad simultanea de que X tome el valor de e tome el valor de . (, ) = ( = , = ) B. Distribución conjunta de v.a continuas. Sean y v. a. continuas su cdf conjunta es la función de dos variables reales dadas por: (, ) = ( ≤ , ≤ ) Con sus funciones marginales dadas por: () = lim →∞ (, ) () = lim →∞ (, ) C. Densidad conjunta Una cdf conjunta posee una pdf conjunta, si existe una función (, ) de dos variables reales tal que: (, ) = ∫ ∫ (, ) ∞ −∞ Con sus densidades marginales: () = ∫ (, ) ∞ −∞ ; () = ∫ (, ) ∞ −∞ D. Covarianza La covarianza de dos v. a. e de define como: (, ) = [( − [])( − [])] (, ) = [] − [][]
En este documento se describe la variables aleatorias multidimensionales con la ayuda de MatLab
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Covarianza y Transformaciones Bidimensionales
Noboa Sebastián, Suquillo Alex
Departamento de Eléctrica y Electrónica, Universidad de las Fuerzas Armadas – ESPE
Como se puede observar si se aumentan mas números aleatorios la
dispersión se concentra, a diferencia de los ejemplos anteriores.
B. Transformaciones bidimensionales
Sean 𝑋 e 𝑌 v.a. independientes uniformes (0,1). Hallar la pdf
de 𝑍 = 𝑋 + 𝑌, 𝑍 = 𝑋 ∗ 𝑌 y 𝑍 = 𝑋/𝑌
Caso: 𝒁 = 𝑿 + 𝒀
En los ejemplos desarrollados en el curso se obtuvo la cdf y la pdf
que están dados por:
𝐹𝑍(𝑧) = ∬ 1𝑑𝑥𝑑𝑦𝑥+𝑦≤𝑧
=𝑧2
2 𝑆𝑖: 0 < 𝑧 < 1
y
𝐹𝑍(𝑧) = ∬ 1𝑑𝑥𝑑𝑦𝑥+𝑦≤𝑧
= 1 −(2 − 𝑧)2
2 𝑆𝑖: 1 < 𝑧 < 2
Entonces la nueva pdf asociada es:
𝑓𝑍(𝑧) = 𝑧 𝑆𝑖: 0 < 𝑧 < 1
y
𝑓𝑍(𝑧) = 2 − 𝑧 𝑆𝑖: 1 < 𝑧 < 2
𝑓𝑍(𝑧) = 0 𝑒𝑛 𝑜𝑡𝑟𝑜𝑠 𝑐𝑎𝑠𝑜𝑠
Para representar estos parámetros en MATLAB se realizó el
siguiente programa:
clc clear close all x=random('unif',0,1,[1,10000]); y=random('unif',0,1,[1,10000]); z=x+y; [h,t]=hist(z,50); aux=sum(h)*(t(2)-t(1)); bar(t,h/aux); pdf_z=pdfz(t); hold on plot(t,pdf_z,'r'); hold off
Mediante el comando “random” se generan las variables aleatorias
X e Y, se realiza la operación 𝑍 = 𝑋 + 𝑌, y se representa el resultado
en un histograma, siendo esta una representación de la pdf de las v. a.
generadas.
Para la pdf obtenida mediante los cálculos matemáticos para la
nueva variable 𝑧 ha sido necesario crear una función llamada “pdfz”,
descrita en el siguiente programa:
function y=pdfz(t); n=max(size(t)); y=zeros(1,n); for i=1:n if t(i)<0 y(i)=0; elseif t(i)>=0 && t(i)<1 y(i)=t(i); elseif t(i)>=1 && t(i)<2 y(i)=2-t(i);
else y(i)=0; end end
Esta pdf es ideal, las dos representaciones han sido superpuestas
para poder compararlas, como se puede observar en la siguiente figura:
Fig. Pdf caso Z = X+Y (1000 v.a.)
En color rojo se puede observar la pdf ideal determinada mediante
cálculos matemáticos, y los datos aleatorios están representados por el
histograma formando una pdf real que se aproxima a la ideal.
Fig. Pdf caso Z = X+Y (10000 v.a.)
Fig. Pdf caso Z = X+Y (100000 v.a.)
Como se puede observar en las figuras () y () si aumenta el número
de v. a. la pdf real se aproxima mucho más a la pdf ideal
Caso: 𝒁 = 𝑿 ∗ 𝒀
En este caso se obtuvo la siguientes pdf para la variable z:
𝑓𝑍(𝑧) = ∫1
𝑤𝑑𝑤
1
𝑧
= − ln(𝑧) 𝑆𝑖: 0 < 𝑧 < 1
Se utiliza el mismo programa que el caso anterior con algunas
diferencias:
clc clear close all x=random('unif',0,1,[1,100000]); y=random('unif',0,1,[1,100000]); z=x.*y; [h,t]=hist(z,50); aux=sum(h)*(t(2)-t(1)); bar(t,h/aux); pdf_z=pdfz(t); hold on plot(t,pdf_z,'r'); hold off xlabel('z') ylabel('f(z)')
Con el comando “random” se generan las variables aleatorias X e
Y, en este caso se realiza la operación 𝑍 = 𝑋 ∗ 𝑌, y se representa el
resultado en un histograma, siendo esta una representación de la pdf
cercana a la realidad.
Como se vio la pdf cambia por lo tanto la función “pdfz” de
MATLAB también debe ser modificada de la siguiente manera:
function y=pdfz(t); n=max(size(t)); y=zeros(1,n);
for i=1:n if t(i)<0 y(i)=0; elseif t(i)>=0 && t(i)<1 y(i)=-log(t(i)); else y(i)=0; end end
Superposición de pdf real y pdf ideal, para este caso representado
por −ln (𝑧)
Fig. Pdf caso 𝑍 = 𝑋 ∗ 𝑌 (1000 v.a.)
En color rojo se puede observar la pdf ideal determinada mediante
cálculos matemáticos, y los datos aleatorios están representados por el
histograma formando una pdf real que se aproxima a la ideal.
Fig. Pdf caso 𝑍 = 𝑋 ∗ 𝑌 (100000 v.a.)
Al igual que el caso anterior se puede observar que si se aumenta el
número de variables aleatorias se obtiene una mejor aproximación.
Caso: 𝒁 = 𝑿/𝒀
𝑍 = 𝑋/𝑌, 𝑊 = 𝑌, 𝑌 = 𝑊
⇒ 𝑋 = 𝑍𝑊
𝑓𝑋,𝑌(𝑥, 𝑦) = 𝑓𝑋(𝑥) ∙ 𝑓𝑌(𝑦)
𝑓𝑍,𝑊(𝑧, 𝑤) = |𝐽|𝑓𝑋,𝑌(𝑥, 𝑦)
𝑓𝑍,𝑊(𝑧, 𝑤) = |𝐽|𝑓𝑋,𝑌(𝑧𝑤, 𝑤)
𝑓𝑍,𝑊(𝑧, 𝑤) = |𝐽|𝑓𝑋(𝑧𝑤)𝑓𝑌(𝑤)
|𝐽| = |𝑤|
𝑓𝑍,𝑊(𝑧, 𝑤) = |𝑤|𝑓𝑋(𝑧𝑤)𝑓𝑌(𝑤)
𝑓𝑍(𝑧) = ∫ |𝑤|𝑓𝑋(𝑧𝑤)𝑓𝑌(𝑤)𝑑𝑤
∞
−∞
𝑓𝑍(𝑧) = ∫ 𝑤𝑑𝑤
1
𝑧
𝒇𝒁(𝒛) = 𝟏 −𝒛𝟐
𝟐
Sean 𝑋 e 𝑌 v.a. independientes para N(0,1). Hallar la pdf de
𝑍 = 𝑋 + 𝑌, 𝑍 = 𝑋 ∗ 𝑌 y 𝑍 = 𝑋/𝑌
Caso: 𝒁 = 𝑿 + 𝒀
𝑥 + 𝑦 ≤ 𝑧 ; 𝑦 = 𝑧 − 𝑥
Sean las pdf:
𝑓𝑋(𝑥) =1
√2𝜋exp (−
𝑥2
2) ; 𝑓𝑌(𝑦) =
1
√2𝜋exp (−
𝑦2
2)
𝑓𝑍(𝑧) = ∫ 𝑓𝑋𝑌(𝑥, 𝑧 − 𝑥)𝑑𝑥
∞
−∞
Independientes:
𝑓𝑍(𝑧) = ∫ 𝑓𝑋(𝑥)𝑓𝑌(𝑧 − 𝑥)𝑑𝑥
∞
−∞
𝑓𝑍(𝑧) = ∫1
√2𝜋exp (−
𝑥2
2) ∙
1
√2𝜋exp (−
(𝑧 − 𝑥)2
2) 𝑑𝑥
∞
−∞
Nueva pdf de Z:
𝒇𝒁(𝒛) =𝟏
√𝟐∙
𝟏
√𝟐𝝅𝐞𝐱𝐩 (−
𝒛𝟐
𝟒)
Una vez obtenida la pdf, se implementa el siguiente programa en
MatLab:
clc clear close all x=random('norm',0,1,[1,1000]); y=random('norm',0,1,[1,1000]); z=x+y; [h,t]=hist(z,50);
aux=sum(h)*(t(2)-t(1)); bar(t,h/aux); pdf_z=pdfz_norm(t); hold on plot(t,pdf_z,'r'); hold off xlabel('z') ylabel('f(z)')
Se genera v. a. para X e Y para una pdf N(0,1), y se sigue el mismo
procedimiento que en caso anterior.
También ha sido necesario crear una función “pdfz_norm” en la
cual se genera la nueva pdf a partir del análisis matemático:
function y=pdfz_norm(t) n=max(size(t)); y=zeros(1,n); for i=1:n y(i)=1/(2*sqrt(pi))*exp(-
t(i)^2/(2*sqrt(2)^2)); end
Los resultados gráficos son presentados a continuación:
Fig. Pdf caso: Z=X+Y (1000 v. a.)
Como se puede observar para una pdf dada por N(0,1) en X e Y, la
transformación Z=X+Y genera una función de distribución pdf que
presenta la misma forma que X e Y, se lo evidencia gráficamente y en
la forma de la función obtenida analíticamente.
En rojo se observa la pdf que se la puede considerar ideal puesto
que tiene una función matemática asociada, mientras que el
histograma representa la distribución de las variables aleatorias
generadas, para el caso de 1000 v. a. e
Fig. Pdf caso: Z=X+Y (100000 v. a.)
Es evidente que cuando se aumenta la cantidad de v. a., el
histograma se aproxima más a la pdf generada a partir de la función
matemática asociada.
Caso: 𝒁 = 𝑿/𝒀
𝑍 = 𝑋/𝑌, 𝑊 = 𝑌, 𝑌 = 𝑊
⇒ 𝑋 = 𝑍𝑊
𝑓𝑋,𝑌(𝑥, 𝑦) = 𝑓𝑋(𝑥) ∙ 𝑓𝑌(𝑦)
𝑓𝑍,𝑊(𝑧, 𝑤) = |𝐽|𝑓𝑋,𝑌(𝑥, 𝑦)
𝑓𝑍,𝑊(𝑧, 𝑤) = |𝐽|𝑓𝑋,𝑌(𝑧𝑤, 𝑤)
𝑓𝑍,𝑊(𝑧, 𝑤) = |𝐽|𝑓𝑋(𝑧𝑤)𝑓𝑌(𝑤)
|𝐽| = |𝑤|
𝑓𝑍,𝑊(𝑧, 𝑤) = |𝑤|𝑓𝑋(𝑧𝑤)𝑓𝑌(𝑤)
𝑓𝑍(𝑧) = ∫ |𝑤|𝑓𝑋(𝑧𝑤)𝑓𝑌(𝑤)𝑑𝑤
∞
−∞
𝑓𝑍(𝑧) = ∫ |𝑤|1
√2𝜋exp (−
(𝑧𝑤)2
2) ∙
1
√2𝜋exp (−
𝑤2
2) 𝑑𝑤
∞
−∞
𝒇𝒁(𝒛) =𝟏
𝝅(𝟏 + 𝒛𝟐) ; 𝑺𝒊 − ∞ < 𝒛 < ∞
Una vez obtenida la pdf, se implementa el siguiente programa en
MatLab:
clc clear close all x=random('norm',0,1,[1,1000]); y=random('norm',0,1,[1,1000]); z=x/y; [h,t]=hist(z,50); aux=sum(h)*(t(2)-t(1)); bar(t,h/aux); pdf_z=pdfz_norm(t);
hold on plot(t,pdf_z,'r'); hold off xlabel('z') ylabel('f(z)')
Se genera v. a. para X e Y para una pdf N(0,1), y se sigue el mismo
procedimiento que en caso anterior.
También ha sido necesario crear una función “pdfz_norm” en la
cual se genera la nueva pdf a partir del análisis matemático:
function y=pdfz_norm(t) n=max(size(t)); y=zeros(1,n); for i=1:n y(i)=1/(pi*(1+(t(i)).^2)); end
Los resultados gráficos son presentados a continuación:
Fig. Pdf caso: Z=X/Y (100 v. a.)
En rojo se observa la pdf que se la puede considerar ideal puesto
que tiene una función matemática que representa a la pdf, mientras
que el histograma representa la distribución de las variables aleatorias
generadas, para el caso de 100 v. a. e
Fig. Pdf caso: Z=X/Y (1000 v. a.)
Si se aumenta la cantidad de v. a., el histograma se aproxima más a
la pdf generada a partir de la función matemática asociada.
IV. CONCLUSIONES
Es importante el conocimiento y uso de v. a. multidimensionales
debido a que en la naturaleza se puede encontrar diversos fenómenos
que se pueden describir a partir de estas, como se vio en este trabajo la
v. a. estatura es dependiente de v. a. peso, de esta manera se llega a
distintos tipos de conclusiones a través de las funciones de
probabilidad conjuntas y marginales.
Matlab permite obtener los datos de covarianza y el coeficiente de
correlación a partir de datos aleatorios, lo que permite tener una noción
de la dependencia directa que tienen cierto tipo de datos como se vio
en el análisis de la base de datos, el grado de correlación y la covarianza
se lo visualiza numéricamente y a través de las gráficas de dispersión.
Las v. a. generan cdf y pdf conjuntas que se pueden representar
mediante graficas 3D, como se vio Matlab facilita la representación
3D, haciendo posible la correcta interpretación de las funciones de
distribución para el caso de v. a. bidimensionales.
Se pudo obtener las transformaciones bidimensionales para algunos
casos partiendo de números aleatorios sujetos a una pdf se generó una
nueva pdf para una transformación dada, y se comparó con las
funciones distribución (pdf) ideales obtenidas analíticamente, de tal
manera que cuando se aumenta la cantidad de números aleatorios la
distribución de estos tiende a aproximarse a la función de distribución
ideal.
REFERENCIAS
[1] Chapra, S , “Método numéricos para ingenieros”, 5ta edición,
Mc Graw Hill, Mexico, ISBN: 970-10-6114-4
[2] Schaum, Monson. H, Outline of Theory and Problems of Digital Signal
Processing, McGraw Hill, 2nd Ed., 2011.
[3] Diniz. P, Digital Signal Processing: System Analysis and Design,