FENOMENOS ALEATORIOS

MÉTODOS PARA GENERAR NÚMEROS PSEUDO-ALEATORIOS

1. GENERADORES CONGRUENCIALES LINEALES:

En 1951, D. H. Lehmer descubrió que residuos de potencias sucesivas de un número tienen buenas

propiedades aleatorias:

X n=an mod m

Una expresión equivalente para calcular xn después de calcular xn-1 es:

X n=a Xn−1 mod m

Los parámetros a y m son llamados multiplicador y modulo respectivamente. Muchos de los generadores

actuales son generalizaciones de la propuesta de Lehmer y tienen la siguiente forma:

X n=(a X n+1+b ) mod m

En donde los x son enteros entre 0 y m-1, y las constantes a y b son no-negativas. La selección de a, b, y

m afectan el periodo y la auto correlación en la secuencia. Entre los resultados de los estudios realizados

con estos generadores tenemos:

1. El modulo m debe ser grande. Dado que los x están entre 0 y m-1, el periodo nunca puede ser

mayor que m.

2. Para que el computo de mod m sea eficiente, m debe ser una potencia de 2, es decir, 2k. En este

caso mod m puede ser obtenido truncando el resultado y tomando en k bits a la derecha.

Ejemplo:

45 mod 16 = 45 mod 24 = 13

3. Si b es diferente de cero, el periodo máximo posible m se obtiene si y solo si:

a) Los enteros m y b son primos relativos -- no tengan factores comunes excepto el 1.

b) Todo número primo que sea un factor de m lo es también de a-1.

c) es un múltiplo de 4 si m es un múltiplo de 4.

Todas estas condiciones se cumplen si m = 2k, a = 4c + 1, y b es impar, donde c, b, y k son enteros

positivos. Si un generador tiene el periodo máximo posible se llama generador de periodo completo.

Todos los generadores de periodo completo no son igualmente buenos. Son preferibles los generadores

con menor autocorrelación entre números sucesivos. Por ejemplo, los dos generadores siguientes son de

periodo completo, pero el primero tiene una correlación de 0.25 entre xn-1 y xn, mientras que el segundo

tiene una correlación despreciable de menos de 2-18.

X n=((234+1 ) Xn−1+1) mod 235

X n=((218+1 ) X n−1+1)mod 235

Algoritmo congruencial lineal

El siguiente código nos permite generar los números pseudo-aleatorios, utilizando el algoritmo

congruencial lineal…, esta hecho en java y utiliza la herramienta de NetBeans.

import javax.swing.JOptionPane;

import javax.swing.*;

/*

* algoritmo.java

*/

public class algoritmo extends javax.swing.JFrame {

public algoritmo() {

initComponents();

}

// <editor-fold defaultstate=”collapsed” desc=”Generated Code”>

private void initComponents() {…}

private void jb_calcularActionPerformed(java.awt.event.ActionEvent evt) {

int a=0;

int m=0;

int x=0;

double X[]=new double 100;

double R[]=new double 100;

String presentar=” ”;

if ((jtf_Xo.getText()!=null) && (jtf_k.getText()!=null) && (jtf_g.getText()!=null)&&(jtf_c.getText()!

=null)){

int Xo=Integer.parseInt(jtf_Xo.getText().toString());

int k=Integer.parseInt(jtf_k.getText().toString());

int g=Integer.parseInt(jtf_g.getText().toString());

http://www.utpl.edu.ec/blog/simulacionsistemas/2008/04/15/algoritmo-congruencial-lineal/

int c=Integer.parseInt(jtf_c.getText().toString());

a=1+4*k;

m=(int) Math.pow(2, g);

X0=Xo;

for (int i= 1; i <= m; i++) {

Xi=((a*Xi-1)+c)%(m);

Ri=Xi/(m-1);

}

for (int i = 1; i <= m; i++) {

presentar+=Xi+”\t”+Ri+”\n”;

}

jta_presentar.setText(presentar);

//System.out.println(m);

//System.out.println(a);

}

else{

JOptionPane.showMessageDialog(null, “Es necesario que los valores de las variables estén

completos y sean enteros”);

}

}

public static void main(String args[]) {

java.awt.EventQueue.invokeLater(new Runnable() {

public void run() {

new algoritmo().setVisible(true);

}

});}

Ejemplo de Generadores Congruenciales Lineales

Los generadores congruenciales lineales son de la forma:

X n=(a X n+1+b ) mod m

En este ejemplo usaremos los siguientes valores para a, b y m para obtener números aleatorios entre 0 y 1.

a = 5

b = 3

m = 16

X n=(5 Xn+1+3 ) mod 16

Usamos esta ecuación con un X 0=7 como semilla y obtenemos los números mostrados en el siguiente

cuadro.

i X i U i

0 7 …

1 6 0.375

2 1 0.063

3 8 0.500

4 11 0.688

5 10 0.625

6 5 0.313

7 12 0.750

8 15 0.938

9 14 0.875

10 9 0.563

11 0 0.000

1.1 Generadores congruenciales lineales multiplicativos:

Los GCL presentados anteriormente son GCL mixtos. Si el incremento b es cero, no hay adición y el

generador es llamado GCL multiplicativo y tienen la forma:

X n=a Xn−1 mod m

Es obvio que estos son más eficientes que los mixtos. Eficiencia adicional puede ser obtenida tomando m

= 2k. Por lo tanto hay dos tipos de GCL multiplicativos dependiendo si m = 2k o no.

1.2 Generadores Congruenciales Lineales Mixtos:

Consideremos nuevamente el generador X n=75 Xn−1 mod(231−1). En la medida que las computadoras

se han vuelto más rápidas, la longitud de su ciclo se ha tornado inadecuada ya que se corre el riesgo de

que, en unas cuantas horas de simulación, la secuencia se agote y se repita varias veces trayendo como

consecuencia serias dudas en cuanto a la validez de los resultados.

Supongamos que tenemos una máquina con un procesador de 1GHz. Esto son 109 ciclos o tics del reloj

por segundo. Supongamos también que el procesador es capaz de generar un número aleatorio por ciclo

(esto es muy optimista ya que en realidad se requieren varios ciclos para producir un número aleatorio

debido a las operaciones involucradas). Bajo estas condiciones se agotaría la secuencia en

2.1 x 109

109 =2.1 seg. Por supuestos que será en más tiempo, pero se observa que efectivamente esta

secuencia es fácilmente agotable durante una simulación.

2. MÉTODO DE CUADRADOS MEDIOS

Este algoritmo no congruencial o de cuadrados medios fue propuesto en la década de los 40 del siglo XX

por Von Neumann y Metrópolis. Requiere un número entero detonador (llamado semilla) con D dígitos,

el cual es elevado al cuadrado para seleccionar del resultado los D dígitos del centro; el primer numero ri,

se determina simplemente anteponiendo el “0”, a esos dígitos. Para obtener el segundo r j, se sigue el

mismo procedimiento, solo que ahora se elevan al cuadrado los D dígitos del centro que se seleccionaron

para obtener el primer ri. Este método se repite hasta obtener n números r i. Los pasos para generar

números con el algoritmo de cuadrados medios son:

1. Seleccionar una semilla (X0)con D dígitos (D>3)

2. Sea X0=resultado de elevar X0 al cuadrado; sea X1=los D dígitos del centro.

3. Sea Yj = al resultado de elevar X, al cuadrado; sea Xi+1= los D dígitos del centro, y sea ri=0, D dígitos

del centro para toda i=1,2,3…n.

4. Repetir el paso 3 hasta obtener los n números rj deseados

Si no es posible obtener los D dígitos del centro del número Y, agregue ceros a la izquierda del número.

Ejemplo 1

Se desea generar una secuencia de números de 4 dígitos pseudo-aleatorios usando el método del medio

del cuadrado. Para ello, se elige como semilla el número x0 = 3187:

(3187)2= 10156969 x1 = 1569

(1569)2= 02461761 x2 = 4617

(4617)2= 21316689 x3 = 3166

(3166)2= 10023556 x4 = 0235

(0235)2= 00055225 x5 = 0552

(0552)2= 00304704 x6 = 3047

(3047)2= 09284209 x7 = 2842

Siguiendo con este proceso se irían obteniendo los números 0769, 5913, 9635, 8332, 4222, 8252,......

Las secuencias obtenidas mediante esta técnica presentan gran número de problemas como bajo periodo

(es decir, que suelen caer rápidamente en una rutina que se repite continuadamente) y el hecho de que si

en algún momento se produce el número cero, todos los números siguientes de la secuencia serán el cero.

Si bien este último problema se puede presentar en la mayoría de los generadores de secuencias pseudo-

aleatorias, la mayoría de las veces éstos se podrán diseñar de forma que se garantice que el número cero

no se van a producir. En este generador es imposible garantizar esto. el siguiente ejemplo muestra este

caso.

Ejemplo 2

Se desea generar una secuencia de números de dos dígitos pseudo-aleatorios empleando el método del

medio del cuadrado, partiendo de la semilla x0 = 44:

(44)2= 1936 x1 = 93

(93)2= 8649 x2 = 64

(64)2= 4096 x3 = 09

(09)2= 0081 x4 = 08

(08)2= 0064 x5 = 06

(06)2= 0036 x6 = 03

(03)2= 0009 x7 = 00

(00)2= 0000 x8 = 00

Algoritmo De Cuadrados Medios

try{

semilla=txtSemilla.getText();

num=Integer.parseInt(txtCuantos.getText());

txtNumeros.setText(null);

if (semilla.length()<4 || Integer.parseInt(semilla)<0 ){

JOptionPane.showMessageDialog(null, "Se necesita una semilla mínima de 4 dígitos...","Error",

JOptionPane.INFORMATION_MESSAGE);

}

else{

long inicial=0;

long cuadrado=0;

int largoCuadrado=0;

int largoSemilla=0;

int posicionCentro=0;

int diferenciaLargo=0;

int cuantos=0;

String valor;

String cadenaCuadrado=" ";

do{

inicial=Integer.parseInt(semilla);

System.out.println("Semiilla inicial : " + inicial);

cuadrado=inicial*inicial;

cadenaCuadrado=String.valueOf(cuadrado);

System.out.println("Semilla al cuadrado : " + cuadrado);

largoCuadrado=cadenaCuadrado.length();

largoSemilla=semilla.length();

System.out.println("Longitud de la semilla : " + largoSemilla);

System.out.println("Longitud del cuadrado : " + largoCuadrado);

diferenciaLargo=largoCuadrado-largoSemilla;

System.out.println("Diferencia de las longitudes : " + diferenciaLargo);

//agregamos ceros o dejamos igual dependiendo de si es par la diferencia

//entre las longitudes

if (diferenciaLargo%2==0){

posicionCentro=(largoCuadrado-largoSemilla)/2;

}

else{

//Aqui es donde agregamos ceros

char cero='0';

do{

System.out.println("Agregando ceros...............");

cadenaCuadrado=cero + cadenaCuadrado;

largoCuadrado=cadenaCuadrado.length();

largoSemilla=semilla.length();

System.out.println("\tCadena actual : " + cadenaCuadrado);

System.out.println("\tLongitud de la semilla : " + largoSemilla);

System.out.println("\tLongitud del cuadrado : " + largoCuadrado);

diferenciaLargo=largoCuadrado-largoSemilla;

System.out.println("Diferencia de las longitudes" + diferenciaLargo);

}

while (diferenciaLargo%2!=0);

}

posicionCentro=(largoCuadrado-largoSemilla)/2;

System.out.println("Cadena al cuadrado modificada : " + cadenaCuadrado);

System.out.println("Posicion central : " + posicionCentro);

valor=cadenaCuadrado.substring(posicionCentro, posicionCentro+largoSemilla);

System.out.println("Número obtenido: " + valor);

txtNumeros.setText(txtNumeros.getText() + "x"+ cuantos + "=" + semilla +

"...............x"+ cuantos + "=" + cadenaCuadrado +

"...............x" +cuantos + "="+ valor +

"...............r" + cuantos + "=" + "0." + valor + "\n");

semilla=String.valueOf(valor);

cuantos++;

}

while(cuantos<num);

}

}

catch(Exception ex){

JOptionPane.showMessageDialog(null, "Falta algun de los dato necesarios o los datos son

incorrectos\n o se ha"+"producido un error desconocido por favor verifique...","Error",

JOptionPane.INFORMATION_MESSAGE);

}

PRUEBAS DE ALEATORIDAD

1. PRUEBA DE SERIES

Esta prueba es usada para probar uniformidad en dos o más dimensiones. En dos dimensiones, se

divide el espacio entre 0 y 1 en K2 celdas de igual área. Si tenemos una muestra de tamaño n,

podemos construir n/2 pares no solapados (x1, x2 ), (x3 , x4 ), ..., y contar los puntos que caen en

cada celda. Idealmente se esperan n/2k2 puntos en cada celda. Se puede usar la chi-cuadrado para

encontrar la desviación entre lo observado y lo esperado. Los grados de libertad son K2-1. Es fácil ver como se puede extender la prueba a k-dimensiones.

Ejemplo:

Para el generador ejemplo, usando una muestra de tamaño 500, y dividiendo en 52 = 25 celdas que dan 250 pares no solapados, obtenemos:

y las siguientes frecuencias:

Con 250 pares esperamos 10 observaciones por celda. El valor de X 02es 23,2 y laX [0.10 ;24 ]

2 =¿ 33,2; por lo tanto aceptamos que los números son uniformes en dos dimensiones a un nivel de α=0.10. No se deben usar pares solapados. Si se usan pares solapados, el número de puntos por celda no es independiente y no se puede usar la prueba chi-cuadrado. La dependencia entre números sucesivos aparece como no-uniformidad en dimensiones más grandes. Por ejemplo, si números

sucesivos tienen correlación de primer orden negativa, es muy probable un valor alto xn sea

seguido de un valor bajo xn+1. Si graficamos los pares no solapados, los puntos tienden a

concentrarse derecha-y-abajo e izquierda-y-arriba y no se pasará la prueba.

2. PRUEBA PÓKER

Esta es una prueba de independencia basada en la frecuencia con que ciertos dígitos se repiten en una

serie de números. Su nombre se debe al popular juego de cartas Póker. Consideremos la siguiente serie de

números con una repetición inusual de dígitos:

0.255, 0.577, 0.331, 0.414, 0.828, 0.909, 0.033, 0.010

En cada caso aparecen uno de los tres dígitos repetido y las posibilidades para este caso son:

• Los tres dígitos distintos

• Los tres dígitos iguales

• Un par de dígitos iguales

y las probabilidades asociadas son:

Supongamos una secuencia de 1000 números aleatorios en donde se analizan los tres primeros dígitos y

se tiene que 680 tienen los 3 dígitos distintos, 289 contienen exactamente un par y 31 tienen todos

iguales. Los cálculos respectivos usando la prueba Chi-Cuadrado son:

Observamos que 47.66 > X 0.05; 22 = 5.99 y por lo tanto rechazamos la hipótesis de independencia de los

números.

Esta prueba se puede extender a más dígitos pero a su vez las posibilidades aumentan y los cálculos se

complican. Por ejemplo, para 5 dígitos, podríamos tener, todos iguales, todos distintos, exactamente un

par, exactamente un trio, un trio y un par, dos pares, etc.

Aplicación de Prueba de Póker

Para realizar esta prueba tomaremos 10 datos y sus 3 primeros dígitos, por lo tanto tenemos:

0.375, 0.063, 0.500, 0.688, 0.625, 0.313, 0.750, 0.938, 0.875, 0.563

Ahora las probabilidades esperadas son:

P (todos distintos) = P (segundo distinto del primero) P (tercero distinto del segundo) = (0.9) (0.8) = 0.72

P (todos iguales) = P (segundo igual al primero) P (tercero igual al segundo) = (0.1) (0.1) = 0.01

P (un par) = 1 – 0.72 – 0.01 = 0.27

P(todos distintos) = P(segundo distinto del primero)P(tercero distinto del segundo)

P(todos iguales) = P(segundo igual al primero)P(tercero igual al segundo)

P (un par) = 1 – P(todos distintos) – P(todos iguales)

Caso Frecuencias

Observadas (O¿¿ i)¿

Frecuencias Esperadas

(E¿¿ i)¿(Oi−E i)

2/ E1

Todos iguales 8 7.2 0.09

Todos distintos 0 0.1 0.10

Exactamente un par 2 2.7 0.18

10 10 0.37

Observamos que 0.37< X0.05 ;22 =5.99 y por lo tanto aceptamos la hipótesis de independencia de los

números.

3. PRUEBA DE LA CORRIDA

Una corrida se define como un conjunto de números que aparecen ordenados en forma

monotonicamente creciente o decreciente.

Por ejemplo: 03, 23, 57, 92, 99 contienen una sola corrida, mientras que 03, 99, 23, 92, 27

contiene (03,99), (223,92), (57)

Si se utiliza el signo + para identificar que el número que aparece a la derecha de otro es mayor,

o si es menor, se tiene que: 30, 23, 57, 92, 99, mientras que 03, 99, 23, 92, 57 ,…

Esta prueba se basa en el supuesto que el número de corridas es una variable aleatoria. Si una

secuencia tiene más de 20 números, el número de corridas que es una variable aleatoria

distribuida normalmente con media y varianza conocida.

La prueba se realiza de la siguiente manera:

Paso 1.- Se formula la hipótesis Ho: La secuencia de números es aleatoria.

Paso 2.- Se selecciona una muestra de tamaño n (n>20)

Paso 3.- Se definen con los signos +, - las posibles corridas.

Paso 4.- Se define la estadística r como el numero de corridas.

Paso 5.- si n>20 y Ho es verdadera, entonces r se aproxima a una distribución normal con media:

Paso 6.- Se acepta ho, a un nivel de riesgo , si donde z(*) esta tabulada en la distribución normal.

Ejemplo:

Se tiene la siguiente secuencia de números pseudoaleatorios: 10 37 08 99 12 66 31 85 63

73 32 04 68 02 99 74 10 77 32 42 76 64 19 09 80 34 45 02 05 03 13 74 09 70 36 76 82 64 74 64

34 24 23 28 64 36 35 68 90 35 si r = 35

De tablas: Z(0.68) = 0.7517 Por lo que para el nivel de significancia por ejemplo 10%

Se afirma la Hipótesis Ho: La secuencia de números es aleatoria.

4. PRUEBA DE KOLMOGOROW

La prueba de Kolmogorov-Smirnov para una muestra se considera un procedimiento de "bondad de ajuste", es decir, permite medir el grado de concordancia existente entre la distribución de un conjunto de datos y una distribución teórica específica. Su objetivo es señalar si los datos provienen de una población que tiene la distribución teórica especificada.

Mediante la prueba se compara la distribución acumulada de las frecuencias teóricas (ft) con la distribución acumulada de las frecuencias observadas (f obs), se encuentra el punto de divergencia máxima y se determina qué probabilidad existe de que una diferencia de esa magnitud se deba al azar.

En las tareas de investigación se pudo obtener un conjunto de observaciones, en las cuales se supone que tienen una distribución normal, binomial, de Poisson, etc. Para el caso, las frecuencias de las distribuciones teóricas deben contrastar con las frecuencias observadas, a fin de conocer cuál distribución se adecua mejor al modelo.

Pasos:

1. Calcular las frecuencias esperadas de la distribución teórica específica por considerar para determinado número de clases, en un arreglo de rangos de menor a mayor.

2. Arreglar estos valores teóricos en frecuencias acumuladas.

3. Arreglar acumulativamente las frecuencias observadas. 4. Aplicar la ecuación D = ft - f obs, donde D es la máxima discrepancia de ambas. 5. Comparar el valor estadístico D de Kolmogorov-Smirnov en la tabla de valores críticos

de D. 6. Decidir si se acepta o rechaza la hipótesis.

Ecuación: D = ft - fobs

En esta ecuación se aprecia que el procedimiento es muy simple y quizá lo que parezca más complicado corresponde al cálculo de la frecuencia esperada de cada tipo de distribución teórica. Por lo tanto, en la marcha de los ejercicios se presentará cada uno de ellos y la manera de aplicar la prueba estadística.

EJEMPLO:

En una investigación, consistente en medir la talla de 100 niños de 5 años de edad, se desea saber si las observaciones provienen de una población normal.

Elección de la prueba estadística.El modelo experimental tiene una muestra y es factible un arreglo en el carácter ordinal o en los rangos de las series de clases.

Planteamiento de la hipótesis.

Hipótesis alterna (Ha). Los valores observados de las frecuencias para cada clase son diferentes de las frecuencias teóricas de una distribución normal.

Hipótesis nula (Ho). Las diferencias entre los valores observados y los teóricos de la distribución normal se deben al azar.

Nivel de significación.Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza Ho.

Zona de rechazo.Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.

Tabla de 100 niños. Los valores X + son 99.2 ± 2.85.

Aplicación de la prueba estadística.Primero se elaboran los cálculos de los valores teóricos esperados para la distribución normal.

Inicialmente se determina el valor Z de los límites de cada clase en la serie, por ejemplo: en la primera clase se determinan el límite inferior y el superior (90 y 93), y en las subsecuentes sólo los límites superiores (97, 101, 105 y 109). Para cada valor de Z, se localiza el área bajo la curva norma tipificada. (Véase: tabla de áreas bajo la curva normal tipificada de 0 a 2).

Los cálculos de valores Z, son de la forma siguiente:

Y así sucesivamente.

Para cada valor Z, se localiza el área de la curva tipificada de la tabla de números aleatorios. A partir de estos valores, se obtiene la diferencia entre los límites de clases entre el superior y el inferior, por ejemplo: 0.4997 - 0.4793 = 0.020, 0.4793 - 0.2357 = 0.2436, 0.2357 - (-0.2794) = 0.5151, -0.2794 - (-0.4854) = 0.206 y -0.4854 - (-0.4994) = 0.014.

Estos resultados de diferencias se multiplican por el tamaño de la muestra (100 niños), luego se obtienen las frecuencias teóricas y después se arreglan en frecuencias acumuladas.

Cálculos de los valores teóricos.

Las frecuencias acumuladas teóricas y las observadas se arreglan en los rangos correspondientes, como se muestra en la siguiente tabla, y posteriormente se aplica la fórmula de Kolmogorov-Smirnov.

Cálculo estadístico D de Kolmogorov-Smirnov.

D = ft - fobs = - 0.036

La diferencia máxima D es igual a -0.049, valor que se compara con los valores críticos de D en la prueba muestral de Kolmogorov-Smirnov y se obtiene la probabilidad de la existencia de esa magnitud de acuerdo con la prueba de Kolmogorov-Smirnov. El valor N es 100 y el mayor número de N en la tabla es 35, por lo cual se aplica la fórmula al pie de la tabla:

Para la probabilidad de

Lo anterior quiere decir que para todo valor menor que el crítico para una probabilidad de 0.05, la probabilidad correspondiente es mayor que 0.05, y todo valor mayor que D al calculado tinen una probabilidad menor que 0.05, o sea, es inversamente proporcional al crítico determinado o localizado en la tabla.

Decisión.En virtud de lo anterior, el estadístico de Kolmogorov-Smirnov obtendo es menor que el crítico y su probabilidad mayor que 0.05, por lo tanto, se acepta Ho y se rechaza Ha.

Interpretación.Las frecuencias observadas y las teóricas calculadas no difieren significativamente. Por lo tanto, las observaciones tienen una distribución normal.

FENOMENOS ALEATORIOS

Documents