-
SIMULACIN UNIDAD 6 pg. 1
Unidad 6: planteo tctico y estratgico para simulacin. Validacin
e implantacin
Introduccin El anlisis de las salidas de simulacin es necesario
para conocer el comportamiento del sistema o para comparar
escenarios del sistema en estudio.
Las salidas de las simulaciones de sistemas discretos son
variables aleatorias por cuanto en la simulacin se generaron
variables con distribuciones de probabilidad dadas mediante
generadores de nmeros aleatorios. Un generador de variables
aleatorias producir salidas que difieren en sus valores porque se
usan nmeros aleatorios diferentes para obtenerlas.
Si en el sistema se mide una variable y, se obtendr el estimador
de esa variable mediante varias corridas de simulacin. La precisin
del estimador puede determinarse mediante el error estndar o el
intervalo de la confianza de y. Sea un sistema de inventario y su
costo por semana es la variable Y, con distribucin de probabilidad
desconocida. Si se corre una simulacin del sistema de inventario
para 1 semana se obtiene una observacin simple de una poblacin de
todas las posibles observaciones de Y. Si se quiere incrementar el
nmero de observaciones se podran correr n semanas para obtener Y1,
Y2, Y3, .Yn pero este conjunto no corresponde a una muestra
aleatoria porque no son estadsticamente independientes. Es decir
que el inventario del fin de una semana es el inicial de la semana
siguiente, y as el valor de Yi influye en el valor de Yi+1
producindose una dependencia y la secuencia de variables aleatorias
Y1, Y2, Y3, .Yn es auto correlacionada. En ese caso no se pueden
aplicar las inferencias de la estadstica clsica a las salidas de
simulacin y por lo tanto se debe modificar la experimentacin de la
simulacin. Las condiciones iniciales tambin pueden influir en las
salidas y es importante especificarlas en el tiempo cero. Esto es,
el valor inicial al comienzo de la simulacin. Del ejemplo del
inventario, la demanda en el da lunes al inicio de la semana puede
afectar el costo del inventario de esa semana. Este comportamiento
se tiene en cuenta en dos tipos de simulaciones segn el tiempo de
simulacin: en estado estacionario y en estado transiente. En el
primer caso, se toman las salidas de simulacin para tiempos de
corridas largos. En el estado transiente interesan las primeras
observaciones o el tiempo inicial hasta que alcance un estado
estable. Es el caso de clientes de un banco que ingresan cuando se
abren las puertas para solicitar atencin de empleados que recin
inician el trabajo (encienden las mquinas, preparan los papeles,
etc.). Luego de un perodo de tiempo el ingreso, egreso y atencin
alcanzan el estado estacionario, es decir, las salidas de simulacin
no difieren de un rango determinado. Por esta razn tambin hay que
considerar los puntos finales de simulacin y las variables de
respuesta obtenidas, para lo cual hay mtodos que intentan asegurar
la validez de los resultados y minimizar los errores a la hora de
la toma de decisiones.
Una vez que se plantea y se programa un modelo de simulacin para
representar el comportamiento de un sistema es necesario comprobar
que el programa realice lo correcto y que los resultados sean
comparables con datos del sistema real.
Entonces se debe verificar el programa atendiendo a las
sentencias o comandos que se escribieron en el lenguaje
seleccionado para la simulacin, de manera que realice lo
correcto.
Y luego de verificado el programa, se deben validar los
resultados con datos disponibles del sistema real o con elementos
del mismo que hagan confiables a la simulacin realizada.
Para estas dos etapas presentes en todo esquema de simulacin hay
mtodos que pueden aplicarse segn el caso y la disponibilidad de
informacin.
-
SIMULACIN UNIDAD 6 pg. 2
Datos de salida de simulacin: estimacin de medias, variancias y
correlaciones, intervalos de confianza y test de hiptesis para las
medias.
Una salida de simulacin es una estimacin de la performance o
desempeo de un sistema. El valor de este estimador cuantifica el
comportamiento del sistema. Por ejemplo el tiempo de permanencia en
un banco, desde el ingreso del cliente hasta su salida habiendo
sido atendido es el estimador del desempeo del sistema Banco. Las
salidas de simulacin son variables aleatorias porque se calculan a
partir de generacin de otras variables
aleatorias de las entradas del modelo de simulacin. Una salida
tiene un punto de estimacin ( ) y un intervalo cuya longitud es una
medida del error en la estimacin del punto.
El parmetro es una media comn, mientras que es una media
ponderada en el tiempo. Los datos de salida de la simulacin pueden
ser de tiempo discreto, bajo la forma de { Y1, Y2, Y3, .Yn}
para
estimar siendo n un ndice con valor discreto. Por ejemplo Yi
puede ser la demora de un cliente i o el costo total en la semana
i. Tambin pueden ser datos de tiempo continuo si los datos de
salida de simulacin tienen la forma {Y(t), 0tTE}
para estimar debido a que t es un valor continuo. Por ejemplo
Y(t) puede ser la longitud de cola en el tiempo t o el nmero de
rdenes atrasadas en un tiempo t. Estimacin de medias
El estimador puntual de , basado en los datos { Y1, Y2, Y3, .Yn}
est definido como
n
i
iYn 1
1
donde es la media muestral de una muestra de tamao n. En el
lenguaje de simulacin puede referirse como estadstico
observacional, de tiempo discreto.
Se dice que el estimador puntual es insesgado para si su valor
esperado es :
E( ) = Sin embargo, en general sucede que
E( )
Y el sesgo del estimador es E( ) - . Si bien es deseable
disponer de datos no sesgado no siempre es posible. El estimado
puntual de sobre los datos {Y(t), 0tTE}, donde TE es el tiempo de
la corrida de simulacin est definido como:
ET
E
dttYT
0
)(1
Y se llama promedio en el tiempo de Y(t) en el intervalo [0,TE].
Los lenguajes de simulacin lo refieren como estadstico de tiempo
continuo, de cambio discreto o de tiempo persistente. Es deseable
que sea un
estimador insesgado pero en general E( )
-
SIMULACIN UNIDAD 6 pg. 3
Generalmente y son considerados como medidas medios de
performance del sistema que est siendo simulado. Tambin pueden
aparecer otros estimadores particulares. Por ejemplo si se quiere
estimar la proporcin de das que se pierden ventas por falta de
stock, se puede plantear
omodotrode
idastockfaltasiYi
0
,1
Con n igual al nmero total de das estimado en la primera ecuacin
(6.1) la proporcin de das sin stock, o de prdidas de ventas, es un
estimador puntual de . Sea la proporcin de veces en que la longitud
de cola es mayor de 10 clientes. Si LQ(t) representa la longitud de
cola en el tiempo t, luego
omodotrode
tLsitY
Q
0
10)(,1)(
As es un estimador puntual de , la proporcin de veces en que la
longitud de cola es mayor que 10 en el tiempo de simulacin. Las
estimaciones de proporciones o probabilidades son casos especiales
de estimadores de medias. Otras medidas de performance o desempeo
son los percentiles o cuantiles. Los cuantiles describen el nivel
de performance que puede ser entregados con una dada probabilidad
p. por ejemplo supongamos que Y representa la demora en cola en
minutos que experimenta un cliente en un sistema de servicios.
Luego el p0,85
cuantil de Y es el valor tal que
Prob {Y } = 0,85
es el 100 % o 85 percentil de demora de un cliente. En
consecuencia el 85% de todos los clientes demorarn
minutos o menos. De otra forma un cliente tiene solo un 15 % de
probabilidad de experimentar una demora
mayor de minutos. Una mediad ampliamente usada es la mediana que
representa el 0,5 cuantil o 50 percentil. El problema de estimar un
cuantil es lo inverso del problema de estimar una proporcin o
probabilidad. Para
estimar una proporcin est dado y la probabilidad p debe ser
estimada. Sin embargo, para estimar un
cuantil, p est dado y hay que estimar . El mtodo ms intuitivo
para estimar un cuantil es formar un histograma de los datos
observados de Y, y luego
encontrar un valor tal que el 100 % del histograma est a la
izquierda o sea menor que . Por ejemplo si se observan n=250
demoras de clientes luego un 85 percentil estimado se puede
calcular como 0,85 x 250 213
de los valores observados que son menores o iguales a . En el
caso de datos continuos, el histograma brinda la fraccin de tiempo
en que el proceso permanece en un cada nivel posible por ejemplo,
posibles valores de longitudes de cola. El proceso es igual al de
datos discretos. Estimacin del intervalo de confianza Un intervalo
de confianza mide el error de una media. Sea la varianza de la
muestra con R repeticiones.
n
i
i YYn
S1
22 )(1
1
El intervalo de confianza usual asume que Yi est distribuida con
una normal. Y el intervalo de confianza es:
n
StY n 1,2/
-
SIMULACIN UNIDAD 6 pg. 4
Donde t/2, n-1 es el cuantil de la distribucin t con n-1 grados
de libertad que corta /2 del rea de cada cola de la
distribucin.
El intervalo de confianza da los extremos o lmites donde puede
estar Y . Mientras ms repeticiones se hagan
ms pequeo es el intervalo de confianza y menos error tendr Y
.
Sea un ciclo de tiempo promedio en un da particular. Un buen
estimador es Y pero no es precisamente exacto. Incluso , que es el
centro de la distribucin no es probable que sea el real ciclo de
tiempo de un da en particular, porque diariamente estos ciclos de
tiempo varan. Un intervalo de prediccin est diseado por otra parte
para contener el ciclo de tiempo de cualquier da en
nStY n
111,2/
La longitud del intervalo no tiene a cero si n aumenta (no
disminuye), y en el lmite se transforma en
z/2 De esta forma, aunque se hagan muchas simulaciones, el ciclo
de tiempo vara. As un intervalo de prediccin como el que se explica
es una medida del riesgo, mientras que un intervalo de confianza es
una medida del error. Se puede simular lejos del error con ms y ms
corridas o repeticiones pero nunca se puede simular lejos del
riesgo, que es una parte inherente del sistema. Sin embargo podemos
hacer un mejor trabajo para evaluar riesgos con ms
repeticiones.
Ejemplo: suponer que el promedio general del ciclo de tiempo
promedio sobre 120 repeticiones de una simulacin de manufactura es
5,8 horas, con una desviacin estndar muestral de 1,6 horas. Como
t0,025, 119 es 1,98 un intervalo de confianza del 95 % para un
ciclo de tiempo promedio diario esperado para una corrida
larga es 5,8 1,98 (1,6 120 ) o 5,8 0,29 hs. De esta forma la
mejor estimacin de un promedio de corrida larga para ciclo de
tiempo diario promedio es 5,8 horas pero podra se en mas y en menos
0,29 hs de error en este estimado.
Para un da particular y teniendo en cuenta el intervalo de
prediccin es 5,8 1,98 (1,6 120/11 ) es 5,8 3,18 hs. Este ltimo
valor refleja la variabilidad inherente en el ciclo de tiempo
promedio diario y el hecho que se quiere un 95 % de confianza de
cubrir el ciclo de tiempo promedio real en un da particular antes
que considerar simplemente un promedio por corrida larga. Hay que
tener la precaucin que el valor est estimado para un promedio
diario, no para productos individuales.
-
SIMULACIN UNIDAD 6 pg. 5
Principios de modelos de simulacin vlidos.
El objetivo de la creacin de modelos es que estos sean vlidos y
crebles para poder utilizarlos.
Para la simulacin es importante la verificacin del modelo que
permite determinar que el programa realiza lo que se propuso. Si no
fuera as se realiza la correccin de los errores.
La verificacin chequea el traslado del modelo de simulacin
conceptual (diagrama de flujo e hiptesis) en un programa que
ejecute correctamente lo pactado. El concepto es simple pero el
trabajo es tedioso.
La validacin es la determinacin si el modelo de simulacin
conceptual representa exactamente al sistema en estudio
Si un modelo est validado, las decisiones hechas con el modelo
son similares a las de la experiencia fsica. Es necesario tener
credibilidad en el modelo ya que el programa se usa con confianza
en la toma de decisiones. Ambas validacin y verificacin se pueden
realizar en las distintas etapas del desarrollo de un modelo de
simulacin: Validacin Verificacin Validacin Credibilidad Sistema
Modelo
Conceptual Programa de
Simulacin Resultados
"correctos" disponibles
Resultados implementados
anlisis y datos programa corrida resultados vendidos al
gerente
Figura 6. 1: aplicacin de la validacin y verificacin en las
etapas de la simulacin.
La validacin implica el contraste de los datos reales con el
anlisis de las salidas de simulacin. Busca la estimacin de las
verdaderas medidas o respuestas. Se pretende aproximar el modelo lo
que ms se pueda al sistema real representado. El problema es
estadstico y depende de la longitud de la corrida (tiempo o nmero
de entidades simuladas) y del nmero de repeticiones de cada corrida
de simulacin. Cabe recordar que son necesarias como mnimo dos
corridas de simulacin para obtener salidas de simulacin
promediadas, considerando la caracterstica aleatoria de los
sistemas discretos. La bondad del modelo debe aproximar su
comparacin con el mundo real. Esto en general implica dos
etapas:
1. Que las hiptesis asumidas sean razonables (validacin). 2. Que
las hiptesis estn correctamente implementadas en el modelo
(verificacin).
Hay distintas categoras de modelos:
vlidos y no verificados
invlidos y no verificados (las hiptesis estn lejos de la
realidad)
invlidos y verificados
vlidos y verificados
-
SIMULACIN UNIDAD 6 pg. 6
Verificacin de programas de simulacin.
Hay distintas tcnicas para la verificacin de modelos de
simulacin: Diseo modular top-down (completo) La modularidad es el
modelado expresado en mdulos, que son subrutinas, subprogramas y
procedimientos individuales comunicados por interfaces que son el
nmero de entradas o salidas o estructura de datos.
Interface + mdulo desarrollo y mantenimiento independientes. Son
pequeos problemas a resolver.
TOP-DOWN diseo jerrquico llevar el sistema a pequeos problemas.
Los mdulos con distintas funciones se subdividen en otros mdulos ms
pequeos hasta un punto en que sean simples de manejar. Ejemplo:
sena mdulos de un simulador de red para estudiar congestin de
trfico, con un nmero de nodos fuentes, un nmero de nodos
intermedios y nodos destinos.
Destino Dm
Nodos intermedios
Nodo Fuente S1
R1 R2 Rm
Nodo Fuente Si Destino Di
Nodo Fuente Sn
Destino D1
Figura 6. 2: estructura de un sistema de red
Los tamaos de paquetes y tiempos de servicio de varios nodos
estn distribuidos aleatoriamente. Por ejemplo 2 LAN conectadas con
m nodos intermedios.
.....
10 MB
56 M B
10 MB
R 1
S m S 1
R m
..... D m D 1
Figura 6. 3: representacin de mdulos de un sistema de red.
Se puede subdividir cada nodo como una subrutina, de manera de
poder hacer mejor la verificacin . Luego es ms fcil detectar los
errores. Correccin de errores (Debugging)
Hay varias formas de hacer la correccin de errores
(debbuging):
1. Realizar la construccin del programa con modelos. 2. Comparar
las formas de pensar el modelo con distintas personas. 3. Correr
varios valores de parmetros y chequear salidas razonables. 4.
Correr por trazas: la traza es el estado del sistema en un tiempo
dado de simulacin. Cada vez que
ocurre un evento se imprime una lista para poder seguirla "a
mano".
-
SIMULACIN UNIDAD 6 pg. 7
5. Disponer de un modelo simplificado para chequear. 6. Observar
una animacin de la salida del programa. 7. Escribir las salidas y
comparar con datos histricos. 8. Usar un simulador en paralelo que
ejecute el mismo modelo.
Tcnicas de verificacin de modelos La inclusin de chequeos y
salidas en el programa indican dnde est el error. Por ejemplo si la
suma de las probabilidades da 1 para ciertos eventos, el programa
chequea esta condicin e imprime un mensaje de error.
Estructura caminar a travs de (walking through): Se explica el
cdigo a otra persona o grupo. Si no lo entienden se observa
cuidadosamente dnde est el error.
Modelos determinsticos: Se usan funciones de distribucin
conocidas para saber los resultados para su correccin.
Casos simplificados de corridas: Se corren casos simples para
saber si hay errores.
Traza: es una lista ordenada en el tiempo de eventos y sus
variables asociadas. El nivel de detalle puede ser la traza de
eventos, de procedimientos, de variables. Las salidas de trazas son
tiles para detectar errores pero causan mucho overhead en el
procesamiento.
Grficas on-line: Muestra lo que sucede durante la corrida.
Demanda mucho tiempo pero es ms informativo que la traza.
Test de continuidad: Se corre varias veces la simulacin para
parmetros de entrada ligeramente diferentes. Normalmente un pequeo
cambio en la entrada provoca un pequeo cambio en la salida. Si no
se registra esto hay un error.
Test de degeneracin: Chequean el modelo para valores de
parmetros que producen resultados similares. Por ejemplo 2 fuentes
con = 100 pps carga la red de la misma forma que 4 fuentes con = 50
pps. Si hay una diferencia debe explicarse o se debe a un error de
programacin.
Independencia de la semilla: Semillas distintas dan resultados
aproximadamente diferentes. Si no fuera as, la semilla est
afectando a la simulacin.
Validacin de modelos de simulacin. Procedimientos para comparar
el mundo real.
En general no se necesita tener una correspondencia 1 a 1 entre
el modelo y el sistema. Por ejemplo: Se producen 10
6 latas de tomates al natural a velocidad constante. Cada lata
es 1 entidad en el
modelo. En este caso el modelo es costoso y poco til. En cambio,
si se hace un flujo continuo se logra la optimizacin del modelo.
Los principios bsicos de la validacin y la verificacin son:
1. Una clara definicin de las entidades y salidas o respuestas
(por ejemplo, si se calcula la velocidad de procesamiento pero no
el espacio ocupado).
-
SIMULACIN UNIDAD 6 pg. 8
2. El buen entendimiento de la configuracin del sistema. 3.
Entender y comprender las necesidades del cliente. 4. Usar
"expertos" (especialistas y gerentes) y realizar anlisis de
sensibilidad (cmo impactan las
variantes de los parmetros) para ayudar a determinar el nivel de
detalle. 5. Seguir un nivel de detalle moderado. 6. Hacer el nivel
de detalle consistente con el tipo de datos disponible. 7.
Considerar que el nivel de detalle es funcin del tiempo y dinero,
lo cual representa una restriccin. 8. Si el nmero de factores es
grande es necesario contar con un modelo analtico para
identificar
factores importantes. Como tcnicas o mtodos para la validacin de
un modelo de simulacin se mencionan las siguientes:
Es importante hacer una experimentacin, si es factible. En el
caso de un sistema real se pueden medir algunas de las variables de
respuesta para comparar con los resultados del modelo de simulacin,
por ejemplo, el tiempo de espera en cola de los clientes en una
caja en un banco.
La dificultad o facilidad de validacin depende de la
disponibilidad de datos en el tiempo y en el espacio. No siempre es
posible medir variables de respuesta como en el caso mencionado en
el punto anterior.
El modelo de un sistema complejo es una aproximacin al mundo
real: a mayor detalle, mayor aproximacin. Sin embargo en algunas
ocasiones los errores aumentan segn el grado de detalles del
sistema modelado, como puede ser el de un modelo de demanda de
transporte en una gran ciudad. En la medida que se plantee un
modelo complejo, los errores en las predicciones pueden ser mayores
en relacin a un modelo simple.
Un modelo vlido para un propsito no lo es para otro.
Se debe hacer la documentacin de las hiptesis del modelo.
Aseguramiento de una validez alta. Para tener la seguridad de que
el modelo tiene una validez alta se pueden hacer:
1. Charlas con "expertos". Los especialistas pueden orientar a
un modelo de mayor validez cuando aportan datos o conocimientos del
sistema que despus se representan o se tienen en cuenta en el
modelo de simulacin. Adems se produce la tormenta de ideas o brain
storming, que permite aclarar en la mayora de los casos el estudio
de un sistema. Por ejemplo se hacen simulaciones y se presentan
resultados de la simulacin y datos histricos o mediciones reales
del caso de estudio a los expertos sin que se distingan a priori
cuales son unos y otros y ver si ellos pueden distinguir los
resultados (de la simulacin respecto a los datos reales). Un caso
puede ser la observacin del grfico de la velocidad de procesamiento
de una red como una funcin de la probabilidad de prdida de paquetes
obtenida de una versin no vlida del modelo de simulacin de la red.
Se simularon dos alternativas y se mostraron en la figura. Para la
alternativa 1 la velocidad decae cuando la probabilidad de prdida
aumenta. Para la alternativa 2, la velocidad mejora inicialmente,
alcanza un mximo de 0,2 y decae despus. Este ltimo caso es
improbable porque la velocidad de la red no puede aumentar cuando
la probabilidad de prdida de paquetes es del 20 %. Este resultado
puede deberse tanto a un error en el programa de simulacin como a
los datos de entrada. Por lo tanto el nico comportamiento razonable
es la alternativa 1. Un experto debe darse cuenta del error
cometido en la alternativa 2.
2. Observaciones del sistema. Es indispensable observar el
sistema tanto para saber representarlo en un
modelo como para capturar la informacin que permitir obtener los
parmetros necesarios para resolverlo. Asimismo luego de cumplidas
estas etapas se vuelve a observar el sistema para chequear si las
hiptesis asumidas o la informacin capturada son correctas, como
tambin para comparar los resultados obtenidos del modelo.
3. Consideraciones de la teora existente. Una herramienta
valiosa es conocer las investigaciones o
trabajos realizados sobre estudios de sistemas cuyos objetivos
son comunes. Esto ayuda al ahorro de tiempo y esfuerzo en el
planteo y resolucin de modelos, para lo cual es fundamental
disponer de la bibliografa o publicaciones hechas sobre el
tema.
-
SIMULACIN UNIDAD 6 pg. 9
4. Resultados relevantes de modelos de simulacin similares. En
este aspecto es importante el comentario hecho en el punto
anterior. Las publicaciones previas al planteo y resolucin de un
modelo de simulacin proveen de distintos enfoques, los cuales son
factibles de adoptar para el caso del estudio, siempre y cuando las
situaciones sean similares.
5. Experiencia/intuicin. En la medida en que se trabaje y se
avance en un modelo de simulacin se
adquiere la prctica y la experiencia, que ayudan a resolver las
dificultades que puedan presentarse. La intuicin tambin hace su
aporte en la medida que se compruebe o se estudie con mayor
profundidad su validez.
Anlisis de los datos de salida de simulacin Cuando se dispone de
un modelo de simulacin verificado y vlido se usa para realizar
experimentos. Esto es, en lugar de producir cambios en el sistema
real se los hace con los valores de los datos de entrada o
parmetros del modelo para ver cmo varan las respuestas y aplicar as
la pregunta que pasara si... (what if ). Por ejemplo, en un sistema
de stock, se puede variar el punto de reorden o el parmetro de la
distribucin de demanda para ver cmo vara el nivel de inventario. En
un sistema de redes se puede cambiar la distribucin de tamaos para
ver cmo vara el nivel de congestionamiento de una red.
Toda simulacin de sistemas discretos utiliza variables
aleatorias para estimar determinadas variables de respuesta o
salida. Entonces estas ltimas tambin son variables aleatorias sobre
las cuales se debe tener mucho cuidado en interpretarlas. Para eso
es imprescindible para quien hace una simulacin determinar la
cantidad de repeticiones o corridas que realizar con el modelo,
dado que debe reproducir el comportamiento aleatorio que est
representando, como as tambin los valores de los datos de entrada y
la precisin estadstica en las respuestas.
Las salidas de simulacin de un sistema discreto tienen el
tratamiento de la estimacin de medias, variancias y correlaciones,
intervalos de confianza y eventualmente se puede hacer un test de
hiptesis para las medias para comparar distintas configuraciones
del sistema simulado. En la unidad 2 se hizo una revisin de
probabilidad y estadstica para luego aplicar estos conceptos a los
datos observados de un sistema real. Esos mismos conceptos son
aplicables para las salidas de simulacin.
Anlisis estadstico para resultados obtenidos mediante
simulaciones. Para analizar los datos se deben hacer una serie de
suposiciones sobre los procesos y observaciones de los mismos
cuando se hace la recoleccin de datos. Si estas suposiciones son
errneas tambin lo sern las conclusiones que se hagan. Cuando se
analizan datos estadsticos por lo general se supone que:
Las observaciones recogidas son independientes. Los procesos no
varan en el tiempo por lo que los datos siguen una misma
distribucin para
una variable.
Cuando la cantidad de observaciones es grande la media de la
muestra es una variable aleatoria con distribucin normal.
Bajo estas suposiciones se hacen las estimaciones de las medias
y varianzas, como se vio al principio de esta unidad, y se sacan
conclusiones.
En la simulacin de eventos discretos las observaciones recogidas
no siempre son independientes e incluso no estacionarias (esto es
no se llega al estado de equilibrio o estado estacionario). Eso
hace dudar que la media de la distribucin que siguen sea
constante.
-
SIMULACIN UNIDAD 6 pg. 10
Una solucin puede ser realizar ejecuciones con repeticiones y
que sean independientes. En una computadora, las repeticiones de
una simulacin son diferentes a las que se hacen en otros mbitos y
tienen las siguientes caractersticas:
- No hay problemas con la metodologa porque el modelo de
simulacin escrito en un lenguaje de programacin es el mismo toda
vez que se ejecute.
- Se debe tener cuidado con las condiciones iniciales y todas
las ejecuciones deben tener las mismas. - Tambin todas las
ejecuciones tienen que tener el mismo final de simulacin, segn sea
ste un tiempo
T o una cantidad de tems procesados. Determinacin del Tamao de
Muestras
Cuando se quiere estimar una media con una exactitud de r % y un
nivel de confianza de 100(1-) %, cul es el nmero de observaciones n
a realizar?
Dado un estimador n
szx , el intervalo de confianza (IC) para una muestra de tamao n
es:
n
szx
n
szx
La exactitud deseada implica que el intervalo de confianza sea:
)100
r1(x);
100
r1(x
Entonces igualando las expresiones para el IC, se tiene:
100
rx
n
sz
2
100
xr
szn
Ejemplo: si el tiempo medio de respuesta x es de 20 segundos y
la desviacin estndar es de 5 segundos, cuntas repeticiones hay que
hacer para tener un tiempo de respuesta con una exactitud dentro de
1 segundo, con el 95 % de confianza? Exactitud requerida: 1 segundo
en 20 segundos, por lo tanto, r = 5 %
x = 20 s = 5
z = 1,96 (de tabla, para 1- = 95 y p = 1-/2 = 0,975)
2100
xr
szn =
2
205
5961100
))((
))(,)((
n = (9,8)
2 = 96,04
n
szx)
r(x
1001
-
SIMULACIN UNIDAD 6 pg. 11
Sistemas con final definido y con final no definido.
Simulaciones terminantes y no terminantes
Los sistemas dinmicos discretos pueden tener un final definido o
no definido.
En el primer caso los eventos dejan de ocurrir en determinado
momento, por ejemplo la atencin de un banco, el dictado de un
curso, etc.
Un banco: el banco abre cada da a las 8:00, sin clientes en el
banco y cierra a las 15:00, completando el servicio de los clientes
que estn en el banco. Aqu la longitud de cada periodo es diferente,
pero cada periodo empieza siempre sin clientes en el sistema. El
suceso de fin se produce cuando sale el ltimo cliente. Posibles
medidas de ejecucin pueden ser el tiempo medio de espera de los
clientes, as como la proporcin de llegadas en diferentes momentos
del da.
Un aula de libre acceso: Cada periodo comienza cuando el aula se
abre y termina cuando llega la hora de cerrar. En este caso el
suceso de fin siempre ocurre a la misma hora. Posible medidas de
ejecucin pueden ser el nmero medio de usuarios conectados al
sistema en los diferentes momentos del da, media del nmero de
usuarios conectados.
En un sistema con final definido en un determinado momento de
tiempo cesan de ocurrir los sucesos. Un evento seala el final de un
perodo, dicho suceso puede ocurrir siempre en el mismo tiempo
durante cada perodo o en un tiempo de ocurrencia aleatorio. Se
conoce como perodo o poca al trnsito desde el comienzo al suceso de
fin. En un sistema con final definido, el estado al finalizar un
perodo no debe afectar al comienzo del siguiente periodo. Hay que
hacer una distincin entre el sistema y la simulacin de dicho
sistema. Cada simulacin (ejecucin del modelo) es un proceso con
final definido, aunque el sistema al que representa lo sea o no.
Por contraste, en un sistema con final no definido, los sucesos
discretos que dirigen el sistema no dejan nunca de ocurrir. Slo
existe un periodo indefinido y no existe un suceso de fin. Los
sistemas con final no definido son aquellos en que los eventos o
sucesos que ocurren en el sistema no terminan y no hay un evento
que indique el fin.
Un aeropuerto: los aviones van aterrizando y despegando durante
todo el da y no existe un momento en que esta actividad cese. Si
consideramos un periodo de un da, en el da siguiente la actividad
no es independiente sino que est conexionado con el da anterior.
Posible medidas de ejecucin pueden ser el tiempo entre
aterrizajes.
Un hospital: los pacientes son atendidos, puede que ingresados y
son dados de alta y estos sucesos no acaban nunca de producirse, ni
se pueden diferenciar periodos independientes en la actividad.
Posibles medidas de comportamiento son el tiempo medio que los
pacientes estn en lista de espera, el tiempo medio de estancia en
el hospital.
Las simulaciones de sistemas con final definido se denominan
terminantes y las de los sistemas que no lo tienen final definido,
no terminantes.
Comportamiento de estado estacionario y transiente de un sistema
discreto. Tambin los sistemas se clasifican en estado estacionario
o en estado transiente, trminos que suelen confundirse con los
sistemas con final definido o no definido. En el primer caso se
hacen referencias al comportamiento del sistema mientras que en el
ltimo caso se hace referencia a la naturaleza del sistema. Cuando
se analizan los resultados de una simulacin es necesario determinar
si se tratan de datos del sistema en el estado transiente o
estacionario. Cuando se trata de este ltimo caso, se hace
referencia a que no hay cambios grandes en el estado del sistema,
es decir, las distribuciones de probabilidad de las variables de
estado se estabilizan o son constantes en el tiempo. Por ejemplo,
un banco de sangre con una demanda que tiene una distribucin
uniforme a lo largo del ao es un sistema con final no definido
(siempre hay demanda de sangre) y alcanza el estado
estacionario.
-
SIMULACIN UNIDAD 6 pg. 12
En cambio, un servicio de emergencias es un sistema con final no
definido, y si a esto se le suma llamadas de servicio que cambian a
lo largo de la actividad del sistema, se trata de un sistema con
estado no estacionario.
Anlisis de salidas para estado estacionario o transiente.
Eliminacin del Transiente Toda corrida de simulacin debe eliminar
el efecto del transiente, que es el perodo inicial de la simulacin
hasta que alcanza el estado estacionario (las salidas de simulacin
son aproximadamente similares). Las formas de hacerlo son: 1.
Corridas largas: es un mtodo largo y costoso. 2. Inicializacin
apropiada: si se dan valores a las variables cerca del estado
estacionario, se reduce la
longitud del estado transiente. 3. Truncacin: La variabilidad de
la respuesta en el estado estacionario es menor en que el
estado
transiente. Esta variabilidad se mide en trminos de rangos (
mnimos y mximos observados). Transiente 9
Nmero de observaciones Sean n observaciones {x1,
x2,......,xn}.
1. Se ignoran las l primeras observaciones y se calculan el
mnimo y el mximo de las n-l observaciones.
2. Se repite para l=1,2,......,n-1 hasta la observacin (l+1) que
no es ni el mnimo ni el mximo. l en este punto da la longitud de
estado transiente. Pero ojo, puede dar datos incorrectos.
Ej.: Se consideran la siguiente secuencia de observaciones:
1,2,3,4,5,6,7,8,9,10,11,10,9,10,11,10,9.....
Ignorando la primer observacin (l=1) se tiene un rango desde 2
hasta 11. Como la segunda observacin es igual al mnimo, la fase
transiente es mayor que 1.
Ignorando las dos primeras observacin (l=2) se tiene un rango
desde 3 hasta 11. Como la siguiente observacin (3) es igual al
mnimo, la fase transiente es mayor que 2.
Se contina as y se llega a l=9 con la secuencia (9,11), y la
observacin 10 no es ni la mxima ni la mnima. Entonces la longitud
del transiente es 9 y las primeras 9 observaciones se
descartan.
Eliminacin de los datos iniciales Requiere estudiar el promedio
total despus que algunas observaciones iniciales son borradas de la
muestra. En estado estacionario borrar algunas observaciones no
cambia el promedio, pero la aleatoriedad en las observaciones hace
cambiar el promedio levemente an en estado estacionario.
Hacer corridas sin cambios en los parmetros de entrada salvo en
la semilla, varias repeticiones. Promediando a travs de las
repeticiones resulta en una trayectoria ms suave.
Sean n repeticiones de tamao n cada una. xij es la observacin j
en la repeticin i. j = 1,2,.....n (tiempo), i = 1,2,...m
(repeticin).
-
SIMULACIN UNIDAD 6 pg. 13
1- Promedio por observacin:
m
iijj njx
mx
1
,....2,11
2- Promedio total:
n
j
jxn
x1
1
Sea l =1 y seguir en 3. 3. Si el transiente es la longitud l, se
borran las l observaciones desde la trayectoria media y se toma
el
promedio desde n-l valores
n
lj
jl xn
x11
1
Ver el cambio relativo
x
xx l
Repetir variando l desde 1 hasta n-1. Graficar la media total y
el cambio relativo como funcin de l. Hay un l que aunque aumenta,
el promedio se estabiliza, ese punto se conoce como punto de
inflexin. Es el punto de longitud del intervalo del transiente.
Promedio del movimiento de repeticiones independientes
Es similar al mtodo de borrado de datos iniciales. Se hace el
clculo de la media a travs de una ventana de intervalo de tiempo en
lugar de una media total.
1) Se toma una trayectoria media:
m
iijj njx
mx
1
,....2,11
2) Se hace k=1
knkkjxk
xk
kl
jj
,..2,112
11
3) Repetir 2 con k = 2,3....hasta convergencia o suavidad del
grfico. 4) La inflexin del grfico da el intervalo transiente.
Medias batch El procedimiento consiste en correr una simulacin
muy larga y dividir en varios intervalos de igual duracin. Cada
parte es llamada batch o submuestra. La media es la media batch. El
mtodo requiere estudiar la variancia de estas medias batch como
funcin del tamao batch. Sea una corrida larga de N observaciones
divididas en m batchs de tamao n.
n
Nm [ ] es la truncacin del L valor entero
Por ejemplo: Se comienza con n=2. Se obtienen xij observaciones
j del batch i.
1. Para cada batch se calcula
n
j
iji nixn
x1
,....2,11
2. Luego se calcula la media
m
i
ixm
x1
1
3. Se calcula la varianza
m
i
i xxm
xVar1
2
1
1)(
-
SIMULACIN UNIDAD 6 pg. 14
Se aumenta n y se repite desde las etapas 1 hasta 3 para n =
2,4,5...r. Se grafica la varianza como funcin del tamao batch n. La
longitud del transiente se determina cuando el valor de n muestra
una varianza que comienza a decrecer. Suponer que la longitud del
transiente es T. Si el tamao batch n es n mayor varianza. - A n
> T la primera media es ligeramente diferente pero las
siguientes comienzan a parecerse, por lo cual la
varianza disminuye.
Simulaciones terminantes Hay simulaciones que nunca alcanzan el
estado estacionario, siempre estn en estado transiente. Por
ejemplo, en una red la transferencia de pequeos paquetes, de 1 a 3
nunca interese para grandes archivos. Por lo que se necesita
estudiar el estado transiente. Eso implica las simulaciones
terminales. A veces suceden cosas parecidas a las condiciones
finales. El sistema al final de la simulacin no interesa o no
alcanza al estado estacionario, por lo que hay que excluir esta
informacin. El mtodo es similar a las condiciones iniciales. Hay
que tener cuidado con el manejo de las entidades al final de la
simulacin. Los tiempos de servicio: slo se consideran los que
completaron el servicio. Tiempos de espera: slo interesan los que
completaron la espera y comienzan con la ejecucin. La longitud de
cola no es igual a la suma de las longitudes de cola en cada evento
dividida por el nmero total de eventos, sino es la longitud de cola
ponderada en el tiempo:
Longitud promedio de cola Q = T
dttQT 0
)(1
Criterios de parada (stop) Longitud de simulacin: se corre el
simulador o el programa hasta alcanzar un intervalo de confianza
deseado.
Si la media es x y la varianza Var( x ) un 100(1-)% de la media
es:
)(2/1 xVarzx
La varianza de la media de la muestra de n observaciones
independientes es: Var( x ) = Var(x)/n . Esto es cierto si las
observaciones son independientes cosa que en simulacin no ocurre:
las observaciones no son independientes.
Si el tiempo de espera para el trabajo i es grande, para el
trabajo i+1 es mucho ms grande an y viceversa. Hay una correlacin
entre las observaciones. Para estos casos se aplican tres mtodos:
repeticiones independientes, medias batch y regeneracin. Los dos
primeros son parecidos a la eliminacin del transiente.
Repeticiones independientes Se repite la simulacin con distintas
semillas. La hiptesis es que las medias de repeticiones
independientes son independientes aunque las observaciones en una
repeticin simple estn correlacionadas. Se hacen m repeticiones de
tamao n+n0 cada una donde n0 es la longitud de la fase transiente.
Las primeras n0 observaciones de cada repeticin se descartan.
1. Para cada repeticin se calcula
nn
njiji njx
nx
0
0 1
,....2,11
-
SIMULACIN UNIDAD 6 pg. 15
2. Luego se calcula la media total para todas las
repeticiones
m
i
ixm
x1
1
3. Se calcula la varianza de las medias repetidas
m
i
i xxm
xVar1
2
1
1)(
4. Se calcula el intervalo de confianza para la respuesta
media:
)(2/1 xVarzx
Se descartan las mn0 observaciones iniciales.
El intervalo de confianza (IC) es inversamente proporcional a mn
Por lo que a IC ms pequeo, si >m o >n, pero para reducir mn0
residuos, m debe ser pequeo, aprox. 10. La longitud de las
repeticiones n debera incrementarse para aumentar el IC. El n
correcto surge de la covarianza de medias batch sucesivas:
))((2
1),( 1
1
1
1 xxxxm
xxCov im
i
ii
es una auto covarianza, por lo que m y n son miembros del mismo
conjunto. Se repite el anlisis hasta que hay un n donde la auto
covarianza de las medias batch es pequea comparada
con sus varianzas. Mtodos de la regeneracin Por ejemplo sea una
simulacin de escalado de una CPU simple. El inicio es una cola de
trabajos vaca. A menudo se vuelve al estado inicial (cola vaca).
Despus de este estado no hay dependencia de la historia previa. El
tiempo de espera depende de los trabajos previos pero despus de un
intervalo donde la CPU estuvo vaca no depende de estos trabajos
previos. El sistema toma un nacimiento totalmente independiente de
su vida previa. Por lo tanto hay una regeneracin. Dnde se produce?
El punto de regeneracin es el instante en el cual el sistema entra
en fase independiente. La duracin de tiempo entre dos puntos de
regeneracin es un ciclo de regeneracin. En cada ciclo las
respuestas no estn correlacionadas. El sistema regenerativo se
puede analizar as: si el sistema tiene dos colas, se regenerara
cuando las dos estn vacas. A mayores colas, la regeneracin es ms
rara y los ciclos son ms largos. El sistema se torna no
regenerativo, tienen memoria ms larga. El clculo de la varianza es
ms complejo que los dos mtodos anteriores. Los ciclos donde
distintas longitudes. Los promedios de los ciclos son relaciones
con bases distintas (longitudes de ciclos.). Suponemos que tenemos
una simulacin regenerativa de m ciclos de tamaos n1, n2,
...,nm.
Las medias de los ciclos son
in
jij
i
i njxn
x1
,....2,11
La media total para todas las repeticiones
m
i
ixm
x1
1
-
SIMULACIN UNIDAD 6 pg. 16
En cambio se deben calcular las sumas de los ciclos:
in
jiji xy
1
La media total es
m
ii
m
ii
n
y
x
1
1
Se hace la diferencia wi = yi ni x i=1,2,....m Sumas observadas
sumas esperadas.
Se calcula la varianza de las diferencias
m
iiw w
mSwVar
1
22
1
1)(
Se hace el clculo de la longitud media del ciclo:
m
iin
mn
1
1
El IC es mn
Szx w2/1
No requiere eliminar las observaciones transientes. No hay
residuos pero... Las longitudes del ciclo son impredecibles. No es
posible planear el tiempo de simulacin de antemano. Encontrar el
punto de regeneracin no es fcil. Muchas tcnicas de reduccin de
varianza no pueden usarse porque las longitudes de los ciclos son
variables. Los estimadores de medias y variancias son parciales
porque los valores esperados de una muestra aleatorio no son
iguales a la cantidad que se est estimando. Otros mtodos son
aproximacin autoregresiva y anlisis espectral.
Tcnica de reduccin de la varianza. El control de corrientes de
los nmeros aleatorios para introducir correlacin en las
observaciones sucesivas de tal forma que la varianza de los
resultados va disminuyendo.