ALUMNO:WILLIAM HUMBERTO CAAMAL EKGRADO:7 BASIGNATURA:INVESTIGACION DE OPERACIONES IIINGENIERA INDUSTRIAL
MAESTRO: ING. RICARDO GOMEZ KU1.4. PROGRAMACION DINMICA PROBABILISTICA
En este capitulo se explica como usar la programacin dinmica para resolver problemas en los que el costo del periodo actual o el estado del siguiente periodo son aleatorios. A estos problemas se les conoce como problemas de programacin dinmica probabilstica (PDP). En una PDP, por lo general el objetivo de quien toma la decisin es minimizar el costo esperado en que se incurre o maximizar la recompensa esperada obtenida en un determinado horizonte de tiempo La programacin dinmica probabilstica difiere de la programacin dinmica determinstica en que el estado de la etapa siguiente no queda completamente determinado por el estado y la decisin de la poltica en el estado actual. En lugar de ello existe una distribucin de probabilidad para lo que ser el estado siguiente. Sin embargo, esta distribucin de probabilidad todava esta completamente determinada por el estado y la decisin de la poltica del estado actual.
EjemploSuponga que el permetro de la rueda de la ruleta rusa esta marcado con los nmeros 1 a 5. La probabilidad de detenerse en el numero i es p1 = 0.3, p2 = 0.25, p3 = 0.2, p4 = 0.15 Y p5 = 0.1.El jugador paga $5 para hacer un mximo de cuatro giros. Determine la estrategia ptima para cada uno de los cuatro giros, y el ingreso neto esperado correspondiente.Etapa 5 f5(j) = 2j
Etapa 4F4 (j) = mx. {2j, p1f5 (1) + p2f5 (2) + p3f5 (3) + p4f5 (4) + p5f5 (5)} = mx. {2j, 0.3 X 2 + 0.25 X 4 + 0.2 X 6 +0.15 X 8 + 0.1 X 10} = mx. {2j, 5}
Ingreso esperadoSolucin ptima
Resultado j del giro 3TerminarGirarF4 (j)Desicin 1255Girar2455Girar3656Terminar4858Terminar510510Terminar
Etapa 3F3 (j) = mx. {2j, p1f4 (1) + p2f4 (2) + p3f4 (3) + p4f4 (4) + p5f4 (5)} = mx. {2j, 0.3 X 5 + 0.25 X 5 + 0.2 X 6 +0.15 X 8 + 0.1 X 10} = mx. {2j, 6.15}
Ingreso esperadoSolucin ptima
Resultado j del giro 2TerminarGirarF3(j)Desicin 126.156.15Girar246.156.15Girar366.156.15Girar486.158.00Terminar5106.1510.00Terminar
Etapa 2F2 (j) = mx. {2j, p1f3 (1) + p2f3 (2) + p3f3 (3) + p4f3 (4) + p5f3 (5)} = mx. {2j, 0.3 X 6.15 + 0.25 X 6.15 + 0.2 X 6.15 +0.15 X 8 + 0.1 X 10} = mx. {2j, 6.8125}
Ingreso esperadoSolucin ptima
Resultado j del giro 1TerminarGirarF3(j)Desicin 126.81256.8125Girar246.81256.8125Girar366.81256.8125Girar486.81258.0000Terminar5106.812510.0000Terminar
Etapa 1F1 (0) = p1f2 (1) + p2f2 (2) + p3f2 (3) + p4f2 (4) + p5f2 (5) = 0.3 X 6.8125 + 0.25 X 6.8125 + 0.2 X 6.8125 +0.15 X 8 + 0.1 X 10 = 7.31La nica opcin disponible al iniciar el juego es girar.De acuerdo con los cuadros anteriores, la solucin ptima es:
Giro nm.Estrategia ptima
1Comienza el juego, girar2Continuar si el giro 1 produce 1, 2 3. Si no, terminar el juego3Continuar si el giro 2 produce 1, 2 3. Si no, terminar el juego4Continuar si el giro 3 produce 1, 2 3. Si no, terminar el juegoIngreso neto esperado = $7.31 - $5.00 = $2.31
Ejemplo 15.2-1En este modelo de inversin, hay que suponer que se desea invertir 10 000 durante los 4 aos veniders. Hay 50% de probabilidades de que el dinero aumente el doble, 20% de probabilidades de salir a mano y 30% de probabilidades de perder la cantidad invertida. Proponer una estrategia optima de inversin.
Al usar la notacin de modelo se tiene que C= 10000 n= 4 m=3P1=0.4 P2=0.2 P3=0.4R1=1 R2=0 R3=-1
ETAPA 4 Entonces
La solucin optima se resume como sigue:
Solucin optima
estado
ETAPA 3=1.44 x3Solucin optima
estado
ETAPA 2=1.728 X2Solucin optima
estado
ETAPA 1 =2.0736x1 Solucin optima
estado
Entonces, la poltica optima de inversin se puede resumir: como sigue para i = 1 a 4, la solucin optima es invertir todos los fondos disponibles al iniciar cada ao. Los fondos acumulados al final de 4 aos son 2.0736x1 = 2.0736 ($10,000) = $20,736.En realidad, se puede demostrar por induccin que el problema tiene la siguiente solucin general en la etapa
**************