Cadenas de markov

Solo disponible en BuenasTareas
  • Páginas : 15 (3554 palabras )
  • Descarga(s) : 0
  • Publicado : 6 de junio de 2011
Leer documento completo
Vista previa del texto
Juegos bipersonales de suma cero En un juego bipersonal de suma cero, cada uno de dos jugadores tiene que escoger entre unas accionesdictadas a cada turno, y la pérdida de cada jugador es igual al beneficio del su contrincante. La matriz de pagos de un juego bipersonal de suma cero tiene reglones etiquetados por las acciones del "jugador renglón" y columnas etiquetadas por las acciones del sucontrincante, el "jugador columna." La entrada ijde la matriz es el pago que gana el jugador renglónen caso de que el jugador renglón usa acción i y el jugador columna usa acción j. Inicio de página | Ejemplo Piedra, papel, tijera
Piedra vence a las tijeras rompiéndolas, las tijeras vencen al papel cortándolo, y el papel vence a la piedra envolviéndola.
Cada entrada +1 indica una ganancia para eljugador renglón, -1 indica una pérdida, y 0 indica un empate. ¿Quiere jugar? Clic en una acción renglón...-------------------------------------------------
Principio del formulario | | Jugador columna |
| | | | | | |
Jugador
renglón | | | 0 | -1 | 1 | |
| | | 1 | 0 | -1 | |
| | | -1 | 1 | 0 | |
Clic en una acción renglón.
Final del formularioInicio de página |Estrategia mixta, Valor esperado Un jugador usa una estrategia purasi usa la misma acción a cada turno del juego. El jugador usa una estrategia mixtasi a cada turno escoge al azar un acción para que cada acción se está usado una fracción determinada del tiempo.Representamos una estrategia mixta (o pura) del jugador reglón por una matriz con un solo renglón (vector probabilidad): R = [a   b   c  . .. ]con lo mismo número de entradas que renglones, y en cual cada entrada representa la fracción de tiempo que está usada la correspondiente acción (o la probabilidad de usar aquel acción) y donde a + b + . . . = 1. Una estrategia mixta para el jugador renglón se represente por un vector probabilidad similar, pero en forma de columna C. Para ambos jugadores, estrategias puras son representadas porvectores probabilidad con un solo 1 y el resto de las entradas 0. El valor esperadodel juego con matriz de pagos P que resulta por las estrategias mixtas R y C es dado por e = RPCEl valor esperado del juego es el pago promedio por turno si cada jugador usa su estrategia mixta especificado por R y Cdespués de un gran número de turnos. Inicio de página | Ejemplo Aquí es una variante de "piedra,papel, tijera" en la que "papel/papel" y "piedra/piedra" ya no está un empate. | | | | |
| | 2 | -1 | 1 | |
| | 1 | 0 | -1 | |
| | -1 | 1 | -2 | |
Suponga el jugador de renglón usa la estrategia mixta R = [0.75   0   0.25](juega papel 75% del tiempo, tijeras 0% del tiempo y piedra 25% del tiempo) y el jugador columna juega tijeras y piedra 50% del tiempo cada uno; C = | | 0 ||
| | 0.5 | |
| | 0.5 | | . |
Entonces el valor esperado del juego es   e | = RPC |
| = [0.75   0   0.25] | | 2 | -1 | 1 | | | 0 | |
| | | 1 | 0 | -1 | | | 0.5 | |
| | | -1 | 1 | -2 | | | 0.5 | |
| = -0.125 | | | | | | | | |
Inicio de página |
Criterio minimax, Principios fundamentales de la teoría de juegos Criterio Minimax
Un jugador quien usael criterio minimaxescoge una estrategia que, entre todas las estrategias posibles, minimiza el daño de la mejor contra-estrategia del otro jugador. Es decir, una estrategia óptima según el criterio minimax es una que minimiza el daño máximo que puede hacer el contrincante. Encontrar la estrategia se llama solucionar el juego. La tercera parte del tutorial para esta temamuestra un métodográficamente para solucionar juegos 2×2. Para juegos general, se puede usar el método simplex (vea siguiente tema). Sin embargo, se puede frecuentemente simplificar un juego y a veces solucionarlo por "reducir por predominio" y/o comprobar si es "estrictamente determinado" (vea más abajo). Principios fundamentales de la teoría de juegosCuando analizamos cualquier juego, hacemos los siguientes supuestos...
tracking img