Cadenas de markov
Piedra vence a las tijeras rompiéndolas, las tijeras vencen al papel cortándolo, y el papel vence a la piedra envolviéndola.
Cada entrada +1 indica una ganancia para eljugador renglón, -1 indica una pérdida, y 0 indica un empate. ¿Quiere jugar? Clic en una acción renglón...-------------------------------------------------
Principio del formulario | | Jugador columna |
| | | | | | |
Jugador
renglón | | | 0 | -1 | 1 | |
| | | 1 | 0 | -1 | |
| | | -1 | 1 | 0 | |
Clic en una acción renglón.
Final del formularioInicio de página |Estrategia mixta, Valor esperado Un jugador usa una estrategia purasi usa la misma acción a cada turno del juego. El jugador usa una estrategia mixtasi a cada turno escoge al azar un acción para que cada acción se está usado una fracción determinada del tiempo.Representamos una estrategia mixta (o pura) del jugador reglón por una matriz con un solo renglón (vector probabilidad): R = [a b c . .. ]con lo mismo número de entradas que renglones, y en cual cada entrada representa la fracción de tiempo que está usada la correspondiente acción (o la probabilidad de usar aquel acción) y donde a + b + . . . = 1. Una estrategia mixta para el jugador renglón se represente por un vector probabilidad similar, pero en forma de columna C. Para ambos jugadores, estrategias puras son representadas porvectores probabilidad con un solo 1 y el resto de las entradas 0. El valor esperadodel juego con matriz de pagos P que resulta por las estrategias mixtas R y C es dado por e = RPCEl valor esperado del juego es el pago promedio por turno si cada jugador usa su estrategia mixta especificado por R y Cdespués de un gran número de turnos. Inicio de página | Ejemplo Aquí es una variante de "piedra,papel, tijera" en la que "papel/papel" y "piedra/piedra" ya no está un empate. | | | | |
| | 2 | -1 | 1 | |
| | 1 | 0 | -1 | |
| | -1 | 1 | -2 | |
Suponga el jugador de renglón usa la estrategia mixta R = [0.75 0 0.25](juega papel 75% del tiempo, tijeras 0% del tiempo y piedra 25% del tiempo) y el jugador columna juega tijeras y piedra 50% del tiempo cada uno; C = | | 0 ||
| | 0.5 | |
| | 0.5 | | . |
Entonces el valor esperado del juego es e | = RPC |
| = [0.75 0 0.25] | | 2 | -1 | 1 | | | 0 | |
| | | 1 | 0 | -1 | | | 0.5 | |
| | | -1 | 1 | -2 | | | 0.5 | |
| = -0.125 | | | | | | | | |
Inicio de página |
Criterio minimax, Principios fundamentales de la teoría de juegos Criterio Minimax
Un jugador quien usael criterio minimaxescoge una estrategia que, entre todas las estrategias posibles, minimiza el daño de la mejor contra-estrategia del otro jugador. Es decir, una estrategia óptima según el criterio minimax es una que minimiza el daño máximo que puede hacer el contrincante. Encontrar la estrategia se llama solucionar el juego. La tercera parte del tutorial para esta temamuestra un métodográficamente para solucionar juegos 2×2. Para juegos general, se puede usar el método simplex (vea siguiente tema). Sin embargo, se puede frecuentemente simplificar un juego y a veces solucionarlo por "reducir por predominio" y/o comprobar si es "estrictamente determinado" (vea más abajo). Principios fundamentales de la teoría de juegosCuando analizamos cualquier juego, hacemos los siguientes supuestos...
Regístrate para leer el documento completo.