lunes, 16 de octubre de 2017

Introducción a la Teoría de Juegos

   En esta breve introducción presentaré algunos juegos y los conceptos básicos que se aplican a ellos sin entrar en cuestiones matemáticas engorrosas como la diagonalización matricial, cuestiones probabilísticas o la derivación, cuestiones básicas pero que no incrementan la curiosidad que pretendo fomentar en esta entrada.
   La Teoría de Juegos comienza a ver la luz a finales del siglo XIX y comienzos del siglo XX debido a estudios realizados en el campo de la economía. Es pues un campo muy reciente de la matemática que se aplica no solo al ambito económico, si no también a la vida cotidiana. En rigor, la finalidad de la Teoría de Juegos es investigar de qué modo los individuos racionales deberán relacionarse cuando sus intereses entran en conflicto. Podemos decir que se desarrolla un juego cuando unos individuos se relacionan con otros: un conductor que circule por una carretera practica un juego con otros conductores; en clase, los alumnos practican un juego con el profesor; en una guerra se practica un juego, que comentaré al finalizar... aunque este último apartado no conviene ponerlo en práctica pero es necesario saberlo.
Cabe preguntarse, ¿por qué devaluar las relaciones entre grupos de individuos llamándolas "teoría de juegos"? Una de las virtudes de la Teoría de Juegos es que usa el lenguaje de juegos comunes como el ajedrez, poker, damas,... para discutir la lógica de las relaciones estratégicas.

Aplicaciones
Como aplicaciones directas de la Teoría de Juegos cabe destacar la economía, que se ocupa de la distribución de recursos. Los recursos suelen ser escasos y es porque hay más individuos que los quieren de los que pueden llegar a tenerlos, por tanto tiene todos los ingredientes para plantear un juego. Se aplica también a la política como puede ser el caso de la elección de un programa
político (2 únicos partidos políticos en EEUU). Tiene aplicaciones a la biología o aplicaciones a la filosofía como el caso del dilema del prisionero en el que Kant afirma que se debe cooperar...

Tipos de Juegos
Los Juegos Cooperativos son aquellos en los que los jugadores pueden comunicarse entre ellos con transferencia de utilidad. Aquí el problema se centra en el análisis de coaliciones y su estabilidad.
Los Juegos NO Cooperativos (son más interesantes) son aquellos en los que los jugadores no pueden llegar a acuerdos previos como, por ejemplo, el dilema del prisionero o la guerra de los sexos.

Reglas del Juego
Las reglas de un juego deben decirnos quién puede hacer qué y cuándo. Deben indicar también cuánto gana cada jugador cuando el juego ha terminado.

Estrategia Pura
La estrategia pura se refiere siempre a un jugador. Es un plan que especifica una acción para cada punto de toma de decisiones por lo que no se deja nada al azar.

El Ajedrez
El ajedrez en un juego que termina de tres maneras posibles: Ganar (G), Empatar (E), Perder (P). Adem ás, se dan en este orden para cada jugador, esto es, el jugador A prefi ere G (o equivalentemente, que sea P para el jugador B) antes que E y E antes que P. Es un juego COMPETITIVO, esto es, lo contrario de un juego EN EQUIPO en el que los intereses de los jugadores coinciden. Tiene informaci on PERFECTA, es decir, los dos jugadores conocen todas las reglas del juego y, por ultimo, posee EQUILIBRIO DE NASH, esto es, lo que gana un jugador lo pierde el otro. El ajedrez, a pesar de tener para cada bloque de jugadas (aperturas o resoluciones finales) la jugada más eficiente (la que da ventaja), cabría esperar que fuera un juego predefinido de forma óptima pero cabe destacar que no hay dos partidas iguales y la razón es que la llamada Matriz de Pagos es tan grande en cada partida que no se puede diagonalizar (lo que nos daría la jugada óptima para ganar en cada planteamiento sobre el tablero).

Algoritmo de Zermelo
Partimos del objetivo fi nal y marchamos hacia atrás. Se le conoce a este proceso como INDUCCIÓN HACIA ATRÁS o PROGRAMACIÓN DINÁMICA. Prueba que un jugador tiene una estrategia para un juego que le garantiza la victoria sea cual sea la estrategia del otro jugador. Un ejemplo típico de aplicación es el ajedrez. Otra aplicación es en el llamado Juego del Duelo: "¿A qué distancia del oponente deber a acercarse un duelista antes de abrir fuego teniendo en cuenta que la probabilidad de alcanzar al contrario es mayor cuanto más cerca se encuentran?" Es cuestión de vida o muerte porque si uno falla el otro puede acercarse y disparar a quemarropa. Si aplicamos el algoritmo de Zermelo se obtiene que dicha distancia a la que se debe abrir fuego (después de cálculos) es D/2 ([Raíz(5)] - 1) donde D es la distancia inicial entre los contrincantes (Si D = 30 metros, por ejemplo, entonces la distancia optima para disparar es de 18 metros).

La Ruleta Rusa
La ruleta rusa es un juego con informaci on IMPERFECTA porque no se conocen todas las reglas del juego. El objetivo es conseguir salvar la vida de un grupo de soldados para un jugador y salvar la vida de un grupo de campesinos para el otro. Los dos objetivos a la vez no se pueden cumplir. Se carga un revolver de 6 rec amaras con 1 bala al azar. Los dos jugadores se turnan. En cada turno un jugador puede decidir si acobardarse y retirarse o disparar. Ser un cobarde o morir supone matar a los dos grupos. A ninguno de los jugadores le preocupa el otro. Hay tres alternativas: el jugador se mata (L), el jugador es un cobarde y no dispara (D) con lo que matan a su grupo de "protegidos", y el jugador no muere (W) con lo que consigue salvar a su grupo y matan al otro grupo. Las preferencias de cada
jugador son pues, por este orden, W,D,L.
Existen dos versiones: una de ellas consiste en que cada vez que se pasa el turno se gira el tambor del revolver, y la otra var ía en que s olo se gira el tambor al principio. Existe informaci on imperfecta porque el jugador sabe que hay una bala pero no sabe donde est a.
Una aplicaci on a la vida cotidiana podrí a ser el hecho de comprar en una tienda: sabemos la cantidad de dinero que nos vamos a gastar (existe una bala) pero no sabemos en qué nos lo gastaremos (no sabemos d onde est a la bala) y tratamos de maximizar los benefi cios comprando algo muy bueno (no morir) con el mí nimo coste.

El Dilema del Prisionero
Es un juego planteado en 1950 que nos proporciona la idea de que no siempre la colaboración es la mejor opción. Es un juego de suma cero, es bipersonal, biestratégico y simétrico.
Su planteamiento es el siguiente: dos delincuentes son detenidos y encarcelados en celdas de aislamiento y no pueden comunicarse entre ellos. Se sospecha que han participado en el robo de
un banco cuya pena es de 10 años de cárcel pero no se tienen pruebas. Solo se les puede culpar por tenencia ilí cita de armas, un delito menor, que tiene 2 años de cárcel. Se les promete a cada uno de ellos la reducci ón de la pena a la mitad (5 años) si proporcionan pruebas para culpar al otro del robo del banco. Las alternativas para cada prisionero pueden representarse mediante la llamada MATRIZ DE PAGOS.
La estrategia "ser leal" significa permanecer en silencio y no acusar al otro preso y "traición" es la estrategia alternativa:
En la siguiente tabla se representan las alternativas de cada preso en años:
   Preso Y
Preso X    Lealtad Traición
Lealtad         2/2      10/1
Traición        1/10      5/5
En la siguiente tabla se cambia el pago en años por ordenes de preferencia de cada prisionero:
   Preso Y
Preso X    Lealtad Traición
Lealtad         2/2       4/1
Traición        1/4       3/3*
El punto "2/2" no es un equilibrio de Nash porque no existe acuerdo previo entre los prisioneros, sin embargo, el punto "3/3" si representa un equilibrio de Nash, por tanto, SI NO SE CONOCE LA DECISI ON DEL OTRO JUGADOR, LO MEJOR ES TRAICIONAR.

La Guerra de los Sexos
Este juego analiza la vida cotidiana y las relaciones entre los hombres y las mujeres. Es un juego SIN REPETICIÓN porque se juega s olo una vez, as í que no es posible tomar decisiones en funci ón de la eleccióon del otro jugador, y es un juego SIN TRANSFERENCIA DE UTILIDAD (no existe comunicaci on previa ni acuerdos entre los jugadores) y es sim étrico.
Su planteamiento es el siguiente: existen dos jugadores, EL y ELLA, y cada uno de ellos puede elegir entre dos posibles estrategias que llamaremos "Fútbol" y "Tiendas". Supongamos que el orden de preferencias de él es:
1) (lo más preferido) él y ella eligen "Fútbol".
2) Él y ella eligen "Tiendas".
3) Él elige "Fútbol" y ella elige "Tiendas".
4) (lo menos preferido) Él elige "Tiendas" y ella elige "Fútbol".
Supongamos que el orden de preferencias de ella es:
1) Él y ella eligen "Tiendas".
2) Él y ella eligen "Fútbol".
3) Él elige "Fútbol" y ella elige "Tiendas".
4) Él elige "Tiendas" y ella elige "Fútbol".
Lo que mencionaba anteriormente, la matriz de pagos asociada, es de la forma:
  Ella
Él         Fútbol Tiendas
Fútbol     1/2       3/3
Tiendas   4/4       2/1
El punto "3/3" no es un equilibrio de Nash porque cuando se separen uno estar á tentado de cambiar de estrategia. Aquí viene lo bueno: supongamos que las posiciones 2 y 3 de las estrategias de él se intercambian (prefiere más ir sólo al fútbol) lo cual se aproxima m ás al mundo real. De esta forma la matriz de pagos queda como sigue:
  Ella
Él          Fútbol Tiendas
Fútbol     1/2*     2/3
Tiendas   4/4       3/1

Está claro que él siempre elegirá "Fútbol" sea cual sea la estrategia de ella. Sabiendo esto, ella prefiere estar con él en vez de ir sola de tiendas, por lo que EL JUGADOR "MÁS EGOISTA"
DOMINA AL OTRO.

La Tragedia de los Comunes
Es un planteamiento más moderno que los anteriores (1968) pero usado desde tiempos inmemoriales:
en una aldea cada familia es propietaria de ganado pero comparten en com ún el pasto. Todas las familias llevan a pastar su ganado a terrenos comunes. Ninguna está estimulada a cuidar los pastos, que no se agoten o controlar la cantidad que come su ganado. Existen pues dos estrategias posibles:
a) Cuidar los pastos.
b) No cuidar los pastos.
El orden de preferencias para cada jugador (familia) es el siguiente:
1) (lo m as preferido) Que los dem ás sean los que cuiden los pastos y no yo.
2) Que todos sean cuidadosos.
3) Que ninguno cuidemos las propiedades comunes.
4) (lo menos preferido) Que yo cuide los pastos y los dem as no.
Por tanto, lo mejor para cada familia, hagan lo que hagan las dem ás, es no ser cuidadoso con los terrenos comunes, por lo que el resultado es peor que si todas cuidaran los pastos.
La conclusión evidente de este planteamiento es que los recursos de propiedad compartida no los cuida nadie. Este juego propone pues las siguientes soluciones:
-Propiedad privada: se divide el prado en parcelas y as í cada familia cuida la suya.
-Propiedad p ublica: las autoridades de la aldea establecen leyes que regulan el
uso y cuidado de la parcela com un con vigilancia, etc...

   Con esta entrada he intentado hacer ver al lector/a que una rama importante de las matemáticas, como es el estudio de los juegos, se aplica a cualquier ámbito de la vida cotidiana. Un ejemplo paralelo al de la Tragedia de los Comunes es el de la guerra: lo más beneficioso para ambos bandos es entrar en guerra a pesar de las bajas y el coste que conlleva para ambos contrincates. Los casos curiosos como el de siempre traicionar en el Dilema del Prisionero o ser egoísta en la Guerra de los Sexos son cuestiones que debemos saber, por si acaso.