El equilibrio de nash

Documento sobre el equilibrio de nash

En la teoría de los juegos, la estrategia de un jugador es cualquiera de las opciones que elige en un escenario en el que el resultado depende no sólo de sus propias acciones, sino de las acciones de los demás[1] La disciplina se refiere principalmente a la acción de un jugador en un juego que afecta al comportamiento o las acciones de otros jugadores. Algunos ejemplos de «juegos» son el ajedrez, el bridge, el póquer, el monopolio, la diplomacia o el acorazado[2] La estrategia de un jugador determinará la acción que éste realizará en cualquier fase del juego. Al estudiar la teoría de los juegos, los economistas recurren a una óptica más racional para analizar las decisiones, en lugar de las perspectivas psicológicas o sociológicas que se adoptan cuando se analizan las relaciones entre las decisiones de dos o más partes en diferentes disciplinas.

El concepto de estrategia se confunde a veces (erróneamente) con el de jugada. Una jugada es una acción realizada por un jugador en algún momento de la partida (por ejemplo, en ajedrez, mover el alfil blanco a2 a b3). Una estrategia, en cambio, es un algoritmo completo para jugar, que indica al jugador qué hacer en cada situación posible a lo largo de la partida. Es útil pensar en una «estrategia» como una lista de direcciones, y en una «jugada» como una única vuelta en la propia lista de direcciones. Esta estrategia se basa en la recompensa o el resultado de cada acción. El objetivo de cada agente es considerar su recompensa en función de la acción de sus competidores. Por ejemplo, el competidor A puede suponer que el competidor B entra en el mercado. A partir de ahí, el competidor A compara los beneficios que recibe al entrar y al no entrar. El siguiente paso es suponer que el competidor B no entra en el mercado y, a continuación, considerar qué recompensa es mejor en función de si el competidor A decide entrar o no entrar. Esta técnica puede identificar estrategias dominantes en las que un jugador puede identificar una acción que puede tomar sin importar lo que haga el competidor para tratar de maximizar la recompensa. Esto también ayuda a los jugadores a identificar el equilibrio de Nash, que se analiza con más detalle a continuación.

Leer más  Se puede ir a otra comunidad a comprar un coche

Ejemplo de equilibrio de nash

Un equilibrio de Nash se utiliza para predecir el resultado de un juego. Por juego se entiende la interacción de unos pocos individuos, llamados jugadores. Cada jugador elige una acción y recibe un pago que depende de las acciones elegidas por todos en el juego.

Considere los juegos de la tabla 16.5 «Dilema del prisionero», la tabla 16.6 «Juego del dictador», la tabla 16.7 «Juego del ultimátum» y la tabla 16.8 «Juego de coordinación». Los números de las tablas indican la recompensa de cada jugador por las acciones que puede llevar a cabo, con la recompensa del jugador de la fila en primer lugar.

Describimos un juego con tres jugadores (1, 2, 3), pero la idea se generaliza directamente a situaciones con cualquier número de jugadores. Cada jugador elige una estrategia (s1, s2, s3). Supongamos que σ1(s1, s2, s3) es la recompensa del jugador 1 si (s1, s2, s3) es la lista de estrategias elegidas por los jugadores (y de forma similar para los jugadores 2 y 3). Ponemos un asterisco (*) para denotar la mejor estrategia elegida por un jugador. Entonces, una lista de estrategias (s*1, s*2, s*3) es un equilibrio de Nash si las siguientes afirmaciones son ciertas:

Cómo calcular el equilibrio nash mixto

El ejemplo 9.17 fue algo desalentador debido a la existencia de múltiples equilibrios de Nash. En general, puede haber cualquier número de equilibrios. ¿Cómo puede saber cada jugador cuál debe jugar? Si cada uno elige uno diferente, no está garantizado que caiga en otro equilibrio como en el caso de los puntos de silla de los juegos de suma cero. Muchos de los equilibrios pueden eliminarse utilizando la optimalidad de Pareto, que se explicó en la sección 9.1.1 y que también apareció en la sección 7.7.2 como forma de coordinar óptimamente varios robots. La idea es formular la selección como un problema de optimización multiobjetivo, que se ajusta a la formulación 9.2.

Leer más  Que es el bce

Consideremos vectores bidimensionales de la forma , en los que y representan los costes y obtenidos bajo la aplicación de un equilibrio de Nash denotado por . Para dos equilibrios diferentes y , se obtienen los vectores de costes y. En el ejemplo 9.17, éstos eran y . En general, se dice que es mejor que si

La definición de «mejor» induce un ordenamiento parcial en el espacio de los equilibrios de Nash. Es sólo parcial porque algunos vectores son incomparables. Consideremos, por ejemplo, y . El primero es preferible a

Póquer de equilibrio de nash

en 1823 se licenció en matemáticas en la Universidad de la Sorbona. A continuación, se convirtió en secretario particular de un mariscal de campo que necesitaba ayuda para escribir sus memorias. Este puesto dejó a Cournot un tiempo considerable para sus propias actividades. Durante los diez años que pasó al servicio del mariscal de campo, obtuvo dos doctorados, uno en mecánica y otro en astronomía. Además, publicó varios artículos e incluso se licenció en Derecho[1].

Cournot fue principalmente un matemático, pero tuvo cierta influencia en la economía. Sus teorías sobre los monopolios y duopolios siguen siendo famosas[cita requerida] En 1838 se publicó el libro Investigaciones sobre los principios matemáticos de la teoría de la riqueza[2], en el que utilizaba la aplicación de las fórmulas y símbolos de las matemáticas en el análisis económico. Este libro fue muy criticado y apenas tuvo éxito en vida de Cournot. No obstante, intentó reescribirlo dos veces. Hoy en día es un libro influyente en la economía. Hoy en día, muchos economistas consideran que este libro es el punto de partida del análisis económico moderno. Cournot introdujo las ideas de las funciones y la probabilidad en el análisis económico. Obtuvo la primera fórmula de la regla de la oferta y la demanda en función del precio y, de hecho, fue el primero en dibujar las curvas de la oferta y la demanda en un gráfico, anticipándose a los trabajos de Alfred Marshall en unos treinta años. El modelo de duopolio de Cournot desarrollado en su libro también introdujo el concepto de equilibrio de Nash (estrategia pura), la función de reacción y la dinámica de la mejor respuesta.

Leer más  Países más liberales del mundo

Por Pablo Mariscal

Soy Pablo Mariscal periodista especializado en tecnología e informática. Entre mis intereses se encuentran la realidad virtual y la programación, pero mi principal objetivo son las noticias. Llevo cinco años escribiendo sobre tecnología y tres como periodista independiente.