Equilibrio di Nash
Da Wikipedia, l'enciclopedia libera.
In teoria dei giochi si definisce equilibrio di Nash un profilo di strategie (una per ciascun giocatore) rispetto al quale nessun giocatore ha interesse ad essere l'unico a cambiare.
Indice |
[modifica] Nascita del teorema di Nash
La prima formulazione di questo teorema, che costituisce la nozione di equilibrio più famosa della teoria dei giochi per quel che riguarda i "giochi non cooperativi", appare in un brevissimo articolo del 1949 dove John Nash, ancora studente a Princeton, spiega la sua idea di fondere intimamente due concetti apparentemente assai lontani: quella di un punto fisso in una trasformazione di coordinate, e quella della strategia più razionale che un giocatore può adottare, quando compete con un avversario anch'esso razionale, estendendo la teoria dei giochi ad un numero arbitrario di partecipanti, o agenti, e dimostrando che, sotto certe condizioni, esiste sempre una situazione di equilibrio, che si ottiene quando ciascun individuo che partecipa a un dato gioco sceglie la sua mossa strategica in modo da massimizzare la sua funzione di retribuzione, sotto la congettura che il comportamento dei rivali non varierà a motivo della sua scelta (vuol dire che anche conoscendo la mossa dell'avversario, il giocatore non farebbe una mossa diversa da quella che ha deciso).
Tutti i giocatori, possono dunque operare una scelta dalla quale tutti traggono un vantaggio (o limitare lo svantaggio al minimo). Una differenza sostanziale rispetto al caso dei giochi a "somma zero" studiati in precedenza da John von Neumann, dove la vittoria di uno dei due (unici) partecipanti era totale e necessariamente accompagnata dalla sconfitta all'altro.
[modifica] L'equilibrio di Nash: definizione
Vediamo ora più nel dettaglio cosa si intende esattamente per equilibrio di Nash. A tal fine, può essere utile chiarire alcuni semplici aspetti matematici della teoria dei giochi e definire alcuni concetti basilari.
Un gioco è caratterizzato da:
- Un insieme G di giocatori, o agenti, che indicheremo con i=1,...,N;
- Un insieme S di strategie, costituito da un insieme di N vettori
ciascuno dei quali contiene l'insieme delle strategie che il giocatore i-esimo ha a disposizione, cioè l'insieme delle azioni che esso può compiere; per brevità indicheremo nel seguito con si la strategia scelta dal giocatore i;
- Un insieme U di funzioni
che associano ad ogni giocatore i il guadagno (datto anche pay-off) ui derivante da una data combinazione di strategie (il guadagno di un giocatore in generale dipende infatti non solo dalla sua strategia ma anche dalle strategie scelte dagli avversari).
Un equilibrio di Nash per un dato gioco è una combinazione di strategie (che indicheremo con l'apice e)
tale che
per ogni i e per ogni strategia si scelta dal giocatore i-esimo.
Il significato di quest'ultima disuguaglianza è molto semplice: se un gioco ammette almeno un equilibrio di Nash, ogni agente ha a disposizione almeno una strategia dalla quale non ha alcun interesse ad allontanarsi se tutti gli altri giocatori hanno giocato la propria strategia . Infatti, come si può desumere direttamente dalla disuguaglianza, se il giocatore i gioca una qualunque strategia a sua disposizione diversa da , mentre tutti gli altri hanno giocato la propria strategia , può solo peggiorare il proprio guadagno o, al più, lasciarlo invariato. Se ne deduce quindi che se i giocatori raggiungono un equilibrio di Nash, nessuno può più migliorare il proprio risultato modificando solo la propria strategia, ed è quindi vincolato alle scelte degli altri. Poiché questo vale per tutti i giocatori, è evidente che se esiste un equilibrio di Nash ed è unico, esso rappresenta la soluzione del gioco, in quanto nessuno dei giocatori ha interesse a cambiare strategia.
Il contributo più importante dato da John Nash alla teoria dei giochi è la dimostrazione matematica dell'esistenza di questo equilibrio. In particolare egli ha dimostrato che ogni gioco finito che ammetta strategie miste ammette almeno un equilibrio di Nash, dove per gioco finito si intende un gioco con un numero qualunque ma finito di giocatori e di strategie, e per strategia mista si intende un sottinsiome di strategie a ciascuna delle quali l'agente associa una data probabilità e che sceglierà secondo quest'ultima. Poiché la maggior parte dei giochi soddisfano queste condizioni, è praticamente sempre possibile prevedere il comportamento dei giocatori: essi giocheranno un equilibrio di Nash, e se esso è unico, l'esito del gioco è noto a priori.
Risolto il problema dell'esistenza, come identificare qual è (o quali sono) l'equilibrio di Nash di un gioco finito? Il procedimento è in se molto semplice, ma per giochi con un elevato numero di giocatori e strategie può diventare un problema matematico tutt'altro che banale. L'ipotesi che sta alla base della ricerca dell'equilibrio e, più in generale, della teoria dei giochi, è l'assioma di razionalità di Peano; senza dilungarci su tale assioma, diremo brevemente che un agente razionale non sceglierà mai una strategia che sa essere dominata . Se esistono quindi, per un dato giocatore, delle strategie pure dominate, esse vanno escluse ai fini della ricerca dell'equilibrio di Nash; conseguentemente, se esiste una strategia pura dominante, un agente razionale scelgierà indubitabilmente quest'ultima. Se non esistono invece strategie pure dominanti, e quindi non esiste una strategia che deterministicamente porti a massimizzare il proprio guadagno a prescindere dalle strategie scelte dagli avversari, allora un agente razionale, non potendo conoscere le scelte degli avversari, giocherà una strategia mista, cioè di volta in volta sceglierà tra un certo numero di proprie strategie probabilisticamente, scegliendo queste probabilità in modo tale da massimizzare il valore atteso del proprio guadagno. Tuttavia, strategie pure e miste non sono mutuamente esclusive: può accadere che pur esistendo una strategia pura dominante, sia possibile costruirne una mista che domina quella pura; questo conduce spesso alla presenza di più equilibri di Nash in un gioco.
Supponiamo per semplicità che tutti i giocatori abbiano a disposizione una sola strategia (mista o pura) dominante (come accade, ad esempio, nel semplice caso del dilemma del prigioniero): tutti i giocatori, per l'assioma di razionalità, giocheranno questa strategia; tale combinazione di strategie rappresenta l'unico equilibrio di Nash del gioco: il singolo agente, cambiando strategia, per la definizione stessa di strategia dominante, può solo peggiorare il proprio risultato. E' comunque importante precisare che se una combinazione di strategie dominanti è sempre un equilibrio di Nash, non è vero il contrario.
Per concludere, è opportuno fare una breve riflessione sul significato profondo del concetto di equilibrio di Nash. Si è visto infatti come esso rappresenti una situazione nella quale nessun agente razionale ha interesse a cambiare strategia e come sia il frutto della scelta, da parte di tutti i giocatori, della propria strategia dominante: l'equilibrio di Nash rappresennta quindi la situazione nella quale il gruppo si viene a trovare se ogni componente del gruppo fa ciò che è meglio per se, cioè mira a massimizzare il proprio profitto a prescindere dalle scelte degli avversari. Tuttavia, non è detto che l'equilibrio di Nash sia la soluzione migliore per tutti. Infatti, se è vero che in un equilibrio di Nash il singolo giocatore non può aumentare il proprio guadagno modificando solo la propria strategia, non è affatto detto che un gruppo di giocatori, o, al limite, tutti, non possano aumentare il proprio guadagno allontanandosi congiuntamente dall'equilibrio. E' noto infatti che l'equilibrio di Nash può non essere un ottimo di Pareto (o ottimo paretiano), e quindi possano esistere altre combinazioni di strategie che conducono a migliorare il guadagno di alcuni senza ridurre il guadagno di nessuno, o addirittura, come accade nel caso del dilemma del prigioniero, ad aumentare il guadagno di tutti. Analogamente, il risultato migliore per tutti può non essere un equilibrio. Supponiamo quindi che in un gioco esista un equilibrio di Nash ed esista anche una combinazione di strategie ottimale, che indicheremo con l'apice o, tale che
per ogni i, ma che questa tale combinazione non sia un equilibrio, come accade nel dilemma del prigioniero, o, in altre parole, che non sia una strategia dominante. In tal caso, ogni singolo agente avrà a disposizione almeno una strategia diversa da che gli permette di migliorare ulteriormente il proprio profitto modificando la sua sola strategia, vale a dire che esiste per ogni agente una tale che
- .
Conseguentemente, per l'assioma di razionalità, sarà portato a preferire una strategia diversa da . Inoltre, l'incremento di guadagno rispetto all'equilibrio di Nash derivante dalla scelta della strategia , dipende, come sempre, dal fatto che tutti abbiano scelto tale strategia, poiche in generale il guadagno di i dipende dalle scelte di tutti i giocatori; non essendo una strategia dominante, è possibile che se anche uno solo degli agenti sceglie di non giocare , gli altri subiscano una riduzione del proprio guadagno rispetto a quello che avrebbero ottenuto giocando una strategia dominante. In conclusione, ogni giocatore troverà comunque preferibile non rischiare e giocare la propria strategia dominante, e la soluzione del gioco resterà comunque l'equilibrio di Nash, anche se esso non garantisce il massimo guadagno possibile.
Non si deve tuttavia pensare che non sia possibile raggiungere una situazione nella quale tutti ottengono il miglior risultato possibile se esso non è un equilibrio (in alcuni casi coincide con e quindi il problema non si pone): ciò è possibile ma a condizione che si instauri una cooperazione tra i giocatori, vale a dire che tutti agiscano non col fine di ottenere il miglior risultato per se, ma di ottenere il miglior risultato per il gruppo, e quindi, indirettamente, ottenendo un risultato migliore anche per se (anche questo concetto è ben esemplificato nel dilemma del prigioniero). Poiche tuttavia spesso la razionalità collettiva contrasta con quella individuale, è nella maggior parte dei casi necessario un accordo vincolante tra i giocatori (e quindi una istituzione che vigili su tale accordo) ed una sanzione nei confronti di chi non lo rispetta, riducendo quindi il profitto del singolo se esso si allontana dalla combinazione di strategie che garantisce a tutti il miglior risultato, affinché nessuno trovi preferibile defezionare.
[modifica] Il "dilemma del prigioniero"
Per approfondire, vedi la voce dilemma del prigioniero. |
L'esempio tipico utilizzato per illustrare il concetto di equilibrio di Nash è il cosiddetto dilemma del prigioniero, in cui le possibili scelte per due prigionieri in celle diverse non comunicanti sono parlare (accusando l'altro) o non parlare.
- Se entrambi non parlano avranno una pena leggera;
- Se entrambi parlano, accusandosi a vicenda, avranno una pena un po' più pesante;
- Se faranno scelte diverse, quello che parla avrà la libertà e l'altro avrà una pena molto pesante.
Se entrambi conoscono queste regole e non prendono accordi, la scelta che corrisponde all'equilibrio di Nash è di parlare, per entrambi. Da questo esempio si vede che la teoria nei casi reali non è sempre la soluzione migliore (o talvolta non è sufficientemente realistica).
[modifica] Equilibrio di Nash e Ottimo di Pareto
Il dilemma del prigioniero fornisce un valido spunto per confrontare questi due concetti e per comprenderne l'applicazione in economia. Riprendendo quanto illustrato nella definizione matematica dell'equilibrio di Nash, vediamo la loro applicazione al caso del dilemma del prigioniero.
Entrambi i giocatori hanno a disposizione le stesse strategie (due) e gli stessi pay-off (2x2) che sono (indicheremo per brevità confessa con c e non confessa con n e gli anni di carcere col segno meno poiché rappresentano perdite e quindi guadagni negativi):
- Strategie:
- Pay-off:
Si deduce immediatamente che, per entrambi, la strategia dominante è confessa, infatti
e
quindi qualunque sia la scelta dell'avversario, scegliere confessa garantisce sempre un guadagno maggiore rispetto a scegliere non confessa. E' immediato riconoscere come la combinazione di strategie dominanti confessa-confessa soddisfi la disuguaglianza che definisce l'equilibrio di Nash, infatti per entrambi i giocatori
(per il secondo giocatore la disuguaglianza è soddisfatta invertendo l'ordine delle strategie). In sosntanza, posto che il secondo gicatore confessi, il primo deve scegliere anch'esso confessa, e non può aumentare il proprio guadagno cambiando solo la sua strategia: il suo pay-off nel caso non confessa-confessa è minore di quello che otterrebbe giocando l'equilibrio. confessa-confessa è inoltre l'unico equilibrio del gioco, infatti nessun'altra combinazione di strategie soddisfa la disuguaglianza.
La soluzione del gioco è quindi che entrambi confessano, ottenendo 6 anni di carcere ciascuno.
L'aspetto tuttavia più interessante del dilemma del prigioniero è il seguente: tutte le combinazioni di strategie, ad eccezione dell'equilibrio di Nash, sono ottimi paretiani. Infatti, presa una qualunque di queste combinazioni, non è possibile trovarne un'altra che comporti per almeno uno dei due giocatori una riduzione degli anni di carcere senza che aumentino quelli dell'altro. Questo concetto non è invece applicabile all'equilibrio confessa-confessa: la combinazione non confessa-non confessa porta ad una riduzione degli anni di carcere per entrambi i giocatori (un anno ciascuno invece di 6) e poiché
per ogni i, (c, c) non è una soluzione Pareto-ottimale.
L'ottimo paretiano è un concetto di grande importanza in economia: l'obbiettivo del mercato è quello di giungere sempre ad un ottimo di Pareto, cioè ad una situazione nella quale, indipendentemente dall'effettiva allocazione delle risorse, non sia possibile trovare un'altra allocazione che porti ad un incremento della ricchezza di alcuni senza sottrarre ricchezza ad altri. La ragione dell'importanza dell'ottimo di Pareto è intuitiva: se esiste una soluzione che comporta un incremento del guadagno di qualcuno senza che nessuno subisca delle perdite, vuol dire che esistono delle risorse che non sono state allocate, e che quindi verrebbero disperse. Nel caso dell'ottimo paretiano, invece, l'arricchimento di qualcuno passa necessariamente per l'impoverimento di qualcun altro. Il dilemma del prigioniero mette in luce un concetto cardine dell'economia: l'ottimo di Pareto è razionale dal punto di vista collettivo, ma non lo è affatto dal punto di vista individuale; in sostanza, non è detto che che se gli N agenti di un gioco (e quindi, per estensione, di un mercato) agiscono secondo la razionalità individuale, cioè col solo fine di massimizzare il proprio profitto personale, essi raggiungano un ottimo di Pareto. Se non lo fanno, le loro azioni hanno comportato una dispersione di risorse.
Il confronto tra equilibrio di Nash e ottimo paretiano smentisce quindi quanto sostenuto da Adam Smith, ritenuto, fino a prima della formulazione della teoria dell'equilibrio, il "padre dell'economia moderna". Egli infatti riteneva che se ogni componente di un gruppo persegue il proprio interesse personale, non può che accrescere la ricchezza complessiva del gruppo. Oggi invece sappiamo che se ogni componente del gruppo fa ciò che è meglio per se, il risultato cui si giunge è un equilibrio di Nash ma non necessariamente un ottimo di Pareto: è quindi possibile (e, si è poi dimostrato, molto frequente) che se ogni agente fa solo il proprio interesse personale, si giunga ad un'allocazione inefficiente delle risosrse. Nel caso del dilemma del prigioniero, ciò è evidente: il valore minimo possibile di anni di carcere è 0 per il singolo e 2 per il gruppo, ma se entrambi scelgono la propria strategia dominante, ne ottengono 6.
[modifica] L'equilibrio di duopolio di Cournot e l'economia
Tale nozione di equilibrio costituisce una generalizzazione dell'equilibrio di duopolio che Antoine Augustine Cournot, matematico ed economista, descrisse già nel 1838. Grazie agli studi di Von Neumann e di Nash, e grazie ai successivi apporti di altri matematici, il campo di applicazione della teoria si è esteso notevolmente, mantenendo, però, una vitale importanza per l'economia. È evidente che quando in "gioco" sono i fenomeni economici o il mercato finanziario, la possibilità o la certezza che vi siano delle scelte di equilibrio assume un'importanza cruciale per chi deve prendere decisioni.
La formulazione delle teorie di John Nash portò un radicale cambiamento in questo campo, rivoluzionando l'approccio sino ad allora basato sulle teorie di Adam Smith, considerato fino a quell'epoca "padre dell'economia moderna", definizione formulata anche all'interno del film A Beautiful Mind, diretto da Ron Howard e dedicato alla singolare vita di Nash, da alcuni studenti, prima, però che quest'ultimo dimostrasse le sue teorie.
Secondo Adam Smith, un gruppo ottiene il massimo risultato quando ogni componente del gruppo fa ciò che è meglio per sé stesso: "l'ambizione individuale serve al bene comune", e di conseguenza "il risultato migliore si ottiene quando ogni componente del gruppo fa ciò che è meglio per sé". L'intuizione di Nash, lo porterà a formulare un risultato più completo: "il risultato migliore si ottiene quando ogni componente del gruppo fa ciò che è meglio per sé e per il gruppo, secondo la teoria delle dinamiche dominanti".
[modifica] Voci correlate
[modifica] Collegamenti esterni
- Nash, Berge, Kakutani dimostrazione del teorema di esistenza dell'equilibrio di Nash e preliminari (file pdf, 12 pag.)