Quelle est la relation entre le dilemme du prisonnier et l’équilibre de Nash ?
Introduction
Le dilemme du prisonnier est un problème de théorie des jeux qui met en évidence les difficultés de la coordination entre deux joueurs lorsqu’ils ont des intérêts en conflit. L’équilibre de Nash est un concept clé de la théorie des jeux, qui permet de caractériser les situations où les joueurs ont des stratégies protégeant leur intérêt et où aucun joueur ne peut améliorer son gain en unilatéralement en changeant de stratégie. Dans cet article, nous verrons comment le dilemme du prisonnier est lié à l’équilibre de Nash.
Le dilemme du prisonnier : un résumé
Le dilemme du prisonnier est souvent considéré comme un exemple classique de la théorie des jeux. Dans ce dilemme, deux joueurs doivent décider s’ils coopèrent ou s’ils trahissent l’autre joueur. Si les deux joueurs coopèrent, ils obtiennent tous deux un gain modéré. Si les deux joueurs trahissent l’un l’autre, ils obtiennent tous deux un gain faible. Cependant, si un joueur trahit et que l’autre coopère, le joueur qui trahit obtient un gain élevé et l’autre joueur un gain nul. Ainsi, chaque joueur a un intérêt égoïste à trahir, mais les deux joueurs ont collectivement un intérêt à coopérer.
L’équilibre de Nash : un résumé
L’équilibre de Nash est un concept clé de la théorie des jeux. Il caractérise les situations où les joueurs ont des stratégies protégeant leur intérêt et où aucun joueur ne peut améliorer son gain en unilatéralement en changeant de stratégie. Dans un équilibre de Nash, chaque joueur joue la meilleure réponse à la stratégie des autres joueurs. Il peut y avoir plusieurs équilibres de Nash dans une situation de jeu donnée.
La relation entre le dilemme du prisonnier et l’équilibre de Nash
Le dilemme du prisonnier ne peut pas avoir un équilibre de Nash qui soit Pareto-optimal – c’est-à-dire une situation où les gains des deux joueurs sont maximisés. Le seul équilibre de Nash dans le dilemme du prisonnier est celui où les deux joueurs trahissent l’un l’autre, ce qui conduit à un résultat sous-optimal pour les deux joueurs. Cet équilibre de Nash est appelé « équilibre non coopératif ». C’est un équilibre instable, car chaque joueur a une incitation à changer de stratégie unilatéralement.
Cependant, si les deux joueurs peuvent communiquer entre eux et s’engager mutuellement à coopérer, un nouvel équilibre de Nash peut se produire. Dans cet équilibre, les deux joueurs coopèrent et atteignent un résultat Pareto-optimal. Cet équilibre de Nash coopératif est stable, car chaque joueur a une incitation à respecter son engagement mutuel.
Comment l’équilibre de Nash est-il obtenu ?
Pour atteindre cet équilibre coopératif, les joueurs ont besoin d’une stratégie qui leur permet de coopérer et de vérifier que l’autre joueur coopère également. Cette stratégie est appelée « stratégie de tit-for-tat ». Elle consiste à coopérer au premier tour et à répéter le dernier mouvement de l’adversaire pour les tours suivants. Cela signifie que si l’adversaire coopère, le joueur coopérera également à chaque tour, mais s’il trahit, le joueur trahira également à chaque tour suivant.
En utilisant cette stratégie, les joueurs peuvent construire une confiance mutuelle et atteindre l’équilibre de Nash coopératif, où les deux joueurs coopèrent et obtiennent un résultat Pareto-optimal.
Reprenons
Le dilemme du prisonnier et l’équilibre de Nash sont deux concepts clés de la théorie des jeux. Le dilemme du prisonnier montre les difficultés de coordination entre deux joueurs ayant des intérêts en conflit. L’équilibre de Nash, quant à lui, caractérise les situations où les joueurs ont des stratégies protégeant leur intérêt et où aucun joueur ne peut améliorer son gain en unilatéralement en changeant de stratégie. Dans le dilemme du prisonnier, l’équilibre de Nash non coopératif conduit à un résultat sous-optimal pour les deux joueurs, tandis que l’équilibre de Nash coopératif permet d’atteindre un résultat Pareto-optimal si les joueurs peuvent communiquer et s’engager mutuellement à coopérer.