COURS DE THÉORIE DES JEUX ET DE LA DÉCISION



THÉORIE DES JEUX ET DE LA DÉCISION

1. Représentatives

1.1. Forme extensive d'un jeu

1.2. Forme extensive d'une décision

1.3. Forme normale d'un jeu

1.3.1. Jeux répétitifs

1.1. Forme ensembliste d'un jeu

1.2. Forme graphique d'un jeu

2. Jeux coopératifs et non-coopératifs

2.1. Optimum de Pareto

2.2. Equilibre de Nash

2.3. Utilité espérée

2.3.1. Critère d'Hurwitz

2.3.2. Critère de Laplace

3. Jeux évolutionnaires

4. Equilibre de Cournot

5. Chaîne de Markov

La théorie de la décision et des jeux dépasse très largement le cadre étroit des jeux de sociétés, même si ces derniers ont constitué son premier objet d'étude et lui ont donné son nom dans la plupart des ouvrages disponibles dans le commerce.

Par ailleurs les deux théories sont très proches l'une de l'autre d'où le fait qu'elle soient très souvent non différenciées dans la littérature.

Définition:

D1. La "théorie des jeux" est l'étude des modèles de prise de décisions en avenir incertain non probabilisables.

D2. La "théorie de la décision" (appelée aussi parfois "analyse décisionnelle") est l'étude des modèles de prise de décisions en avenir incertain probabilisables (objectivement ou subjectivement).

Chacune des méthodes d'analyse de ces deux théories se fait principalement sous forme tabulaire (tableau) ou sous la forme d'une arbre vertical ou horizontal.

Voici un schéma assez connu par les coordinateurs de projets qui résume assez bien la situation globale:

equation

Ces outils ont pour objectif de tenter de formaliser comment décider que telle configuration ou décision est meilleure qu'une autre? Nous chercherons pour cela à trouver l'optimum de certains paramètres qui permettent de quantifier la qualité stratégique d'une situation. Il faut également déterminer quelles conditions conduisent à une configuration qui est jugée optimale.

La théorie des jeux et de la décision est aujourd'hui assez répandue et utilisée dans les milieux universitaires, non seulement en économie (finance d'entreprise particulièrement), mais également par toute une classe d'autres sciences dans lesquelles l'étude des situations de confits est pertinente : sociologie, biologie, évolution, informatique (jeux vidéos), marketing...

Remarque: Dans le monde de l'industrie les techniques de décisions sont inconnues de la quasi-totalité des dirigeants dont les choix sont souvent plus qualitatifs, instinctifs que scientifiques...

Nous tenterons, commme toujours sur ce site, de minimiser au mieux le nombre de définitions et concepts afin de ne pas noyer la rigueur de l'analyse mathématique sous le chaos d'un vocabulaire inutile et non nécessaire à une telle analyse (et dans le cadre de la théorie de jeux c'est un peu comme dans la théorie des graphes vraiment le cauchemard!).

Définition: Un "jeu" est une situation où des joueurs sont conduits à faire des choix stratégiques parmi un certain nombre d'actions possibles, et dans un cadre défini à l'avance qui seront les "règles du jeu", le résultat de ces choix constituant une "issue du jeu", à laquelle est associé un "gain" (ou payement), positif ou négatif, pour chacun des participants.

Remarque: Un joueur peut être une personne, un groupe de personnes, une société, une région, un parti politique, un pays ou la Nature.

Postulats (nous les retrouverons en économétrie) :

P1. Le marché est régi par la compétition et la coopération....

P2. Les comportements des agents économiques sont rationnels (...)

P3. Il est possible de formaliser les comportements compétitifs

P4. Toutes les phénomènes compétitifs ont une dimensions utilitaire

Nous différencions et définissons quatre types de situations (que nous formaliserons plus loin) :

D1. Les "jeux coopératifs et non coopératifs" : un jeu est dit coopératif lorsque les joueurs peuvent communiquer librement entre eux et passer des accords (par ex. sous forme d'un contrat). Ils forment alors une coalition et recherchent l'intérêt général suivi d'un partage des gains entre tous les joueurs. Dans un jeu non coopératif, les joueurs (qui ne communiquent pas ou ne peuvent pas communiquer entre eux) agissent selon le principe de rationalité économique : chacun cherche à prendre les meilleurs décisions pour lui-même (c'est à dire cherche à maximiser égoïstement ses gains individuels). Ce dernier type de jeu fait intervenir les probabilités.

D2. Les "jeux à somme nulle et non nulle" : un jeu est dit à "somme nulle" lorsque la somme des gains des joueurs est constante (ou par le choix subtile d'une fonction utilité peut l'être...) ou autrement dit : ce que l'un gagne est nécessairement perdu par un autre (échecs, poker…). Les jeux de société sont souvent des jeux à somme nulle mais les situations réelles sont souvent mieux décrites par les jeux non coopératifs à somme non nulle car certaines issues sont profitables pour tous, ou dommageables pour tous (vie politique, situations d'affaires…).

Remarques:

R1. Certains théoriciens critiquent les jeux à somme nulle, au moins en vue des situations économiques, au motif qu'un échange économique est en principe mutuellement avantageux et que les jeux à somme nulle seraient totalement irréalistes.

R2. Les jeux à somme nulle sont parfois appelés "jeux antagonistes".

R3. Depuis l'invention de l'arme atomique, l'équilibre de la terreur respose sur la doctrine de dissuasion offensive. Contre les capacités réciproques à s'infliger des dégâts colossaux, les arsenaux nucléaires respectifs s'auto-annulent, dans un jeu à somme nulle, par un principe de desctruction mutuelle assurée

D3. Les "jeux avec ou sans équilibre": un jeu à somme non nulle coopératif ou non est dit avec "équilibre de Nash" s'il existe un couple de stratégies (dans le cas d'un jeu à deux joueurs) tel que aucun des joueurs n'a intérêt à changer unilatéralement de stratégie et ceci afin de s'assurer le maximum des minium (le "maximin") des gains.

D4. Les "jeux compétitifs et non compétitifs": un jeu non compétitif est à l'opposé d'un jeu compétitif tel que par définition, lorsque toute couple de stratégie (dans le cas d'un jeu à deux joueurs) est tel qu'il fait perdre ou gagner simultanément à tous les joueurs un gain donné (quand je perds quelque chose tu perds quelque chose, quand je gagne quelque chose tu gagnes aussi quelque chose).

REPRÉSENTATIVES de jeux

Il existe différentes manières de formaliser la théorie des jeux et de la décision et ce d'autant plus suivant le type de situations dont il s'agit. Ainsi, nous distinguons :

1. Les "formes extensives" qui sont des formes synoptiques (arbre, branche, feuille) utiles à une compréhension simple des stratégies possibles et où l'issue d'un jeu est assimilée à une feuille dans laquelle nous retrouvons le vecteur des gains (ou "payements") respectif des joueurs. Ce genre de représentation devient compliquée (longue à dessiner) lors de jeux répétitifs.

Lorsqu'une forme extensive fait appelé aux probabilités nous faisons alors référence à une "arbre de décision" car comme nous l'avons mentionné au début, l'intervention des probabilités est considéré à comme une théorie à part entière: la théorie de la décision.

2. Les "formes normales" qui permettent de réduire considérablement la taille et le temps de représentation graphique d'un jeu sous forme d'un tableau (matrice) de gains (ou "payements") mais qui sont inadaptés aux jeux répétitifs.

Deux sous-catégories principales peuvent en plus se distinguer (il en existe donc d'autres!):

- Les "formes normales des jeux à somme nulle" (jeux strictement compétitifs) où selon un choix adapté il est possible de simplifier la représentation de la matrice (ou "bimatrice") en demi-matrice puisque les gains sont égaux et opposés pour les joeurs pour chaque stratégie donnée.

- Les "formes normales des jeux à somme non nulle" (jeux compétitifs).

Remarque: Chaque cellule du tableau/matrice contient donc un "vecteur" dont les composantes sont les gains respectifs des joueurs. Si le jeu est à somme nulle chaque cellule ne contient qu'une seule valeur puisque ce qui est gagné par un joueur est perdu par l'autre. Nous en verrons de nombreux exemples.

3. Les "formes ensemblistes" qui ont une approche ensembliste orientée probabiliste qui va nous permettre d'étudier la dernière forme ci-dessous.

4. Les "formes graphiques" qui sont sympathiques à regarder et que nous introduirons comme approche complémentaire car faisant appel à la recherche opératonielle (cf. chapitre de Méthodes Numériques).

FORME EXTENSIVE d'un jeu

Les règles d'un jeu stratégique et les gains contingents qui y sont associés peuvent donc être représentées sous une forme extensive plus courrament nommé par les connaisseurs "arbre de Kuhn".

exempleExemple:

Nous considèrons deux firmes d'ordinateurs qui ont à faire un choix de système d'exploitation. La compatibilité entre les systèmes serait socialement préférable, mais pour des raisons liées à l'histoire des deux firmes, chacune préférerait que ce soit l'autre qui fasse l'effort de s'adapter. Si les deux firmes choisissent CAM, MBI (equation) gagne 600 M$ et Poire (equation) 200 M$. Si elles choisissent MAC, c'est Poire qui gagne 600 M$ et MBI 200 M$. S'ils ne sont pas compatibles, ils gagnent chacun 100 M$.

Remarque: Nous appelons ce type de jeu, un "jeu de coordination". Par exemple, le choix de standards de télévision ou de lecteur des Mac et PC correspondent à ce type de jeux. Chaque constructeur voudrait imposer son propre standard mais en cas de désaccord, les consommateurs pourraient refuser d'acheter le produit.

Les firmes jouent séquentiellement tel que le jeu puisse être représenté sous la forme d'un arbre de décision:

equation
  (1)

Remarques:

R1. La structure informationnelle mise en évidence fait référence à l'information dont dispose chaque joueur à chaque noeud de décision du jeu.

R2. MAC/CAM est un jeu à "information parfaite" dans le sens que les joueurs connaissent exactement l'éventail des leurs stratégies et de celles de leur adversaire et les conséquences précises de ces stratégies. Ainsi, chaque noeud de la forme extensive est visible par les joueurs (nous définirons le concept d'information parfaite de manière formelle un peu plus loin).

Une analyse plus simple de la meilleure stratégie à opter dans le cadre d'un jeu consiste à passer directement à la forme normale comme nous le verrons un peu plus loin (mais cette forme normale n'est pas adaptée pour une forme extensive d'une décision).

FORME EXTENSIVE D'UNE DÉCISION

Comme nous l'avons mentionné au début de ce chapitre, la théorie des jeux et de la décision se différencient par le fait que les données de départ du premier se trouvent dans un univers totalement déterministe alors que pour le second elles sont totalement probabilistes. Ce dernier contexte est tellement important dans l'industrie qu'il existe comme nous allons le voir de suite des logiciels spécialisés sur le marché pour gérer leur forme extensive.

exemple Exemple:

Imaginons une société informatique B en concurrence potentielle, pour une migration informatique internationale avec une autre société A (cette dernière pouvant être vue comme un ensemble de concurrents aussi!).

En simplifiant quelque peu, mais sans être toutefois hors de la réalité, considérons que deux choix sont ouverts à B: viser "cher" ou viser "bas".

Supposons que nous savons également que dans le passé B a soumis une proposition pour chaque appel d'offres de ce type, alors que le groupe A ne l'a fait que dans 60% des cas (pas de fonction de distribution de probabilité dans notre scénario!).

Nous savons également que:

- Si B soumet cher et est le seul à soumettre une proposition, le bénéfice attendu est de 22 millions.

- Si B soumet un prix élevé mais se trouve en concurrence avec le groupe A, il obtiendra le contrat selon le niveau de prix demandé par le groupe A. Dans ce cas, il sait qu'il obtiendra en moyenne 1 million.

- Si enfin B soumet à un prix bas, il est sûr d'obtenir le contrat et de réaliser un bénéfice de 10 millions.

Donc dans le cadre où le choix du projet est déterminé uniquement par son prix (au détriment de la qualité comme dans la réalité...) les questions qui se posent sont alors les suivantes:

Q1. Que doit faire B, si aucune information complémentaire ne peut être obtenue?

Ceci constitue une situation du type: "décision sans information"

Q2. À supposer qu'un espion au groupe A puisse informer B si le groupe A soumettra une offre ou non, combien vaudrait cette information pour B?

Ceci constitue une situation du type: "décision avec information parfaite"

Q3. Une société de conseil spécialisée peut donner son avis, mais son expertise, chère, s'élève à 1 million par étude. Pour répondre à cette question, nous savons que, dans le passé, sur les 30 fois où les groupe A avait en fait soumis une proposition, la société de conseil l'avait prévu 24 fois. Et, sur les 20 fois où il n'en avait pas soumis, elle l'avait prévu 17 fois. Faut-il lui commander une étude (bon de toute façon dans la réalité ce genre d'information est quasi impossible à obtenir...)?

Ceci constitue une situation du type: "décision avec information imparfaite"

S1. Pour répondre à la première question, nous représentons tout d'abord le problème à résoudre sous une forme graphique fort logique (qui est pour l'instant assez simple à mettre aussi sous forme de tableau) avec le logiciel TreeAge par exemple:

equation
  (2)

Ensuite en lançant le calcul de l'espérance à chaque branchement, TreeAge nous donne simplement:

equation
  (3)

Ainsi, la réponse à la première question est que la stratégie donnant l'espérance de gain la plus grande est la stratégie "Pas Cher" car il y a un gain espéré de 10 millions.

Avec la première décision (Cher) nous gagnerions en moyenne que:

equation   (4)

Remarque: Dans les arbres de décisions construites avec TreeAge une règle de base est d'avoir à chaque branche probabiliste la somme des probabilités qui vaut 1!

S2. Pour répondre à la deuxième question (Q2) qui est de connaître la valeur financière de l'information donné par l'espion nous devons d'abord construire l'arbre (bon l'exemple est tellement simple qu'ici ce n'est pas vraiment nécessaire mais bon...) d'une situation dite de concurrence à "information parfaite" (car l'espion peut nous fournir une information tout à fait sûre).

L'arbre est facile à construire. Si l'espion nous dit que le groupe A va faire une offre, alors nous allons devoir proposer l'offre la moins chère. Dans le cas contraire, nous allons proposer l'offre la plus chère. Le scénario est donc le suivant:

equation
  (5)

La probabilité qu'il y ait concurrence est de 60% et 40% qu'il n'y en ait pas. Donc l'espérance du gain est dans une situation à information parfaite:

equation   (6)

Donc par rapport à la meilleure situation d'avant nous avec un delta de 4.8 millions. C'est donc la valeur de l'information parfaite de l'espion.

S3. Concernant la troisième question qui consiste à déterminer la valeur de l'information imparfaite fournie par une société de conseil. La seule certitude de bon sens que nous ayons est que cette information ne peut avoir une valeur supérieure à celle de l'information parfaite: elle aura donc une valeur comprise entre 0 et  4.8 millions.

Pour commencer rappelons que  selon l'énoncé nous pensons que pour le mandat actuel il y a 60% de probabilité qu'il y ait concurrence et la société de conseil dans le passé a eu 80% du temps raison (24 fois sur 30) lorsqu'il avait dit qu'il y avait concurrence (et donc 20% des autres fois tort...).

Respectivement, nous pensons pour le mandat actuel qu'il y a 40% de probabilité qu'il y ait non concurrence (1-60%) et la société de conseil dans le passé au eu 85% du temps raison (17 fois sur 20) lorsqu'il avait dit qu'il n'y avait pas de concurrence (et donc 15% des autres fois tort...).

Ce qui se résume sous forme de tableau:

   

Prévisions

Proba.

Concurrence

Sans concurrence

Réalité

Concurrence

60%

80%

20%

Sans concurrence

40%

15%

85%

Tableau: 1  - Décision avec information imparfaite (forme initiale)

Nous aimerions maintenant:

1. Calculer la probabilité qu'il y ait réellement concurrence ET que  la société de conseil ait prévu de la concurrence.

2. Calculer la probabilité qu'il y ait réellement  pas de concurrence ET que la société de conseil ait prévu de la concurrence.

3. Calculer la probabilité qu'il y ait réellement  pas de concurrence ET que la société de conseil ait prévu pas de concurrence.

4. Calculer la probabilité qu'il y ait réellement concurrence ET que la société de conseil ait prévu pas de concurrence.

Pour  calculer ces probabilités, nous allons utiliser la formule de Bayes démontrée dans le chapitre de Probabilités. Ainsi pour rappel, les probabilités à posteriori et à priori sont données par

equation et  equation   (7)

d'où:

equation   (8)

Nous pouvons maintenant:

1. Calculer la probabilité qu'il y ait réellement concurrence ET que la société de conseil ait prévu de la concurrence. Nous avons alors en utilisant le tableau précédent:

equation   (9)

où dans cette situation A est donc l'événement "il y a eu réellement concurrence" et B est l'événement "prévision de concurrence par la société de conseil". B/A est donc l'événement "prévision de concurrence par la société de conseil sachant qu'il y a eu réellement concurrence".

2. Calculer la probabilité qu'il n'y ait réellement pas concurrence ET que la société de conseil ait prévu de la concurrence. Nous avons alors en utilisant le tableau précédent:

equation   (10)

où dans cette situation A est donc l'événement "il y a eu réellement pas de concurrence" et B est l'événement "prévision de concurrence par la société de conseil". B/A est donc l'événement "prévision de concurrence par la société de conseil sachant qu'il y a eu réellement pas de concurrence".

3. Calculer la probabilité qu'il y ait  réellement pas concurrence ET que la société de conseil ait prévu pas concurrence. Nous avons alors en utilisant le tableau précédent:

equation   (11)

où dans cette situation A est donc l'événement "il y a eu réellement pas de concurrence" et B est l'événement "prévision de pas de concurrence par la société de conseil". B/A est donc l'événement "prévision de pas concurrence par la société de conseil sachant qu'il y a eu réellement pas de concurrence".

4. Calculer la probabilité qu'il y ait  réellement concurrence ET que  la société de conseil ait prévu pas de concurrence. Nous avons alors en utilisant le tableau précédent:

equation   (12)

où dans cette situation A est donc l'événement "il y a eu réellement concurrence" et B est l'événement "prévision de pas de concurrence par la société de conseil". B/A est donc l'événement "prévision de pas concurrence par la société de conseil sachant qu'il y a eu réellement concurrence".

Nous avons alors le tableau suivant qui résume de manière utilisable les scénarios possibles pour notre P.D.M. :

Réalité/Prévisions

Concurrence

Sans concurrence

Concurrence

48%

12%

Sans concurrence

6%

34%

Total

54%

46%

Tableau: 2  - Décision avec information imparfaite (forme finale)

A l'aide de ce tableau, nous vérifions bien que la somme des 4 premières cases donne 100% (c'est-à-dire l'ensemble des éventualités).

Nous voyons donc que 54% du temps la société de conseil prévoit de la concurrence (quelque soit l'issue réelle) et 46% du temps aucune concurrence (quelque soit l'issue).

Nous avons alors l'arbre de décision suivant dans un logiciel comme TreeAge:

equation
  (13)

Ce qui donne après calculs:

equation
  (14)

Nous nous retrouvons donc avec une espérance de gain de 13 millions moins les 1 million de paiement pour la société de conseil cela fait 12 millions.

Ainsi la valeur de l'information imparfaite est de 2 millions par rapport aux 4.8 que rapporte l'information parfaite. Ce résultat est donc tout à fait logique.

Remarques:

R1. Ce type d'arbre est souvent utilisé en pharmacoéconomie (analyse des coûts). Ainsi, la racine sera une infection X dont il existe plusieurs antibiotiques (branche A/B) et dont chacun à deux issues (traîtement réussi/raté) avec deux résultats possibles (effets secondaires oui/non). Pour chaque noeud une probabilité est associée et pour les noeuds terminaux des coûts de traîtement. Ainsi, en calculant l'espérance, il est possible de déterminer le choix économique du meilleur antibiotique pour l'institut médical (évidemment c'est utile déontologiquement que lorsque le taux de succès des deux antibiotiques est proche et que le taux d'effets secondaires oui/non l'est aussi... sinon cette méthode ferait scandale!).

R2. Dans l'industrie, mes clients utilisent ces arbres avec des distribution de probabilités définies sur chaque noeud. Ils font ensuite une simulation de Monte-Carlo sur l'ensemble et font une analyse de la sensibilité (graphe Tornado) avec des suites décisionnelles comme celle de @Risk de Palisade.

FORME NORMALE d'un jeu

Pour passer à la forme normale ou encore "forme stratégique", nous définissons une stratégie comme un plan d'action complet pour chaque joueur, qui spécifie un choix pour chaque noeud de l'arbre et donc pour chaque situation pouvant survenir au cours du jeu. La "matrice des gains" représente la situation stratégique des joueurs et le gains qu'ils recevront pour chaque stratégie.

Nous reprenons l'exemple précédent MAC/CAM et obtenons:

J1 / J2

CAM

MAC

CAM

600 , 200

100 , 100

MAC

100 , 100

200 , 600

Tableau: 3  - Matrice des gains d'un jeu à somme non nulle

Il s'agit donc d'une simple forme tabulaire du jeu.

Remarques:

R1. Nous voyons dans cette matrice que les intérêts des deux entreprises ne sont pas complètement opposées, elles progressent à chaque fois dans la même direction lorsque les stratégies sont opposées (si un perd, l'autre perd aussi et inversement). Ainsi, le jeu MAC/CAM est un jeu dont les gains ne progressent pas dans des directions (stratégies) opposées. Nous parlons alors de "jeux non strictement compétitif" (nous définirons ce concept de manière formelle un peu plus loin).

R2. Nous voyons également que quelque soit la stratégie choisie par un des joueurs, chaque choix possible par l'autre joueur aménera toujours à des gains équivalents. Dès lors, nous disons qu'il que c'est un "jeu sans tactique prudente".

Définition: Une stratégie donnée est dite à "tactique prudente" (c'est le choix du numéro de la ligne pour le joueur ligne, ou le numéro de la colonne pour le joueur colonne) lorsque le gain d'un des joueurs est tel que lorsque par rapport à une stratégie choisie, l'ensemble des choix de son concurrent apporte un gain maximal à ce dernier. Le gain minimal assuré de equation est appelé le "niveau de sécurité" de equation.

exemple Exemple:

J1 / J2
b1
b2
b3
b4
a1
5 , 5
6 , 4
0 , 10
4 , 6
a2
1 , 9
7 , 3
5 , 5
6 , 4
a3
6 , 4
7 , 3
7 , 3
8 , 1
a4
4 , 6
8 , 1
0 , 10
2 , 8
a5
3 , 7
5 , 5
9 , 0
0 , 10
Tableau: 4  - Matrice des gains d'un jeu avec tactique prudente

Le joueur A peut penser que le joueur B est très perspicace, ou a beaucoup de chance, et est ainsi en mesure de choisir la meilleure réponse possible à toute tactique de A.

Ainsi :

- Si A choisit a1, B le devinant choisirait b3, et A aurait gagné 0
- Si A choisit a2, B le devinant choisirait b1, et A aurait gagné 1
- Si A choisit a3, B le devinant choisirait b1, et A aurait gagné 6
- Si A choisit a4, B le devinant choisirait b3, et A aurait gagné 0
- Si A choisit a5, B le devinant choisirait b4, et A aurait gagné 0

Le choix prudent de A est donc a3, qui lui assure de gagner au moins 6. Ce gain minimal assuré est le niveau de sécurité. En faisant de même pour B s'il redoute l'extrême perspicacité de A est b1. Cette tactique lui assure un gain de 4, qui est aussi son niveau de sécurité.

Si nous étudions le jeu MAC/CAM par sa matrice de gains, nous pouvons nous rendre compte qu'il y a deux issues remarquables où le gain des deux entreprises est maximum par rapport aux autres stratégies. Ces deux issues sont intéressantes à plus d'un titre :

Effectivement, les deux entreprises n'ont aucun regret quant à leur choix de stratégie. S'ils considèrent la stratégie de leur adversaire comme inéluctable, leur propre choix de stratégie est le meilleur possible. Nous disons que les deux issues sont des "équilibres de Nash" (nous définirons ce concept de manière formelle un peu plus loin). L'équilibre de Nash caractérise ainsi en quelque sorte la rationalité individuelle!

Remarque: Le jeux MAC/CAM comporte deux équilibres de Nash. Dès lors, nous ne sommes pas capables, sans aucune information complémentaire, de prédire quelle sera exactement la solution du jeu. Les deux résultats sont également vraisemblables.

C'est ainsi que la théorie des jeux fait apparaître la stratégie sociale la plus favorable aux deux joueurs : que les deux joueurs adoptent aux moins le même système. Quant à savoir lequel... le jeu devra dès lors être non-coopératif.

Dans l'exemple précédent aussi, la conjonction des tactiques prudentes (a3,b1) constitue un équilibre de Nash (dans le sens où chacun des joueurs n'a pas intérêt à changer unilatéralement de stratégie s'il veut préserver le gain maximum). Cela tient à une particularité de ce jeu ! En d'autres termes :

1. Il existe de nombreux jeux qui n'ont pas d'équilibre

2. Il existe de nombreux jeux qui ont des équilibres qui ne correspondent pas à la conjonction des tactique prudentes.

Remarque: Si dans un jeu, un couple d'issues est telle qu'il est impossible d'améliorer le score de l'un des deux joueurs sans diminuer le score de l'autre, nous disons que ces issues sont "pareto-optimales" ou "pareto-efficientes" (nous définirons ce concept de manière formelle un peu plus loin).

exemple Exemple:

Dans ce jeu, deux joueurs equation s'affrontent à pierre, ciseaux, papier (PCP...). La forme extensive de ce jeu est trivialement :

equation
  (15)

Pour faire apparaître la simultanéité du jeu sur la représentation, nous avons entouré les ensembles d'informations. equation sait que equation a choisi un élément, mais il ne sait pas lequel, donc il ne connaît pas le noeud exact où son propre choix va intervenir, et donc il est incapable de déterminer l'issue du jeu qui va être atteinte. Le jeu est donc a "information imparfaite".

Sous forme normale, nous avons donc:

J1 / J2

Pierre

Ciseaux

Papier

Pierre

0 , 0

1 , -1

-1 , 1

Ciseaux

-1 , 1

0 , 0

1 , -1

Papier

1 , -1

- 1 , 1

0 , 0

Tableau: 5  - Matrice des gains d'un jeu à somme nulle

Ce jeu est un jeu à somme nulle dans le sens où tout ce qui est gagné par l'un est perdu par l'autre. En d'autres termes, nous avons déjà vu que nous pouvions parler dès lors de jeux "strictement compétitifs".

Les jeux à somme nulle ont ceci de particulier en plus qu'il est toujours possible comme nous l'avons déjà mentionné de les représenter par leur demi-matrice (par rapport à un seul joueur donc) qui résume à elle seule tout le jeu puisque ce qui est gagné par ce joueur est perdu par l'autre et inversement :

J1 / J2

Pierre

Ciseaux

Papier

Pierre

0

1

-1

Ciseaux

-1

0

1

Papier

1

- 1

0

Tableau: 6  - Demi-matrice des gains d'un jeu avec tactique prudente

Au besoin, si les gains et pertes respectives du jeu n'ont pas le même "delta", il suffit de définir une fonction d'utilité adéquate pour l'autre joueur tel qu'il soit toujours possible pour n'importe quel jeu strictement compétitif où les gains ne sont pas opposés et égaux d'être mis sous la forme d'une demi-matrice. Nous démontrerons qu'il existe une telle fonction d'utilité.

Remarque: Sur la demi-matrice d'un jeu à somme nulle, il est très facile de reconnaître s'il existe un équilibre de Nash ou non. Par exemple :

2

0

1

3

Tableau: 7  - Demi-matrice sans équilibre de Nash

Dans ce jeu, la ligne 2 est la tactique prudente du joueur ligne et le joueur colonne choisira la colonne 1 comme tactique prudent dans laquelle ne se trouve pas la plus grande. Dès lors, le joueur ligne aura intrérêt à se déplacer en première ligne donc les tactiques prudentes conjointes ne sont pas un équililibre et par ailleurs, il n'y pas d'équilibre de Nash!!

Dans le duel tactique ainsi défini, l'espérance du joueur ligne est le maximum des minimums de lignes, c'est-à-dire le "maximin", tandis que l'espérance du joueur colonne est le minimum des maximums de colonnes, c'est-à-dire le "minimax".

Définitions:

D1. Le "maximin", appelé aussi parfois "critière de Wald", est un critère pessimiste. Il s'agit effectivement selon ce critère, de maximiser le résultat minimum. Pour le mettre ne oeuvre, il convient :

- Pour chaque décision (ou stratégie), de retenir le résultat le plus faible

- Parmi, les moins bons résultats, choisir le plus élevé des moins bons résultats des différentes stratégies.

Ce genre d'approche peut donc outre sous forme tabulaire être représentée sous la forme d'une arbre de décision.

D2. Le "maximax", selon la même logique que le critère précédent consiste à retenir le meilleur des résultats des différentes stratégies possibles, c'est donc un critère optimiste. Pour le mettre ne oeuvre, il convient :

- Pour chaque décisions (ou stratégie), de retenir le résultat le plus attendu le plus élevé

- Parmi, les meilleurs résultats, choisir le plus élevé des meilleurs résultats des différentes stratégies.

Ce genre d'approche peut donc outre sous forme tabulaire être représentée sous la forme d'une arbre de décision.

Si et seulement si le maximin est égal au minimax, leur valeur commune, qui est l'espérance commune aux deux adversaires, est appelée la "valeur du jeu" (nous le démontrons juste quelques lignes en-dessous), et tout couple formé par une telle tactique prudente du joueur ligne et une tactique prudente du joueur colonne défini un équilibre (pour cette raison l'exemple précédent n'a pas d'équilibre).

exempleExemple:

2

4

1
3

0

4

Tableau: 8  - Demi-matrice avec équilibre de Nash

Dans ce jeu, la ligne 1 est la meilleure tactique prudente du joueur ligne et le joueur colonne choisira la colonne 1 comme tactique prudente dans laquelle se trouvent les plus petites pertes. Dès lors, la cellule supérieure gauche correspond aux tactiques prudentes conjointes et correspond comme nous le voyons à un équilibre de Nash.

Définition: Dans un jeu à somme nulle, nous appelons "col" l'utilité (vue dans le sens du gain ou de la perte) qui est à la fois minimum dans sa ligne et maximum dans sa colonne (ce qui est le cas de l'exemple précédent où l'équilibre est un col).

Démontrons maintenant que dans tout jeu à somme nulle, si et seulement si les niveaux de sécurité des deux joueurs sont opposés (le minimax est égal au maximin), la conjonction des tactiques prudentes est toujours un équilibre.

Reprenons la définition d'un couple formé :

- d'une tactique prudente equation pour le joueur A, lui assurant de gagner au moins equation
- d'une tactique prudente equation pour le joueur B, lui assurant de gagner au moins equation

Dans le cas d'un jeu à somme nulle, nous pouvons toujours redéfinir la fonction d'utilité d'un des joueurs de manière à obtenir equation comme nous l'avons vu afin de pouvoir écrire la demi-matrice. Dès lors, observons ce qu'il ce passe (en se rappelant bien que dans un tel jeu, le gain équivaut à la perte donc par extension quand le gain est minimal pour l'un la perte est minimale pour l'autre) :

Le couple equation, comme tout couple qui contient equation, assure A de gagner au moins v et in extenso assure B de gagner au moins -v (puisque equation).

A n'a donc aucun intérêt à s'écarter unilatéralement de equation, puisque B s'est assuré de perdre au plus v dans la stratégie de A. De même, B n'a aucun intérêt à s'écarter unilatéralement de la tactique equation, puisque A s'est assuré de gagner au moins v.

Par conséquent, dans le cas où les niveaux de sécurité des deux joueurs sont égaux et opposés, la conjonction des tactiques prudentes est un équilibre.

Nous avons déjà vu précédemment un exemple dans lequel les niveaux n'étaient pas exactement opposés.

JEUX RÉPÉTITIFS

Supposons qu'un homme equation et une femme equation aillent au cinéma, Une fois sur place, ils doivent choisir entre aller voir un documentaire ou une comédie. L'un des deux préfère les documentaires et l'autre les comédies, mais tous deux préfèrent voir un film ensemble que séparément : c'est... la guerre des sexes (GDS...)

Les stratégies disponibles pour chacun des deux joueurs, en considérant qu'ils font leur choix simultanément (ce qui est peu vraisemblable dans un cas réel, la galanterie obligeant à désynchroniser le jeu profit de la femme :-) ), sont alors :

- Aller voir un documentaire, ce que nous noterons Doc

- Aller voir une comédie, ce que nous noterons Com

La matrice des gains sera alors :

J1 / J2

Doc

Com

Doc

2 , 3

1, 1

Com

1 , 1

3 , 2

Tableau: 9  - Matrice pour jeu répétitif

D'abord, nous pouvons remarquer que GDS n'est pas un jeu strictement compétitif (donc inutile d'essayer de le représenter sous la forme d'une demi-matrice) et qu'il s'aigt d'un jeu de coordination. Deuxièmement, nous remarquons que les deux issues à gain maximum sont des équilibres de Nash (nous ne pouvons donc prédirie l'issue du jeu).

Ce jeu à cependant de particulier par rapport aux précédent au fait qu'il est un jeu à une seule étape. Supposons ainsi maintenant que le couple retourne au cinéma la semaine suivante, et qu'il doive à nouveau faire ce choix. Nous pouvons de nouveau représenter cette situation par un jeu, qui nn'est en fait que la répétition de GDS, notons le GDS2.

GDS2 a deux étapes. Si nous considérons que lors de la deuxième étape chacun des deux joueurs sait ce que l'autre a choisi lors de la première étape, les stratégies disponibles sont maintenant des stratégies conditionnelles : elle peuvent tenir compte des coups joués par l'adversaire lors des étapes précédentes.

La description de ces stratégies suit le schéma suivant : nous jouons equation au premier coup, puis si l'autre a choisi le documentaire lors de la première sortie, alors nous jouons equation, sinon equation, avec equation prenant leur valeur dans l'ensemble equation. Nous noterons cette stratégie :

equation   (16)

Nous pouvons lire cette notation de la manière suivante : nous jouons equation, puis si nous nous retrouvons en equation alors nous jouons equation, et si nous nous retrouvons en equation alors nous jouons equation. Dans le cas GDS2, nous avons donc 8 stratégies :

1. equation : nous choisissons toujours le documentaire :

2. equation : nous choisissons toujours le documentaire, sauf si la première fois nous nous sommes retrouvé(e)s seul(e)s

3. equation : nous choisissons toujours le documentaire, sauf si la première fois nous avons tous les deux choisi le documentaire

4. equation : la première fois nous choisissons le documentaire et la seconde la comédie.

5. equation : la première fois nous choisissons la comédie et la seconde le documentaire

6. equation : nous choisissons toujours la comédie, sauf si la première fois nous nous sommes retrouvé(s) seul(e)s.

7. equation : nous choisissons la comédie sauf si la première fois nous avons tous les deux choisi la comédie.

8. equation : nous choisissons toujours la comédie.

Pour chaque issue de GDS2, les vecteurs d'utilité sont déterminés en effectuant la somme des vecteurs obtenus pour chacune des étapes considérées comme des issues de GDS. Nous dirons que GDS2 est un "superjeu" dont GDS est le "jeu constitutif".

Définition: Un "équilibre parfait en sous-jeux" correspond à une combinaison stratégique dont les actions choisies pour chaque sous-jeux sont des équilibres de Nash.

Remarque: Un "sous-jeu" est simplement un sous-arbre de l'arbre de jeu.

Voyons maintenant tous ces concepts de manière ensembliste (accrochez-vous un peu ;-) )


page suivante : 1.1. Forme ensembliste d'un jeu