Théorie des jeux: un aperçu | Microéconomie

Nous discuterons ici brièvement de la manière dont la théorie des jeux peut être utilisée pour étudier le comportement économique sur les marchés oligopolistiques.

La matrice de gains d'un jeu:

Une interaction stratégique peut impliquer de nombreux joueurs et de nombreuses stratégies, mais nous ne considérerons ici que les jeux à deux personnes avec un nombre fini de stratégies. Cela nous permettra de présenter facilement le jeu dans une matrice de gains.

Nous pouvons prendre l'aide d'un exemple spécifique pour comprendre le sujet. Supposons que deux personnes jouent à un jeu simple. La personne A n'a que deux stratégies disponibles et la personne B en a aussi deux. Le nombre total de résultats possibles est donc 2 x 2 = 4.

Pour chaque résultat possible, il y a un gain correspondant pour chaque joueur. Le tableau 14.1 est la matrice de gains du jeu. Dans ce tableau, les gains pour deux joueurs sont donnés en combinaisons.

La première entrée de chaque combinaison représente le gain pour le joueur A et la seconde entrée donne le gain au joueur B. Par exemple, si les deux joueurs adoptent leurs premières stratégies respectives, la combinaison de gains sera (1, 2). De même, si A adopte la stratégie 1 et B adopte la stratégie 2, la combinaison de gains sera alors (0, 1).

Voyons maintenant quelle sera l'issue de ce type de jeu. Ce jeu a bien sûr une solution très simple. Du point de vue de A, il est toujours préférable qu’il adopte sa stratégie 2, car les gains de ce choix (2 ou 1) sont toujours supérieurs aux gains correspondants (1 ou 0) de la stratégie 1.

De même, il est toujours préférable que B adopte sa stratégie 1, car ses gains de ce choix (2 ou 1) sont toujours supérieurs aux gains correspondants (1 ou 0) de la stratégie 2. Nous nous attendrions donc à ce que l'équilibre stratégie pour A est sa stratégie 2 et que pour B est sa stratégie 1, et donc, la combinaison de gains d'équilibre serait ici (2, 1).

Nous avons une stratégie dominante, c’est-à-dire un choix de stratégie optimal pour chaque joueur, indépendamment de ce que fait l’autre joueur. La matrice de gains du tableau 14.1 montre que quel que soit le choix de stratégie choisi par B, A obtiendra un gain plus élevé s’il joue la stratégie 2; il est donc logique que A adopte la stratégie 2.

D’autre part, quel que soit le choix que fait A, B aura un gain plus élevé s’il adopte sa stratégie 1. C’est donc ici que ces choix de stratégie, c’est-à-dire que la stratégie 2 pour A et la stratégie 1 pour B dominent les choix alternatifs un équilibre dans les stratégies dominantes.

Dans cet exemple, on pourrait donc s'attendre à un résultat d'équilibre dans lequel A joue sa stratégie 2 en recevant un gain d'équilibre de 2, et B joue sa stratégie 1 en recevant un gain d'équilibre de 1.

L'équilibre de Nash :

Le jeu est plutôt facile à gérer si nous avons une stratégie dominante pour chaque joueur, ce qui, cependant, peut ne pas toujours être le cas. Par exemple, le jeu donné dans le tableau 14.2 n’a pas de stratégie dominante. Ici, lorsque B adopte sa stratégie 1, A obtient un gain de 2 (de la stratégie 1) ou 0 (de la stratégie 2), et lorsque B choisit la stratégie 2, le gain pour A est 0 (de la stratégie 1) ou 1 (de stratégie 2).

Ainsi, ici, lorsque B adoptera la stratégie 1, A jouera également sa stratégie 1; par contre, lorsque B joue sa stratégie 2, A changerait sa stratégie de 1 à 2. Ainsi, le choix optimal de A dépend de ce qu'il pense que B va faire. En d'autres termes, il n'y a pas de stratégie dominante pour A dans ce cas. B n’a pas non plus de stratégie dominante ici.

Comme nous le voyons dans la matrice de gains, lorsque A choisit la stratégie 1, B choisira sa stratégie 1 et lorsque A choisira la stratégie 2, B changera de stratégie 1 à stratégie 2. C’est-à-dire que B n’a pas non plus de stratégie dominante ici. . Son choix optimal dépendrait de ce qu'il pense que A fera.

Par conséquent, cet équilibre stratégique dominant, bien que facile à atteindre, ne se produit pas toujours. Car cela demande trop. Cela exige qu'une stratégie particulière de A (ou B) soit optimale pour tous les choix de la stratégie de B (ou de la stratégie de A).

Cependant, au lieu d'exiger autant, nous pouvons simplement exiger que le choix de A soit optimal pour les choix (optimaux) de B. Bien entendu, ce qui est optimal pour B dépendra à nouveau du choix de A. Nous en arrivons au concept de ce que l’on appelle l’équilibre de Nash.

Nous dirons qu'une paire de stratégies forme un équilibre de Nash (nommé d'après le mathématicien américain John Nash) si le choix de A est optimal, compte tenu du choix de B, et si celui-ci est optimal, compte tenu du choix de A, ) ne sait pas ce que le joueur B (ou A) fera quand il devra faire son propre choix de stratégie. Mais chaque personne peut avoir certaines attentes quant au choix de l'autre personne. En tant que tel, un équilibre de Nash peut être attendu comme une paire d’attentes concernant le choix de chaque personne, de sorte qu’aucun d’eux ne souhaite changer de comportement lorsque le choix de l’autre personne est révélé.]

Dans le cas du tableau 14.2, la combinaison de la stratégie 1 de A et de la stratégie 1 de B correspond à un équilibre de Nash. Pour le prouver, notons que si A choisit sa stratégie 1, la meilleure chose à faire pour B est de choisir également sa stratégie 1 car son gain serait alors de 1, alors que pour la stratégie 2, son gain serait de 0.

Encore une fois, si B choisit sa stratégie 1, la meilleure chose à faire pour A est de choisir sa stratégie 1, car son gain serait alors de 2, alors que pour la stratégie 2, son gain serait de 0.

C'est-à-dire que nous avons obtenu que si A choisit sa stratégie 1, le choix optimal pour B serait de choisir la stratégie 1, et si B choisit la stratégie 1, le choix optimal pour A serait alors de choisir sa stratégie 1. Donc, ici, nous avons un équilibre de Nash. Chaque personne fait le choix optimal compte tenu du choix de l'autre personne.

D'après la définition de l'équilibre de Nash, il est évident que l'équilibre de Cournot sous oligopole est un cas particulier de l'équilibre de Nash. Dans l’équilibre de Cournot, les choix portent sur les niveaux de production des deux entreprises duopoles.

Chaque entreprise choisit son niveau de production en prenant le choix de l’autre entreprise comme étant fixe. Ici, le choix du niveau de production de chaque entreprise est le choix de sa stratégie et le montant des bénéfices obtenus par chaque entreprise est son gain. Dans le modèle de Cournot, chaque entreprise est supposée faire le mieux pour elle-même, en supposant que l'autre entreprise continuera à produire le niveau de production, c'est-à-dire qu'elle continuera à jouer la stratégie qu'elle s'est choisie.

Un équilibre de Cournot est obtenu lorsque chaque entreprise maximise ses profits compte tenu du comportement de l'autre entreprise. C'est précisément la définition de l'équilibre de Nash.

Cependant, l'équilibre de Nash a aussi ses problèmes. Premièrement, une partie peut avoir plus d’un équilibre de Nash. Par exemple, dans le tableau 14.2, la combinaison de la stratégie 2 du joueur A et de la stratégie 2 du joueur B nous donne également un équilibre de Nash. Nous pouvons vérifier cela à l'aide du type d'argument présenté ci-dessus ou simplement noter que la structure du jeu est symétrique.

Le deuxième problème avec le concept d’équilibre de Nash est qu’il existe des jeux qui n’ont pas du tout l’équilibre de ce que nous avons décrit. Par exemple, considérons le jeu donné dans le tableau 14.3. Ici, l'équilibre de Nash n'existe pas.

Car ici, si le joueur A joue sa stratégie 1, alors le joueur B jouera aussi sa stratégie 1. Mais si le joueur B joue la stratégie 1, le joueur A voudra jouer la stratégie 2 (et non la stratégie 1). De nouveau, si le joueur A joue la stratégie 2, le joueur B voudra jouer sa stratégie 2 (pas la stratégie 1). Mais si le joueur B joue la stratégie 2, le joueur A décidera de jouer la stratégie 1 (pas la stratégie 2). Par conséquent, ici l'équilibre de Nash ne se produit jamais.

Stratégies mixtes:

Jusqu'ici, nous supposons que chaque joueur choisit une stratégie une fois pour toutes. C'est-à-dire que chaque joueur s'en tient au choix de la stratégie une fois faite. Cela s'appelle une stratégie pure.

Cependant, nous pouvons également permettre aux joueurs de jouer leur choix au hasard en fonction de certaines probabilités assignées. Par exemple, on peut supposer que le joueur A joue sa stratégie 1 fois dans 50% des cas et la stratégie 2, 50% du temps, tandis que B joue sa stratégie 1, 50% des fois et la stratégie 2, 50 pour cent du temps. Ce type de stratégie s'appelle une stratégie mixte.

Si A et B suivent les stratégies mixtes données ci-dessus pour jouer chacun de leurs choix la moitié du temps, alors nous avons:

Le dilemme du prisonnier

L'équilibre de Nash dans un jeu présente un problème: il ne conduit pas nécessairement à des résultats Pareto-efficaces. Considérons, par exemple, le jeu donné dans le tableau 14.4. Ce jeu est connu sous le nom de dilemme du prisonnier.

Dans ce jeu, nous considérons une situation dans laquelle deux prisonniers qui étaient partenaires d'un crime ont été interrogés séparément. Chaque prisonnier avait deux options: avouer le crime et impliquer ainsi l’autre ou nier avoir joué un rôle dans le crime.

Les avantages du jeu sont les suivants: si un seul prisonnier avouait, il serait libéré, et l'autre prisonnier serait réservé et envoyé en prison pour six mois. Si les deux prisonniers nient avoir joué un rôle dans le crime, ils seraient tous les deux détenus pendant un mois pour des motifs techniques et, s'ils l'avouaient, ils seraient tous deux détenus pendant trois mois.

Par souci de simplicité, les gains sont quantifiés en plaçant un signe négatif devant les différentes peines de prison mentionnées ci-dessus et, en conséquence, le tableau des gains est présenté dans le tableau 14.4.

Un examen de cette matrice nous donne: Si le prisonnier B utilise sa stratégie 2 (refus), alors le prisonnier A serait certainement mieux s'il utilisait sa stratégie 1 (avouer), car il serait alors libéré.

De même, si le prisonnier B utilise la stratégie 1 (avouer), le prisonnier A s'en porterait mieux s'il utilisait également sa stratégie 1 (avouer), car s'il le fait autrement, c'est-à-dire qu'il utilise sa stratégie 2 (refuser), il obtiendrait alors: une peine de 6 mois. Ainsi, quoi que fasse le prisonnier B, le prisonnier A s'en sort mieux s'il utilise sa stratégie 1 (avouer).

La même chose est obtenue pour le prisonnier B également, c’est-à-dire qu’il vaut mieux utiliser sa stratégie 1 (avouer) quoi que fasse le prisonnier A. Ainsi, dans ce jeu, l’équilibre de Nash unique se produirait lorsque les deux prisonniers décideraient d’utiliser leur stratégie 1, c’est-à-dire lorsque les deux décideraient d’avouer, parce que si le prisonnier A choisit la stratégie 1, alors B optimisera en choisissant sa stratégie 1 et si le prisonnier B choisit sa stratégie 1, alors A optimiserait en utilisant sa stratégie 1.

On remarquera également que l’équilibre présenté dans le tableau 14.4 n’est pas seulement un équilibre de Nash, mais qu’il s’agit également d’un équilibre stratégique dominant. Car ici, pour chaque prisonnier, sa stratégie 1 (avouer) est une stratégie dominante.

Cependant, nous avons noté au tout début de cette section que la solution d’équilibre de Nash n’était pas nécessairement efficace de Pareto. Par exemple, dans le jeu présenté dans le tableau 14.4, la combinaison d’équilibre de Nash (avouer, avouer) des deux détenus est inefficace, car s’ils adoptent leur deuxième stratégie respective, c’est-à-dire s'ils choisissent la combinaison (nier, nier)., alors les deux auraient plus de retombées. La combinaison de gains serait maintenant (-1, -1) alors que la combinaison de gains d’équilibre de Nash était (-3, -3).

Dilemme du prisonnier et instabilité du cartel :

Le dilemme du prisonnier peut être utilisé pour illustrer un large éventail de phénomènes économiques. L'un de ces domaines est l'instabilité des cartels. Si les membres d'une entente respectent leurs quotas respectifs, la stabilité de l'entente ne présente aucun danger. Mais si l’un ou les deux produisent plus que le quota de production alloué, le cartel est confronté à une grave instabilité et il tombe en panne.

Nous pouvons illustrer l’instabilité des cartels si, dans le jeu du dilemme du prisonnier, nous remplaçons les stratégies de «avouer» et de «nier», respectivement, par «produire plus que le quota» et «s'en tenir au quota initial» et d'assumer les gains correspondants. les combinaisons sont celles indiquées dans le tableau 4.5.

À l'instar du dilemme du prisonnier illustré au tableau 14.4, le tableau 14.5 illustre le dilemme des deux sociétés membres de l'entente. Ici, chaque duopoliste a deux stratégies, à savoir, produire plus que le quota alloué et s’en tenir au quota alloué.

Voici les avantages des différentes combinaisons de stratégies: si les deux duopoleurs respectent le quota initial, c’est-à-dire s’ils respectent l’accord, chacun obtiendra un avantage de 15 [combinaison d’effets de la ligne 2, colonne 2], de l’autre Par contre, si les deux produisent plus, chacun aura un gain moindre (ici 10).

Par exemple, s’ils passent de l’équilibre du cartel à l’équilibre de Cournot, ils obtiendront tous deux un gain égal mais inférieur [combinaison des gains de la rangée 1, colonne 1].

Par contre, si l’un des duopoleurs s’en tenait au quota mais que l’autre duopoliste en produisait plus, ce dernier serait largement récompensé, mais le premier serait désavantagé [combinaison des gains de la ligne 1, colonne 2 ou ligne 2, colonne 1. ].

En d’autres termes, l’instabilité des cartels découle du dilemme suivant: si un membre du cartel pense que l’autre membre respectera son quota, il le paiera alors pour produire plus que son propre quota. Mais s’il pense que l’autre société produira d’énormes quantités, il pourra le faire également.

Voyons maintenant quelle est la bonne façon de jouer au jeu dans le dilemme du prisonnier. Si le jeu n'est pas répété, s'il s'agit d'un jeu à un coup, la stratégie consistant à confesser ou à démissionner de l'entente semble raisonnable, car quoi que fasse l'autre joueur, il est préférable de l'avouer ou de le renvoyer, surtout quand il n'a aucun moyen d'influencer le comportement de l'autre personne.

 

Laissez Vos Commentaires