Coopération entre agents au sein d’une population hétérogène
1- Principe général
Le système multi-agents mis en place par les auteurs [1] cherche à modéliser l’évolution d’une population constituée d’agents hétérogènes. Ces agents sont répartis en différents groupes, et devront coopérer pour survivre. Ils seront caractérisés par l’une de ces trois attitudes : les « Surveillants » travaillent et punissent ceux qui évitent le travail ; les « Coopérateurs » travaillent et ne punissent pas les tire-au-flanc ; et les « Egoïstes » évitent le travail si ça n’est pas trop risqué.
Le modèle reflète les conditions empiriques suivantes :
Les groupes sont suffisamment petits, afin que tous les membres puissent interagir directement, mais suffisamment grands afin qu’il soit possible d’éviter le travail en profitant du travail du groupe.
Il n’y a pas de structure centralisée de gouvernance, le respect des lois dépend donc uniquement des membres du groupe.
Les différences de statut sont limitées, ce qui justifie le traitement des agents comme homogènes mis à part le type de comportement et le groupe auquel ils appartiennent.
Les individus du modèle ne conservent pas de ressources.
La forme de punition est le bannissement, et le coût d’être banni dépend de l’importance de la punition et des paramètres démographiques du modèle.
Les différences de comportement sont une caractéristique émergente du modèle, ce qui correspond à la réalité dans des sociétés de chasseurs-cueilleurs et des les sociétés de consommation modernes.
Les agents dans la simulation peuvent vivre et travailler seuls, mais dans ce cas chacun de ces agents a un niveau de santé (« fitness ») < 0. Les agents peuvent également coopérer au sein d’un groupe, chacun produisant un montant b à un prix c. Le bénéfice étant réparti équitablement entre chacun des membres du groupe, si tous les membres travaillent alors chaque agent augmente son niveau de santé de b-c (>0).
La simulation évolue génération après génération. A chaque génération, les parents transmettent leur comportement à leurs enfants avec une probabilité de 1-ε, l’enfant ayant donc une probabilité de ε/2 de choisir chacun des deux autres comportements. Toujours avec une probabilité de 1-ε, les agents égoïstes héritent de leurs parents l’estimation du coût du bannissement ; ils reçoivent dont une nouvelle estimation de ce coût avec une probabilité de ε.
Les agents égoïstes évitent le travail avec une certaine probabilité, et cette absence de ressources pèse sur l’ensemble du groupe puisque les revenus sont répartis équitablement. Ils doivent cependant faire attention à minimiser le risque d’être bannis, en prenant en compte le nombre de « Surveillants » au sein du groupe et le coût du bannissement. S’il n’y a aucun surveillant dans le groupe, l’ensemble des agents égoïstes évitera donc le travail.
Punir un tire-au-flanc coûte autant à un surveillant que la perte de ce qu’il aurait dû obtenir au temps courant : s’il avait dû gagner x en temps normal, le fait de punir un égoïste lui coûtera x.
A la fin de chaque période, les agents bannis rejoignent un groupe d’individus solitaires. Ils pourront retourner au sein d’un nouveau groupe grâce aux migrations qui ont lieu à chaque période. Les candidats à l’immigration sont ces individus, ainsi qu’une fraction d’individus qui souhaitent changer de groupe (on modélise ainsi les volontés de déplacement afin de trouver un partenaire, ou de mettre fin à une dispute avec un voisin).
Le nombre total d’individus au sein de la population est fixé. Le nombre d’individus par groupe est fixé au départ, mais il évolue au cours du temps. Si un cours atteint un trop petit nombre de membres, il est dissous et remplacé par un nouveau groupe construit à partir des candidats à l’immigration.
2- Evolution de la simulation
La simulation commence avec 20 groupes de 20 agents. Tous les agents sont initialisés en tant qu’agents égoïstes, avec un risque de bannissement choisi au hasard sur une distribution uniforme [0, 1]. Ils vont éviter de travailler avec une probabilité calculée à partir de ce risque de bannissement.
Le taux d’immigration dans les groupes est fixé à 3% par période, et le taux d’émigration est fixé à 5% : à chaque période, il y a donc plus de candidats à la migration que de places dans les groupes.
L’ensemble des paramètres fixés est récapitulé dans le tableau suivant :
Sur la base de ces paramètres, le graphe suivant montre l’évolution du type des agents et le taux moyen d’évitement du travail :
Pour illustrer la dynamique d’un groupe unique, voici l’évolution de ses constituants depuis le moment où le groupe est formé jusqu’au moment où il est dissous :
Le groupe est constitué au temps 320 (après dissolution d’un groupe précédent). Il commence avec une proportion globalement égale des trois types d’agents, mais les agents égoïstes sont vite bannis par les surveillants, et remplacés par des coopérateurs. A partir du temps 330, les coopérateurs commencent à remplacer les surveillants, devenus inutiles par manque d’agents égoïstes à surveiller, et ce jusqu’à la période 345, où le groupe est surtout constitués de coopérateurs et de quelques égoïstes. Le nombre de surveillants étant très bas, le risque devient très faible pour les tire-au-flanc, le pourcentage d’évitement du travail augmente donc considérablement. Les égoïstes augmentent ainsi rapidement en proportion, remplaçant petit à petit les coopérateurs. A ce point, le niveau de santé du groupe est bas : à moins d’une immigration de surveillants, le groupe est condamné. On constate effectivement l’effondrement de la taille du groupe. Vers la fin, l’entrée d’un surveillant fait baisser légèrement le taux d’évitement du travail, mais pour augmenter le niveau de santé du groupe, il doit bannir des agents égoïstes, ce qui conduit au démantèlement du groupe faute de membres.
|
|
|
|
|
|
|
|
|
Le processus de mutation programmé est suffisant pour l’émergence d’un haut niveau de coopération entre les agents en un temps relativement court : 500 périodes suffisent. Cette coopération apparaît parce qu’avec un tel taux de mutation, il faut attendre peu de temps avant qu’un groupe ait assez de surveillants pour obliger à un haut niveau de coopération. Quand cela arrive, la taille du groupe coopérant augmente, ses membres migrent donc dans d’autres groupes et repeuplent des zones évacuées par des groupes dissous.
3- Analyse
Les auteurs ont cherché à comparer les résultats obtenus grâce à leur modèle à ce qui peut se produire dans une société réelle. Les études de sociétés contemporaines "simples" montrent que ce type d’évolution au sein d’une société se vérifie : les paresseux sont généralement punis, le travail doit être partagé et effectué par tous, et les ressources obtenues grâce à ce travail doivent être partagées. La punition retenue dans ce modèle (le bannissement), n’est pas la seule possible ; elle peut prendre la forme d’une scission du groupe, afin de minimiser l’interaction des travailleurs avec les égoïstes, ou bien une obligation qu’ont les égoïstes à redevenir travailleurs pour rester dans le groupe.
D’après les études ethnographiques et paléoanthropologiques citées par les auteurs, le modèle qu’ils présentent pourrait tout à fait avoir capturé les conditions sociales de la fin du Pléistocène. Ce modèle, enrichi de règles supplémentaires du type de celles présentées précédemment, permet de fournir une description plausible de l’organisation sociale des groupes de chasseurs – cueilleurs de cette époque. Certes, on ne peut pas savoir si cette coopération a réellement évolué telle qu’on l’a décrite, mais les simulations suggèrent qu’elle peut avoir existé.
4- D’autres modèles de coopération entre agents...
La coopération entre être humains et l’émergence de règles sociales intéressent de multiples équipes de recherche. R. Conte et F. Dignum [2], par exemple, travaillent sur les interactions entre règles sociales et agents. Ils décrivent un modèle théorique permettant la constitution d’une société d’agents respectueux des normes et conscients des interactions qu’ils peuvent avoir avec leurs voisins. Ils cherchent ainsi à modéliser l’évolution des lois au sein de la société, la propagation des normes et des conventions, et l’influence de celles-ci sur le comportement des agents. La base de leur étude est le fonctionnement des sociétés humaines réelles : les auteurs souhaitent déterminer quelles parties du système social complexe d’une société humaine sont déterminantes dans le bon fonctionnement de cette société.
S. Bowles, avant la parution de son article sur l’évolution de la coopération dans une population hétérogène, avait déjà cherché à simuler l’apparition de règles sociales au sein d’une population d’agents virtuels. Dans son article sur la co-évolution entre comportements individuels et institutions sociales [2], il décrit un modèle permettant de faire émerger des règles sociales très répandues dans les sociétés humaines : la monogamie et le partage de nourriture. L’évolution du système multi-agents développé à partir de son modèle montre que ces deux règles sociales permettent une bonne cohésion du groupe, et se mettent généralement en place au bénéfice du groupe.
La coopération entre agents est à la base de diverses publications, ce thème de recherche étant majoritaire au sein de publications telles que le JASSS (Journal of Artificial Societies and Social Simulation). Les chercheurs espèrent, grâce à de tels modèles, mieux comprendre l’évolution des règles au sein d’une société humaine, et les processus qui ont entraîné la mise en place des sociétés complexes actuelles.
Références
[1] Bowles, S. (2003) The Evolution of Cooperation in Heterogeneous Population
[2] Conte, R. & Dignum, F. (2001) From Social Monitoring to Normative Influence
in
JASSS : Journal of Artificial Societies and Social Simulation
vol. 4, no. 2,
< http://www.soc.surrey.ac.uk/JASSS/4/2/7.html
>
[3] Bowles, S. (2000) The Co-Evolution of Individual Behaviors and Social Institutions