Robotique Collective

Mikolaj Barbarski & Aurélien Hazan, DEA Sciences Cognitives.

 

« The right microworlds to study are not fragments of the sophisticated human achievements, but the less sophisticated achievements of the various animal intelligences, ranged across the phylogenetic tree » [Clark]

 

Bien qu’il soit difficile de dater les premières expériences de robotique mobile autonome, on mentionne volontiers les véhicules de Braitenberg ou l’architecture de subsomption de Brooks pour évoquer des architectures classiques d’agents réactifs. A l’inverse des systèmes de contrôle fondé sur des unités fonctionnelles étroitement imbriquées, Brooks proposait des niveaux superposés de tâches indépendantes, chacune étant responsable d’un comportement. Selon lui, « la mobilité, la vision précise, et la capacité d’accomplir des tâches nécessaires à la survie dans un environnement dynamique constituent une base nécessaire pour le développement d’une intelligence véritable. »[Brooks]

 

Le comportement et son évolution se situent au coeur des théories fondatrices de la neuroéthologie défendue par Cliff, dont l’objet d‘étude est le lien entre comportement et mécanismes neuronaux chez des organismes artificiels évoluant dans un environnemnt fermé.

Selon Floreano et Mondada, au terme de ce raisonnement naît même l’idée extrême que l’évolution artificielle des systèmes de contrôle en robotique autonome constituerait une « approche plus fructueuse que le simple design à la main ».[Floreano, Mondada] 

 

La neuroéthologie prenait également, à la suite de Clark, le parti d’une approche bottom-up, débarrassée d’ « a priori anthropocentriques », si bien que Cliff proposa de transformer la classique AI en Artificial Insects. Depuis l’économie dont fait preuve leur système nerveux jusqu’à leurs comportements sociaux complexes (dont la somme représente bien plus que la somme des parties), les insectes inspirèrent d’innombrables études de robotique mobile autonome et permirent d’observer l’émergence de faits collectifs relevant d’une certaine division du travail (cf [Theraulaz, Bonabeau]) et présentant des propriétés adaptatives non  supervisées.(cf [Mataric, 97])

 

D’autres préoccupations menèrent certains chercheurs, à la suite de Searle, à cerner les limites intrinsèques de l’IA classique. En reprenant le problème de la chambre chinoise de Searle, Harnad soulève le « symbol grounding problem » : un système artificiel fondé entièrement sur la manipulation de symboles serait réduit à troquer sans fin tel symbole contre tel autre, sans jamais entrevoir la sémantique qui leur est associée.  A l’inverse, une représentation symbolique ancrée dans les projections sensorielles du système perceptif ainsi que dans des catégories établies par extraction d’invariants à la suite d’un apprentisage constituerait une solution au problème. Les symboles élémentaires sont les noms des catégories d’objets ou d’événements extraits ou projettés. Ils sont fondés sur le rapport au monde physique (ou simulé), à la perception et à l’action.

 

Tout en tenant compte des interrogations déjà formulées, la question de la nature des agents demeure pour le concepteur d’architecture collectivite. N’excluant pas le recours à des agents cognitifs ou hybrides (cf [Botelho, Alami] ), les travaux mentionnés impliquaient parfois une hétérogénéité au sein de l’ « espèce » et se fondaient sur des comportements variés tels que la collaboration « altruiste »[Lucidarme, Simonin, Liégeois], le vol en formation [Reynolds] ou, lorsque divers « espèces » intervenaient, une concurrence féroce [Floreano, Nofli, Mondada]. 

 

Divers axes se dégagent de cette évocation pointilliste des débats récents en neuroscience computationnelle,  et nous permettent d’isoler les thèmes majeurs autour desquels s’articulent les travaux en robotique mobile collective : 

 

Axes principaux:

·        Evolution du comportement(Machine Learning)

·        Division du travail (Task Allocation)

·        Perception & Manipulation (Sensing & Manipulating)

·        Hétérogénéité inter et intra spécifique.

 

 

1)     Evolution du  comportement

 

Pourquoi des agents devraient apprendre ? Avant tout pour réutiliser les informations, et assister à l’émergence de comportements résolvant les problèmes qui leurs sont posés. L'apprentissage peut être particulièrement utile:

 

(1) dans les cas où il y a des agents qui doivent plusieurs fois faire face au même type de problème;

(2) dans les cas où l'expérience de quelques agents peut aider les autres dans la réalisation de leurs tâches;

(3) dans la résolution de problèmes complexes, divisés en sous problèmes et lorsque ceux­ ci ont déjà été partiellement résolus dans le passé;

(4) dans les situations où le type d'organisation des interactions entre les agents est mal adapté à une classe spécifique de problèmes et où le système est amené à tester plusieurs formes possibles d'organisation (c'est le contexte de l'auto -organisation dans les systèmes multi agents).

 

La première distinction constatée pour la nature de l’apprentissage est la différence entre apprentissage Distribué et Centralisé. En effet un point de vue centralisé permet de comparer tous les individus et de sélectionner les meilleurs comportements. Cependant, une base centrale doit être présente dans cette configuration afin de recueillir les informations venant des robots (inconvénient :grands nombre de communications, mais on peut suivre l’évolution du processus d’ensemble). Contrairement au points de vue centralisé le système distribué ne présente pas de point de vue global. Les systèmes distribués comptent de multiples méthodes d’apprentissage : l’apprentissage par renforcement tente de maximiser les récompenses et de minimiser les punitions au cours du temps (modèle de Sian et séparement de Sekaran et de Sen). L'utilisation des agents Q­learning [Sandholm & Crites,95a] conduit au choix préférentiel des meilleures actions et à l'abandon des actions dont la perspective de succès est plus faible (cf algorithme ACE ). En accord avec [Mataric,95], les méthodes de renforcement par apprentissage obtiennent de bons résultats dans le cas d'un but unique. Par contre, les résultats s'avèrent médiocres lorsque celles­ci sont appliquées à des situations où coexistent plusieurs objectifs. En ce sens, il est proposé une méthodologie qui prend en compte les propriétés et les connaissances implicites du domaine, dans le but d'accélérer le processus d'apprentissage et de le rendre possible dans des systèmes complexes et dynamiques. Cette méthodologie est constituée par un algorithme capable de traiter de multiples sous­objectifs concernant le même agent, à l'aide d'une fonction de renforcement hétérogène. Cette méthode utilise des estimateurs de progrès, ce qui permet au renforcement d'être en accord avec l'évolution du processus de résolution des sous­objectifs, au cours de la résolution d'un problème. D’autres apprentissages distribués empruntés aux SMA sont directement appliquable en robotique : citons le système d’apprentissage mutuellement supérvisé ([Goldman & Rosenschein,95] ) dans ce cas la connaissance passe par les communications, si un agent sait faire quelque chose il l’apprend aux autres. Une autre voie et l’apprentissage par imitation (appliquable pour la manipulation d’objets).

 

L’évolution du comportement peut être directement liée au nombre et aux capacités des espèces. Dans le cas d’une seule espèce (groupe de robots ayant beaucoup de points en communs mais surtout un but commun) le mode d’évolution le plus simple à voir est diréctement inspiré du monde animal : l’évolution par la séléction des plus aptes et l’élimination des plus faibles (Darwin) ou la ”Genetic programming” ([Koza]). Le modèle animal peut être implementé de différentes manières : d’abord une simulation sur ordinateur de plusieurs milliers de générations (pour apprendre à marcher aux robots insectes par exemple) ou la séléction pour des tâches : tout dépend de la fonction d’évaluation des aptitudes. Les concept de génétiques (quatre phases succéssives : création d’individus, séléctions des plus aptes qui ensuite se reproduisent et les autres sont éliminés, puis la mutation des enfants et itération) peut résoudre beaucoup de problèmes.

 Les réseaux de neurones, autre méthode possible, se fondent sur la génération et la maintenance des contraintes de l’adaptivité : en l’adaptant aux robots réel, les agents calculent  localement  leur efficacité opur telle tâche, l’aide une fonction d’aptitude très simple.

 

Les comportements issus de ces processus d’évolution, observables sur les populations de robots sont variés :

-spécialisation de certains  individus pour certaines tâches, et amélioration corrélative de leur efficacité pour cette tâche. Les résultats sont meilleurs globalement lorsque l'équipe est hétérogène au départ. ([Li, Martinoli, Abu-Mostafa]).

-coévolution : dans le cas ou plusieurs espèces intéragissent comme dans l’ approche proie /prédateur, une aptitude nouvellement crée ne vaut que par rapport aux comportements et aptitudes de l’autre espèce (à l’inverse d’une évolution simple, où la performance est toujours donnée par rapport à une métrique définie a priori). En effet comme on peut le voir dans [Floreano, Nofli, Mondada] il y a une altérnance de stratégie de la proie immédiatement suivie de celle du prédateur, parfois en cycle fermé (i.e. les mêmes solutions sont redécouvertes sans fin). En effet dans ce concept de co-évolution l’environnement change sans cesse, la solution optimale ne peut pas être a priori définie, le plus important est l’adaptivité et même le changement de stratégie dans la même génération (« Ontogenetic Change »).

 

 

2)     Division du travail

Cette division intervient lorsqu’il y a communauté de but entre individus. On dira par extension qu’elle ne se produit qu’au sein d’une même espèce (voir partie Hétérogénéité inter et intra spécifique.).

 

a-Modèles microscopiques et macroscopiques

 

Les approches macroscopiques constituent une modélisation directe du comportement de groupe, opérée par l’application uniforme de règles arbitraires supposées régir le comportement de l’individu par rapport à la communauté, mais permettant à chaque individu d’évoluer en fonction de son expérience propre. On postule cependant l’existence d’un deus-ex-machina capable  d’embrasser la situation du groupe dans sa globalité et d’ajuster les paramètres de contrôle pour réguler le comportmeent de chaque individu. Le but poursuivi est l’adéquation entre l’observation et la modélisation (Ex: [Théraulaz]) .

 Il ne s’agit donc pas ici de comprendre comment des règles simples régissant l’interaction entre les individus mènent à l’ « émergence » d’un comportement d’ensemble cohérent avec l’observation.  

Cependant, le mérite de ces modéles est d’isoler les paramètres essentiels qui règulent le comportement global réel observé, et d’offrir un exemple implémentable d’architecture artificielle collective robuste et efficace.

 

-A l’opposé, les modèles microscopiques privilégient les interactions individuelles entre  congénères. (Ex: [Parker], [Lucidarme, Simonin, Liégeois]). Dans  la mesure où les possibilités d’interprétation des mouvements des autres agents dépassent en général la compétence des individus, la communication devient ici capitale. Remarquons ici que le protocole de communication peut être inné, fourni tel quel par les concepteurs sans possibilité d’évolution du langage, ou peut être le résultat d’une entente entre agents (cf [Steels]) après synchronisation. Dans les deux cas cités, les agents se contentent d’informer leurs semblables de leur état interne (ou de leur « satisfaction » dans le cas de [Lucidarme, Simonin, Liégeois]), sollicitent leur aide pour résoudre un conflit ou lorsqu’une tâche est susceptible de nécessiter leur concours. Cependant, bien que leur cycle de communication comporte une phase d’écoute, ils n’attendent pas explicitement une réponse pour chacune de leurs requètes.

Lorsqu’un agent reçoit un signal d’intensité I donnée, il le compare au degré d’évolution de sa tâche courante, s’il en a une. Si le signal est suffisamment intense pour justifier qu’il abandonne sa tâche, il devient « altruiste » et suit le champ de force dérivant du champ de potentiel généré par les autres agents, les surfaces attractives ou répulsives (cf [Khatib]). L’agent le plus insatisfait propage automatiquement son insatisfaction et tous les agents à portée se mettent à sa disposition afin de résoudre les conflits.   

Cette classe de méthodes permet donc, sans coordinateur central, et grâce à des agents cognitifs simples et robustes, de gérer les conflits, de distribuer les tâches de proche en proche sans connaissance globale de l’environnement. Cependant, l’expérience de résolution de problèmes ne donne lieu à aucun apprentissage de la part de ces agents : les mêmes solutions seront circulairement redécouvertes sans progression d’ensemble. 

 

 

 

b-On retrouve la distinction Distribué/Centralisé (ex :[Khatib] vs [Botelho, Alami]) constatée aussi pour la nature de l’apprentissage. 

 

Cette problématique est fortement liée à la nature réactive ou cognitive du système. On oppose souvent ([Mataric, 97]) les architectures réactives, pour lesquelles le concepteur doit prévoir toutes les situations afin que les processus à l’éxecution soient le plus simples et les plus fiables possibles, avec les architectures délibératives, planificatrices ou encore cognitives. Nous remarquerons, comme Mataric, le flou terminologique qui caractérise la discipline (et les diverses acceptions qu’y prend le terme comportement. Par exemple, Parker oppose « behavior » et « reasoning »), et nous en tiendrons à la notion de distribution qui peut autant s’appliquer pour le groupe d’agents que pour l’agent lui-même.

 

Le problème d’évitement des obstacles, considéré habituellement comme un probleme de haut niveau résolu par planification grâce à des algorithme dédiés  permet d’illustrer cette dualité. Ainsi, [Khatib] propose une approche doublement distribuée (pour l’agent lui-même et entre agents) fondée sur la modélisation par champs de potentiels: les buts sont des pôles attractif et les obstacles sont assimilés à des surfaces répulsives géométriquement simples. Chaque agent répartit son activité sur deux niveaux: l’intégration de la planification (donc de haut niveau) pour une stratégie et un cheminement par buts intermédiaire puis le bas niveau satisfaisant ces buts en exploitant les données fournies par le champ de potentiel.

 

Dans le cas du Projet Martha [Botelho, Alami] à base de robots cognitifs, un poste central stocke et répartit en cas de nécessité les informations connues sur l’environnement ainsi que la désignation générale des tâches à accomplir, ce qui laisse tout lattitude à l’agent pour s’acquitter de sa tâche selon le plan. On constate ici la limite d’un clivage abrupt distribué/centralisé puisque différents niveaux (local et global) se distinguent : bien que la division globale du travail soit centralisée (attribution des tâches par ordre de proximité et selon des règles d’économie du nombre de robots assignés à une même tâche), la division locale est dévolue aux robots eux-mêmes, par exemple lorsqu’il s’agit de résoudre un conflit de positionnement ou de ressources entre robots. La méthode coopérative générique utilisée au niveau local (Plan-Merging-Paradigm) a les propriétés suivantes : pas de centralisations de données, production de plan coordonnés compatibles avec ceux des autres robots. 

Cependant on notera que l’économie réalisée par attribution globale y gagne ce qu’y perd la robustesse du système : si le poste central est déficient ou hors d’usage, les robots sont inopérants.

 

 

 

c-Dépend du mode de coopération entre individus  (voir classification Sansonnet, Intro SMA p.35 ):

 

Cette énumération non exhaustive rassemble certains des modes qui nous ont paru les plus pertinents :

 

-agrégation. Reynolds développa en 1987 un ensemble de règles déstinées à modéliser, pour les besoins de l’infographie, le comportement d’un grand nombre d’individus agissant sur la base de quelques règles simples, à l’instar de particules soumises à des règles physiques convenues. Les « acteurs » combinent des procédures et des modes de communication entre agents afin de modifier leur état interne. Les règles sont les suivantes :

 

1-Evitement des collisions avec les membres du groupe les plus proches.

2-Maintien d’une vitesse stable adaptée à celle des membres du groupe les plus proches .

3-Centrage de la position afin de rester proche des voisins.

 

Elles ne supposent donc qu’une perception à courte distance de l’environnemt, mais permettent des tactiques complexes comme la scission du groupe en deux afin d’éviter un obstacle présent sur la trajectoire. Il est en revanche nécessaire de pouvoir reconnaître ses semblables, et le modèle de Reynolds adopte une solution ad hoc de perception afin d’éviter de traiter la vision artificielle et la reconnaissance. De plus, tout comme les modèles macroscopiques, celui-ci  limite l’influence des interactions agent/agent et suppose un arbitrage omniscient et omnipotent lorsqu’il s’agit de déterminer la trajectoire du groupe. Bien que d’une part, dans un grand groupe d’animaux, le mouvement parte de quelques individus avant d’être suivi par tous les autres, et que d’autre part ce modèle ait l’ambition de mimer de tels phénomènes observables dans la nature, ici la trajectoire est imposée en fixant l’accélération de tous les membres du groupe afin qu’ils se dirigent là où le concepteur le désire.

 

- "altruisme" (Cf [Khatib], [Lucidarme, Simonin, Liégeois]). Comme on l’a vu plus haut, la propagation d’un signal de satisfaction/insatisfaction fondé sur l’exploitation du champ de potentiel attractif ou répulsif indique à l’agent les tâches possibles aux alentours, et devient préemptif en cas de conflit ou de blocage susceptible d’immobiliser le groupe entier.

 

-"coopération"  optimisée ([Gerksey, Mataric,2003]). Ici, l’allocation de tâches pour un goupe de robots (Multi-robots Task Allocation, MRTA), considérée comme un problème d ‘optimisation sous contraintes, est traitée comme telle, à l’aide des outils initialement développés en statistique, en théorie des jeux ou en économie. (« Optimal Assignment Problem”).

Cette approche, destinée à répondre au critères draconiens édictés par la DARPA (P = « deploying 100 robots to achieve a complex multi-faceted task in an unknown environment, possibly over a twenty-four-hour period »), réassigne itérativement toutes les tâches (par ordre de priorité) de manière décentralisée. Cela repose sur des hypothèses discutables en dehors du postulat P:  (1) que toutes les tâches soient connues d’avance, et (2) que chaque « ouvrier » connaisse sa propre compétence pour chacune d’elles.

Cependant, bien que cette méthode soit la plus efficace lorsque (1) se vérifie, nous préferons adopter la conception de  [Floreano, Nofli, Mondada] qui posent l’optimalité comme un a priori irrecevable dans un environnement incertain, ce qui constitue le cas général. A l’inverse, il semble plus rationnel d’insister sur l’évolution et l’adaptativité, permise par l’adaptation ontogénétique, se traduisant par une modification possible des stratégies envisageables par l’agent au cours de son existence.(voir Evolution du comportment, coévolution).

 

-la concurrence fait intevenir la notion d’espèces distinctes, et relève plutôt du problème de la coévolution.(voir Evolution du  comportement )

 

3)     Perception & Manipulation

 

 

Dans la plupart des contributions scientifiques le problème majeur est celui de la perception locale et non globale : en effet la perception qui n’est pas globale soulève la question de la perception et de l’autonomie d’un agent (cf projet ICARE). La navigation se révèle se décomposer en une multitudes de domaines tel que :

·        planifications des tâches, et du mouvement

·        navigation réflexe et contrôle d’exécution : Il s'agit de rendre robuste le comportement du système face à une certaine variabilité des conditions d'exécution de la tâche. On fait intervenir les « sens » (senseurs) des robots pour corriger les incertitudes des mouvements et les imprévus.

·        navigation coopérative : exemple de la  répartition de la perception dans un système distribué de robots autonomes. ([Sellem], [Sellem, Luzeaux] )

·         stabilisation de cette perception : (projet ICARE)

 

a-problème de représentation du monde

 

            Comment représenter le monde ? Grilles de lecture déjà fournie, autoapprentissage ou apprentissage supervisé ? Mais aussi comment reconnaître les structures connues surtout par raport à la perception que le robot en a ? Différents solutions sont proposées tel que les représentations du monde locales et la modélisation géométrique des objets.

            L’échange de représentation de l’environnement [Sellem et Luzeaux]  permet d’étendre la perception locale à une perception multilocale.

               

b-un robot peut agir sur l'environnement

 

                Pour la plupart des robots actuels la base de leurs intervention réside dans le déplacement  par des roue et ses dérivées pour la plupart ou des pattes (mode de locomotion inspiré des animaux, chiens, araignées). Avant tout le déplacement est immédiatement corrélé à la  perception de l’environnement (les robots ne perçoivent pas ce qu’ils ne voient pas, ce qui ls ammène à ignorer une partie du monde

            L’un des exemples les plus illustrateur des robots agissant dans un environnement dynamique sont les robots footballeurs ( cf lien Robocup etles  multiples liens vers les robots footballeurs). Des problèmes liés à la modification de l’environnement sont pour la plupart corrélés avec la techniques.

La manipulation peut être faite de différentes manières :

-action directe : bras articulé, puis contrôle d’exécution et correction des mouvements.

-requête vers un autre agent ou robot (protocole d’échange d’informations obligatoire) qui soulève des problèmes de partage de ressources (voir concurrence ou coopération)

 

c-dimension temporelle du changement

        

Le principal problème est le temps réel, en effet le robot doit agir dans un temps déterminé, en général assez bref. Adopter des choix rapides, réflexes est décrit dans l’architecture de subsomption proposée par R. Brooks pour la construction d'agents réactifs (elle consiste à décomposer un agent en modules verticaux chacun étant responsable d'un type de comportement très limité. Chaque niveau peut subsumer la décision de la couche recouverte, la couche plus basse de détection d'obstacle peut choisir d'annuler la décision de se déplacer en avant d'une couche de détection de nourriture).

 Actuellement la plupart des équipes de chercheurs travaillent sur une architecture hybride  pour dépasser les inconvénients des agents seulement réactifs (exemple : Robocup). On ajoute sur une couche réactive (donc réflexe) une couche cognitive (planification et réprésentation).

Le problème d'un monde ouvert et de sa représentation (des points de vue multiples engendrent des mondes hétérogènes) est le fait que si le monde est trop complexe, les brusques changements de la vision que l’agent en a (car son système permet d’intégrer une petite partie des informations) peuvent le perturber  et limiter son action à une activité  réflexe. Cette partie du problème est résolue par la mise en avant de certains informations perçues (problème de pertinence des informations).

 

d-Les capteurs 

 

 On remarque aisément que, dans la majorité des actions physiques qu’un homme exécute, il utilise principalement ses sens de la vision et du toucher.Un système perceptif faisant appel à des capteurs capables d’acquérir des informations à distance (comme la vision) ou au contact (comme le toucher) devrait aider à l’exécution correcte de nombreux types de tâches non déterminées à l’avance. On divise usuellement ces capteurs en trois catégories :

 

– les capteurs au contact, ou tactiles,  sont utilisés pour la reconnaissance géométrique  de l’environnement (par palpation) ; on parle de capteurs d’efforts  lorsque l’information à acquérir concerne une force , un couple , ou un moment.

– les capteurs à faible distance , ou capteurs proximétriques , donnent des images de quelques points de l’environnement local en utilisant les rayonnements infrarouges ou ultrasonores, ou les variations de champ magnétique (pour des objets sensibles à ce champ).

– les capteurs à distance  fournissent des images détaillées d’un environnement plus global ; il s’agit de caméras de type.

Un senseur est un objet disposant de méthodes de calibration, d’activation/inactivation et d’aquisition. La calibration devient superflue lorsqu’on fusionne les données redondantes de plusieurs senseurs,  ce qui améliore notablement la fiabilité des données et la robustesse d’aquisition. (projet ICARE) 

 

 

4)     Hétérogénéité inter et intra spécifique.

On définira ici l’espèce comme une communauté d’individus semblables dans leur constitution générale et partageant le même but (ex : Se reproduire en tant qu’espèce). De plus, la stratégie sera une combinaison de modes d’évolution des individus et de division du travail –lorsqu’elle a lieu d’être-  adoptés par les individus ou imposés par le superviseur)

 

En fonction du nombre d’individus de l’environnement, du nombre d’espèces et de la variabilité inter-spécifique, on distingue –en guise de récapitulatif- plusieurs cas (Cf figure suivante), auxquels correspondront autant de stratégies distinctes et parfois complémentaires parmi celles  vues plus haut. 

Plus on descend le long de l’arbre des stratégies, plus les méthodes sont susceptibles de se juxtaposer. (Ex : un agent unique pourra évoluer, deux agents identiques pourront évoluer et coopérer, un groupe d’agents hétérogènes pourra évoluer pour se spécialiser tout en coopérant de manière altruiste, etc...)

 

 

Nombre n d’individus

Nombre e d’espèces

Variabilité

inter-   spécifique

Stratégie

 

 

 

 
 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

CONCLUSION:

L'ancrage dans le monde physique des symboles manipulés par les agents collectifs a déjà permis un changement de leur nature : de l'agent purement réactif à l'agent téléonomique hybride doté d'une représentation du monde extérieur. En revanche, la recherche en robotique collective autonome se préoccupe peu de la reflexivité des agents, considérant comme Clark que "l'intelligence a évolué afin de satisfaire notre besoin premier: la survie. Elle n'a pas été selectionnée pour sa capacité à effectuer des tâches de haut niveau qui font l'objet de tant de travaux en IA", tels que la modélisation du langage humain. Cependant, cette absence de conscience de soi serait peut-être plus tolérable si les concepteurs pouvaient au moins se fonder sur des comparaisons d'individus pour expliquer l'évolution de leur systèmes. Or, un des défauts souvent opposés aux approches connexionistes par les tenants de la Good Old Fashionned AI est l'impossibilité d'expliciter cette évolution à l'issue d'un processus d'apprentissage, de la prouver, ou de la rendre réfutable. Du point de vue des sciences cognitives, dont l'intérêt se porte sur les liens entre formalisme, représentations et conduites, l'absence de correspondances accessibles entraîne une frustration certaine. Bien que nous préferions la conception adaptative plutôt qu'optimale de l'évolution, nous la jugeons insuffisante dans le sens où elle n'explicite pas l'influence réciproque entre les contraintes du milieu et adaptation de l'individu au sein de son espèce, mais se satisfait de comportements moyens. Se contenter d'un très relatif jugement ex-cathedra sur l'évolution d'une espèce d'agent nous semble illusoire, et devrait se compléter, afin de tirer parti de l'ancrage physique permis par la robotique autonome ainsi que d'une architecture distribuée dans un modèle microscopique, d'un jugement de chaque agent sur son environnement et sur ses congénères susceptible d'être échangé et exprimé par un code évolutif.

 

 


Références:

 

[1]Brooks, « Achieving artificial intelligence through building robots», A.I.Memo 864, M.I.T. A.I Lab, 1985.

 

[2] Botelho, Alami, "Multi Robot Cooperation in the Martha Project", IEEE Int. Conf. On Robotics and Automation, pp. 1234-1239, 1999.

 

[3] Clark, “Artificial intelligence and the biological factor ». CSRP 049, Univ. of Sussex School of Cognitive and Computing Science, 1985.  

 

[4] Cliff, “Computational Neuroethology: A Provisionnal Manifesto”, Univ. of Sussex School of Cognitive and Computing Science, 1990. 

 

[5] Floreano, Mondada: “Evolution of Homing Navigation in a Real Mobile Robot”.

 

[6] Floreano, Nofli, Mondada: "Co-Evolution and Ontogenetic Change in Competing Robots".

 

[7] Harnad, ”The Symbol Grounding Problem.”, Physica D 42: 335-346, 1990.

 

[8] Khatib, "Real Time Obstacle Avoidance for Manipulators and Mobile robots", IEEE Int. Conf.on Robotics and Automation, pp. 500-505, 1985.

 

[9] Koza, “Genetic programming:on the programming of computers by means of natural selection”, MIT Press Cambridge, 1992.

 

[10] Li, Martinoli, Abu-Mostafa :“Emergent Specialization in Swarm Systems”.

 

[11] Lucidarme, Simonin, Liégeois: "Implementation and Evaluation of a Satisfaction/Altruism Based Architecture for Multi-Robot Systems “

 

[12] Mataric: "Behavior-Based Control: Examples from Navigation, Learning, and Group Behavior", Journal of Experimental and Theoretical Artificial intelligence, special issue on Software Architectures for Physical Agents, 9(2-3), 1997, 323-336.

 

[13] Gerksey, Mataric :"A Framework for Studying Multi-Robot Task Allocation", 2003.

 

[14] Parker, ”ALLIANCE, an architecture for fault-tolerant, cooperative control of heterogenous, mobile robots”.

           

[15] Reynolds: "Flocks, Herds, and Schools:A Distributed Behavioral Model".

 

[16] Sellem : « Navigation coopérative par échange de représentation de l’environnement ».

 

[17] Sellem, Luzeaux : « Répartition de la perception dans un système distribué de robots autonomes ».

 

[18] Luc Steels, “Self­organising vocabularies”, 1995.

 

[19] Theraulaz, Bonabeau: "Response threshold reinforcement and division of labour in insect societies"

 

 

 

 

Liens

 

-robots footballeurs :

 

http://www.robocup2003.org

www.lip6.fr/Laboratoire/Rapport_2000/Projets.pdf

www.lirmm.fr/~ferber/warbot/ProjetWarBot.html

 

-déplacement dans un milieu connu 

 http://www.ensta.fr/~oudot/tipe/tipe.html

 

-projet ICARE : http://www.inria.fr/rapportsactivite/RA2001/icare/icare_tf.html

 

-LABOS:

Centre de Recherches sur la Cognition Animale: http://cognition.ups-tlse.fr/

EPFL Autonomous Systems Lab:http://dmtwww.epfl.ch/isr/asl/

EPFL Collective Robotics Group:http://diwww.epfl.ch/lami/collective/collective.html

Interaction Lab, Maja Mataric: http://www-robotics.usc.edu/~maja/

Caltech CORO: http://www.coro.caltech.edu/