Mikolaj Barbarski & Aurélien Hazan, DEA Sciences Cognitives.
« The
right microworlds to study are not fragments of the sophisticated human
achievements, but the less sophisticated achievements of the various animal intelligences,
ranged across the phylogenetic tree » [Clark]
Bien qu’il soit difficile de dater les premières
expériences de robotique mobile autonome, on mentionne volontiers les véhicules
de Braitenberg ou l’architecture de subsomption de Brooks pour évoquer des
architectures classiques d’agents réactifs. A l’inverse des systèmes de
contrôle fondé sur des unités fonctionnelles étroitement imbriquées, Brooks
proposait des niveaux superposés de tâches indépendantes, chacune étant
responsable d’un comportement. Selon lui, « la mobilité, la vision
précise, et la capacité d’accomplir des tâches nécessaires à la survie dans un
environnement dynamique constituent une base nécessaire pour le développement
d’une intelligence véritable. »[Brooks]
Le comportement et son évolution se situent au coeur
des théories fondatrices de la neuroéthologie défendue par Cliff, dont l’objet
d‘étude est le lien entre comportement et mécanismes neuronaux chez des
organismes artificiels évoluant dans un environnemnt fermé.
Selon Floreano et Mondada, au terme de ce
raisonnement naît même l’idée extrême que l’évolution artificielle des systèmes
de contrôle en robotique autonome constituerait une « approche plus
fructueuse que le simple design à la main ».[Floreano, Mondada]
La neuroéthologie prenait
également, à la suite de Clark, le parti d’une approche bottom-up, débarrassée
d’ « a priori anthropocentriques », si bien que Cliff proposa de
transformer la classique AI en Artificial Insects. Depuis l’économie dont
fait preuve leur système nerveux jusqu’à leurs comportements sociaux complexes
(dont la somme représente bien plus que la somme des parties), les insectes
inspirèrent d’innombrables études de robotique mobile autonome et permirent
d’observer l’émergence de faits collectifs relevant d’une certaine division
du travail (cf [Theraulaz, Bonabeau])
et présentant des propriétés adaptatives non supervisées.(cf [Mataric, 97])
D’autres préoccupations
menèrent certains chercheurs, à la suite de Searle, à cerner les limites
intrinsèques de l’IA classique. En reprenant le problème de la chambre chinoise
de Searle, Harnad soulève le « symbol grounding problem » : un
système artificiel fondé entièrement sur la manipulation de symboles serait
réduit à troquer sans fin tel symbole contre tel autre, sans jamais entrevoir
la sémantique qui leur est associée. A
l’inverse, une représentation symbolique ancrée dans les projections
sensorielles du système perceptif ainsi que dans des catégories établies par extraction
d’invariants à la suite d’un apprentisage constituerait une solution au
problème. Les symboles élémentaires sont les noms des catégories d’objets ou
d’événements extraits ou projettés. Ils sont fondés sur le rapport au monde
physique (ou simulé), à la perception et à l’action.
Tout en tenant compte
des interrogations déjà formulées, la question de la nature des agents demeure
pour le concepteur d’architecture collectivite. N’excluant pas le recours
à des agents cognitifs ou hybrides (cf [Botelho, Alami] ), les travaux mentionnés impliquaient parfois une hétérogénéité
au sein de l’ « espèce » et se fondaient sur des comportements variés
tels que la collaboration « altruiste »[Lucidarme, Simonin, Liégeois],
le vol en formation [Reynolds] ou, lorsque divers « espèces » intervenaient,
une concurrence féroce [Floreano, Nofli, Mondada].
Divers axes se dégagent
de cette évocation pointilliste des débats récents en neuroscience
computationnelle, et nous permettent
d’isoler les thèmes majeurs autour desquels s’articulent les travaux en
robotique mobile collective :
Axes
principaux:
·
Evolution du comportement(Machine Learning)
·
Division du travail (Task Allocation)
·
Perception & Manipulation (Sensing
& Manipulating)
·
Hétérogénéité inter et intra spécifique.
Pourquoi des agents devraient apprendre ? Avant tout pour réutiliser les
informations, et assister à l’émergence de comportements résolvant les
problèmes qui leurs sont posés. L'apprentissage peut être particulièrement
utile:
(1) dans les cas où il
y a des agents qui doivent plusieurs fois faire face au même type de problème;
(2) dans les cas où
l'expérience de quelques agents peut aider les autres dans la réalisation de
leurs tâches;
(3) dans la résolution
de problèmes complexes, divisés en sous problèmes et lorsque ceux ci ont déjà
été partiellement résolus dans le passé;
(4) dans les situations
où le type d'organisation des interactions entre les agents est mal adapté à
une classe spécifique de problèmes et où le système est amené à tester
plusieurs formes possibles d'organisation (c'est le contexte de l'auto -organisation
dans les systèmes multi agents).
La
première distinction constatée pour la nature de l’apprentissage est la
différence entre apprentissage Distribué
et Centralisé. En effet un point de vue centralisé permet de comparer tous
les individus et de sélectionner les meilleurs comportements. Cependant, une
base centrale doit être présente dans cette configuration afin de recueillir
les informations venant des robots (inconvénient :grands nombre de
communications, mais on peut suivre l’évolution du processus d’ensemble).
Contrairement au points de vue centralisé le système distribué ne présente pas
de point de vue global. Les systèmes distribués comptent de multiples méthodes
d’apprentissage : l’apprentissage par renforcement tente de
maximiser les récompenses et de minimiser les punitions au cours du temps
(modèle de Sian et séparement de Sekaran et de Sen). L'utilisation des agents Qlearning
[Sandholm & Crites,95a] conduit au choix préférentiel des meilleures
actions et à l'abandon des actions dont la perspective de succès est plus
faible (cf algorithme ACE ). En accord avec [Mataric,95], les méthodes de
renforcement par apprentissage obtiennent de bons résultats dans le cas d'un
but unique. Par contre, les résultats s'avèrent médiocres lorsque cellesci sont
appliquées à des situations où coexistent plusieurs objectifs. En ce sens, il
est proposé une méthodologie qui prend en compte les propriétés et les
connaissances implicites du domaine, dans le but d'accélérer le processus
d'apprentissage et de le rendre possible dans des systèmes complexes et
dynamiques. Cette méthodologie est constituée par un algorithme capable de
traiter de multiples sousobjectifs concernant le même agent, à l'aide d'une
fonction de renforcement hétérogène. Cette méthode utilise des estimateurs de
progrès, ce qui permet au renforcement d'être en accord avec l'évolution du
processus de résolution des sousobjectifs, au cours de la résolution d'un
problème. D’autres apprentissages distribués empruntés aux SMA sont directement
appliquable en robotique : citons le système d’apprentissage
mutuellement supérvisé ([Goldman & Rosenschein,95] ) dans ce cas la
connaissance passe par les communications, si un agent sait faire quelque chose
il l’apprend aux autres. Une autre voie et l’apprentissage par imitation
(appliquable pour la manipulation d’objets).
L’évolution du comportement peut être directement
liée au nombre et aux capacités des espèces. Dans le cas d’une seule espèce
(groupe de robots ayant beaucoup de points en communs mais surtout un but
commun) le mode d’évolution le plus simple à voir est diréctement inspiré
du monde animal : l’évolution par la séléction des plus aptes et l’élimination
des plus faibles (Darwin) ou la ”Genetic programming” ([Koza]). Le modèle
animal peut être implementé de différentes manières : d’abord une simulation
sur ordinateur de plusieurs milliers de générations (pour apprendre à marcher
aux robots insectes par exemple) ou la séléction pour des tâches : tout
dépend de la fonction d’évaluation des aptitudes. Les concept de génétiques
(quatre phases succéssives : création d’individus, séléctions des plus
aptes qui ensuite se reproduisent et les autres sont éliminés, puis la mutation
des enfants et itération) peut résoudre beaucoup de problèmes.
Les
réseaux de neurones, autre méthode possible, se fondent sur la génération
et la maintenance des contraintes de l’adaptivité : en l’adaptant aux
robots réel, les agents calculent localement
leur efficacité opur telle tâche, l’aide une fonction d’aptitude très
simple.
Les comportements issus
de ces processus d’évolution, observables sur les populations de robots sont
variés :
-spécialisation de certains individus pour certaines tâches, et amélioration corrélative
de leur efficacité pour cette tâche. Les résultats sont meilleurs globalement
lorsque l'équipe est hétérogène au départ. ([Li, Martinoli, Abu-Mostafa]).
-coévolution : dans
le cas ou plusieurs espèces intéragissent comme dans l’ approche proie /prédateur,
une aptitude nouvellement crée ne vaut que par rapport aux comportements et
aptitudes de l’autre espèce (à l’inverse d’une évolution simple, où la performance
est toujours donnée par rapport à une métrique définie a priori). En effet
comme on peut le voir dans [Floreano, Nofli, Mondada] il y a une altérnance
de stratégie de la proie immédiatement suivie de celle du prédateur, parfois
en cycle fermé (i.e. les mêmes solutions sont redécouvertes sans fin). En
effet dans ce concept de co-évolution l’environnement change sans cesse, la
solution optimale ne peut pas être a priori définie, le plus important est
l’adaptivité et même le changement de stratégie dans la même génération (« Ontogenetic
Change »).
Cette division intervient lorsqu’il y a communauté de but entre individus. On dira par extension qu’elle ne se produit qu’au sein d’une même espèce (voir partie Hétérogénéité inter et intra spécifique.).
Les approches macroscopiques constituent une
modélisation directe du comportement de groupe, opérée par l’application
uniforme de règles arbitraires supposées régir le comportement de l’individu
par rapport à la communauté, mais permettant à chaque individu d’évoluer en
fonction de son expérience propre. On postule cependant l’existence d’un
deus-ex-machina capable d’embrasser la
situation du groupe dans sa globalité et d’ajuster les paramètres de contrôle
pour réguler le comportmeent de chaque individu. Le but poursuivi est
l’adéquation entre l’observation et la modélisation (Ex: [Théraulaz]) .
Il ne s’agit
donc pas ici de comprendre comment des règles simples régissant l’interaction
entre les individus mènent à l’ « émergence » d’un comportement
d’ensemble cohérent avec l’observation.
Cependant, le mérite de ces modéles est d’isoler les
paramètres essentiels qui règulent le comportement global réel observé, et
d’offrir un exemple implémentable d’architecture artificielle collective
robuste et efficace.
-A l’opposé, les modèles microscopiques privilégient
les interactions individuelles entre
congénères. (Ex: [Parker], [Lucidarme,
Simonin, Liégeois]). Dans la mesure
où les possibilités d’interprétation des mouvements des autres agents dépassent
en général la compétence des individus, la communication devient ici capitale.
Remarquons ici que le protocole de communication peut être inné, fourni tel
quel par les concepteurs sans possibilité d’évolution du langage, ou peut être
le résultat d’une entente entre agents (cf [Steels]) après synchronisation.
Dans les deux cas cités, les agents se contentent d’informer leurs semblables
de leur état interne (ou de leur « satisfaction » dans le cas de [Lucidarme, Simonin, Liégeois]),
sollicitent leur aide pour résoudre un conflit ou lorsqu’une tâche est
susceptible de nécessiter leur concours. Cependant, bien que leur cycle de
communication comporte une phase d’écoute, ils n’attendent pas explicitement
une réponse pour chacune de leurs requètes.
Lorsqu’un agent reçoit un signal d’intensité I
donnée, il le compare au degré d’évolution de sa tâche courante, s’il en a une.
Si le signal est suffisamment intense pour justifier qu’il abandonne sa tâche,
il devient « altruiste » et suit le champ de force dérivant du champ
de potentiel généré par les autres agents, les surfaces attractives ou
répulsives (cf [Khatib]). L’agent le plus insatisfait propage automatiquement
son insatisfaction et tous les agents à portée se mettent à sa disposition afin
de résoudre les conflits.
Cette classe de méthodes permet donc, sans
coordinateur central, et grâce à des agents cognitifs simples et robustes, de
gérer les conflits, de distribuer les tâches de proche en proche sans
connaissance globale de l’environnement. Cependant, l’expérience de résolution
de problèmes ne donne lieu à aucun apprentissage de la part de ces
agents : les mêmes solutions seront circulairement redécouvertes sans
progression d’ensemble.
Cette problématique est fortement liée à la nature
réactive ou cognitive du système. On oppose souvent ([Mataric, 97]) les
architectures réactives, pour lesquelles le concepteur doit prévoir toutes les
situations afin que les processus à l’éxecution soient le plus simples et les
plus fiables possibles, avec les architectures délibératives, planificatrices
ou encore cognitives. Nous remarquerons, comme Mataric, le flou terminologique
qui caractérise la discipline (et les diverses acceptions qu’y prend le terme
comportement. Par exemple, Parker oppose « behavior » et
« reasoning »), et nous en tiendrons à la notion de distribution qui
peut autant s’appliquer pour le groupe d’agents que pour l’agent lui-même.
Le problème d’évitement des obstacles, considéré
habituellement comme un probleme de haut niveau résolu par planification grâce
à des algorithme dédiés permet
d’illustrer cette dualité. Ainsi, [Khatib] propose une approche doublement
distribuée (pour l’agent lui-même et entre agents) fondée sur la modélisation
par champs de potentiels: les buts sont des pôles attractif et les obstacles
sont assimilés à des surfaces répulsives géométriquement simples. Chaque agent
répartit son activité sur deux niveaux: l’intégration de la planification (donc
de haut niveau) pour une stratégie et un cheminement par buts intermédiaire
puis le bas niveau satisfaisant ces buts en exploitant les données fournies par
le champ de potentiel.
Dans le cas du Projet
Martha [Botelho, Alami] à base de robots
cognitifs, un poste central stocke et répartit en cas de nécessité les
informations connues sur l’environnement ainsi que la désignation générale des
tâches à accomplir, ce qui laisse tout lattitude à l’agent pour s’acquitter de
sa tâche selon le plan. On constate ici la limite d’un clivage abrupt
distribué/centralisé puisque différents niveaux (local et global) se
distinguent : bien que la division globale du travail soit centralisée
(attribution des tâches par ordre de proximité et selon des règles d’économie
du nombre de robots assignés à une même tâche), la division locale est dévolue
aux robots eux-mêmes, par exemple lorsqu’il s’agit de résoudre un conflit de
positionnement ou de ressources entre robots. La méthode coopérative générique utilisée au niveau local
(Plan-Merging-Paradigm) a les propriétés suivantes : pas de
centralisations de données, production de plan coordonnés compatibles avec ceux
des autres robots.
Cependant on notera que l’économie
réalisée par attribution globale y gagne ce qu’y perd la robustesse du système
: si le poste central est déficient ou hors d’usage, les robots sont
inopérants.
Cette énumération non exhaustive rassemble certains
des modes qui nous ont paru les plus pertinents :
-agrégation. Reynolds
développa en 1987 un ensemble de règles déstinées à modéliser, pour les besoins
de l’infographie, le comportement d’un grand nombre d’individus agissant sur la
base de quelques règles simples, à l’instar de particules soumises à des règles
physiques convenues. Les « acteurs » combinent des procédures et des
modes de communication entre agents afin de modifier leur état interne. Les
règles sont les suivantes :
2-Maintien d’une vitesse stable adaptée à celle des membres du groupe les plus proches .
3-Centrage de la position
afin de rester proche des voisins.
Elles
ne supposent donc qu’une perception à courte distance de l’environnemt,
mais permettent des tactiques complexes comme la scission du groupe en
deux afin d’éviter un obstacle présent sur la trajectoire. Il est en revanche
nécessaire de pouvoir reconnaître ses semblables, et le modèle de Reynolds
adopte une solution ad hoc de perception afin d’éviter de traiter la vision
artificielle et la reconnaissance. De plus, tout comme les modèles macroscopiques,
celui-ci limite l’influence des
interactions agent/agent et suppose un arbitrage omniscient et omnipotent
lorsqu’il s’agit de déterminer la trajectoire du groupe. Bien que d’une
part, dans un grand groupe d’animaux, le mouvement parte de quelques individus
avant d’être suivi par tous les autres, et que d’autre part ce modèle
ait l’ambition de mimer de tels phénomènes observables dans la nature,
ici la trajectoire est imposée en fixant l’accélération de tous les membres
du groupe afin qu’ils se dirigent là où le concepteur le désire.
- "altruisme" (Cf [Khatib], [Lucidarme, Simonin, Liégeois]). Comme on l’a vu plus haut, la propagation d’un
signal de satisfaction/insatisfaction fondé sur l’exploitation du champ de
potentiel attractif ou répulsif indique à l’agent les tâches possibles aux
alentours, et devient préemptif en cas de conflit ou de blocage susceptible
d’immobiliser le groupe entier.
-"coopération" optimisée ([Gerksey, Mataric,2003]). Ici,
l’allocation de tâches pour un goupe de robots (Multi-robots Task Allocation,
MRTA), considérée comme un problème d ‘optimisation sous contraintes, est
traitée comme telle, à l’aide des outils initialement développés en
statistique, en théorie des jeux ou en économie. (« Optimal Assignment Problem”).
Cette approche, destinée à répondre au critères draconiens édictés par
la DARPA (P = « deploying 100 robots to achieve a complex multi-faceted task in an
unknown environment, possibly over a twenty-four-hour period »), réassigne itérativement
toutes les tâches (par ordre de priorité) de manière décentralisée. Cela repose
sur des hypothèses discutables en dehors du postulat P: (1) que toutes les tâches soient connues
d’avance, et (2) que chaque « ouvrier » connaisse sa propre
compétence pour chacune d’elles.
Cependant, bien que cette méthode soit la plus
efficace lorsque (1) se vérifie, nous préferons adopter la conception de [Floreano, Nofli, Mondada] qui posent
l’optimalité comme un a priori irrecevable dans un environnement
incertain, ce qui constitue le cas général. A l’inverse, il semble plus
rationnel d’insister sur l’évolution et l’adaptativité, permise par
l’adaptation ontogénétique, se traduisant par une modification possible des
stratégies envisageables par l’agent au cours de son existence.(voir Evolution du comportment, coévolution).
-la concurrence fait
intevenir la notion d’espèces distinctes, et relève plutôt du problème de la
coévolution.(voir Evolution
du comportement )
Dans la plupart des contributions
scientifiques le problème majeur est celui de la perception locale et non globale : en effet la perception qui
n’est pas globale soulève la question de la perception et de l’autonomie d’un
agent (cf projet ICARE). La navigation se révèle se décomposer en une
multitudes de domaines tel que :
·
planifications
des tâches, et du mouvement
·
navigation
réflexe et contrôle d’exécution : Il s'agit de rendre robuste le
comportement du système face à une certaine variabilité des conditions
d'exécution de la tâche. On fait intervenir les « sens » (senseurs)
des robots pour corriger les incertitudes des mouvements et les imprévus.
·
navigation
coopérative : exemple de la
répartition de la perception dans un système distribué de robots
autonomes. ([Sellem], [Sellem, Luzeaux] )
· stabilisation de cette perception : (projet ICARE)
a-problème de représentation du monde
Comment représenter le
monde ? Grilles de lecture déjà fournie, autoapprentissage ou
apprentissage supervisé ? Mais aussi comment reconnaître les structures
connues surtout par raport à la perception que le robot en a ? Différents
solutions sont proposées tel que les représentations du monde locales et la
modélisation géométrique des objets.
L’échange de représentation de l’environnement [Sellem et Luzeaux] permet d’étendre la perception locale à une perception multilocale.
b-un robot peut agir sur l'environnement
Pour la plupart des robots actuels la base de leurs
intervention réside dans le déplacement
par des roue et ses dérivées pour la plupart ou des pattes (mode de
locomotion inspiré des animaux, chiens, araignées). Avant tout le déplacement
est immédiatement corrélé à la
perception de l’environnement (les robots ne perçoivent pas ce qu’ils ne
voient pas, ce qui ls ammène à ignorer une partie du monde
L’un des exemples les plus illustrateur des robots
agissant dans un environnement dynamique sont les robots footballeurs ( cf
lien Robocup etles multiples liens vers
les robots footballeurs). Des problèmes liés à la modification de
l’environnement sont pour la plupart corrélés avec la techniques.
La manipulation peut être
faite de différentes manières :
-action directe : bras
articulé, puis contrôle d’exécution et correction des mouvements.
-requête vers un autre agent ou robot (protocole d’échange d’informations obligatoire) qui soulève des problèmes de partage de ressources (voir concurrence ou coopération)
c-dimension temporelle du changement
Le principal problème est le temps réel, en effet le robot doit agir dans
un temps déterminé, en général assez bref. Adopter des choix
rapides, réflexes est décrit dans l’architecture de subsomption
proposée par R. Brooks pour la construction d'agents réactifs (elle consiste à
décomposer un agent en modules verticaux chacun étant responsable d'un type de
comportement très limité. Chaque niveau peut subsumer la décision de la couche
recouverte, la couche plus basse de détection d'obstacle peut choisir d'annuler
la décision de se déplacer en avant d'une couche de détection de nourriture).
Actuellement la plupart des équipes de chercheurs travaillent sur
une architecture hybride pour dépasser
les inconvénients des agents seulement réactifs (exemple : Robocup). On
ajoute sur une couche réactive (donc réflexe) une couche cognitive
(planification et réprésentation).
Le problème d'un monde
ouvert et de sa représentation (des points de vue multiples engendrent des
mondes hétérogènes) est le fait que si le monde est trop complexe, les brusques
changements de la vision que l’agent en a (car son système permet d’intégrer
une petite partie des informations) peuvent le perturber et limiter son action à une activité réflexe. Cette partie du problème est
résolue par la mise en avant de certains informations perçues (problème de
pertinence des informations).
d-Les capteurs
On remarque aisément que, dans la majorité des actions physiques
qu’un homme exécute, il utilise principalement ses sens de la vision et du
toucher.Un système perceptif faisant appel à des capteurs capables d’acquérir
des informations à distance (comme la vision) ou au contact (comme le toucher)
devrait aider à l’exécution correcte de nombreux types de tâches non
déterminées à l’avance. On divise usuellement ces capteurs en trois catégories
:
– les capteurs au contact,
ou tactiles, sont utilisés pour la
reconnaissance géométrique de
l’environnement (par palpation) ; on parle de capteurs d’efforts lorsque l’information à acquérir concerne
une force , un couple , ou un moment.
– les capteurs à faible
distance , ou capteurs proximétriques , donnent des images de quelques points
de l’environnement local en utilisant les rayonnements infrarouges ou
ultrasonores, ou les variations de champ magnétique (pour des objets sensibles
à ce champ).
– les capteurs à
distance fournissent des images
détaillées d’un environnement plus global ; il s’agit de caméras de type.
Un senseur est un objet disposant de méthodes de calibration, d’activation/inactivation et d’aquisition. La calibration devient superflue lorsqu’on fusionne les données redondantes de plusieurs senseurs, ce qui améliore notablement la fiabilité des données et la robustesse d’aquisition. (projet ICARE)
On définira ici
l’espèce comme une communauté d’individus semblables dans leur
constitution générale et partageant le même but (ex : Se reproduire en
tant qu’espèce). De plus, la stratégie sera une combinaison de modes
d’évolution des individus et de division du travail –lorsqu’elle a lieu d’être- adoptés par les individus ou imposés par le
superviseur)
En fonction du nombre d’individus de l’environnement, du nombre d’espèces
et de la variabilité inter-spécifique, on distingue –en guise de récapitulatif-
plusieurs cas (Cf figure suivante), auxquels correspondront autant de
stratégies distinctes et parfois complémentaires parmi celles vues plus haut.
Plus on descend le long de
l’arbre des stratégies, plus les méthodes sont susceptibles de se juxtaposer.
(Ex : un agent unique pourra évoluer, deux agents identiques pourront
évoluer et coopérer, un groupe d’agents hétérogènes pourra évoluer pour se
spécialiser tout en coopérant de manière altruiste, etc...)
|
Nombre n d’individus |
Nombre e d’espèces |
Variabilité inter-
spécifique |
Stratégie |

Références:
[1]Brooks, « Achieving artificial
intelligence through building robots», A.I.Memo 864, M.I.T. A.I Lab, 1985.
[2] Botelho, Alami, "Multi Robot Cooperation
in the Martha Project", IEEE Int. Conf. On Robotics and Automation, pp.
1234-1239, 1999.
[3] Clark, “Artificial intelligence and the
biological factor ». CSRP 049, Univ. of Sussex School of Cognitive and
Computing Science, 1985.
[4] Cliff, “Computational Neuroethology: A
Provisionnal Manifesto”, Univ. of Sussex School of Cognitive and Computing
Science, 1990.
[5] Floreano, Mondada: “Evolution of Homing
Navigation in a Real Mobile Robot”.
[6] Floreano, Nofli, Mondada: "Co-Evolution
and Ontogenetic Change in Competing Robots".
[7] Harnad, ”The Symbol Grounding Problem.”,
Physica D 42: 335-346, 1990.
[8] Khatib, "Real Time Obstacle Avoidance for Manipulators and Mobile robots", IEEE Int. Conf.on Robotics and Automation, pp. 500-505, 1985.
[9] Koza, “Genetic
programming:on the programming of computers by means of natural selection”, MIT
Press Cambridge, 1992.
[10] Li, Martinoli, Abu-Mostafa :“Emergent
Specialization in Swarm Systems”.
[11] Lucidarme, Simonin, Liégeois: "Implementation
and Evaluation of a Satisfaction/Altruism Based Architecture for Multi-Robot
Systems “
[12] Mataric: "Behavior-Based Control: Examples from Navigation,
Learning, and Group Behavior", Journal of Experimental and Theoretical
Artificial intelligence, special issue on Software Architectures for Physical
Agents, 9(2-3), 1997, 323-336.
[13] Gerksey, Mataric
:"A Framework for Studying Multi-Robot Task Allocation", 2003.
[14] Parker, ”ALLIANCE, an
architecture for fault-tolerant, cooperative control of heterogenous, mobile
robots”.
[15] Reynolds: "Flocks, Herds, and Schools:A
Distributed Behavioral Model".
[16] Sellem :
« Navigation coopérative par échange de représentation de
l’environnement ».
[17] Sellem, Luzeaux :
« Répartition de la perception dans un système distribué de robots
autonomes ».
[18] Luc Steels, “Selforganising vocabularies”,
1995.
[19] Theraulaz, Bonabeau: "Response threshold
reinforcement and division of labour in insect societies"
Liens
-robots footballeurs :
http://www.robocup2003.org
www.lip6.fr/Laboratoire/Rapport_2000/Projets.pdf
www.lirmm.fr/~ferber/warbot/ProjetWarBot.html
-déplacement dans un milieu
connu
http://www.ensta.fr/~oudot/tipe/tipe.html
-projet ICARE :
http://www.inria.fr/rapportsactivite/RA2001/icare/icare_tf.html