|
Extraction de pattern d'action dans des interactions
langagieres
ou Extraction de sens dans les
collectifs humains médiés
Contexte et
problematiques
Stephane Bonneaud et Herve Guillaume
Contents
Introduction
1. Le
collectif humain médiatisé
1.1. Le médium et la collectivité.
1.2. Théories des collectifs : facteurs influençant le bon fonctionnement
1.3. Quel
médium pour les collectifs humains
?
2. Extraction
de semantique
2.1 Base théorique 2.2 Approches théoriques
existantes
3. Perspectives
et conclusions
4. POUR EN SAVOIR PLUS…
Introduction
Nous introduisons ici l'état de l'art des recherches sur
l'extraction de pattern d'interaction au sein des collectifs humains
médiatisés (Grossièrement : groupe d'individus interagissant via un
ordinateur). Cette extraction a pour but, en première approximation,
d'observer et de repérer les différents types d'interactions langagières
au sein d'un collectif afin de comprendre comment la communauté s'organise
et comment un groupe, par le biais d'interactions multiples, résout ses
problèmes et atteint ses objectifs. Nous présentons dans un premier
temps ce qu'est un collectif humain médiatisé et ses particularités, afin
d'introduire notre problématique et sa raison d'être. Dans un deuxième
temps nous présentons un état de l'art sélectif des techniques actuels en
matière d'extraction d'information.
1. Le
collectif Humain médiatisé
Le
développement de l’informatique a permis l’éclosion de moyens de
communication nouveaux. Du mail (1971) et des premiers échanges différés
de personne à personne nous sommes passés aux « salons de discussion »
permettant à plusieurs personnes de communiquer en temps réel via
l’ordinateur. L’état actuel des technologies a donc permis la création
de ce qu’il est convenu d’appeler les Collectifs Humains Médiatisés (CHM)
(cf. Etat de l’art sur les collectifs humains médiatisés de
Laure Poulain et Gabriel Ripoche), c'est-à-dire des groupes d’individu
partageant un objectif commun et interagissant au travers d’un médium, en
l’espèce l’outil de communication informatique.
1.1. Le médium et la
collectivité.
Les collectifs humains médiatisés posent le problème du rôle du médium
dans la communication et les interactions au sein d'un collectif. Ce qui
différencie principalement cette sorte d'interaction des interactions
hommes-machine simples c'est l'apparition d'une dimension sociale dans
la communication. La recherche en informatique a donc logiquement profité
des théories sociales ayant mis l'accent sur le rôle de la médiation dans
les activités humaines : la théorie de l'activité, la théorie de l'action
située (Suchman, 1987) et la cognition distribuée. Ces trois approches
ont pour point commun de mettre en avant l'importance du contexte dans
lequel l'interaction prend place, du caractère co-construit des actes
de cognition et des artefacts qui médiatisent les processus d'interaction.
Elles ont servi de fondement à la CMO (Communication Médiée par Ordinateur)
apparue dans le milieu des années 80 et qui étudie les modalités de communication
via l'ordinateur. Dans cette optique, une tentative en vue d'améliorer
le fonctionnement d'un collectif ne saurait faire l'économie de l'analyse
du support qui médiatise les interactions. Cette analyse ne peut cependant
être entreprise qu'après avoir définit ce qu'est un collectif humain
médiatisé et les facteurs qui sous-tendent son bon fonctionnement.
1.2. Théories des collectifs : facteurs influençant leur bon fonctionnement
La notion de " collectif " est en soi très vague et ne fait pas
l'objet d'un consensus. Le collectif peut être défini simplement comme un
ensemble d'agent en interaction ou comme le lieu d'affrontement d'intérêts
et d'objectifs personnels. Pour notre part nous retiendrons la définition
du collectif comme étant " un groupe avec des objectifs communs " (Schmidt
et Bannon, 1992). Dans cette optique la raison d'être du collectif est
garantie par un but commun et vouloir assurer son bon fonctionnement
nécessite de lui donner les moyens d'accéder ce but
Ceci étant
posé, quels sont les facteurs susceptibles de permettre au collectif
d'atteindre son objectif?
- Premièrement, une bonne communication entre les protagonistes et surtout
une bonne dynamique de groupe. D'une part, chaque individu doit être capable
de trouver les bons protagonistes en fonction de son objectif du moment
et donc des compétences et savoirs qu'il recherche. D'autre part, les
interactions particulières doivent aboutir à l'avancement de l'objectif
commun. Cela passe par une bonne répartition des taches (par exemple:
éviter que plusieurs personnes ne produisent le même travail !) et une
bonne coordination des différents membres et de leurs compétences.
C'est l'objectif auquel répond l'une des branches de la
CMO : le Travail Coopératif Assisté par Ordinateur (TCAO). Afin de
comprendre ce qui se joue au sein de collectif humain travaillant pour un
objectif commun, cette branche pluridisciplinaire fait appel aussi bien à
la sociologie, qu'à la psychologie, à l'informatique ou à l'économie.
L'objectif du TCAO est de trouver les moyens par lesquels les outils
informatiques permettront des interactions efficaces dans le cadre du
travail, et d'en mesurer l'impact au niveau groupe et de son
comportement.
- Deuxièmement,
une bonne diffusion du savoir. Le savoir des individus et du collectif
est construit par la combinaison des savoirs particuliers des membres
à travers les interactions. Le bon fonctionnement du collectif passera
donc par la facilitation des échanges de l'information. Ce problème constitue
l'objet d'étude de L'apprentissage Coopératif Assisté par Ordinateur (ACAO)
qui est en grande partie issu des recherches sur le TCAO. Cependant, alors
que le TCAO s'intéresse principalement à l'étude des interactions, l'ACAO
se concentre sur le contenu de ces interactions. L'individu du collectif
est conçu comme un agent recherchant activement de nouveaux savoirs et
l'ACAO vise à aménager l'espace de collaboration pour cette démarche.
En bref, un
collectif se définit par rapport à son objectif. Pour assurer son bon
fonctionnement il faut, d'une part faciliter l'échange des savoirs
(individuel ou collectif), d'autre part s'assurer de la coordination du
travail de chacun, c'est-à-dire que les objectifs particuliers doivent
être définis et coordonnés en vue de l'objectif supérieur du groupe. Le
médium informatique permettant la communication au sein d'un collectif
humain doit répondre à ces deux critères.
1.3. Quel médium pour les collectifs humains
?
Nous pouvons au regard de ce qu'est un collectif et de ce dont il a
besoin pour atteindre son objectif explorer les solutions actuelles pour
la conception d'un medium efficace.
Nous ne
savons toujours pas finalement comment la communauté du collectif se
synchronise, ou comment les individus accèdent aux connaissances et
résolvent des problèmes. Autant de questions qui soulignent bien la
complexité de telles communautés.
Ce que nous
savons est que ces communautés sont peu structurées et que l'ensemble
des participants n'est pas fixe. Les ressources (connaissances, méthodes,
etc.) sont largement distribuées et les formes de communication et d'échange
d'information sont hétérogènes. Il y a en effet des communications directes,
par chat par exemple, mais également, et souvent, des échanges langagiers
indirects et clairsemes par forum ou autres support de type " tableau
noir ".
Dans ce contexte
distribué et d'interaction humain-machine-humain, l'approche multi-agents
semble la plus prometteuse. Les
systèmes multi agents, inspirés de l'informatique distribuée et issus
de l'intelligence artificielle distribuée, permettent, grâce à la répartition
des problèmes à traiter entre différents agents, de gérer des systèmes
:
· dans
lequel aucun contrôle central ne peut être effectue ; · dont la
configuration varie dans le temps suivant la manière dont les individus
l'utilisent ou interagissent avec ;
· qui sont immergés dans les collectivités humaines et qui doivent supporter
un manque d'information sur ces collectivités ;
· qui doivent associer des logiciels très différents dans leurs fonctions,
fonctionnements et méthodes de communication ;
· qui permettent de part le regroupement des
différents composants du système, l'émergence de comportements
intéressants ;
· qui doivent constamment s'adapter a leur environnement (social, physique,
informatique) afin d'augmenter leur efficacité.
(cf. Drogoul)
Les systèmes
multi-agents sont bien au cœur de ces problématiques. D'autre part, nous
allons voir qu'ils sont pertinents face à deux des problèmes
principaux que rencontre la collectivit: la conception participative et
la gestion des problèmes.
a. La conception
participative
La conception participative
représente en fait la tentative de faire travailler ensemble des
individus hétérogènes. Il s'agit ici de chercher a atteindre le but du
collectif, donc de concevoir collectivement et faire avancer le travail
du collectif. Au niveau multi agents, la recherche dans la conception
participative vise à utiliser des agents comme médiateurs des
interactions, et à permettre a des experts et des non experts de
collaborer de façon interactive en considérant ces individus comme des
agents immerges dans un contexte informatique. En particulier, l'idée
est d'utiliser avantageusement les agents autonomes. Ils feraient partie
du système informatique (gestion des connaissances, traitement des
communications, etc.) mais pourraient également servir d'agents
assistants ou agents dédies a un utilisateur. En les dotant de capacités
d'apprentissage, ils pourraient au travers de leurs interactions
améliorer leur comportement (par apprentissage par imitation, par
démonstration, par apprentissage social, etc.) (cf. EN SAVOIR
PLUS). On aurait des agents situes et adaptatifs tout a fait
pertinents pour les communautés distribuées et complexes auxquelles nous
nous intéressons. Un exemple interessant de travaux a suivre dans
cette problematique : l'Action Spécifique " Conception participative de modèles de simulations
orientées agent " dont le coordinateur est Alexis Drogoul (LIP6,
UPMC).
b. La gestion des problèmes
La gestion
du collectif se heurte à la quantité de données disponibles et à la
difficulté de les organiser. Il faut en plus dans ce cadre gérer les
problèmes apparaissant dans la communauté c'est à dire les identifier,
de suivre leur évolution et de les traiter. Cette problématique est
donc celle de l'avancement de la collectivité dans la gestion des erreurs
et problèmes.
Au niveau multi agents, on pense a des agents "archiveurs"
dans le domaine de la recherche, de l'organisation et de l'accès a
l'information. Les agents assistants peuvent également aider à la
résolution de problème en orientant vers l'information, vers d' autres
individus, etc.
En d'autres
termes, l'étude par les systèmes multi agents des systèmes complexes,
auto-organisées et situes, et la recherche de comportements cohérents
produits par ces communautés hétérogènes se résument en une question :
Comment obtenir des comportements cohérents de la part d'un grand nombre
d'agents hétérogènes (humains, computationnels) qui interagissent de manière
inconnue, irrégulière et variable dans le temps ?
Répondre a cette question, c'est permettre de construire un système informatique
intelligent, adaptatif et autonome tout a fait adapté a notre problématique
de gestion des collectifs.
Plus concrètement
dans ces collectifs, il s'agit de permettre l'échange des savoirs. Or
essentiellement, dans ces communications humain-humain, c'est la langue
naturelle qui est la plus utilisée et certainement la plus efficace. Tenter
de formaliser les interactions dans ce type de communautés n'est pas une
solution envisageable. La question du traitement de la langue naturelle,
de la récupération à partir de celle-ci de connaissance, d'information
est centrale pour nous. C'est pourquoi, nous parlerons de traitement de
la langue naturelle et par là d'extraction de sémantique (c'est-à-dire
du sens des choses).
Il s'agit également de permettre la coordination du travail, des compétences,
des membres. Or permettre cette coordination c'est avoir une vue globale,
et donc c'est avoir des mécanismes pour comprendre ce qui se passe dans
ces communautés.
Pour comprendre ce qui se passe, nous nous intéressons aux interactions
qui sont l'expression locale de la collaboration. Ces interactions particulières
visent a répondre a un problème (ponctuel ou non) du collectif. Appréhender
ces interactions, c'est permettre une gestion globale de la communauté,
le suivi du but commun, et un renvoi, un feedback (une réflexivité) de
la communauté sur elle-même.
Pour finir,
maintenant que nous avons appréhendé l'approche actuelle des systèmes
multi agents et vu en eux la promesse de résultats, nous nous intéressons
a une sous problématique particulièrement importante. Dans tous les
cas, nous voyons qu'un point essentiel de la gestion du collectif est la
capacité par l'ordinateur de traiter la langue naturelle, support de la
majorité des échanges langagiers. Ce point vient de la volonté de
permettre a l'ordinateur d'extraire automatiquement des connaissances sur
ce qui se passe dans la communauté. Nous étudierons donc maintenant
l'extraction de sémantique, en vue de récupérer automatiquement des
informations sur ce qui se passe (le sens des choses).
2. Extraction de sémantique
Après avoir exploré le contexte de travail - les collectifs médiés
humains - puis avoir replacé l'informatique et sa fonction de médium actif
dans ce contexte, et finalement avoir établit notre approche agent, nous
accédons enfin à la problématique première de ce travail : l'extraction de
patterns d'action dans des interactions langagières. En première
approximation, notre but est d'observer et de repérer les différents types
d'interactions langagières et le sens qu'elles véhiculent afin de
comprendre comment la communauté s'organise et comment le groupe, par le
biais d'interactions multiples, résout ses problèmes et atteint ses
objectifs.
Le but étant
de dégager du sens, nous exposerons d'abord la base théorique pour l'étude
de la sémantique dans des interactions langagières. Puis, nous explorerons
quelques domaines connexes. Sans prétendre faire un état de l'art
exhaustif du domaine, nous souhaitons mettre en avant les recherches qui
nous paraissent pertinentes et en dessiner les contours.
2.1 Base
théorique
Il
existe une base théorique à l'étude de la sémantique dans les interactions
langagières.
La base
théorique mise en œuvre est le modèle des "actes de langage" qui a été
développé par Austin et Searle (philosophes de la langue). Pour ces
auteurs, l'unité de base du discours est " l'acte de langage " (ou de
dialogue).
D'après
Austin, " Parler c'est agir, c'est modifier l'état d'âme de l'autre et par
delà, l'état des choses ". C'est à ce niveau qu'apparaît la notion d'actes
de langage. " La problématique de la langue naturelle n'est plus celle
d'un Sens Absolu, hors du langage humain, mais celle de l'efficacité de
l'interaction. Un énoncé n'est plus Vrai ou Faux ; il réussit ou il échoue
(dans son intention). ".
Partant de la thèse d'Austin, John Searle (1969) a fondé une théorie des
actes de langage ou " Speech Acts " qui désignent l'ensemble des actions
intentionnelles effectuées au cours d'une interaction. " Il existerait
cinq catégories d'actes de langage : Assertifs (Tell), Directifs
(Do), Promissifs (Commit), Expressifs (Mood), Déclaratifs (Declare). Les
discours langagiers sont donc vus comme porteurs d'une intention, et la
sémantique considérée uniquement dans ce cadre.
Rappelons que
notre problématique est de caractériser avant tout la façon dont les
membres interagissent en vue de résoudre les problèmes et de concevoir
collectivement. Chaque inter-action peut être vu comme une série d'actions
réciproques dont on observera l'impact sur les objectifs fixés par le
collectif. Dans cette optique les traces langagières gagnent à être
analysés au sein de la théorie des actes de langage comme des actions
intentionnelles. Nous chercherons donc à identifiés des patterns d'action,
dont l'identification passera par une analyse des verbes employés lors des
interactions langagières.
2.2
Approches théoriques existantes
Une fois les traces langagières des interactions récupérées (exemple
: conversation par chat sous format XML), leur traitement en vue d'extraire
des éléments particuliers peut faire l'objet de plusieurs approches. Différents
domaines ont travaillé sur le problème du sens. La linguistique étudie
sa forme langagière, la logique et l'informatique en élabore des modèles
formels et l'opérationnalise, la psychologie essaie de comprendre les
processus qui président à son émergence chez l' humain, la sociologie
de rendre compte des mécanismes collaboratifs de sa construction, etc.
De nombreux
domaines sont intéressés par le problème de l'extraction
de sens, nous avons souhaité n'en présenter que trois d'entres eux : d'une
part, le TAL (Traitement Automatique de la Langue) et la fouille de données
qui supportent le problème de l'extraction d'informations en générale
et de sa formalisation et , d'autre part, l'acquisition de sémantique
(d'après les travaux du professeur Habert du LIMSI) qui s'intéresse directement
au problème de l'extraction du sens et qui propose une approche alternative.
TAL
(Traitement Automatique de la Langue)
Les premières recherches en Traitement Automatique du Langage
visaient à créer un modèle unique, capable de formaliser la compréhension
du langage dans sa globalité. Cette approche, initiée par Chomsky, s'est
vite avérée difficile à mettre en œuvre.
A l'heure
actuelle, les systèmes de TAL utilisent une approche à base de corpus,
moins ambitieuse mais beaucoup plus pragmatique. Celle-ci consiste à
utiliser un corpus de documents représentatifs du domaine à modéliser. Le
système va l'utiliser pour obtenir une couverture du langage suffisante
afin de permettre au système de TAL de donner des résultats de bonne
qualité.
Très
brièvement nous présentons ici la technique théorique qui décompose
l'analyse d'un texte en quatre étapes successives d'analyse : ·
L'analyse morpho-lexicale, qui se préoccupe de la structure des mots
; · L'analyse syntaxique dédiée à l'analyse de la structure des phrases
; · L'analyse sémantique qui s'intéresse au sens des phrases
considérées individuellement ; · L'analyse pragmatique qui s'attache à
remettre un contexte autour des phrases
Chacun de ces
modules d'analyse traite une caractéristique spécifique du langage.
Pratiquement, un texte ne subit pas successivement chaque niveau
d'analyse, ces derniers interagissant au cours du traitement. La
distinction de ces éléments est donc avant tout pédagogique.
Photo : "
Le traitement automatique du langage ", KMCenter, 2002,
Le TAL s'intéresse
strictement à la langue naturelle et reste collé à ses caractéristiques
(la syntaxe, etc.). A la différence, nous travaillons sur des interactions
langagières pour satisfaire des considérations autres que celles de la
langue naturelle. Même si celle-ci est sûrement le langage le plus efficace
dans les interactions humaines. Donc, s'il est intéressant d'emprunter
des outils et des méthodes au domaine du TAL, notre approche plus orientée
vers les actes de langage se démarque de la démarche classique
du TAL.
Fouille de
données
Les entrepôts de données et la fouille de données sont les éléments
d'un domaine de recherche et de développement très actifs actuellement :
l'extraction de connaissances à partir de données ou Knowedge Discovery in
Databases (KDD for short). Par ce terme, on désigne tout le cycle de
découverte d'information. Il regroupe donc la conception et les accès à de
grandes bases de données ; tous les traitements à effectuer pour extraire
de l'information de ces données ; l'un de ces traitements est l'étape de
fouille de données ou Data Mining. Il est hors d'atteinte d'un tel
travail de prétendre dresser une liste exhaustive de toutes les techniques
disponibles en fouille de données. Pour n'en citer que quelques unes :
l'algorithme des k-moyennes, les règles d'association, la méthode des plus
proches voisins, les arbres de décision et les réseaux de
neurones.
Voici une
brève présentation pratique de la méthode générale: Processus Itératif
en 4 étapes :
" Nettoyage et Intégration de bases de
données Suppression des données inconsistantes ou
combinaison de données de différentes sources pour constituer un
entrepôt " Prétraitement de
données Sélection ou transformation de données de
l'entrepôt pour les rendre exploitables " Fouille de données Utilisation de méthodes
intelligentes pour extraire des motifs. Tâches: caractérisation,
discrimination, association, classification, prédiction, analyse de
données évolutives " Evaluation et
Présentation Identifier les motifs intéressants, les
visualiser, et interagir
Il est à noter
que la fouille de données est largement associée à des méthodes d'apprentissage
qui vont chercher à rendre la fouille plus performante et à adapter les
mécanismes aux données traitées. Ce point là est particulièrement intéressant
car l'apprentissage permet de travailler sur des corpus de données obscurs,
c'est-à-dire non totalement saisissables ou définissables. Dans notre
contexte de collectifs médiés, ces mécanismes d'apprentissage sont très
intéressants.
La fouille de données est
déjà beaucoup plus pertinente dans notre problématique. Notre contexte, le
collectif médié humain, peut, comme nous le verrons plus tard, réunir un
corpus de langage très important, éventuellement très hétérogène et non
corrigé. C'est-à-dire que nous aurons à faire avec des interactions
langagières d'acteurs ne cherchant pas à se conformer aux règles strictes
de la langue, mais à se faire comprendre ponctuellement par quelqu'un dans
un contexte donné. La fouille de données, parce qu'elle sonde des bases de
données importantes et cherche à en extraire de l'information, promet
d'offrir des techniques et des outils robustes pour la manipulation de nos
corpus langagiers.
Acquisition de
sémantique
Principe de l'acquisition sémantique (travaux professeur Habert -
ORSAY)
Il nous a
semblé intéressant de présenter également l'acquisition sémantique. Cette
approche a des avantages qui nous ont attiré et peut éventuellement
apporter un éclairage nouveau à notre problématique.
Il s'agit de
développer des méthodes pour révéler, caractériser ou paramétrer la sémantique.
On va donc essayer de rapprocher les mots entres eux, de faire des liens.
Par exemple, on va rapprocher les synonymes et les antonymes. La sémantique
s'apparente là à une mise en relation, non à un Sens absolue. On peut
penser à la théorie cognitiviste qui affirme que l'humain se construit,
lors de la lecture d'un texte par exemple, une représentation, structurée
en réseau de propositions. Prenons l'exemple du dictionnaire, la définition
d'un mot est un sous-réseau d'autres mots, et tout son sens est définit
par cet agencement particulier.
Dnas le cadre de cette démarche, l'acquisition de sémantique propose
l'hypothèse suivante :
" Deux mots sont similaires si on arrive à
les placer dans le même contexte.
Au lieu de
chercher des liens de proximité entre deux mots, il s'agit donc de trouver
un contexte commun à ces deux mots. Donc, au lieu de lier des mots par des
liens pas forcement évidents à formuler (liens d'opposition, liens de
complémentarité, etc.) et au lieu de se poser la question du nombre de
liens que l'on devra établir (nombre qui pourrait être très grand !), nous
limitons la problématique à un travail sur le contexte. Ca n'est plus des
mots que l'on rapproche, mais un contexte que l'on construit.
Les questions
sont alors détournées sur le contexte : par exemple, quelle est sa taille
? Il s'agit alors de développer des techniques pour faciliter la
recherche de contexte commun. On peut, par exemple, si on prend un mot,
changer sa forme (verbe passé à l'infinitif), et ainsi permettre un
rapprochement sur un plus petit nombre de traits, découvrant un petit
contexte. Les traits sont ici les paramètres de comparaison entre les
mots. De leur choix dépendra la pertinence de l'analyse.
Une fois tout
le travail sur le contexte effectué, on s'intéresse aux mots. On peut les
représenter chacun par un vecteur, ou même parfois par une matrice creuse.
Deux mots sous la forme de vecteurs peuvent plus aisément être comparés.
On peut, par exemple, calculer la distance entre eux et ensuite avec cette
distance utiliser des techniques de clustering, c'est-à-dire qu'on
rassemble des mots en groupes. La construction de ces groupes est
également un travail, mais une fois les critères de regroupement établis,
on peut éventuellement manipuler ces groupes (en jouant sur la géométrie
de ces groupements : arbres, etc.).
Une fois ces
mots mis sous forme de vecteurs et organisés en groupes, on peut
construire des familles et organiser des hiérarchies de familles. On peut
alors tester si un mot appartient à une famille donnée ou à une de ses
sous famille par exemple. De ce concept de famille, c'est-à-dire d'une
sorte de définition du groupe, on obtient immédiatement la description
idéale de l'individu représentant le groupe et ayant toutes ses
caractéristiques, on obtiendra un patron. Il est alors facile d'utiliser
ce patron pour la comparaison de mots par exemple, ou pour acquérir des
apprentissages de reconnaissance de mots par des agents ou systèmes
informatiques donnés.
Cette
approche nous paraissait intéressante pour une raison. Elle rappelle que
la sémantique peut également se chercher, voire se définir, en contexte.
Celui-ci pourrait en fait devenir un objet d'étude. Dans un collectif
médié, nous sommes confrontés à des interactions langagières prenant sens
dans un contexte de travail. Les patterns d'action devront donc être
étudiés en fonction de ce contexte.
Autres
D’autres domaines sont intéressés ou intéressants pour notre
problématique. La psychologie cognitive, la linguistique, etc.
3. Perspectives et conclusions
Replacons maintenant notre problématique de l’extraction des
patterns d’action dans des interactions langagières. Notre contexte
apparaît plus clair, il s’agit d’un collectif médié humain dont l’objectif
principal est l’accomplissement de son but. Nous nous inscrivons dans
cette problématique en cherchant à permettre au système informatique de
manipuler plus efficacement et plus activement les interactions inter
humaines du collectif. Nous entendons par efficace et active une
manipulation permettant une organisation plus pertinente des données, un
accès plus automatisé et plus précis, un feedback sur le travail collectif
et une collaboration plus acéré. Le collectif ainsi doté de réflexivité
aurait un mécanisme auto régulateur lui assurant une plus grande
robustesse face aux problèmes et un meilleur angle de vue pour préciser
son évolution vers son but.
Voici maintenant un ensemble de travaux, groupes de recherche ou
laboratoires concernés par cette problématique.
|
Dans le cadre de RTP 38: L'Action Specifique CoMETE (Co-construction
éMergente d'Expérience par
inTEraction)
Coordinateurs : Salima Hassas, Alain Mille (LIRIS, UCB Lyon
1)
Le réseau se propose d'étudier les phénomènes de construction
de sens dans les processus humains et/ou artificiels : ? pour les
sujets humains, dans le paradigme 'action située et distribuée'
(rapport à l'activité et au contexte social, corporel et matériel),
? pour les agents informatiques, dans une perspective de
conception de représentation du monde et d'acquisition des
connaissances par interaction avec d'autres agents et leur
environnement, pour les agents humains en situation
"d'interaction" avec l'artificiel (agents informatiques) : notion
d'assistants.
Concretement, les differentes aspects que se propose
d'etudier cette AS se resument par les cinq points suivants
: " d'identifier les différentes formes d'expériences que l'on
peut tracer lors de la réalisation d'une tâche collective ; " de
fournir des moyens de les représenter , de les exploiter
efficacement dans un contexte informatique ; " de fournir un
paradigme d'assistance basé sur la capitalisation de l'expérience,
fruit de la réutilisation en contexte de l'expérience individuelle
et collective ; " d'étudier la co-construction d'un sens commun,
dans un collectif par interaction ; " d'étudier la co-évolution
et apprentissage des individus engagés dans un processus collectif
de partage d'expérience.
Participants et leurs travaux : Zacklad :
MEDIANNOTE -- Annotations numériques collectives pour la gestion des
connaissances dans les activités coopératives Ploux :
Acquisition, représentation, classification automatique des concepts
dans le domaine des sciences cognitives Grainger :
Modélisation computationnelle de l'apprentissage de mots
écrits Paroubek : Vers un modèle Action-Perception pour
la Compréhension du Langage (APCOLAN)
|
Ces travaux sont tout a fait dans la dynamique de notre
problematique. Ils se concentrent sur les problemes du sens dans les
collaborations (realisation d'une tache par un groupe). L'idee est de
chercher a extraire ce qui se passe, la logique des experiences des
individus, a la representer et a la reutiliser (la reinjecter dans le
collectif). De la, l'AS cherchera a etudier la co-construction du sens
commun a travers les interactions inter individus.
|
RTP 33 - Documents et contenu : création,
indexation, navigation
Les problematiques traitees ici sont l’accès partagé à
l’information, la gestion des connaissances pour les organisations,
une valeur ajoutée pour les services, la transformation des
industries culturelles dans le cadre individuel ou de collectif. Il
s’agit donc de : « Analyser les documents (structure,
évolutivité, collection, etc.), les médiations (techniques et
sociales) et leur relation avec l'activité humaine et ses limites
(navigation, recherche documentaire et utilité, construction sociale
des normes..). S’interroger sur les outils à construire, sur les
modalités de leur construction et sur les conséquences de leur
utilisation. Croiser l’informatique (conception des systèmes et
outils), la linguistique (analyse de textes, construction de
terminologies et multilinguisme), les sciences cognitives
(construction du sens), et les « sciences de l’information »
(construction des modèles sociaux). Discuter la notion de «
document », renouvelée sinon contestée par le développement
numérique. » |
|
Laboratoire
ICAR (Interactions, Corpus, Apprentissages,
Représentations) – Lyon2 (lien)
Le laboratoire ICAR a pour objectif de décrire et de
théoriser le fonctionnement des différents types d'interactions
communicatives, de la conversation familière aux échanges en
contexte institutionnel. Ses travaux s'inscrivent dans le cadre de
l'approche interactionnelle et cognitive des faits de langue et de
discours. |
|
Projet RTP
39
L’objectif ici est de developper des cooperations profondes
entre les acteurs concernes par les concepts autour de celui de
connaissance, par les methodes et techniques de modelisation de la
structure de l’information et des fonctions permettant les actes de
connaissance. Outre coupler les activités fondamentales et les
applications, la contribution originale du programme est d'aborder
ces questions de façon profondément transdisciplinaire, mettant en
jeu les 3 départements STIC, SDV et
SHS. |
|
ACOSTIC lien
Activité, Connaissances & Organisation Action
spécifique n° 53, RTP n° 35 "Economie et Société" Animation :
Régine Teulier (CRG) & Pascal Salembier (IRIT)
(Le RTP 35 compte l’Actions Spécifiques Pratiques Collectives
Distribuées et Technologies de Coopération (PCD-TC))
Contact: Manuel Zackald Dans le contexte collectif, les
systèmes informatiques doivent non seulement apporter de
l'information mais aussi être des supports de plus en plus
sophistiqués et sémantiquement riches de l'activité, dont ils
deviennent un support crucial. La conception de tels outils dans le
tissu organisationnel suppose de prendre en compte la complexité de
la cognition, des situations de travail collectif, des modes
d'organisation, des tissus organisationnels et institutionnels.
Globalement, il s'agit de produire des modèles et des artefacts
intervenant dans l'ensemble complexe qui génère et résulte de
l'activité humaine dans les organisations. L'activité humaine, les
connaissances et l'organisation qu'on se propose d'assister
deviennent alors centrales pour les STIC, cependant qu'elles sont
aussi étudiées dans de nombreuses disciplines. On peut ainsi se
focaliser sur trois concepts clés (entendus dans un sens très
générique), abordés par plusieurs champs disciplinaires dont les
acquis conceptuels et méthodologiques cumulés notamment des Sciences
Humaines et Sociales sont déjà nombreux. Un champ de recherche se
dessine, balisé autour de ces trois concepts et de leurs liens :
recouvrant des processus cognitifs individuels et collectifs. C'est
pourquoi cette trilogie nous semble suffisamment fédératrice pour
être reprise en titre de l'AS et susciter des échanges
pluridisciplinaires qui peuvent contribuer à orienter les
différentes approches disciplinaires. |
4. POUR EN
SAVOIR PLUS…
… sur les théories évoquées
:
L’ACAO
E-learning pour une intelligence collective de
l’entreprise (processus par lequel des apprenants acquièrent de
nouvelles compétences ou connaissances afin d’améliorer leur
performance.)
… sur les domaines de recherches et les
laboratoires :
La fouille de données
Outils commercialisés de fouille de données : Intelligent
Miner, Entreprise Miner (SAS Institute), MineSet (Silicon
Graphics Inc.), Clementine (Integral Solutions Ltd, racheté par
SPSS), DBMiner (
ou autre lien, version
libre 90 jours),
Sites pour la fouille de données http://www.kddnuggets.com/ : à consulter http://www.crisp-dm.org/ : CRoss-Industry Standard
Process for Data Mining - effort de standardization
Livres P. Adriaans and D. Zantinge. Data Mining.
Addison-Wesley, 1996
J. Hertz, A. Krogh & R. G. Palmer, An introduction to the
theory of Neural Computation (Addison-Wesley, 1991) C.M. Bishop,
Neural Networks for Pattern Recognition (Oxford: Oxford University
Press, 1995) L. Devroye, L. Györfi and G. Lugosi, A Probabilistic
Theory of Pattern Recognition, (Springer-Verlag
1996)
L’acquisition de sémantique
Le professeur Benoit Habert du LIMSI
L’approche multi agents
Cours • Courses @ multiagent.com : around 30 links to agents and
multi-agent courses. Submitted by their authors. • Courses @ AgentLink.org :
broken down by countries, this database is part of AgentLink's effort to
highlight and improve available resources on Agent training and teaching
in Europe. Submitted by the educational institutions. • Courses @
AgentWeb : around 60 links to agents and multi-agent courses (some
outdated). Submitted by their authors.
Qu'est-ce que l'Autonomie ajustable ? Qu'est-ce que
l'Apprentissage interactif situe ?
Autres
La Société de
Linguistique de Paris
Sociologie :
Bernard Conein (Lille) Gensollen (ENST) Nicolas
Auray
(ENST)
… sur les conférences
et évènements :
Journée Fouille de données et Applications
médicales Mercredi 14 mai 2003 45, rue d'Ulm, Paris –
France Les techniques dites de "Fouille de données" (traduit de
l'anglais data mining) sont issues de multiples domaines de recherche :
bases de données, statistiques, apprentissage automatique, intelligence
artificielle, théorie de la décision, algorithmique... Le fouille de
données se définit comme l'extraction à partir de données brutes de
connaissances potentiellement exploitables. Les professionnels de la
santé sont aujourd'hui confrontés aux avancées rapides des technologies
de l'information et à l'évolution des systèmes d'informations qui ont eu
lieu ces dernières décennies. Cette journée représente une
opportunité pour les chercheurs et industriels des domaines de la santé
et de l'informatique de partager leurs idées et leurs visions. C'est
aussi l'occasion de découvrir la discipline de l'informatique médicale
aujourd'hui en plein essor.
Pour ceux qui sont tres interesses, differentes conférences pour
la fouille de données : PAKDD, PKDD, SIAM-Data Mining, (IEEE) ICDM,
DaWaK, SPIE-DM, etc.
La 11ème conférence annuelle sur le traitement automatique des
langues (TALN-2004) : Lieu : Fès, au Maroc du 19 au 22
avril 2004 Organisateur : Philippe Blache - LPL, UMR 6057 Thème :
Les conférences JEP ("Journées d'Etude sur la Parole") et TALN
("Traitement Automatique des Langues Naturelles") constituent les
manifestations scientifiques francophones les plus importantes dans le
domaine du traitement de la parole et de l'écrit. Elles réunissent une
communauté scientifique très interdisciplinaire abordant le domaine des
sciences du langage à la fois dans ses aspects descriptifs, formels et
computationnels. Des travaux théoriques autant que des applications et
des systèmes y sont présentés. Pour plus d’informations : http://www.lpl.univ-aix.fr/jep-taln04/
… sur la presse et biblio :
Journal of
Computer-Mediated Communication
Magazine
of Computer-Mediated Communication
L’actualité scientifique des sciences
sociales
Articles
Le Langage
: Un numéro hors-série de Sciences Humaines réalisé avec le
CNRS
L'Internet : un nouveau modèle de communication
scientifique ?
Revue
Traitement Automatique des Langues
Traitement de la connaissance – théories du
langage
• THEORIE DE LA PERTINENCE: NOUVEAUX DEVELOPPEMENTS (Sperber, en
collaboration avec Deirdre Wilson)
• L. Charnay (LIMSI/CNRS). Un modèle informatique d'acte de
dialogue. Ergo IA 96, pp. 61-70.
Autres
Encyclopédie Yahoo !
Département
des Sciences de l’Homme et de la Société –
CNRS
|