Extraction de pattern d'action dans des interactions langagieres

ou Extraction de sens dans les collectifs humains m
édiés

Contexte et problematiques

 

Stephane Bonneaud et Herve Guillaume

 

 

Contents

Introduction

1. Le collectif humain médiatisé

1.1. Le médium et la collectivité.
1.2. Théories des collectifs : facteurs influençant le bon fonctionnement
1.3. Quel médium pour les collectifs humains ?

2. Extraction de semantique

2.1 Base théorique
2.2 Approches théoriques existantes

3. Perspectives et conclusions

4. POUR EN SAVOIR PLUS…



Introduction


Nous introduisons ici l'état de l'art des recherches sur l'extraction de pattern d'interaction au sein des collectifs humains médiatisés (Grossièrement : groupe d'individus interagissant via un ordinateur). Cette extraction a pour but, en première approximation, d'observer et de repérer les différents types d'interactions langagières au sein d'un collectif afin de comprendre comment la communauté s'organise et comment un groupe, par le biais d'interactions multiples, résout ses problèmes et atteint ses objectifs.
Nous présentons dans un premier temps ce qu'est un collectif humain médiatisé et ses particularités, afin d'introduire notre problématique et sa raison d'être.
Dans un deuxième temps nous présentons un état de l'art sélectif des techniques actuels en matière d'extraction d'information.


1. Le collectif Humain médiatisé

Le développement de l’informatique a permis l’éclosion de moyens de communication nouveaux. Du mail (1971) et des premiers échanges différés de personne à personne nous sommes passés aux « salons de discussion » permettant à plusieurs personnes de communiquer en temps réel via l’ordinateur.
L’état actuel des technologies a donc permis la création de ce qu’il est convenu d’appeler les Collectifs Humains Médiatisés (CHM) (cf. Etat de l’art sur les collectifs humains médiatisés de Laure Poulain et Gabriel Ripoche), c'est-à-dire des groupes d’individu partageant un objectif commun et interagissant au travers d’un médium, en l’espèce l’outil de communication informatique.


1.1. Le médium et la collectivité.

Les collectifs humains médiatisés posent le problème du rôle du médium dans la communication et les interactions au sein d'un collectif. Ce qui différencie principalement cette sorte d'interaction des interactions hommes-machine simples c'est l'apparition d'une dimension sociale dans la communication. La recherche en informatique a donc logiquement profité des théories sociales ayant mis l'accent sur le rôle de la médiation dans les activités humaines : la théorie de l'activité, la théorie de l'action située (Suchman, 1987) et la cognition distribuée. Ces trois approches ont pour point commun de mettre en avant l'importance du contexte dans lequel l'interaction prend place, du caractère co-construit des actes de cognition et des artefacts qui médiatisent les processus d'interaction. Elles ont servi de fondement à la CMO (Communication Médiée par Ordinateur) apparue dans le milieu des années 80 et qui étudie les modalités de communication via l'ordinateur. Dans cette optique, une tentative en vue d'améliorer le fonctionnement d'un collectif ne saurait faire l'économie de l'analyse du support qui médiatise les interactions. Cette analyse ne peut cependant être entreprise qu'après avoir définit ce qu'est un collectif humain médiatisé et les facteurs qui sous-tendent son bon fonctionnement.


1.2. Théories des collectifs : facteurs influençant leur bon fonctionnement

La notion de " collectif " est en soi très vague et ne fait pas l'objet d'un consensus. Le collectif peut être défini simplement comme un ensemble d'agent en interaction ou comme le lieu d'affrontement d'intérêts et d'objectifs personnels. Pour notre part nous retiendrons la définition du collectif comme étant " un groupe avec des objectifs communs " (Schmidt et Bannon, 1992). Dans cette optique la raison d'être du collectif est garantie par un but commun et vouloir assurer son bon fonctionnement nécessite de lui donner les moyens d'accéder ce but

Ceci étant posé, quels sont les facteurs susceptibles de permettre au collectif d'atteindre son objectif?
- Premièrement, une bonne communication entre les protagonistes et surtout une bonne dynamique de groupe. D'une part, chaque individu doit être capable de trouver les bons protagonistes en fonction de son objectif du moment et donc des compétences et savoirs qu'il recherche. D'autre part, les interactions particulières doivent aboutir à l'avancement de l'objectif commun. Cela passe par une bonne répartition des taches (par exemple: éviter que plusieurs personnes ne produisent le même travail !) et une bonne coordination des différents membres et de leurs compétences.
C'est l'objectif auquel répond l'une des branches de la CMO : le Travail Coopératif Assisté par Ordinateur (TCAO). Afin de comprendre ce qui se joue au sein de collectif humain travaillant pour un objectif commun, cette branche pluridisciplinaire fait appel aussi bien à la sociologie, qu'à la psychologie, à l'informatique ou à l'économie. L'objectif du TCAO est de trouver les moyens par lesquels les outils informatiques permettront des interactions efficaces dans le cadre du travail, et d'en mesurer l'impact au niveau groupe et de son comportement.

- Deuxièmement, une bonne diffusion du savoir. Le savoir des individus et du collectif est construit par la combinaison des savoirs particuliers des membres à travers les interactions. Le bon fonctionnement du collectif passera donc par la facilitation des échanges de l'information. Ce problème constitue l'objet d'étude de L'apprentissage Coopératif Assisté par Ordinateur (ACAO) qui est en grande partie issu des recherches sur le TCAO. Cependant, alors que le TCAO s'intéresse principalement à l'étude des interactions, l'ACAO se concentre sur le contenu de ces interactions. L'individu du collectif est conçu comme un agent recherchant activement de nouveaux savoirs et l'ACAO vise à aménager l'espace de collaboration pour cette démarche.

En bref, un collectif se définit par rapport à son objectif. Pour assurer son bon fonctionnement il faut, d'une part faciliter l'échange des savoirs (individuel ou collectif), d'autre part s'assurer de la coordination du travail de chacun, c'est-à-dire que les objectifs particuliers doivent être définis et coordonnés en vue de l'objectif supérieur du groupe. Le médium informatique permettant la communication au sein d'un collectif humain doit répondre à ces deux critères.


1.3. Quel médium pour les collectifs humains ?

Nous pouvons au regard de ce qu'est un collectif et de ce dont il a besoin pour atteindre son objectif explorer les solutions actuelles pour la conception d'un medium efficace.

Nous ne savons toujours pas finalement comment la communauté du collectif se synchronise, ou comment les individus accèdent aux connaissances et résolvent des problèmes. Autant de questions qui soulignent bien la complexité de telles communautés.

Ce que nous savons est que ces communautés sont peu structurées et que l'ensemble des participants n'est pas fixe. Les ressources (connaissances, méthodes, etc.) sont largement distribuées et les formes de communication et d'échange d'information sont hétérogènes. Il y a en effet des communications directes, par chat par exemple, mais également, et souvent, des échanges langagiers indirects et clairsemes par forum ou autres support de type " tableau noir ".

Dans ce contexte distribué et d'interaction humain-machine-humain, l'approche multi-agents semble la plus prometteuse. Les systèmes multi agents, inspirés de l'informatique distribuée et issus de l'intelligence artificielle distribuée, permettent, grâce à la répartition des problèmes à traiter entre différents agents, de gérer des systèmes :

· dans lequel aucun contrôle central ne peut être effectue ;
· dont la configuration varie dans le temps suivant la manière dont les individus l'utilisent ou interagissent avec ;
· qui sont immergés dans les collectivités humaines et qui doivent supporter un manque d'information sur ces collectivités ;
· qui doivent associer des logiciels très différents dans leurs fonctions, fonctionnements et méthodes de communication ;
· qui permettent de part le regroupement des différents composants du système, l'émergence de comportements intéressants ;
· qui doivent constamment s'adapter a leur environnement (social, physique, informatique) afin d'augmenter leur efficacité.
(cf. Drogoul)

Les systèmes multi-agents sont bien au cœur de ces problématiques. D'autre part, nous allons voir qu'ils sont pertinents face à deux des problèmes principaux que rencontre la collectivit: la conception participative et la gestion des problèmes.

a. La conception participative

La conception participative représente en fait la tentative de faire travailler ensemble des individus hétérogènes. Il s'agit ici de chercher a atteindre le but du collectif, donc de concevoir collectivement et faire avancer le travail du collectif.
Au niveau multi agents, la recherche dans la conception participative vise à utiliser des agents comme médiateurs des interactions, et à permettre a des experts et des non experts de collaborer de façon interactive en considérant ces individus comme des agents immerges dans un contexte informatique. En particulier, l'idée est d'utiliser avantageusement les agents autonomes. Ils feraient partie du système informatique (gestion des connaissances, traitement des communications, etc.) mais pourraient également servir d'agents assistants ou agents dédies a un utilisateur. En les dotant de capacités d'apprentissage, ils pourraient au travers de leurs interactions améliorer leur comportement (par apprentissage par imitation, par démonstration, par apprentissage social, etc.) (cf. EN SAVOIR PLUS).
On aurait des agents situes et adaptatifs tout a fait pertinents pour les communautés distribuées et complexes auxquelles nous nous intéressons.
Un exemple interessant de travaux a suivre dans cette problematique : l'Action Spécifique " Conception participative de modèles de simulations orientées agent " dont le coordinateur est Alexis Drogoul (LIP6, UPMC).


b. La gestion des problèmes

La gestion du collectif se heurte à la quantité de données disponibles et à la difficulté de les organiser. Il faut en plus dans ce cadre gérer les problèmes apparaissant dans la communauté c'est à dire les identifier, de suivre leur évolution et de les traiter. Cette problématique est donc celle de l'avancement de la collectivité dans la gestion des erreurs et problèmes.
Au niveau multi agents, on pense a des agents "archiveurs" dans le domaine de la recherche, de l'organisation et de l'accès a l'information. Les agents assistants peuvent également aider à la résolution de problème en orientant vers l'information, vers d' autres individus, etc.

En d'autres termes, l'étude par les systèmes multi agents des systèmes complexes, auto-organisées et situes, et la recherche de comportements cohérents produits par ces communautés hétérogènes se résument en une question :
Comment obtenir des comportements cohérents de la part d'un grand nombre d'agents hétérogènes (humains, computationnels) qui interagissent de manière inconnue, irrégulière et variable dans le temps ?
Répondre a cette question, c'est permettre de construire un système informatique intelligent, adaptatif et autonome tout a fait adapté a notre problématique de gestion des collectifs.

Plus concrètement dans ces collectifs, il s'agit de permettre l'échange des savoirs. Or essentiellement, dans ces communications humain-humain, c'est la langue naturelle qui est la plus utilisée et certainement la plus efficace. Tenter de formaliser les interactions dans ce type de communautés n'est pas une solution envisageable. La question du traitement de la langue naturelle, de la récupération à partir de celle-ci de connaissance, d'information est centrale pour nous. C'est pourquoi, nous parlerons de traitement de la langue naturelle et par là d'extraction de sémantique (c'est-à-dire du sens des choses).
Il s'agit également de permettre la coordination du travail, des compétences, des membres. Or permettre cette coordination c'est avoir une vue globale, et donc c'est avoir des mécanismes pour comprendre ce qui se passe dans ces communautés.
Pour comprendre ce qui se passe, nous nous intéressons aux interactions qui sont l'expression locale de la collaboration. Ces interactions particulières visent a répondre a un problème (ponctuel ou non) du collectif. Appréhender ces interactions, c'est permettre une gestion globale de la communauté, le suivi du but commun, et un renvoi, un feedback (une réflexivité) de la communauté sur elle-même.

Pour finir, maintenant que nous avons appréhendé l'approche actuelle des systèmes multi agents et vu en eux la promesse de résultats, nous nous intéressons a une sous problématique particulièrement importante.
Dans tous les cas, nous voyons qu'un point essentiel de la gestion du collectif est la capacité par l'ordinateur de traiter la langue naturelle, support de la majorité des échanges langagiers. Ce point vient de la volonté de permettre a l'ordinateur d'extraire automatiquement des connaissances sur ce qui se passe dans la communauté. Nous étudierons donc maintenant l'extraction de sémantique, en vue de récupérer automatiquement des informations sur ce qui se passe (le sens des choses).



2. Extraction de sémantique

Après avoir exploré le contexte de travail - les collectifs médiés humains - puis avoir replacé l'informatique et sa fonction de médium actif dans ce contexte, et finalement avoir établit notre approche agent, nous accédons enfin à la problématique première de ce travail : l'extraction de patterns d'action dans des interactions langagières. En première approximation, notre but est d'observer et de repérer les différents types d'interactions langagières et le sens qu'elles véhiculent afin de comprendre comment la communauté s'organise et comment le groupe, par le biais d'interactions multiples, résout ses problèmes et atteint ses objectifs.

Le but étant de dégager du sens, nous exposerons d'abord la base théorique pour l'étude de la sémantique dans des interactions langagières. Puis, nous explorerons quelques domaines connexes. Sans prétendre faire un état de l'art exhaustif du domaine, nous souhaitons mettre en avant les recherches qui nous paraissent pertinentes et en dessiner les contours.



2.1 Base théorique

Il existe une base théorique à l'étude de la sémantique dans les interactions langagières.

La base théorique mise en œuvre est le modèle des "actes de langage" qui a été développé par Austin et Searle (philosophes de la langue). Pour ces auteurs, l'unité de base du discours est " l'acte de langage " (ou de dialogue).

D'après Austin, " Parler c'est agir, c'est modifier l'état d'âme de l'autre et par delà, l'état des choses ". C'est à ce niveau qu'apparaît la notion d'actes de langage. " La problématique de la langue naturelle n'est plus celle d'un Sens Absolu, hors du langage humain, mais celle de l'efficacité de l'interaction. Un énoncé n'est plus Vrai ou Faux ; il réussit ou il échoue (dans son intention). ".
Partant de la thèse d'Austin, John Searle (1969) a fondé une théorie des actes de langage ou " Speech Acts " qui désignent l'ensemble des actions intentionnelles effectuées au cours d'une interaction. " Il existerait cinq catégories d'actes de langage : Assertifs (Tell), Directifs (Do), Promissifs (Commit), Expressifs (Mood), Déclaratifs (Declare). Les discours langagiers sont donc vus comme porteurs d'une intention, et la sémantique considérée uniquement dans ce cadre.

Rappelons que notre problématique est de caractériser avant tout la façon dont les membres interagissent en vue de résoudre les problèmes et de concevoir collectivement. Chaque inter-action peut être vu comme une série d'actions réciproques dont on observera l'impact sur les objectifs fixés par le collectif. Dans cette optique les traces langagières gagnent à être analysés au sein de la théorie des actes de langage comme des actions intentionnelles. Nous chercherons donc à identifiés des patterns d'action, dont l'identification passera par une analyse des verbes employés lors des interactions langagières.



2.2 Approches théoriques existantes

Une fois les traces langagières des interactions récupérées (exemple : conversation par chat sous format XML), leur traitement en vue d'extraire des éléments particuliers peut faire l'objet de plusieurs approches. Différents domaines ont travaillé sur le problème du sens. La linguistique étudie sa forme langagière, la logique et l'informatique en élabore des modèles formels et l'opérationnalise, la psychologie essaie de comprendre les processus qui président à son émergence chez l' humain, la sociologie de rendre compte des mécanismes collaboratifs de sa construction, etc.

De nombreux domaines sont intéressés par le problème de l'extraction de sens, nous avons souhaité n'en présenter que trois d'entres eux : d'une part, le TAL (Traitement Automatique de la Langue) et la fouille de données qui supportent le problème de l'extraction d'informations en générale et de sa formalisation et , d'autre part, l'acquisition de sémantique (d'après les travaux du professeur Habert du LIMSI) qui s'intéresse directement au problème de l'extraction du sens et qui propose une approche alternative.


TAL (Traitement Automatique de la Langue)

Les premières recherches en Traitement Automatique du Langage visaient à créer un modèle unique, capable de formaliser la compréhension du langage dans sa globalité. Cette approche, initiée par Chomsky, s'est vite avérée difficile à mettre en œuvre.

A l'heure actuelle, les systèmes de TAL utilisent une approche à base de corpus, moins ambitieuse mais beaucoup plus pragmatique. Celle-ci consiste à utiliser un corpus de documents représentatifs du domaine à modéliser. Le système va l'utiliser pour obtenir une couverture du langage suffisante afin de permettre au système de TAL de donner des résultats de bonne qualité.

Très brièvement nous présentons ici la technique théorique qui décompose l'analyse d'un texte en quatre étapes successives d'analyse :
· L'analyse morpho-lexicale, qui se préoccupe de la structure des mots ;
· L'analyse syntaxique dédiée à l'analyse de la structure des phrases ;
· L'analyse sémantique qui s'intéresse au sens des phrases considérées individuellement ;
· L'analyse pragmatique qui s'attache à remettre un contexte autour des phrases

Chacun de ces modules d'analyse traite une caractéristique spécifique du langage. Pratiquement, un texte ne subit pas successivement chaque niveau d'analyse, ces derniers interagissant au cours du traitement. La distinction de ces éléments est donc avant tout pédagogique.


Photo : " Le traitement automatique du langage ", KMCenter, 2002,

Le TAL s'intéresse strictement à la langue naturelle et reste collé à ses caractéristiques (la syntaxe, etc.). A la différence, nous travaillons sur des interactions langagières pour satisfaire des considérations autres que celles de la langue naturelle. Même si celle-ci est sûrement le langage le plus efficace dans les interactions humaines. Donc, s'il est intéressant d'emprunter des outils et des méthodes au domaine du TAL, notre approche plus orientée vers les actes de langage se démarque de la démarche classique du TAL.



Fouille de données

Les entrepôts de données et la fouille de données sont les éléments d'un domaine de recherche et de développement très actifs actuellement : l'extraction de connaissances à partir de données ou Knowedge Discovery in Databases (KDD for short). Par ce terme, on désigne tout le cycle de découverte d'information. Il regroupe donc la conception et les accès à de grandes bases de données ; tous les traitements à effectuer pour extraire de l'information de ces données ; l'un de ces traitements est l'étape de fouille de données ou Data Mining.
Il est hors d'atteinte d'un tel travail de prétendre dresser une liste exhaustive de toutes les techniques disponibles en fouille de données. Pour n'en citer que quelques unes : l'algorithme des k-moyennes, les règles d'association, la méthode des plus proches voisins, les arbres de décision et les réseaux de neurones.

Voici une brève présentation pratique de la méthode générale:
Processus Itératif en 4 étapes :

" Nettoyage et Intégration de bases de données
Suppression des données inconsistantes ou combinaison de données de différentes sources pour constituer un entrepôt
" Prétraitement de données
Sélection ou transformation de données de l'entrepôt pour les rendre exploitables
" Fouille de données
Utilisation de méthodes intelligentes pour extraire des motifs.
Tâches: caractérisation, discrimination, association, classification, prédiction, analyse de données évolutives
" Evaluation et Présentation
Identifier les motifs intéressants, les visualiser, et interagir

Il est à noter que la fouille de données est largement associée à des méthodes d'apprentissage qui vont chercher à rendre la fouille plus performante et à adapter les mécanismes aux données traitées. Ce point là est particulièrement intéressant car l'apprentissage permet de travailler sur des corpus de données obscurs, c'est-à-dire non totalement saisissables ou définissables. Dans notre contexte de collectifs médiés, ces mécanismes d'apprentissage sont très intéressants.
La fouille de données est déjà beaucoup plus pertinente dans notre problématique. Notre contexte, le collectif médié humain, peut, comme nous le verrons plus tard, réunir un corpus de langage très important, éventuellement très hétérogène et non corrigé. C'est-à-dire que nous aurons à faire avec des interactions langagières d'acteurs ne cherchant pas à se conformer aux règles strictes de la langue, mais à se faire comprendre ponctuellement par quelqu'un dans un contexte donné. La fouille de données, parce qu'elle sonde des bases de données importantes et cherche à en extraire de l'information, promet d'offrir des techniques et des outils robustes pour la manipulation de nos corpus langagiers.


Acquisition de sémantique

Principe de l'acquisition sémantique (travaux professeur Habert - ORSAY)

Il nous a semblé intéressant de présenter également l'acquisition sémantique. Cette approche a des avantages qui nous ont attiré et peut éventuellement apporter un éclairage nouveau à notre problématique.

Il s'agit de développer des méthodes pour révéler, caractériser ou paramétrer la sémantique. On va donc essayer de rapprocher les mots entres eux, de faire des liens. Par exemple, on va rapprocher les synonymes et les antonymes. La sémantique s'apparente là à une mise en relation, non à un Sens absolue. On peut penser à la théorie cognitiviste qui affirme que l'humain se construit, lors de la lecture d'un texte par exemple, une représentation, structurée en réseau de propositions. Prenons l'exemple du dictionnaire, la définition d'un mot est un sous-réseau d'autres mots, et tout son sens est définit par cet agencement particulier.
Dnas le cadre de cette démarche, l'acquisition de sémantique propose l'hypothèse suivante :
" Deux mots sont similaires si on arrive à les placer dans le même contexte.

Au lieu de chercher des liens de proximité entre deux mots, il s'agit donc de trouver un contexte commun à ces deux mots. Donc, au lieu de lier des mots par des liens pas forcement évidents à formuler (liens d'opposition, liens de complémentarité, etc.) et au lieu de se poser la question du nombre de liens que l'on devra établir (nombre qui pourrait être très grand !), nous limitons la problématique à un travail sur le contexte. Ca n'est plus des mots que l'on rapproche, mais un contexte que l'on construit.

Les questions sont alors détournées sur le contexte : par exemple, quelle est sa taille ?
Il s'agit alors de développer des techniques pour faciliter la recherche de contexte commun. On peut, par exemple, si on prend un mot, changer sa forme (verbe passé à l'infinitif), et ainsi permettre un rapprochement sur un plus petit nombre de traits, découvrant un petit contexte. Les traits sont ici les paramètres de comparaison entre les mots. De leur choix dépendra la pertinence de l'analyse.

Une fois tout le travail sur le contexte effectué, on s'intéresse aux mots. On peut les représenter chacun par un vecteur, ou même parfois par une matrice creuse. Deux mots sous la forme de vecteurs peuvent plus aisément être comparés. On peut, par exemple, calculer la distance entre eux et ensuite avec cette distance utiliser des techniques de clustering, c'est-à-dire qu'on rassemble des mots en groupes. La construction de ces groupes est également un travail, mais une fois les critères de regroupement établis, on peut éventuellement manipuler ces groupes (en jouant sur la géométrie de ces groupements : arbres, etc.).

Une fois ces mots mis sous forme de vecteurs et organisés en groupes, on peut construire des familles et organiser des hiérarchies de familles. On peut alors tester si un mot appartient à une famille donnée ou à une de ses sous famille par exemple.
De ce concept de famille, c'est-à-dire d'une sorte de définition du groupe, on obtient immédiatement la description idéale de l'individu représentant le groupe et ayant toutes ses caractéristiques, on obtiendra un patron. Il est alors facile d'utiliser ce patron pour la comparaison de mots par exemple, ou pour acquérir des apprentissages de reconnaissance de mots par des agents ou systèmes informatiques donnés.

Cette approche nous paraissait intéressante pour une raison. Elle rappelle que la sémantique peut également se chercher, voire se définir, en contexte. Celui-ci pourrait en fait devenir un objet d'étude. Dans un collectif médié, nous sommes confrontés à des interactions langagières prenant sens dans un contexte de travail. Les patterns d'action devront donc être étudiés en fonction de ce contexte.


Autres

D’autres domaines sont intéressés ou intéressants pour notre problématique. La psychologie cognitive, la linguistique, etc.



3. Perspectives et conclusions


Replacons maintenant notre problématique de l’extraction des patterns d’action dans des interactions langagières.
Notre contexte apparaît plus clair, il s’agit d’un collectif médié humain dont l’objectif principal est l’accomplissement de son but. Nous nous inscrivons dans cette problématique en cherchant à permettre au système informatique de manipuler plus efficacement et plus activement les interactions inter humaines du collectif. Nous entendons par efficace et active une manipulation permettant une organisation plus pertinente des données, un accès plus automatisé et plus précis, un feedback sur le travail collectif et une collaboration plus acéré. Le collectif ainsi doté de réflexivité aurait un mécanisme auto régulateur lui assurant une plus grande robustesse face aux problèmes et un meilleur angle de vue pour préciser son évolution vers son but.

Voici maintenant un ensemble de travaux, groupes de recherche ou laboratoires concernés par cette problématique.


Dans le cadre de RTP 38:
L'Action Specifique CoMETE (Co-construction éMergente d'Expérience par inTEraction)

Coordinateurs : Salima Hassas, Alain Mille (LIRIS, UCB Lyon 1)

Le réseau se propose d'étudier les phénomènes de construction de sens dans les processus humains et/ou artificiels :
? pour les sujets humains, dans le paradigme 'action située et distribuée' (rapport à l'activité et au contexte social, corporel et matériel),
? pour les agents informatiques, dans une perspective de conception de représentation du monde et d'acquisition des connaissances par interaction avec d'autres agents et leur environnement,
pour les agents humains en situation "d'interaction" avec l'artificiel (agents informatiques) : notion d'assistants.

Concretement, les differentes aspects que se propose d'etudier cette AS se resument par les cinq points suivants :
" d'identifier les différentes formes d'expériences que l'on peut tracer lors de la réalisation d'une tâche collective ;
" de fournir des moyens de les représenter , de les exploiter efficacement dans un contexte informatique ;
" de fournir un paradigme d'assistance basé sur la capitalisation de l'expérience, fruit de la réutilisation en contexte de l'expérience individuelle et collective ;
" d'étudier la co-construction d'un sens commun, dans un collectif par interaction ;
" d'étudier la co-évolution et apprentissage des individus engagés dans un processus collectif de partage d'expérience.

Participants et leurs travaux :
Zacklad : MEDIANNOTE -- Annotations numériques collectives pour la gestion des connaissances dans les activités coopératives
Ploux : Acquisition, représentation, classification automatique des concepts dans le domaine des sciences cognitives
Grainger : Modélisation computationnelle de l'apprentissage de mots écrits
Paroubek : Vers un modèle Action-Perception pour la Compréhension du Langage (APCOLAN)

Ces travaux sont tout a fait dans la dynamique de notre problematique. Ils se concentrent sur les problemes du sens dans les collaborations (realisation d'une tache par un groupe). L'idee est de chercher a extraire ce qui se passe, la logique des experiences des individus, a la representer et a la reutiliser (la reinjecter dans le collectif). De la, l'AS cherchera a etudier la co-construction du sens commun a travers les interactions inter individus.


RTP 33 - Documents et contenu : création, indexation, navigation

Les problematiques traitees ici sont l’accès partagé à l’information, la gestion des connaissances pour les organisations, une valeur ajoutée pour les services, la transformation des industries culturelles dans le cadre individuel ou de collectif. Il s’agit donc de :
« Analyser les documents (structure, évolutivité, collection, etc.), les médiations (techniques et sociales) et leur relation avec l'activité humaine et ses limites (navigation, recherche documentaire et utilité, construction sociale des normes..).
S’interroger sur les outils à construire, sur les modalités de leur construction et sur les conséquences de leur utilisation.
Croiser l’informatique (conception des systèmes et outils), la linguistique (analyse de textes, construction de terminologies et multilinguisme), les sciences cognitives (construction du sens), et les « sciences de l’information » (construction des modèles sociaux).
Discuter la notion de « document », renouvelée sinon contestée par le développement numérique. »

 

Laboratoire ICAR
(Interactions, Corpus, Apprentissages, Représentations) – Lyon2 (lien)

Le laboratoire ICAR a pour objectif de décrire et de théoriser le fonctionnement des différents types d'interactions communicatives, de la conversation familière aux échanges en contexte institutionnel. Ses travaux s'inscrivent dans le cadre de l'approche interactionnelle et cognitive des faits de langue et de discours.

 


Projet RTP 39

L’objectif ici est de developper des cooperations profondes entre les acteurs concernes par les concepts autour de celui de connaissance, par les methodes et techniques de modelisation de la structure de l’information et des fonctions permettant les actes de connaissance.
Outre coupler les activités fondamentales et les applications, la contribution originale du programme est d'aborder ces questions de façon profondément transdisciplinaire, mettant en jeu les 3 départements STIC, SDV et SHS.

 


ACOSTIC
lien

Activité, Connaissances & Organisation
Action spécifique n° 53, RTP n° 35 "Economie et Société"
Animation : Régine Teulier (CRG) & Pascal Salembier (IRIT)

(Le RTP 35 compte l’Actions Spécifiques Pratiques Collectives Distribuées et Technologies de Coopération (PCD-TC))

Contact: Manuel Zackald
Dans le contexte collectif, les systèmes informatiques doivent non seulement apporter de l'information mais aussi être des supports de plus en plus sophistiqués et sémantiquement riches de l'activité, dont ils deviennent un support crucial. La conception de tels outils dans le tissu organisationnel suppose de prendre en compte la complexité de la cognition, des situations de travail collectif, des modes d'organisation, des tissus organisationnels et institutionnels. Globalement, il s'agit de produire des modèles et des artefacts intervenant dans l'ensemble complexe qui génère et résulte de l'activité humaine dans les organisations. L'activité humaine, les connaissances et l'organisation qu'on se propose d'assister deviennent alors centrales pour les STIC, cependant qu'elles sont aussi étudiées dans de nombreuses disciplines. On peut ainsi se focaliser sur trois concepts clés (entendus dans un sens très générique), abordés par plusieurs champs disciplinaires dont les acquis conceptuels et méthodologiques cumulés notamment des Sciences Humaines et Sociales sont déjà nombreux. Un champ de recherche se dessine, balisé autour de ces trois concepts et de leurs liens : recouvrant des processus cognitifs individuels et collectifs. C'est pourquoi cette trilogie nous semble suffisamment fédératrice pour être reprise en titre de l'AS et susciter des échanges pluridisciplinaires qui peuvent contribuer à orienter les différentes approches disciplinaires.

 



4. POUR EN SAVOIR PLUS…


… sur les théories évoquées :

L’ACAO

E-learning pour une intelligence collective de l’entreprise (processus par lequel des apprenants acquièrent de nouvelles compétences ou connaissances afin d’améliorer leur performance.)

… sur les domaines de recherches et les laboratoires :

La fouille de données

Outils commercialisés de fouille de données :
Intelligent Miner,
Entreprise Miner (SAS Institute),
MineSet (Silicon Graphics Inc.),
Clementine (Integral Solutions Ltd, racheté par SPSS),
DBMiner ( ou autre lien, version libre 90 jours),

Sites pour la fouille de données
http://www.kddnuggets.com/ : à consulter
http://www.crisp-dm.org/ : CRoss-Industry Standard Process for Data Mining - effort de standardization

Livres
P. Adriaans and D. Zantinge. Data Mining. Addison-Wesley, 1996

J. Hertz, A. Krogh & R. G. Palmer, An introduction to the theory of Neural Computation (Addison-Wesley, 1991)
C.M. Bishop, Neural Networks for Pattern Recognition (Oxford: Oxford University Press, 1995)
L. Devroye, L. Györfi and G. Lugosi, A Probabilistic Theory of Pattern Recognition, (Springer-Verlag 1996)


L’acquisition de sémantique

Le professeur Benoit Habert du LIMSI

L’approche multi agents

Cours
• Courses @ multiagent.com : around 30 links to agents and multi-agent courses. Submitted by their authors.
• Courses @ AgentLink.org : broken down by countries, this database is part of AgentLink's effort to highlight and improve available resources on Agent training and teaching in Europe. Submitted by the educational institutions.
• Courses @ AgentWeb : around 60 links to agents and multi-agent courses (some outdated). Submitted by their authors.

Qu'est-ce que l'Autonomie ajustable ?
Qu'est-ce que l'Apprentissage interactif situe ?


Autres

La Société de Linguistique de Paris

Sociologie :

Bernard Conein (Lille)
Gensollen (ENST)
Nicolas Auray
(ENST)

 

… sur les conférences et évènements :

Journée Fouille de données et Applications médicales
Mercredi 14 mai 2003
45, rue d'Ulm, Paris – France
Les techniques dites de "Fouille de données" (traduit de l'anglais data mining) sont issues de multiples domaines de recherche : bases de données, statistiques, apprentissage automatique, intelligence artificielle, théorie de la décision, algorithmique... Le fouille de données se définit comme l'extraction à partir de données brutes de connaissances potentiellement exploitables.
Les professionnels de la santé sont aujourd'hui confrontés aux avancées rapides des technologies de l'information et à l'évolution des systèmes d'informations qui ont eu lieu ces dernières décennies.
Cette journée représente une opportunité pour les chercheurs et industriels des domaines de la santé et de l'informatique de partager leurs idées et leurs visions. C'est aussi l'occasion de découvrir la discipline de l'informatique médicale aujourd'hui en plein essor.

Pour ceux qui sont tres interesses, differentes conférences pour la fouille de données :
PAKDD, PKDD, SIAM-Data Mining, (IEEE) ICDM, DaWaK, SPIE-DM, etc.

La 11ème conférence annuelle sur le traitement automatique des langues (TALN-2004) :
Lieu : Fès, au Maroc du 19 au 22 avril 2004
Organisateur : Philippe Blache - LPL, UMR 6057
Thème : Les conférences JEP ("Journées d'Etude sur la Parole") et TALN ("Traitement Automatique des Langues Naturelles") constituent les manifestations scientifiques francophones les plus importantes dans le domaine du traitement de la parole et de l'écrit. Elles réunissent une communauté scientifique très interdisciplinaire abordant le domaine des sciences du langage à la fois dans ses aspects descriptifs, formels et computationnels. Des travaux théoriques autant que des applications et des systèmes y sont présentés.
Pour plus d’informations : http://www.lpl.univ-aix.fr/jep-taln04/

… sur la presse et biblio :

Journal of Computer-Mediated Communication

Magazine of Computer-Mediated Communication

L’actualité scientifique des sciences sociales


Articles

Le Langage : Un numéro hors-série de Sciences Humaines réalisé avec le CNRS

L'Internet : un nouveau modèle de communication scientifique ?

Revue Traitement Automatique des Langues


Traitement de la connaissance – théories du langage

• THEORIE DE LA PERTINENCE: NOUVEAUX DEVELOPPEMENTS (Sperber, en collaboration avec Deirdre Wilson)

• L. Charnay (LIMSI/CNRS). Un modèle informatique d'acte de dialogue. Ergo IA 96, pp. 61-70.

 

Autres


Encyclopédie Yahoo !


Département des Sciences de l’Homme et de la Société – CNRS